Realmente flor de laburo y desarrollo ! Ya que hiciste el sintetizador...ahora un digitalizador con reconocimiento de pequeños comandos, y una interface para activar cosas !!! Multiplataforma claro.
Beamrider
Asi sin pensarlo mucho, diria que sin asistencia de hard es imposible hacer reconocimiento de voz, de hecho ya es complicado para un PIC16 de 20MHz, yo pude hacer en el PIC el reconocimiento de tonos telefonicos, el PIC se conecta al telefono, reconoce la tecla que uno pulsa y emite un mensaje digitalizado grabado en una memoria flash, todo esto en tiempo real y en multitarea, es decir se puede ir pulsando distintas teclas, se interrumpe el mensaje y se empieza el nuevo. Pero el algoritmo esta hecho para reconocer un maximo de 8 frecuencias bien definidas y requiere un tiempo para digitalizar y analizar varias muestras, no determina la frecuencia sino que compara la señal con frecuencias precalculadas y da un grado de aproximacion para descartar si corresponde o no. Adaptandolo un poco puede que se puede utilizar para la voz, pero hay que analizar muy bien varias muestras de voces diferentes para tener una idea de frecuencias en comun que se puedan usar. Para recibir ordenes simples probablemente sea posible hacer algo, ese codigo puede correr en paralelo con el sintetizador de voz para PIC16 y de hecho corre, porque la voz digitalizada que reproduzco desde la flash pasa por el sintetizador, que se limita a leer cada muestra desde la memoria en vez de hacerlo desde el programa. Pero ya que es el mismo programa, se puede perfectamente mezclar sonidos en memoria externa y sonidos sintetizados, el programa que tengo hecho trata todo como fonemas, hay fonemas sintetizados, fonemas virtuales que son sonidos en memoria flash, e incluso captura en vivo desde el conversor A/D del PIC, todo eso puede agregarse transparentemente a la lista de reproduccion del sintetizador. El secuenciador le pasa el control a la rutina correspondiente y esta puede obtener el sonido como sea (sintesis, memoria flash, conversor A/D) y solo tiene que devolver una muestra de 8 bits para enviar a la salida de audio, cuando hace eso devuelve el control al secuenciador.
Para no hacer el tema mas largo, con el mismo chip sintetizador de voz se puede tener ademas algun reconocimiento basico de frecuencias, se podria pasar esta informacion a la C64 como un numero de 0 a 7 y que algun programa en la C64 reconozca la variacion de la voz, o se podria hacer algo integrado en el PIC, aunque esto dejaria el programa mas limitado para hacer mejoras.
Esta informacion de frecuencia tambien podria servir para hacer un vumetro, aunque solo para las frecuencias de usadas por la voz, de no mas de 4KHz. Por otro lado, la tolerancia a estas frecuencias es muy ajustada porque el programa esta diseñado para no variar mas del 1 o 2% si mal no recuerdo (la tolerancia del reconicimiento de DTMF), asi que no serviria mucho para un vumetro musical.
En cuanto a la interfaz para activar cosas, eso ya se puede hacer con el puerto del usuario, pero si se usa el PIC, hay un monton de pines que quedan sin usar, asi que se podria tener algo asi de 12 o 13 pines de E/S, los cuales se podrian leer o activar por la misma conexion RS232 usada para el sintetizador.