Esto es una breve actualizacion del proyecto, tuve curiosidad de saber cuanto audio real se necesita para el futuro motor de sintesis basado en sonido almacenado, asi que capture todos los sonidos generados por el sintetizador, obviando alteraciones como los acentos, que se pueden generar por programa escalando en tiempo real el sonido almacenado. El resultado fue que el PIC genera el equivalente a 1,518 segundos de sonido, que en la realidad debe ser calculando a ojo algo asi de la decima parte o menos, es decir lo que realmente esta almacenado en el programa y se usa como ondas base para la sintesis.
Basado en estos 1,518 segundos, a la calidad actual de reproduccion de sonido me da un poco menos de 11Kbytes, demasiado para un PIC16 que llega hasta los 8K (de 14 bits), pero manejable por ejemplo para un PIC18F2520 de 16K (de 16 bits), que gracias a la arquitectura de 16 bits ademas me duplica la capacidad de almacenamiento de sonido, ya que puedo almacenar 2 bytes por palabra en vez de 1 que podia en la serie 16.
Es decir que en un PIC18F2520, usando unicamente sonido almacenado mas un par de alteraciones al sonido por programa para los acentos de las vocales, estaria usando el 33 o 34% de la memoria del PIC para sonido, y el motor quedaria mucho mas simple ya que practicamente tendria que concatenar sonido de la ROM interna. Me atreveria a decir que en ese PIC se podria tener dos voces almacenadas, idealmente masculina y femenina, mas el otro tercio de la memoria dedicada al programa de sonido y a la comunicacion con el exterior.
Por el momento estoy recapturando el sonido original y remplazando las capturas generadas por el PIC por su equivalente en sonido real, con mismo tono y duracion (un trabajo de locos), pero hasta ahora va muy bien, ya tengo las vocales que las hice en un par de horas de edicion de sonido. Los sonidos mas complejos son los mas faciles de capturar, los que parecen mas simples son los dificiles, como la L, M, N, vocales, que es dificil pronunciarlas en el tono correcto si no es en una palabra, y al estar en una palabra el sonido se pega con los otros, pero ya tengo años de experiencia en esto.
No veo la hora de probarlo aunque sea en una simulacion concatenando los sonidos en la misma calidad exacta con que estaran almacenados en el PIC, con suerte en uno o dos dias, o antes si la locura sigue conmigo, podre tener una idea de como suena.