Existe mucha teorÃa en torno a la sÃntesis de audio. Intentaré introducir conceptos generales, que nos sirvan para entender el funcionamiento de un sintetizador, y el papel que desempeña dentro del proyecto.
En primer lugar, decir que se comentarán dos tipos de sÃntesis:
- SÃntesis de Audio Modulada en Frecuencia (FM synthesis).
- SÃntesis de Audio por Tabla de Ondas (wavetable synthesis).
1.- SÃntesis de Audio Modulada en Frecuencia
Como bien dice [1]: “La sÃntesis FM es un método que permite la manipulación de un timbre para obtener sonidos reales y naturales”. Más adelante, se comenta que “con velocidades por encima de la capacidad humana y frecuencias con una rapidez similar a las frecuencias de audio, comienzan a aparecer componentes armónicos proporcionales a más o menos la frecuencia portadora del tono que se está haciendo vibrar”.
Os lo explicaré de forma sencilla. El sonido es como cualquier otra onda fÃsica, y por tanto, tiene una serie de propiedades cuantificables. Por ejemplo, la frecuencia (inversa de la longitud de onda, lambda). Sonidos de baja frecuencia (alta longitud de onda) son sonidos graves, mientras que sonidos de alta frecuencia (baja longitud de onda) son sonidos agudos. Otra propiedad del sonido es su intensidad, concepto al que estamos muy familiarizados, y del que sobran explicaciones.
Sin embargo, todavÃa podemos hablar de una propiedad más. ¿Cómo es posible que nuestro oÃdo sea capaz de distinguir dos sonidos con la misma intensidad (mismo volumen), y la misma frecuencia (la misma nota) que provienen de dos instrumentos distintos? Los sonidos también tienen un timbre. ¿De dónde proviene esa cualidad del sonido?
La explicación es sencilla. Casi ningún instrumento genera ondas simples, sino varias ondas que se superponen y generan un sonido como resultado de toda esa superposición simultánea en el tiempo. En otras palabras, cuando escuchamos una nota de un instrumento, ¡en realidad estamos escuchando varias! ¿Cómo es ésto posible?
Os contaré un secreto: no todas las ondas que estamos escuchando en un sonido suenan con la misma intensidad. Digamos que existe una nota central, que es la que destaca, y luego una serie de notas que también suenan, pero con una intensidad considerablemente menor a la nota central.
Ahora bien, ¿qué notas suenan, además de la nota central? ¿Y con qué intensidad, en relación a la nota central? Muy sencillo: depende. Depende de las caracterÃsticas fÃsicas del instrumento. Eso incluye las medidas usadas en su construcción, el tipo de material usado, y un largo etcétera.
Os contaré un segundo secreto: las notas que suenan simultáneamente con la nota central no son notas cualesquiera. Son notas que tienen una relación muy especial con la nota central. Matemáticamente hablando, son notas cuya frecuencia son múltiplos de la frecuencia de la nota central. Musicalmente hablando, son notas armónicas, probablemente construÃdas con intervalos justos.
Cuando escuchamos varios sonidos simultáneamente, pueden provocarnos varias sensaciones. Sin ser demasiado técnico, pueden ser agradables (consonancias), y otros desagradables (disonancias). Dentro de los sonidos consonantes, que suenan agradables al oÃdo (aún sin ser un experto musical) están los intervalos justos: 4ª J, 5ª J y 8ª J. Curiosamente, las frecuencias de los sonidos que forman parte de éstos intervalos tan agradables al oÃdo, son múltiplos uno del otro.
Como véis, existe una estrecha relación entre las matemáticas y la armonÃa.
Si conocemos cada una de las partes que compone un sonido, ¿acaso no podemos construir nuestros propios sonidos artificialmente? Esa es la idea de la sÃntesis FM: a partir de un modelo matemático que explique el comportamiento del sonido (basado en los modelos fÃsicos utilizados para describir el comportamiento de ondas), somos capaces de construir un circuito electrónico que genere sonidos bastante parecidos a los sonidos reales de cualquier instrumento.
El parámetro más complicado de generar es, sin duda, el timbre. Cambiar la frecuencia de una onda, o su amplitud, no es más que un simple cálculo matemático, por lo que no es para nada complicado. Sin embargo, como ya habÃamos comentado, el timbre se consigue a base de superponer armónicos con menor intensidad a la nota principal.
Modelo matemático de la SÃntesis FM
A modo de curiosidad, en [1] se afirma: “En FM, la frecuencia instantánea de una onda portadora es variada de acuerdo a una onda moduladora, de tal forma que los cambios en la portadora se convierten en la frecuencia de la onda moduladora o frecuencia moduladora.”
Se consideran dos ondas: una onda portadora, y una onda moduladora. La frecuencia de la onda portadora se calcula a partir de la onda moduladora (a partir de una ecuación con funciones trigonométricas). De ahà que se diga que la sÃntesis es Modulada en Frecuencia.
El desarrollo matemático escapa al objetivo de éste post. Aquà podréis encontrar más sobre la teorÃa matemática que sustenta éste modelo, la TeorÃa de FM. Como última curiosidad, indicar que para calcular los armónicos de la nota principal, parece que se utilizan las Funciones de Bessel, utilizadas en muchos otros campos.
Un sonido puro y sin armónicos
Anteriormente mencionamos que casi ningún instrumento generaba una onda simple (refiriéndome a un sonido sin armónicos). Efectivamente, existe un instrumento que sÃ, y es el diapasón.
Según la wikipedia: “Normalmente se utiliza para afinar instrumentos musicales de acuerdo a una nota concreta; sin el diapasón serÃa muy difÃcil lograr que distintos instrumentos se pudieran afinar independientemente de forma concreta y armónica”.
El sonido generado por un diapasón es lo que más se parece en la práctica a un sonido sin armónicos. Su forma de onda es senoidal. Otra forma de obtener un sonido puro serÃa generando una onda senoidal en un ordenador.
2.- SÃntesis de Audio por Tablas de Ondas
De todas formas, aunque con la sÃntesis FM se conseguÃan resultados más que aceptables, se notaba que los sonidos eran generados por un computador. Con el objetivo de obtener un resultado más realista, se diseñó la sÃntesis de audio que vamos a presentar a continuación.
La idea es bastante intuitiva: ahora disponemos de una tabla con sonidos muestreados de cada uno de los instrumentos, almacenados de forma digitalizada en una ROM (por hardware) o en disco (por software). La tabla nos proporciona sonidos reales de cada uno de esos instrumentos (muestras, en inglés samples), un sonido base a partir del cual podemos modificar algunos parámetros básicos, para obtener el sonido final.
Por ejemplo, a partir de un sonido base, y modificando la frecuencia, podemos obtener todos los sonidos de la escala. Sin embargo, cuanta mayor sea la diferencia entre la nota real y la nota que queremos obtener, el resultado será de peor calidad. En otras palabras, con un LA podemos obtener un LA bemol o un LA sostenido de bastante calidad, pues son notas que están razonablemente cerca. Pero si intentamos obtener un DO a partir de un LA, se notará claramente que es un sonido construido de forma artificial.
En consecuencia: “Cuanto mayor sea la cercanÃa (cuantificada en tonos y semitonos) entre la nota sintetizada y la nota muestreada, mayor será el realismo del sonido resultante”.
El caso extremo serÃa tener una muestra de cada una de las notas que puede generar el instrumento. Pero aquà tendrÃamos el inconveniente de que, al tener tantas muestras, la tabla de ondas serÃa demasiado grande (con más razón si estamos contemplando la posibilidad de almacenar la tabla en una ROM). También hay que pensar que, probablemente, querremos tener sampleado más de un instrumento. Lo cual convierte al tamaño de la tabla en un parámetro a tener en cuenta.
Una caracterÃstica interesante de muchas tarjetas de sonido (sobre todo, las profesionales), es que incorporan una cierta cantidad de memoria RAM interna. En ese caso, es posible almacenar la tabla de ondas en la RAM, de forma que el acceso a las muestras de la tabla se realizarÃa con mayor eficiencia, con el aumento de prestaciones que ello conlleva.
En caso de no disponer una tarjeta tan buena, siempre queda la posibilidad de almacenar la tabla en la memoria principal, a coste de tener un menor rendimiento. De todas formas, ahora no es un problema demasiado grave, puesto que tanto la tecnologÃa de computadores como la tecnologÃa de memorias han mejorado mucho sus prestaciones en éstos últimos años (capacidad de procesamiento en el primer caso, y cantidad de memoria y latencia, en el segundo).
También es posible una estrategia mixta, en caso de que la tabla de ondas sea de un tamaño superior a la RAM disponible en la tarjeta de sonido.
Posteriormente, para generar el sonido, se utiliza un oscilador con diversos componentes que permiten modificar la onda de salida.
Fuentes interesantes:
[1] Fundamentos de SÃntesis de Audio con Frecuencia Modulada, por Juan Reyes
Wavetable synthesis, artÃculo en la Wikipedia
Wavetable Synthesis 101. A Fundamental Perspective, por Robert Bristow-Johnson (para profundizar)