Fundamentos del sonido
En este capitulo vamos a tratar de proporcionar unos conceptos rápidos pero esenciales que nos permitan entender la manera de tratar el sonido. Una vez aprendidos estos, nos será posible trabajar con el ordenador y el sonido con un cierto grado de confianza.
La naturaleza del sonido
El sonido es una vibración que se propaga a través del aire. Se aplican los mismos principios que cuando lanzamos una piedra a un estanque: la perturbación de la piedra provoca que el agua se agite en todas las direcciones hasta que su amplitud es tan pequeña que deja de percibirse.
Frecuencia
Al número de veces que esta vibración se produce por segundo es lo que se conoce como frecuencia. La frecuencia del sonido se mide en Hertzios (Hz). Una persona con los oídos saludables puede oír frecuencias comprendidas entre los 20 y los 20000 Hz.
Cuando estas vibraciones del aire llegan a nuestros oídos, este las transforma en señales eléctricas que puedan ser entendidas por nuestro cerebro. Un micrófono actúa de manera similar transformando las vibraciones acústicas en eléctricas de manera que puedan guardarse, manipularse, y reproducirse. A esta señal se la denomina señal analógica.
La forma de onda más sencilla es la denominada onda sinusoidal, que se caracteriza por tener una frecuencia y una amplitud constante. Este tipo de ondas son las que se utilizan normalmente para realizar los estudios ya que cualquier señal puede descomponerse mediante Transformadas de Fourier en series de estas.
Amplitud
La amplitud de una onda nos informa de la fuerza o energía de la señal. La unidad de medida de esta fuerza es el decibelio (dB).
El oído necesita un porcentaje elevado de variaciones en la fuerza de un sonido para detectar un ligero cambio en la intensidad percibida, lo que nos indica que la sensibilidad del oído es logarítmica. Para hacernos una idea diremos que un incremento de solo 3 dB duplica la intensidad de un sonido, pero nosotros solo percibiremos un ligero incremento de este. Necesitaremos un aumento de 10 dB para que nuestros oídos perciban un sonido con el doble de intensidad.
Ancho de Banda
El ancho de banda de un sistema nos indica la diferencia entre la frecuencia máxima y mínima con la que el sistema puede trabajar. Antes dijimos que el oído humano puede percibir frecuencias comprendidas entre los 20 y los 20000 Hz, es decir, el ancho de banda de nuestro oído es de unos 20 KHz.
Muestreo:
Conversión analógica - digital ( ADC )
Este proceso convierte una señal analógica continua en series de datos tomando medidas instantáneas de la amplitud de la señal a una velocidad constante. Si estas medidas se toman a una frecuencia de muestreo alta, tendremos una aproximación bastante fiable de la señal original. Para entender mejor este concepto pensemos en el símil cinematográfico el cual toma 24 imágenes por segundo que son suficientes para simular un movimiento continuo de la escena. Evidentemente cuantas más muestras tomemos por segundo mejor reproduciremos la señal original.
Los sistemas digitales utilizan como unidad de información el bit el cual solo tiene dos estados, 0 y 1. Evidentemente no podemos asociar todos los posibles valores de los datos con tan solo un bit, por este motivo se utilizan combinaciones de 8 bits ( byte ) a los que ya podremos asociar 256 valores, no obstante si se necesitara mayor resolución se utilizaran 16 bits ( word ) incrementando de esta manera el rango hasta 65536 valores.
Conversión digital - analógica ( DAC )
Es el proceso que convierte los valores digitales discretos que representan al sonido en una señal analógica continua.
Frecuencia de muestreo
La frecuencia de muestreo debe de ser lo suficientemente alta como para que los sonidos de alta frecuencia puedan recogerse con precisión. Según el teorema de muestreo es posible reproducir con exactitud una forma de onda si la frecuencia de muestreo es como mínimo el doble de la frecuencia mayor a muestrear. La frecuencia más alta que percibe el oído humano es de 20 kHz, de modo que haciendo un muestreo a 44.1 kHz aseguramos una excelente reproducción del original. Se podría asumir que todo lo que hay que hacer por tanto para obtener buen sonido es grabar a velocidad límite de 44.1 kHz con muestras de 16 bits. El único problema que nos encontramos es la enorme cantidad de espacio en disco que se requiere para almacenar la información (1 minuto ocupa aproximadamente 10.5 Mbytes).
Formatos de archivos de sonido
El formato de datos mas utilizado para los archivos de sonido es el denominado Pulse Code Modulated ( PCM, modulación en código de pulso ) de 8 bits. De esta forma se obtiene un byte por muestra de sonido. Los archivos estéreo contienen dos bytes, uno por muestra de cada canal, con lo que se obtiene mejor calidad a costa del limitado espacio en disco.
Se han desarrollado muchos formatos de archivos comprimidos que permiten realizar grabaciones de alta calidad sin necesidad de tanto espacio, uno de ellos es el Adaptative Differential Pulse Code Modulated (ADPCM). La contrapartida es que una vez comprimido no se puede modificar.
A continuación haremos referencia a los mas utilizados por los distintos paquetes de software del mercado.
Formato de archivo de sonido Microsoft Waveform (WAV)
Microsoft adoptó este formato para emplearlo con las extensiones multimedia de Windows. Almacena muestras de audio digital de 8 y 16 bits, gestiona los datos en mono o en estéreo y admite tres frecuencias de muestreo: 11.025 kHz, 22.05 kHz, 44.1 kHz, comprimidos o sin comprimir.
Formato de archivo de voz de Creative (VOC)
Admite muestras de 8 y 16 bits, admite frecuencias de muestreo de 11.025 kHz, 22.05 kHz, y 44.1 kHz, y los datos pueden guardarse comprimidos o sin comprimir ( solo para Sound Blaster ). El formato de archivo VOC usa el concepto de bloques de silencio, es decir, un periodo extenso de silencio se reemplaza en el archivo de audio con una marca y un valor de su duración temporal, con lo que se consigue un pequeño ahorro de espacio en disco.
Formato de Intercambio de Audio ( IIF )
Apple Macintosth utiliza el formato de intercambio de audio ( IIF ) para almacenar muestras de sonido digitalizado, admite varias frecuencias de muestreo y tamaños de muestra de hasta 32 bits por muestra. Las aplicaciones IBM PC normalmente no hacen uso de este formato.
Sound ( SND )
El formato de Archivo de Recursos de Sonido ( SND ) es un archivo compacto de solo 8 bits por muestra. Se utiliza normalmente para sonidos cortos como el sonido de la alarma del altavoz .
Que es el MIDI
El MIDI es un estándar de comunicación adoptado por todos los fabricantes de instrumentos musicales, ordenadores y aparatos de audio/vídeo en general.
Las siglas MIDI se corresponden con Musical Instruments Digital Interface. Los instrumentos musicales de hoy en día permiten transmitir al módulo de sonido el
" gesto del músico ". Es decir, que nota ha sido tocada, con que duración, con que fuerza, etc...
El MIDI, es por tanto, un protocolo de comunicaciones de datos capaz de permitir que un instrumento musical pueda controlar a otro.
Las posibilidades del MIDI son ilimitadas, pero podemos resumirlas en:
Anteriormente se dijo que el MIDI permitía que un instrumento controlar a otro o incluso a varios, pues bien, el instrumento que se encarga de controlar recibe el nombre de Maestro. Por el contrario, el instrumento controlado recibe el nombre de Esclavo.
En principio, una configuración MIDI debe contar al menos con un instrumento maestro y otro esclavo.