sábado, 24 de enero de 2015

Introducción al Audio Digital (tercera parte)

Características del audio digital

1-Frecuencia de muestreo

    El proceso de captura de audio a soporte digital ser conoce como "muestreo" (sampling, en el ámbito de los DJ). Esta operación de codificación del audio analógico a 0, 1 tiene lugar a tiempo real, es decir mientras la señal de audio analógico (audio "real") se reproduce. En los grabadores de audio digital, tanto en sistemas dedicados como en las tarjetas de sonido populares, existe un componente llamado conversor AD (analógico-digital, es decir el componente que se encarga de convertir señales eléctricas a cadenas binarias). El proceso inverso, es decir la reproducción utiliza un conversor DA (digital-analógico). El conversor aplica una "rejilla" de tiempo al audio y captura el audio comprendido en las casillas de la rejilla. Podemos utilizar un ejemplo muy sencillo. Si queremos grabar un atleta que corre durante" x" metros en una pista olímpica, necesitamos una cámara que corra junto a éste (imagina la clásica cámara montada en rieles). Esta cámara capturará 25 fotos (frames, en el argot) por segundo. ¿25 y no 98 o 4.7? 25 fotos por segundo es más que suficiente para engañar al ojo humano y hacerle creer que esta sucesión de fotos es un movimiento real de un señor corriendo. Para capturar el audio de ese corredor necesitamos un micrófono y un grabador de audio que "fotografíe" el sonido. Para engañar al oído, necesitamos más de 25 fotos por segundo, bastantes más...44.100 fotos por segundo, para ser exactos.


    En el mundo del audio no se utiliza la expresión fotos por segundo, sino que se habla de la Frecuencia de Muestreo. Una frecuencia de muestreo de 44.100 se conoce como 44.1 kHz (Kilo Hercios). Esta frecuencia de muestreo permitiría no diferenciar la fuente un sonido que se produce en la habitación de al lado, oiríamos a un señor hablando y no sabríamos si es real o una grabación que se está reproduciendo. Si la frecuencia de muestreo fuera menor, por ejemplo 22.050 kHz, ese señor tendría una voz muy opaca, como si hablase con una mano tapándose la boca. Nos parecería muy raro, no sería una voz natural. ¡No podrían engañarnos!


    Existe una relación matemática que relaciona la frecuencia máxima registrable (es decir, hasta qué frecuencia podremos grabar) en función de la frecuencia de muestreo. Estamos hablando del teorema de Nyquist y básicamente nos dice que si queremos grabar una señal de audio que llega hasta "x" frecuencia, debemos utilizar una frecuencia de muestreo mínima de "2x", es decir el doble de la frecuencia más alta originada en la señal que deseamos grabar. Por ejemplo, si queremos grabar una señal de audio que llega hasta los 20 KHz, Nyquist nos dice que necesitamos una frecuencia de muestreo mayor o igual a 40kHz. Todos los CD del mercado reproducen audio con una frecuencia de muestreo de 44.1kHz, es decir, pueden reproducir perfectamente señales de audio con frecuencias de hasta 22050Hz (que es justamente el límite de frecuencias teórico que podemos oír los humanos; los elefantes poseen un límite inferior por debajo de los 10Hz y las hormigas mayor a 22kHz). La radio digital emplea una frecuencia de muestreo de 32kHz (hasta los 16000Hz) frente a los 96kHz del estándar DVD (hasta los 48000Hz). Por lo tanto..
.

2- Resolución de bits

    Ya sabemos que necesitamos tomar 44100 "fotos" del sonido por segundo, pero ¿estas fotos cómo se almacenan? En forma de bits, cadenas de 0 y 1 totalmente manejables por el ordenador. La cantidad de bits que se utilizan para representar la muestra del audio es la resolución de la muestra. Una resolución de 8 bits (1 byte) permite manejar valores de entre 0 a 255 (256 valores). Dicho de otra forma, para representar una señal máxima de 255 necesitaré 8 dígitos binarios (0 o 1) y en este ejemplo, 255 es 1111111 en binario (8 dígitos 1). Una palabra de 16 bits (2 bytes) maneja un valor máximo de 65535 (65536 si contamos el 0 como valor), 1111111111111111=65535.


    De esta forma, cada uno de las 44100 capturas realizadas contiene un valor codificado en "x" bits. Cuanto mayor sea la resolución, más calidad tendrá la grabación. Tanto la frecuencia de muestreo como la resolución tienen incidencia directa en la calidad de la grabación y reproducción de audio digital. La resolución, por su parte, también tiene incidencia directa en el rango dinámico o relación señal-ruido de la grabación (abreviada S/R o S/N en inglés y se mide en dB o decibelios). Existe una relación que indica que esta relación S/N es igual al resultado de multiplicar la resolución de bits por 6. Una grabación a 8 bits posee una relación S/N de 54dB, una de 16 bits 96dB y 144dB a 24 bits. Tengamos en cuenta que estos dB son valores teóricos y que en la práctica bajan sustancialmente debido a los componentes analógicos de los grabadores tarjetas de sondo, etc... Lo normal es que un grabador a 16 bits alcance los 90-92dB y lo extraordinario es que efectivamente nos entregue una S/N de 96dB. Para nosotros, los humanos, un rango dinámico de entre 90 y 100dB es suficiente. Estas cifras salen del propio rango dinámico humano, la diferencia entre el umbral de dolor y el umbral de audición

3-Rango dinámico / Relación señal ruido

    La relación señal ruido (S/N) es la diferencia entre el nivel de señal útil (música, sonido, etc...) y el nivel de ruido (ruido provocado por señales eléctricas en el interior de un equipo electrónico). El ruido se mide sin ninguna señal a la entrada del equipo. Para calcular este valor se toman mediciones del nivel de señal cuando se captura o se reproduce audio y se restan de las mediciones al mismo nivel sin señal alguna en las que puede apreciarse el ruido inherente del propio aparato. Dicho de otra forma, es la diferencia entre el nivel de la señal nominal y el nivel de la señal residual, al mismo nivel de trabajo.

     Una prueba muy sencilla, al escuchar música en tu mini-cadena hi-fi, sube el volumen al máximo (en modo stop) y comprobarás como el ruido residual aumenta ¿te gusta? Si con el volumen máximo pulsases el "play", el audio se reproduciría a su máximo volumen, la diferencia de volumen entre ese audio "a tope" y ese ruido residual es la S/N. Cuanto mayor sea la diferencia de volumen entre la señal útil y el ruido, mayor calidad tendrá el mismo. Técnicamente la señal se mide en voltios y para pasar a dB se calcula el 20·log(S/N) donde S es el valor de la "Señal" y N el valor del "Ruido" o "Noise", en inglés. Cuanto mayor sea el valor de S/N mayor calidad tendrá el audio.


    Ahora planteémonos un problema muy interesante. El hombre, como especie animal, tiene una limitación en su oído; no podemos oír toda la gran gama de frecuencias generadas en la naturaleza (o por medios artificiales, como esos antiguos mandos a distancia por ultra-sonidos). A partir de las frecuencias cercanas a los 20.000Hz, el silencio penetra en nuestros oídos. ¿Qué puede ocurrir si registro una señal de audio con un sonido que va más allá del umbral humano?
Imaginemos que estamos grabando audio con una frecuencia de muestreo de 44.1kHz y en ese audio se reproducen frecuencias cercanas a los 29.000Hz (que naturalmente no podemos oír). Nuestra grabación registrará todas las frecuencias hasta los 22.050Hz pero aparecerá un ruido de 15.1Hz (44.1kHz-29kHz), algo totalmente audible que en el original no existía. Estas frecuencias fantasmas se llaman "alias", dando nombre a una distorsión conocida como "aliasing". Para prevenir esto, tanto los sistemas de grabación de audio como las tarjetas de sido incluyen un filtro "anti-alisasing" que no permite la entrada de frecuencias superiores a la mitad de la frecuencia de muestro; estamos hablando otra vez de Nyquist.

Mr. ArzNova

lunes, 19 de enero de 2015

Introducción al Audio Digital (segunda parte)


Soporte digital y analógico: las diferencias más importantes entre el soporte analógico y el digital


Soporte Analógico

    Degradable: Cuantas más veces se usa, mayor degradación se obtiene. Los datos se almacenan físicamente sobre unsustrato que es mucho más alterable con el paso del tiempo.
Lineal: El audio se graba secuencialmente en el tiempo y con el mismo orden de ejecución, de principio a fin.
    Calidad de audio: La calidad de un sistema de grabación analógico resulta inferior a la mínima calidad de audio ofrecida por un sistema digital. En la práctica, un sistema analógico rara vez supera los 70dB de relación señal ruido (SNR). Un grabador profesional analógico puede alcanzar los 85dB SNR. Inicialmente, no es importante saber qué es la relación señal ruido, sino simplemente tener constancia de las distintas cifras que miden esta importante característica de las tarjetas.


    Por otro lado, deberíamos evitar una sensación de triunfalismo absoluto del audio digital frente al analógico. En buen técnico de sonido puede lograr que una canción suene increíblemente bien en sistemas analógicos, de hecho tenemos toda la industria de la música para demostrarlo. Aunque el medio analógico sufre muchos problemas de calidad e inestabilidad, los grandes profesionales de producción saben cómo solucionar estos problemas. ¿Qué problemas?


    Por ejemplo, la diafonía e imperfecciones de la mecánica. Los distintos canales de una grabadora analógica suelen mezclarse, es decir, parte de la señal de un canal también se percibe en otro canal. El propio medio analógico provoca que parte de la señal de un canal se "cuele" en el otro canal. Un método para evitar este problema consiste en utilizar cintas más anchas, en las que las pistas ocupan más espacio físico. Por otro lado, las imperfecciones de la mecánica empleada para la reproducción sonora dan lugar a problemas de wow, flutter, tremolo, etc. Otras notables diferencias son la separación entre los canales izquierdo y derecho, la relación entre la señal y el ruido de fondo, la linealidad de la respuesta en frecuencias y de fase, la relación entre el nivel más bajo y el más alto.


    Edición destructiva: La edición de las grabaciones de audio en el mundo analógico es totalmente destructiva, baste un sólo ejemplo para comprobarlo. Algo tan sencillo como copiar un fragmento del estribillo, significa grabar ese fragmento en otra cinta, reproducir esta mientras la original inicia la grabación a partir del punto deseado. La edición en el mundo analógico es siempre destructiva e incluso a veces se destruye parte del propio medio en el que reside la grabación, la cinta o bobina (en operaciones de copia en las que se requiere cortar físicamente la cinta). Por otro lado, el tiempo invertido en la edición es extremadamente elevado así como los costes en términos el precio en términos de pruebas fallidas y errores humanos
.

Soporte Digital

    No degradable: Una grabación de audio digital es una cadena gigante de 0 y 1 perfectamente ordenados. Es imposible que "el paso del tiempo" convierta un 0 a un 1, es decir que pueda alterar esa cadena. Como mucho, es posible que una mala manipulación del soporte (por ejemplo el CD) provoque que durante un instante aparezcan artefactos o ruidos que originalmente no estaban. Lo que nunca ocurrirá es que el audio de ese soporte digital vaya apagándose, perdiendo brillo con el paso del tiempo. La durabilidad de los datos es eterna, puesto que pueden ser almacenados en cualquier dispositivo de almacenamiento, como puede ser un disco duro, una memoria, etc., y recuperados en cualquier momento

    Lineal / No-lineal (acceso aleatorio): Si en el mundo analógico el tiempo es algo fijo e invariable (una canción se registra de principio a fin) en el mundo digital no tiene por qué ser así. Existe un soporte digital llamado DAT que está basado en cinta analógica aunque en ella se registran 0 y 1 como un en CD pero con una calidad superior a éste. En este caso, la grabación y reproducción es lineal. Si deseo ir al final de la canción, debo pulsar el botón Fast Foward y esperar a que la cinta llegue a su punto. Considerando el disco duro de nuestro ordenador como soporte digital (archivos wav, aiff o MP3) llegamos a la inequívoca conclusión de que es un soporte no lineal. Los 0 y 1 de las canciones que registramos se almacenan por todo el disco duro sin orden alguno. El acceso a cualquier parte de esta canción (una vez grabada) es instantáneo, no hay tiempo de espera, dicho de otra forma, se tarda tanto en reproducir desde el inicio de la canción como, en mitad de ella: apenas unos milisegundos.

    Calidad de audio: La calidad de audio del soporte digital, es mayor que la del analógico. La respuesta de frecuencias, es decir el espectro de frecuencias que el grabador digital es capaz de grabar es mucho mayor que el analógico, aunque en el caso del mundo digital la teoría y la práctica siguen caminos que pueden ser muy distintos, es decir, la calidad teórica de un sistema de audio a 24 bits es superior a la calidad que ofrece en la realidad, aunque esta realidad mermada es muy superior a la analógica; sea como sea, el audio digital siempre puede tener más calidad que el analógico.

    Diafonía imperceptible o casi nula: En los grabadores de audio digital, nunca ocurrirá que monitorizando una pista aislada podamos oír parte de la señal de sus pistas adyacentes. Cada pista de ese grabador digital registra y reproduce sus propias cadenas gigantes de 0 y 1. Es imposible que el ordenador se equivoque y sume 0 y 1 de distintas pistas.

    Edición no destructiva: El último aspecto es quizás el más interesante dentro de la vertiente creativa del sonido. Por primera vez es posible crear audio. La música siempre ha tenido efectos como reverberación, retardos, distorsiones y ecualización, pero por primera vez estamos ante el nacimiento de nuevos efectos de indescriptibles resultados. En la película MATRIX, cuando Neo es desconectado del mundo "Real" produce un interesante grito de dolor. Imaginemos a Andy Wachowski (director de MATRIX) diciéndole al técnico de audio que desea un grito humano que vaya convirtiéndose progresivamente en un grito digital, una voz que denote la existencia de un mundo digital, la sensación que debe percibir el espectador es la de que Neo abandona el mundo de los vivos para adentrase en el mundo de la máquina MATRIX. Ese efecto de sonido que apenas dura 3 segundos, es materialmente imposible de recrear sin la tecnología de procesado de audio digital. Si el grito de Neo original no hubiera sido grabado digitalmente en forma de 0 y 1, nunca se habría podido aplicar ese grado de manipulación. El procesado de estos efectos puede ser destructivo, es decir alterando la grabación original (los 0 y 1) son manipulados y alterados o bien no destructivos en el que los cálculos se realizan a tiempo real, es decir, "mientras el audio suena". En este caso el archivo original se mantiene intacto.

Mr. ArzNova

jueves, 15 de enero de 2015

Introducción al Audio Digital (primera parte)



¿Qué es el audio digital?


    Podríamos definir audio digital como la representación de una señal de audio mediante números, en general codificados en forma binaria (es decir con ceros y unos, el lenguaje interno de las computadoras). Entendemos como señal de audio cualquier objeto sonoro audible, el viento, el agua, nuestra voz, nuestra música preferida y evidentemente esos molestos "ruidos" nocturnos de los vecinos que no nos dejan dormir. Cualquier sonido puede representarse en números, al igual que cualquier imagen o gráfico.
    En términos menos genéricos, también podemos llamar audio digital a la tecnología que permite grabar, editar, mezclar y masterizar una señal de audio completamente en el dominio digital. Para ello existe un amplio surtido de aparatos y equipos que procesan la señal de audio en el dominio digital, dominio que ofrece muchas más ventajas ya que es totalmente "tratable" por una computadora, es decir, permite un grado de manipulación sin precedentes.

1-Introducción

    Para la gran industria de la música, el audio digital nació de una necesidad muy concreta; ahorrar tiempo de producción. Antes del audio digital, el método de grabación era lo que hoy en día se conoce como grabación analógica, los impulsos del sonio se registraban en una bobina o cinta. La edición de esa bobina era un proceso muy largo y tedioso, en el que la precisión y paciencia eran algo obligado. Por otro lado, obtener un buen equipo analógico era algo realmente caro. Hablando de creatividad de mezclas y producción de audio, los procesos que podían aplicarse eran muy limitados comparados con los de hoy en día. Por poner un ejemplo, si se requería una reverberación concreta el músico debía registrar su interpretación en la sala que producía esa reverberación.

    La introducción del audio digital ha revolucionado, sin duda alguna, toda la industria de la música, las empresas que construyen instrumentos, los creadores o músicos, los procedimientos de edición y mezcla, y desde luego el soporte; es decir lo que nosotros oímos en casa: un CD de audio o los tan famosos MP3. La tecnología del audio digital ha dado lugar a toda una nueva legión de instrumentos musicales que prometen un grado de libertad de creación de sonidos sin precedentes (solo superada por la síntesis virtual). Estos nuevos instrumentos han propiciado la existencia d nuevos estilos musicales que dependen en gran parte de esa tecnología. Un ejemplo muy corriente puede ser lo que se conoce popularmente como música "dance" que no sólo se produce con instrumentos digitales sino que parte de la composición es un rompecabezas de otras grabaciones digitales realizadas por terceros y mezcladas hasta formar una nueva composición.

    El músico tradicional ha tenido que adaptarse a esos cambios. Cuando nacieron los primeros instrumentos digitales los músicos eran reacios a utilizarlos (el sintetizador el instrumento musical con más rechazo de toda la historia). Muchos pensaban que eran máquinas malditas que pretendían sustituir o imitar instrumentos tradicionales. No les faltaba parte de razón. El audio digital son fotografías digitales de sonido, por lo que no hacía falta tratar de imitar un piano, ya que tenemos la foto del sonido de un piano. La primera consecuencia fue la drástica reducción de costes de grabación. Para grabar un piano hacen falta micrófonos. Los micrófonos deben situarse correctamente según el ambiente y color que pretendemos dar a ese piano. Eso representa horas de pruebas y corrección de pequeñas imperfecciones producidas por el solapamiento de las señales de los micros. Si utilizamos un instrumento digital con un buen sonido de piano, sólo requerimos dos cables, izquierdo y derecho y siempre sonará igual de bien sea cual sea el entorno acústico. Aunque los primeros instrumentos digitales eran muy caros, hoy en cualquier ordenador incluye un instrumento digital, la tarjeta de sonido, que es muy limitada en comparación con los grandes sintetizadores de la industria, pero extremadamente más avanzada que los primeros instrumentos digitales.

    En el entorno del estudio de grabación, el audio digital también ha supuesto un importante avance. Ya no hace falta guardar celosamente las bobinas master (para que el paso del tiempo no las merme) el audio digital es indestructible, sólo puede destruirse deteriorando el medio en el que se almacena; un CD, un disco duro, etc.... También han desaparecido los tediosos procesos de cortar y pegar (hechos literalmente con tijeras y cola). Ahora existe la edición no lineal que como veremos más adelante puede ser destructiva o no. La ambientación de la mezcla ha pasado a ser una realidad palpable. Donde antes existían habitaciones enormes con paredes móviles para recrear reverberaciones, ahora existen pequeños equipos de no más de 5kg que incluyen ambientes de salas y halls famosos; podríamos cantar con el ambiente de en la opera de Sydney, aunque eso sólo existirá en nuestro cerebro, ya que en realidad estaríamos solos delante de un ordenador. Existen otros detalles menores, como el hecho de que por primera vez el músico puede grabar parte de su música en casa y luego seguir en un estudio, transfiriendo digitalmente las pistas. Esto ofrece una libertad de mezclas y producción de audio increíbles: un usuario sin recursos puede acudir a un estudio y seguir editando sin perder la calidad original.

Mr. ArzNova