HomeDivulgaciónLa señal de audio, conceptos y medidas

La señal de audio, conceptos y medidas

audio

El convertir una señal sonora en una señal de audio, nos va a permitir almacenarla, reproducirla o transmitirla. La utilización de dispositivos de almacenamiento, reproducción o transmisión nos obligará a tener en cuenta los márgenes de trabajo de dichos sistemas. Traspasar esos umbrales es multiplicar las posibilidades de un defectuoso tratamiento de la señal. Por lo tanto, es fundamental conocer y saber cómo funciona una señal de audio. Los medidores de señal serán unas de las herramientas para ayudarnos en esta tarea.
Sin embargo, la percepción auditiva es relativa. Cambia con la persona y la edad, las costumbres, la cultura, etc. De sobra es conocida la opinión de que el reproductor de CD no suena cálido, o que la conversión que realizan las tarjetas de audio dependiendo de la frecuencia de muestreo mejoran sensiblemente la calidad, o el concepto del LOUDNESS, o el factor de enmascaramiento, utilizado en los algoritmos de compresión, hace que sean muchos los factores que influyen a la hora de decidir si una señal de audio es correcta o no. Saber conjugar lo que nuestro oído nos dice y lo que un medidor nos muestra, es garantía de un resultado satisfactorio.

PROPIEDADES DE LA SEÑAL DE AUDIO

Se toma como norma que el ancho de banda de una señal de audio está entre los 20 Hz y los 20 Khz. Sin embargo, por lo expuesto anteriormente, pocas son las personas que escuchan por encima de los 16 Khz. o por debajo de los 40 Hz. No obstante, la reproducción de frecuencias por encima y por debajo de los márgenes de audición, crean a su vez, frecuencias sumas y restas que entran dentro del espectro audible. Limitar, por tanto, el ancho de banda a frecuencias que aparentemente no escuchamos, limita la riqueza armónica del conjunto. Ese fue uno de los grandes problemas que se encontró la industria del audio digital al principio, pues crear filtros que limitaran el ancho de banda, para no tener que procesar una frecuencia de muestreo muy alta creaba distorsiones de fase que afectaban al programa audible.
En una señal de audio encontramos tres aspectos fundamentales: Frecuencia, amplitud y fase. Una señal de audio está compuesta normalmente por una frecuencia fundamental y sus armónicos. Recordemos que estos últimos son normalmente múltiplos y submúltiplos de una frecuencia fundamental. Es lo que se llama el TIMBRE, y es lo que diferencia a dos fuentes de audio con la misma frecuencia fundamental. Como podemos imaginar, al ir sumando frecuencias fundamentales más la suma y diferencia de sus armónicos, más, a su vez, la suma y diferencia de frecuencias que existen por la interacción entre los propios armónicos, crea una forma de onda totalmente compleja con respecto al tiempo y la amplitud.
Observemos que en el espacio de tiempo representado, existen múltiples variaciones de nivel. Desde el punto de vista auditivo, existe un promedio llamado RMS (Root Mean Square) que es el valor medio (eficaz) de una señal alterna. O dicho de otra manera, es la forma matemática que tenemos de expresar la energía que contiene una señal de audio. Si tomamos una onda sinusoidal, el valor RMS es 0,707 veces su valor de pico. Sin embargo, si tenemos una onda cuadrada, ambos valores, pico y RMS son iguales. Es decir, que podemos tener dos señales con el mismo valor de RMS, pero distinto valor de pico, o a la inversa.
Otro de los valores que encontramos en la amplitud de la señal es el valor de pico a pico. Esta es la desviación máxima absoluta de la señal.
Con respecto a la fase la definiremos como la posición en la que se encuentra una onda desde que empezamos a contar el tiempo. Se mide en radianes o grados, siendo 360º= 2p rad. Si calculamos el coseno nos da un valor entre +1 y -1. El análisis de la fase en una señal estéreo es fundamental. Dos frecuencias con la misma amplitud, pero con distinta fase (180º entre ellas), se anularían, con el desastroso resultado que ello conlleva. Sin embargo darse cuenta de ello es más complicado. Si las sumamos desaparecen, pero si la tratamos como una señal estéreo y cada una de ellas la reproducimos en altavoces separados, lo que observamos es que aquellas señales que deberían sonar en el centro lo hacen por separado en cada altavoz. Es un problema, porque si al mismo tiempo está siendo reproducida en un dispositivo mono, por ejemplo una televisión, ésta desaparecería, pero nosotros no nos daríamos cuenta. El fasímetro, o el vectorscopio nos ayudará a monitorizar dicha señal. Si la fase tiende hacía +1 las señales están en fase. Si tienden hacia -1 están fuera de fase.
Los dispositivos electrónicos que generan señales estéreo a partir de señales mono, crean algoritmos para modificar la fase de la señal. Hay que tener cuidado al utilizarlos, ya que nos podemos encontrar frecuencias de la señal unas fuera de fase y otras no. No obstante, jugar con ella crea también interesantes efectos sonoros que pueden enriquecer nuestro trabajo.

EL DECIBELIO

Así como el oído no puede captar variaciones de presión infinitas, tampoco puede percibir infinitos niveles de presión sonora. Además, por su propia característica no percibe por igual una misma frecuencia a distintos niveles de presión. Tampoco las variaciones de presión las percibe de forma lineal, sino logarítmica, lo que la utilización del Belio, y su submúltiplo, el decibelio, como magnitud proporcional a la percepción auditiva nos ayudará a medirla. El decibelio es una unidad relativa de una señal, tal como la potencia, voltaje, etc. Los logaritmos son muy usados debido a que la señal en decibelios (dB) puede ser fácilmente sumada o restada. Lo utilizamos como unidad de referencia para medir la potencia de una señal o la intensidad de un sonido. Nos permite saber la ganancia de un sistema comparando su nivel de entrada y de salida. En términos de potencia, aumentos de 3 en 3 dB, implica el doble de potencia. Con respecto a la tensión, el doblarlo implica un aumento de 6 dB.
Al utilizar el concepto de octava estamos describiendo la capacidad logarítmica del oído con respecto a la frecuencia. Es dividir el espectro en varias secciones. Comenzando en una frecuencia específica cada octava más alta es el doble de la frecuencia. Es decir, si una octava comienza en 31,5 Hz., la siguiente octava comenzará en 63 Hz., la siguiente a 125 Hz., la siguiente a 250 Hz., y así sucesivamente, pero la distancia entre octavas en su representación gráfica es la misma. Al analizar espectralmente una señal de audio veremos representado lo que nuestro oído recibe. Otra cosa es lo que realmente oímos.
Mientras la medida de la presión sonora SPL (Sound Pressure Level) va desde el umbral de audición (0 dB) al umbral del dolor (140 dB) la señal de audio recorre desde la mínima señal (8) hasta un máximo sin distorsión (0dB).

RELACIÓN ENTRE DBU, DBM, DBV

El uso del decibelio procede de los principios de la telefonía. Debido a la longitud de los cables por los que circulaba la señal de un punto a otro, los ingenieros se dieron cuenta que utilizando 1mW de potencia sobre la impedancia de carga que suponía la línea (600 W), permitía transmitir la señal sin pérdida aparente de nivel, con una aceptable relación señal ruido, y sin utilizar grandes niveles de potencia. A ese nivel lo denominaron 0dBm (la m viene de milivatio), o 0,775 voltios. Sin embargo, cuando intercalaban un voltímetro para medir la señal, esta caía 4 dB, por lo que para compensarlo amplificaron la señal para que diera como resultado el nivel de señal deseado. Por dicha razón se utilizó + 4dBm o 1,23 voltios como estándar en cuanto a nivel de señal, pero siempre referenciado a una impedancia de 600W.
Con el paso del tiempo, y debido a la mejora en cuanto a la calidad de los circuitos empleados en los equipos electrónicos, estos eran capaces de generar apreciables niveles de corriente sin apenas inmutarse. Por lo tanto, ya no se hizo necesario que tuvieran una referencia de 600W, ya que eran capaces de entregar los niveles de señal requeridos ante cualquier impedancia. Así que ya no era cuestión de potencia a entregar, y de esta manera se desechó el concepto de dBm y empezó a aplicarse el dBu. Este entrega el mismo nivel de señal, pero independiente de la impedancia.
Los equipos domésticos no suelen tener transformadores que permitan establecer un estándar en cuanto a impedancia de entrada o de salida. En este caso se utiliza el dBV. Si el nivel de referencia en dBm o dBu a cero es 0,775 voltios, el nivel de referencia del dBV es 1 Voltio. Sin embargo, estos equipos trabajan a -10 dBV, o 0,316 voltios. Solemos encontrarnos también procesadores de efectos, dinámica, o incluso módulos de sonido que tienen ese nivel de salida, e incluso algunos un conmutador para poder conectarse a entradas de + 4 dBu 0 -10 dBV.
Dependiendo de la fuente que genere la señal de audio podemos encontrarnos:
–    Nivel de micrófono: de -60 dBu a -20 dBu
–    Nivel de línea: de -20 dBu a +20 dBu.

DINÁMICA

Como hemos visto, la señal de audio es una señal compleja que adquiere múltiples valores en una unidad de tiempo. Las diferencias entre el valor máximo y mínimo en un instante es lo que se denomina dinámica.
El margen dinámico es la relación entre el nivel más alto de señal y el mínimo valor sin ruido. El ruido es una señal no deseada que interfiere en la señal que deseamos. Por lo tanto ese nivel debe de estar lo más bajo posible en relación al nivel de señal. Esa relación se llama SNR (Signal Noise Ratio, en inglés relación señal ruido), medida en decibelios, por lo que cuanto mayor sea ese nivel mayor separación entre el ruido y la señal, y por lo tanto, mayor separación entre ambas señales. Se debe tender a tener el mayor  margen dinámico. Un vinilo tenía un margen dinámico de 40 dB, una cinta de cassette 60 dB, y en la actualidad, valores por encima de 100 dB son de lo más normal.

MEDIDORES DE VOLUMEN

Hace años siempre encontrábamos el mismo tipo de medidor, un dispositivo mecánico con una aguja que se movía dependiendo del nivel que reproducíamos. En la actualidad encontramos displays tipo LCD, electroluminiscentes, o pantallas de monitorización de video. Pero hagamos un poco de historia.
El Vúmetro (VU meter, medidor de unidades de volumen) fue el medidor estándar desde 1939. La velocidad de integración, o la velocidad con la que el medidor consigue el nivel de referencia es de 300mseg, velocidad  que simula la percepción auditiva. Si mostráramos todos los valores instantáneos de la señal, la velocidad sería tan rápida que no nos serviría para monitorizar. Por lo tanto a éste se le añade un picómetro, normalmente un led, que se enciende cuando supera un nivel preestablecido (normalmente + 6dB referenciado a 0dB el máximo nivel sin distorsión). Actualmente su uso va decayendo, utilizándose fundamentalmente en calibración.
En la actualidad, con la irrupción de los equipos digitales, tanto el vúmetro como el picómetro han sido sustituidos por el PPM (Program Peak Meter). Suele ser una barra de leds con tiempos de integración de aprox. 10mseg, mientras que su tiempo de caída suele estar en 20 dB/1,5 seg.
Como el nivel máximo de señal en digital corresponde al número máximo de bits de resolución, por encima de él, no debería de existir más señal, por lo que el 0 dBFS (decibel full scale), es el valor máximo.
Varios medidores PPM han sido desarrollados por diferentes países y compañías. Básicamente solo difieren en la definición de escalas, pues su tiempo de integración y caída son prácticamente idénticos. Entre otros podemos encontrar:
PPM DIN: Comúnmente utilizado en Europa de Este. Los rangos van desde -50 a +5 dB
PPM Nordic: Usado por Broadcasters en el norte de Europa. Rangos desde -42 a +12 dB.
PPM BBC: Desarrollado por la BBC en el Reino Unido, aunque también se utiliza en otros países. El rango va desde 1 a 7 ( cada paso corresponde a 4 dB)
PPM EBU: Adoptado por EBU en transmisión de señal. El rango va desde -12 a +12 dB
Digital EBU (DMU I): Relativo a señales digitales. Su rango va desde -60 a 0 dBFS.
Digital EBU (DMU II): Zoom digital. De -6 dBFS a 0 dBFS.

MODULACIÓN

El rango dinámico variará dependiendo del tipo de programa sonoro con el que trabajemos. La música clásica tiene mayor que la música comercial, sin embargo, no es lo mismo mezclar una misma señal para transmitir por televisión o para ser escuchada en cine.
En broadcast los márgenes EBU son:
·    En audio digital la señal test es un tono de 1Khz a -18 dBFS, EBU
·    En audio digital el máximo nivel permitido (PML) es de -9 dBFS
·    En audio analógico la señal test es un tono de 1Khz a 0 dBu= 0,775v RMS
·    En audio analógico el máximo nivel permitido es (PML) es de + 9 dBu
Para evitar que los dispositivos trabajen al máximo de sus posibilidades, normalmente se marcan un margen de 9 dB por debajo de ese valor máximo.

LOUDNESS

Podríamos definir el LOUDNESS como la percepción que tenemos del volumen de un programa sonoro.
Depende de múltiples factores como la no linealidad de la respuesta en frecuencia, nivel RMS, duración, enmascaramiento, fatiga del oído, agrado de la señal o no. Sin embargo, no está relacionado con los transitorios de audio y los picos de la señal.
Por esta razón, hay múltiples interpretaciones a la hora de determinar el correspondiente LOUDNESS percibido de una señal de audio.
Debido a la dificultad en la interpretación de este parámetro se han creado diferentes estándares a lo largo de los años. Valga simplemente destacar:
Zwicker (ISO 532-1975), K-system, TC-Electronic LARM, etc.
Dependiendo para qué y para quién, la medida del loudness variará si utilizamos un algoritmo u otro.
La ITU (International Telecommunications Union) ha definido los requerimientos de un sistema que pueda medir la señal loudness y opcionalmente los picos reales digitales. Ha introducido una nueva unidad: el LU (Loudness Unit) en la que una reducción de 10 dB en la señal muestra una reducción de 10 en la escala LU.

Ramón Sousa
POST TAGS:
Avid presenta "New T
TVC: los pioneros
Rate This Article: