HomeDivulgaciónEvaluación de formatos de compresión de vídeo para producción de contenidos en HDTV

Evaluación de formatos de compresión de vídeo para producción de contenidos en HDTV

formatos

Ante el reto que supone la inevitable migración a la TV de alta definición en la que están inmersos todos los radiodifusores, el grupo técnico HDTP (High Definition Television Production) de la EBU, ha llevado a cabo un conjunto plan de medidas con el objetivo de evaluar la calidad de los formatos emergentes de compresión de vídeo para entornos de producción en Alta Definición. Estos formatos se incorporan a los formatos  clásicos que han sido los pilares de la producción en HDTV desde finales de la década de los 90 hasta nuestros días, como son el DVCPRO HD de Panasonic y los HDCAM-SR, HDCAM y XDCAM HD35 de Sony.
A excepción del HDCAM-SR, todos ellos tienen como denominador común la utilización de submuestreos espaciales en las componentes de luminancia y crominancia, reduciendo sensiblemente la resolución nativa de los formatos de 1080 líneas y de 720 líneas.  Dicho escalado permite obtener un buen balance entre calidad y tasa binaria, pero puede llegar a comprometer la calidad final en producciones donde se requiera de una calidad extrema, que implique fuertes procesos de postproducción y en consecuencia que se incurra en numerosas fases de multigeneración.
La novedad de los formato de nueva generación como el AVC-I de Panasonic, XDCAM HD422 de Sony, Infinity J2K de Thomson o el DNxHD de Avid, es su capacidad para trabajar con las resoluciones nativas de Alta Definición,  adecuándose al emergente mercado de pantallas de usuario con capacidades de Full HD, así como la capacidad para trabajar con profundidades de píxel de 10bits.
También introducen novedades tecnológicas como la utilización de la transformada bidimensional Discreta de Wavelets de los formatos de Thomson definida en el estándar JPEG2000, que realiza una compactación energética de modo global en toda la imagen, a diferencia de las transformaciones locales clásicas basadas en la DCT con bloques de 8×8. En este último caso, el formato de Panasonic también introduce novedades en su  transformada DCT, al ser ésta de coeficientes enteros sin perdida de precisión, así como la introducción de una etapa de predicción Intracuadro de elevada ganancia, estando amparadas ambas novedades en los nuevos perfiles profesionales del nuevo estándar MPEG-4 AVC/H.264
A día de hoy nadie duda del hecho de que la producción en HDTV exige la elaboración de contenidos de muy alta calidad, con el firme objetivo de satisfacer  las tremendas expectativas que ha creado la HDTV en los usuarios, y que de no llevarse a cabo en estos términos, pueden provocar un fuerte rechazo en los espectadores.
Es por ello que en el seno del grupo HDTP, se decidió el llevar a cabo evaluación de la robustez de los nuevos formatos, con la misma metodología de pruebas desarrollada en la EBU/SMPTE Task Force que evaluó en 1998 la calidad de los formatos de compresión en definición estándar frente a la multigeneración. Dicha metodología se basa en el análisis de las calidades objetivas y subjetivas obtenidas en cada una de las generaciones producidas en la compresión y descompresión de los contenidos, considerando como límite máximo en un ciclo de producción la 7ª generación.
Siendo conscientes de que la futura producción con infraestructuras IT, eliminara en gran medida el número de etapas de multigeneración en el flujo de trabajo habitual, se consideró realista el escenario descrito con 7 generaciones, al existir todavía un gran número de elementos en las etapas de edición, almacenamiento y distribución entre otras,  que implican la sucesiva codificación y decodificación de contenidos.
Se generó una biblioteca con 14 secuencias ad hoc con resoluciones de 1080i25, 1080p25 y 720p50, con el objetivo de que ofrecieran una variada complejidad espacio-temporales, de modo que permitieran evaluar dichos formatos de  modo exhaustivo. De igual manera se intentó que dicha biblioteca cubriera un amplio espectro de géneros, desde escenas deportivas, drama, estudio y cine entre otras.
Como métrica de evaluación objetiva, y a pesar de la deficiente correlación con la calidad de la imagen percibida que presenta en muchas ocasiones, se optó por evaluar la PSNR (Peak Signal to Noise Ratio) con 10 bits de precisión. Esta métrica sigue siendo considerada como la única métrica neutra, que informa de modo «objetivo» la distorsión que introduce la etapa de comprensión.
La constatación de la mencionada deficiente correlación perceptual que presenta de la PSNR también en secuencias con resoluciones de Alta Definición, llevó a la investigación en el seno del grupo de trabajo, de modelos de percepción visual  subjetiva alternativos que permitieran su utilización como herramienta complementaria a las métricas basadas en PSNR.
En concreto se estudió la posible adaptación a los formatos de HDTV, de las cuatro  métricas objetivas de evaluación perceptual  aprobadas en el 2005 por el VQEG (Video Quality Experts Group) para definición estándar, y recogidas en las normativas ITU-R BT.1638 y ITU-T J.44,.  De todas ellas tan solo la «Edge PSNR» ofrece una implementación independiente de la resolución del formato bajo análisis, estando su arquitectura basada en el análisis de la degradación de los bordes de la imagen, al ser estos muy sensibles al modelo de percepción visual humano. Dichos bordes al contener elevados valores  de componentes energéticas de altas frecuencias, son fuertemente degradados por los sistemas de compresión de vídeo.
Los trabajos realizados, incluyeron la utilización del filtro de Canny como alternativa al filtrado clásico de bordes de Sobel, que permite independizar el algoritmo de los umbrales de decisión máximos y mínimos del detector. Los resultados obtenidos con esta métrica, mejoran sustancialmente la correlación con la calidad perceptual que ofrece la PSNR clásica.
Las siguientes imágenes se pueden apreciar como la detección de bordes es extremadamente precisa y selectiva, no generando falsos bordes debido al ruido inherente en las zonas de baja luminosidad, como suele ocurrir con algoritmos de detección basados en umbrales manuales.
En lo referido a la evaluación subjetiva de los distintos formatos, se llevó a acabo distintas sesiones de presentación a los miembros del grupo de trabajo sobre pantallas de distinta resolución y tecnología, con el objetivo de contrastar las ligeras distorsiones apreciadas, que en ningún caso como es de suponer, son equiparables a las distorsiones clásicas de blocking, Blurring o Tilling, percibidas por los formatos de difusión a baja velocidad.
Las conclusiones y una visión global de los resultados obtenidos en estas pruebas, son resumidas en la recomendación EBU R-124 donde entre otras se concluye lo siguiente:
–    Los formatos progresivos son más robustos a la multigeneración que los formatos entrelazados.
–    Se recomienda la utilización de formatos 4:2:2 sin submuestreo espacial, siendo suficientes 8 bits para producciones que no requieran de una fuerte postproducción.
–    Para formatos que trabajen en modo Intra-frame, no es aconsejable utilizar tasas binarias inferiores a 100 Mbps, si se quiere mantener una calidad casi transparente después de 4 ó 5 generaciones.
– De igual modo, en los supuestos de formatos que trabajan en modo «Long GOP», la tasa binaria mínima para asegurar la calidad en los parámetros descritos anteriormente, debe ser como mínimo de 50Mbps.

TXT: Damian Ruiz Coll Corporación RTVE
Crestron ISYS 5.7”
La nueva TV interact