informe avc-intra 2013 · panasonic 3 definiciÓn de clase la implementación del avc-intra por...
TRANSCRIPT
Panasonic
2
Concepto y especificaciones de AVC-INTRA
INTRODUCCIÓN
Como alternativa a la familia de formatos de grabación basados en la compresión DV, Panasonic apostó
en el año 2006 por la tecnología de compresión H.264/MPEG-4 AVC. Hasta la fecha, se han
implementado dos códecs basados en esta tecnología, concretamente AVCHD y AVC-Intra.
AVCHD se basa en compresión intercuadro o de largo GOP, para ofrecer así un bit-rate bajo, de entre 6 y
28Mbps. De este modo, es un codec conveniente para disfrutar de muchos minutos de grabación en una
misma tarjeta de memoria, para enviar vídeos por la red, o para ocupar poco espacio de almacenamiento.
En cambio, la compresión de AVC-Intra es intracuadro, es decir, sólo considera cuadros I. Pensado para
producción de alto nivel en alta definición, AVC-Intra es un codec de vídeo de alta eficiencia, que se
encuentra disponible en la mayoría de camcorders profesionales P2 HD de Panasonic. La adopción del
estándar H.264 ha sido posible gracias a los avances experimentados en la tecnología de compresión,
representados por procesadores cada vez más potentes y por el abaratamiento de la memoria. Aún así,
se trata de un codec con un gran coste computacional, lo que obliga a trabajar con sistemas de edición de
ciertas garantías.
El material codificado en AVC-Intra se graba en forma de ficheros MXF en tarjetas de memoria P2. La
compresión intracuadro (I-only) facilita la edición con precisión de frame, y evita la propagación de errores
a lo largo del grupo de imágenes (GOP). Además, la estabilidad de la calidad de imagen está asegurada
gracias a la no influencia de los cuadros adyacentes. Igualmente, la compresión I-only es conveniente
para el procesado en paralelo con las CPU multi-procesador (multi-core), y también para el procesado con
codecs de software.
FAMILIA AVC-ULTRA
AVC-Intra forma parte de la familia AVC-Ultra, un conjunto de formatos de grabación de Panasonic que
contempla diferentes opciones de compresión para diferentes aplicaciones, desde producción de alta
gama hasta flujos de trabajo basados en proxy de muy bajo bit-rate. La progresiva utilización de las redes
IT en detrimento de la transmisión de vídeo SDI proporciona una gran flexibilidad de operación, ya que
una misma red de datos puede transportar diferentes niveles de calidad de vídeo, cada uno optimizado
para las necesidades de cada usuario o aplicación.
Por un lado, AVC-Ultra da cabida a tres clases de AVC-Intra (50, 100 y 200), con perspectiva de dar
soporte a señales que van más allá del HD: 2K, 4K, 4:4:4, etc. Por otro, y con denominación AVC-Long G,
AVC-Ultra ofrece códecs HD con un bit-rate típico de definición estándar (25 y 50Mbps), con calidad 4:2:2
y 10 bits. Por último, y con el fin de enviar vídeos a través de Internet o para flujos de trabajo offline, el
codec AVC-Proxy permite disponer de vídeos de muy bajo bit-rate, de entre 1 y 3.5Mbps.
Panasonic
3
DEFINICIÓN DE CLASE
La implementación del AVC-Intra por parte de Panasonic es flexible para el usuario, que puede escoger
entre diversas calidades, denominadas clases (Class). Actualmente, se puede elegir entre Class100 o
Class50, que actualmente, ofrecen un bit-rate de vídeo de 100 o 50Mbps respectivamente. Próximamente,
se le añadirá la Class200, con un bit-rate de 200Mbps o más. Conviene no confundir la clase con el
bit-rate, ya que a medida que se incorporen nuevos formatos y nuevas clases, la correspondencia entre
ambos conceptos puede no coincidir, como se explicará más adelante.
La clase se asocia con un nivel de calidad de imagen, a partir de las especificaciones técnicas de
resolución, velocidad de cuadro, muestreo y profundidad de color. El bit-rate es el resultado de la
combinación de todos ellos. Dentro de una misma clase, puede haber diferentes bit-rates, ya que se
contemplan diferentes formatos (1080i, 1080p, 720p, etc.). En particular, el bit-rate del formato 1080/50p
es el doble que el de los formatos 1080i y 720p.
La clase AVC-Intra 100 ofrece resolución completa HD (1920x1080 o 1280x720 muestras) y se ajusta
completamente al perfil High 4:2:2 con muestreo 4:2:2 y codificación de 10 bits. En formato 1080/50i o
720/50p, el bit-rate resultante es de 111.8Mbps, que suele simplificarse como 100Mbps. La clase 100 está
destinada a aplicaciones broadcast y producción de alto nivel.
Con objeto de reducir la tasa binaria a la mitad, la clase AVC-Intra 50 se ajusta al perfil High 10 con
muestreo 4:2:0 y 10 bits, partiendo de una señal prefiltrada (1440x1080 o 960x720). En formato 1080/50i
o 720/50p, el bit-rate resultante es de 54.3Mbps, que suele simplificarse como 50Mbps. La clase 50 es
una buena opción para aplicaciones ENG, ya que permite optimizar el ancho de banda disponible
conservando el esquema de compresión intracuadro.
La clase AVC-Intra 200 se incorporará a la familia AVC-Ultra a partir de 2013, implementando un codec
apto para archivo y para masterización, visualmente sin pérdidas. Las especificaciones son similares a la
clase 100, es decir, resolución completa, muestreo 4:2:2 y codificación a 10 bits, pero con el doble de
bit-rate: 227Mbps en formato 1080/50i, y 455Mbps en formato 1080/50p.
Como puede observarse, AVC-Intra utiliza los perfiles altos (High) incorporados por la extensión FRExt en
H.264. Siguiendo con el concepto multi-formato de la marca, AVC-Intra soporta señales tanto de 1080
como de 720 líneas, con exploración progresiva o entrelazada y todas las velocidades de cuadro posibles.
La familia AVC-Ultra contempla todavía una clase más de calidad superior, denominada Class4:4:4, con
resoluciones de 2K y 4K, y profundidad de color de 12 bits, que se hallará disponible en un futuro próximo.
En cuanto al audio, se mantiene la filosofía de no comprimir el sonido (codificación PCM lineal), con dos
calidades seleccionables en la mayoría de equipos: 48KHz y 16bits, o 48KHz y 24bits. Normalmente, los
camcorders ofrecen 4 canales de grabación de audio, aunque el sistema P2 contempla hasta 8 canales.
Panasonic
4
SUPERIORIDAD DEL MODO INTRACUADRO (I-only)
Los métodos de compresión de vídeo se pueden dividir básicamente en dos tipos. Uno es la compresión
intracuadro (sólo cuadros I, o en inglés I-only) que completa todo el proceso de compresión en un solo
frame, mientras que el otro es la compresión de largo GOP (Group Of Pictures), que se completa a lo
largo de varios cuadros. Ambas características se representan en la tabla 2.
Compresión I-only Compresión Largo GOP
Unidad procesada de
compresión
1 frame
時刻I0 I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 I11、フレーム間の参照関係が無く 毎フレーム独立に圧縮
Múltiples frames (cerca de 15 frames)
時刻B0 B1 I2 B3 B4 P5 B6 B7 P8 B9 B10 P11
、フレーム間で参照関係があり GroupOfPicture単位に圧縮
Disminuir el bit-rate Correlación sólo en cada frame Correlación entre múltiples frames
Retardo por procesado 1 frame Múltiples frames
Dependencia de la calidad
de imagen Dentro de un frame Afecta a múltiples frames
Facilidad de edición Fácil (cuadro a cuadro) Complicado (GOP)
Propagación del error Máx. 1 frame Múltiples frames
Deterioración en copia Dentro de un frame Múltiples frames
Procesado paralelo Máx. 1 frame Múltiples frames
Tabla 2: Características de la compresión I-only y Largo GOP
La compresión de largo GOP tiene la ventaja de producir una tasa binaria baja, asumiendo que la imagen
adyacente es muy similar. Sin embargo, hay muchas imágenes que no se adecuan a la condición anterior,
como por ejemplo un reportaje con flashes, imágenes de deportes con movimiento intenso, y programas
musicales con efectos de luces.
AVC-Intra adopta la compresión I-only para satisfacer las demandas de todo el flujo de trabajo, tanto en
captación como en edición. A diferencia de otros formatos de captación como DVCPROHD o XDCAMHD,
AVC-Intra preserva la calidad de imagen al más alto nivel, en parte gracias a la codificación de 10 bits. En
este sentido, rivaliza con codecs propios de post-producción, como ProRes422 y DNxHD, aunque con
una tasa binaria inferior. Si bien AVC-Intra presenta un alto coste computacional, con la progresiva
adopción de los sistemas multiprocesador de 64 bits, esto ha dejado de ser ya un inconveniente. De
hecho, la capacidad computacional de los sistemas actuales es de tres a cuatro veces superior a la de los
sistemas existentes en el momento que se introdujo el codec.
Cada frame es independiente
tiempo tiempo
Los frames B y P dependen de otros frames
Panasonic
5
COMPARACIÓN CON MPEG-2
Para mejorar la eficiencia de la compresión intracuadro, AVC-Intra selecciona un conjunto de
herramientas del estándar H.264. Estas herramientas permiten utilizar nuevos algoritmos y opciones
avanzadas de compresión, que hasta ahora no eran posibles debido a las limitaciones de hardware.
Como resultado, incluso con compresión intracuadro, AVC-Intra es el doble de eficiente que MPEG-2.
Dos métodos específicos contribuyen decisivamente a mejorar la eficiencia: la predicción intracuadro y
la codificación de entropía CABAC.
• Predicción Intra-cuadro
Se trata de un proceso que parte de unos elementos de imagen pre-codificados, con el fin de encontrar
elementos similares dentro del mismo cuadro de vídeo.
Obsérvese la imagen de entrada original en el codificador y la imagen de predicción generada a partir de
la imagen de entrada. Si el modo de predicción se ha escogido bien, la imagen de predicción se parecerá
mucho a la imagen original.
Cuando la imagen de predicción se resta de la imagen de entrada original, se genera una imagen residual
como la que se puede ver en la figura. Como se ha dicho, cuando la predicción es buena, los bloques
residuales poseerán valores pequeños. En la imagen residual, las áreas grises al 50% representan
valores cero, es decir, indican que allí la predicción es igual a la imagen original. Las áreas más oscuras y
más claras representan los errores entre la imagen original y la de predicción. Si la imagen residual es
muy gris, significará que el error es pequeño y, por tanto, se comprimirá muy bien.
Imagen original Imagen de predicción intra
Panasonic
6
A continuación, se aplica la DCT sobre la imagen residual, y luego se cuantifican los coeficientes DCT,
haciendo los valores de cada bloque todavía más pequeños. Dado que la cantidad de información de la
imagen residual puede reducirse gracias a la alta precisión de la predicción intra, se consigue una
compresión altamente eficiente incluso en modo I-only. A diferencia de la predicción intercuadro empleada
en la codificación de largo GOP, la predicción intracuadro se realiza dentro de un frame, por lo que la
precisión de la predicción no se ve afectada a causa del movimiento en la escena. La eficiencia se debe
a la facilidad de comprimir la imagen residual.
• Codificación de entropía CABAC
La codificación de entropía es la última etapa del proceso de compresión, y está basada en el
comportamiento estadístico de las señales de vídeo. Consiste en una codificación sin pérdidas que
sustituye los datos por símbolos codificados que, en combinación con las predicciones, las
transformaciones y la cuantificación, suponen una reducción considerable de bit-rate. Eso sí, la
codificación de entropía por su cuenta sólo aporta una modesta reducción de datos; la verdadera
reducción se produce al considerar todo el conjunto de procesos que componen el codificador.
La codificación de entropía no introduce pérdidas (representa la información de una forma diferente, con
menos bits). La compresión DV (DVCPRO) utilizaba una codificación de entropía VLC (Huffman), que
asigna menos bits a los símbolos más frecuentes, y más bits a los símbolos menos frecuentes. La
asignación se hace en base a una única tabla de referencia.
CAVLC es lo mismo que VLC pero aplicada al contexto. A tal efecto, tiene más tablas de referencia, y
escoge la que más conviene según el contenido de cada imagen. Este modo es más sencillo que CABAC,
y por eso se aplica en el modo AVC-I 100M.
La codificación aritmética de entropía utilizada en el estándar AVC recibe el nombre de Codificación
Aritmética Binaria Adaptativa al Contexto (CABAC). Por contexto se entiende “circunstancias del entorno”,
y es un método utilizado para lograr una compresión más eficiente mediante el ajuste de los parámetros
de codificación según las características de la imagen. CABAC da mejores resultados con bit-rates bajos.
Por eso se aplica en el modo AVC-I 50M, además de Blu-Ray y AVCHD.
MPEG-4 AVC/H.264
MPEG-2
VLC CAVLC CABAC
Método de codificación Codificación Longitud Variable (VLC) Codificación aritmética
Proceso de ajuste al
contexto No
Unidad de
coeficiente DCT Unidad de 1 bit
Eficiencia de compresión Moderada Muy buena Excelente
Tabla: Comparación de métodos de codificación de entropía
Panasonic
7
PSNR COMO MEDICIÓN DE CALIDAD
La relación señal-ruido de pico (Peak Signal-to-Noise Ratio) mide la diferencia entre las imágenes
originales y descodificadas de una secuencia de vídeo. Cuando las mediciones de PSNR se realizan
sobre la misma secuencia, el codificador que consigue la PSNR más alta es el que ofrece también la
mayor calidad de vídeo. Cuando se considera la información de croma, se utiliza la fórmula ponderada de
0.8Y + 0.1Cr + 0.1Cb.
Comparación entre formatos de compresión MPEG-4 AVC a bit-rates elevados
Fuente: revista Broadcast Engineering, Junio 2008
En los diferentes tests realizados para comparar las codificaciones MPEG-4 y MPEG-2, se observa que la
compresión MPEG-4 AVC 4:2:2 de 10 bits puede llegar a ofrecer una PSNR de 6dB o más que la
codificación MPEG-2 4:2:2 de 8 bits. Además, en MPEG-4 AVC no se produce el efecto damero típico de
MPEG-2, gracias al uso de un filtro desbloqueador (in-loop deblocking filter). Este filtro es obligatorio en
cualquier codificador MPEG-4 AVC/H.264.
Comparación entre AVC/H.264 H422P y MPEG-2 H422P.
Fuente: revista Broadcast Engineering, Mayo 2009
Panasonic
8
PROFUNDIDAD DE COLOR DE 10 BITS
A diferencia de la mayoría de formatos de grabación (que se basan en una codificación de 8 bits por
muestra), AVC-Intra codifica cada muestra con 10 bits. Al tratarse de un sistema binario, la diferencia en
esos dos bits extra es muy notable: si con 8 bits se pueden codificar hasta 256 niveles, con 10 bits se
pueden codificar hasta 1024 niveles. Esta codificación de niveles o tonalidades se denomina también
profundidad de color.
Cuando se trabaja con una profundidad de color de 8 bits, puede aparecer un problema de banding en
imágenes con degradados de color, como por ejemplo el azul del cielo, un amanecer o una puesta de sol.
El banding (o posterización de color) se produce por la falta de bits para representar todas las tonalidades
de un gradiente de color, y es algo inherente a las imágenes de 8 bits (que sólo se pueden representar 256
tonalidades). En cambio, cuando la profundidad de color es de 10 bits, no se produce banding, ya que se
pueden codificar prácticamente todas las tonalidades presentes en la imagen.
Asimismo, una profundidad de color de 10 bits proporciona mejores resultados para la extracción del color
de fondo en un chroma key, o para la aplicación de efectos de color sobre la imagen (filtros, retoques, etc.).
En general, la profundidad de color de 10 bits es beneficiosa para cualquier proceso de postproducción.
Imagen de 8 bits con banding Imagen de 10 bits sin banding
8 bits
(256 niveles)
10 bits
(1024 niveles)
Panasonic
9
ESTABILIDAD y COSTE COMPUTACIONAL
En comparación con compresión Long GOP, AVC-Intra ofrece estabilidad, es decir, calidad de imagen
constante. En cambio, Long GOP es inestable (a veces bien, a veces mal). Por ejemplo, Long GOP
introduce pérdidas en imágenes con zoom-in/out, paneos, flashes… Lo mismo cuando se realizan copias
del material (multigeneración). Asimismo, la compresión Intra saca un mayor rendimiento del procesado
en paralelo, por ejemplo con la tecnología Core Duo.
Tal como sucede con el codec DVCPROHD, y a diferencia de otros códecs de alta definición, existe un
descodificador de software para AVC-Intra. Esto facilita la edición no lineal en nativo y la integración IT.
Además, el decoder funciona a tiempo real, gracias a la compresión Intra. Asimismo, AVC-Intra puede ser
reproducido por cualquier descodificador H.264 de perfil High 10.
COMPATIBILIDAD CON OTROS SISTEMAS
AVC-Intra goza de un gran soporte en la industria de producción audiovisual. A la hora de editar o de
etalonar, Apple (Final Cut Pro), Avid (Media Composer, Symphony), Adobe (PremierePro), Grass Valley
(Edius, Aurora), Autodesk (Smoke, Flint, Flame, Inferno, Lustre), SGO (Mistika), Assimilate (Scratch), DVS
(Clipster), Quantel (eQ, iQ, sQEdit) y Harris (Velocity) proporcionan soluciones compatibles con AVC-Intra
de forma nativa. Como sistemas completos de noticias, Avid, Dalet, Bitcentral y Cinegy dan soporte al
formato AVC-Intra. En ninguno de ellos hay que transcodificar antes de empezar a editar, lo que acelera
enormemente el proceso de post-producción.
A nivel de servidores de vídeo, Grass Valley (familia K2), Avid (AirSpeed Multi Stream), DVS (Venice), EVS
(familia XT), Harris (Nexio), Omneon (Spectrum) y Quantel (sQ) dan soporte a AVC-Intra también de forma
nativa. Por tanto, es posible tener un sistema nativo AVC-Intra desde la captación hasta el playout, con
calidad Full HD y 10 bits de principio a final.
En aquellas aplicaciones que requieran una transcodificación previa, MainConcept, Rhozet, Telestream, y
Digital Rapids ofrecen diversas alternativas. Panasonic ofrece a través de su web un plug-in para Apple
Compressor, que permite exportar una secuencia editada en formato AVC-Intra.
Panasonic
10
VALORACIÓN DEL CODEC
A la hora de valorar un codec de vídeo para producción, además de los parámetros eminentemente
técnicos, se puede considerar cuatro aspectos primordiales: Velocidad, Calidad de imagen, Compatibilidad
y Coste de utilización.
Decimos que un formato es rápido cuando permite codificar y descodificar múltiples streams en tiempo
real, cuando no requiere transcodificar, o cuando se puede enviar directamente a un servidor de playout.
Un codec preserva al máximo la calidad de imagen cuando respeta la resolución completa (sin aplicar
prefiltrado), muestrea toda la croma a 4:2:2, codifica las muestras con 10 bits, y no se producen pérdidas
significativas a lo largo de múltiples generaciones.
La calidad y rapidez de codec no sirven de nada si el codec no es soportado por productos de otros
fabricantes. El mejor ejemplo de compatibilidad se tiene cuando el codec puede ser editado en nativo en
los principales sistemas no lineales.
El coste de utilización viene dado por el bit-rate (que es un factor multiplicador del espacio o ancho de
banda necesario), por el soporte de grabación en adquisición (coste de las tarjetas de memoria) y por la
implementación del flujo de trabajo completo (tiempos de transcodificación, software adicional, etc.).
Seguramente, AVC-Intra 100 no es el mejor codec en cada una de estas cuatro áreas, pero sí es la mejor
opción cuando se ponen las cuatro en una balanza. AVC-Intra 100 es rápido porque puede ser utilizado
nativamente en las tres fases de la producción: captación, edición y playout. Al no tener que transcodificar
y con un bit-rate (100Mbps) inferior al de códecs de similar calidad, AVC-Intra también puede ser
transferido por red a mayor velocidad.
La codificación a 10 bits evita posibles artefactos de banding, y el muestreo 4:2:2 asegura la conservación
del color en sucesivas generaciones. En evaluaciones realizadas con test EBU, la relación PSNR da fe de
la robustez del AVC-Intra en sucesivas iteraciones de descodificación y codificación. Además, gracias a la
compatibilidad nativa de AVC-Intra con sistemas de edición y servidores de playout, estos procesos de
descodificación y codificación pueden ser evitados.
Al basarse en un estándar abierto como es H.264, AVC-Intra se beneficia de la capacidad de investigación
de un numeroso grupo de expertos, siendo la predicción intra-cuadro el mejor ejemplo. La compresión
extra que aporta este modo de predicción (cifrada en un 30%) permite dejar el bit-rate en 112Mbps, muy
por debajo de los 145 o 220Mbps de códecs de calidad similar (ProRes422 y DNxHD respectivamente).
Este menor bit-rate se traduce en un ahorro de coste tanto de red como de almacenamiento.
Por todo ello, AVC-Intra 100 se erige como la mejor solución para producción HD de alta calidad, apto para
todas las etapas de la producción, desde la captación hasta el playout, pasando por la edición y la
corrección de color. AVC-Intra se halla disponible en prácticamente todos los camcorders profesionales
P2, tanto en formato de hombro como en cámara de mano.
Panasonic
11
ESPECIFICACIONES
Class 50 y Class 100 (1080i, 720p)
Class 50 Class 100
Formato 1080i 720p 1080i 720p
Resolución real 1440x1080 960x720 1920x1080 1280x720
Velocidad de
cuadro
59.94i, 50i, 29.97p,
25p, 23.98p
59.94p, 50p, 29.97p,
25p, 23.98p
59.94i, 50i, 29.97p,
25p, 23.98p
59.94p, 50p, 29.97p,
25p, 23.98p
Compresión H.264 / MPEG-4 AVC Intracuadro (I-only)
Perfil High-10 Intra High 4:2:2 Intra
Nivel Level 4 Level 3.2 Level 4.1
Muestreo 4:2:0 4:2:2
Cuantificación 10 bits
Entropía CABAC CAVLC
Bit-rate 54.3Mbps 111.8Mbps
Class 100 y Class 200 (1080p, 1080i, 720p) (disponible a partir de 2013)
Class 100 Class 200
Formato 1080i
720p 1080/50p
1080i
720p 1080/50p
Resolución real 1920x1080
1280x720 1920x1080
1920x1080
1280x720 1920x1080
Velocidad de
cuadro
1080i: 59.94i, 50i,
29.97p, 25p, 23.98p;
720p: 50p, 59.94p
59.94p, 50p
1080i: 59.94i, 50i,
29.97p, 25p, 23.98p;
720p: 50p, 59.94p
59.94p, 50p
Compresión H.264 / MPEG-4 AVC Intracuadro (I-only)
Perfil High 4:2:2 Intra High 4:2:2 Intra
Nivel Level 4.1 Level 4.2 Level 4.1 Level 4.2
Muestreo 4:2:2 4:2:2
Cuantificación 10 bits
Entropía CAVLC CAVLC
Bit-rate 111.8Mbps 227Mbps 227Mbps 455Mbps