Banda AnchaCompresión, Almacenamiento y Transmisión Eficiente de Señales de Voz, Video y Datos
MSc. Luis Rojas
INTRODUCCIÓN
Para el almacenamiento y transmisión eficiente
de señales de voz, video y texto se utilizan técnicas de
codificación fuente y de canal. La codificación fuente
comprime eficientemente las señales mediante la
eliminación de sus partes redundantes e irrelevantes.
CONTENIDO
Modelo de un sistema de telecomunicaciones.Teoría de señales aleatorias.Probabilidad.Variables aleatorias.Procesos Estadísticos.Teoría de la Información.Modelos fuentes.Codificación fuente.Modelos de Canal.Codificación de Canal.
Modelo de un Sistema de Comunicación
Haciendo uso de modelos matemáticos se pueden analizar, diseñar o comparar sistemas de comunicación tal como lo muestra el diagrama de bloques siguientes:
Fuente CodificaciónFuente
Codificaciónde
Canal
Destino DecodificaciónFuente
Decodificaciónde
Canal
Canal
Perturbación
Modelos Fuente y Codificación Fuente
La Teoría de la Información modela la señal fuente mediante procesos aleatorio o estocástico.Una información se puede dividir en cuatro partes :
Una línea horizontal divide la parte relevante (significativa) de la parte irrelevante (no significativa).Cada línea vertical divide la parte redundante (conocida) de la parte no redundante (desconocida).Solamente la parte interesante debe transmitirse al receptor.La tarea de la codificación fuente es eliminar tanto la parte redundante así de la parte irrelevante de la información por transmitir.
Modelos Fuente y Codificación Fuente
Redundante (conocida)
R
Irrelevante (no significativa)
No redundante (desconocida)
H
Relevante
(significativa)Interesante
Planos de información según Schouten
Modelos Fuente y Codificación Fuente
Las ecuaciones asociadas son:El valor del contenido de decisión Ho referido a un solo símbolo ak del conjunto de k símbolos es:
Ho = Log 2 K (bit/símbolo) 1.1
El contenido de decisión está constituido por la redundancia R y el contenido de información H:
Ho = R+H 1.2
El contenido de información I(ak) del símbolo ak se define de la siguiente manera:
I (ak) = log 2 P(ak) (bit) 1.3
El contenido de información medio del conjunto de símbolos a1, ..... ak ...... ak se calcula de la siguiente manera:
K
H = - ? p(ak) . Log 2 p(ak) (bit/símbolo) 1.4 K=1
Modelo de Canal
Canal discreto utilizando un canal no discreto
FuenteCodificador
deFuente
Codificadorde
CanalModulador
DestinoDecodificador
deFuente
Decodificadorde
CanalDemodulador
CanalSímbolos binarios
Símbolos binarios
Perturbación
Canal Discreto
Código Reversible
Un código reversible debe satisfacer ciertas condiciones:
Símbolos fuente u
Probabilidad
p(u)
CódigoI
CódigoII
CódigoIII
CódigoIV
A1A2A3A4
0.50.250.1250.125
00110
010011
010110111
001011
0111
Codificación Fuente Para Facsímil
Para reducir el tiempo de transmisión a través de una codificación que elimina la redundancia se dividen los puntos en grupos con la misma amplitud y cada grupo se codifica y transmite su longitud. Dicha codificación se denomina “run length coding”. Para codificar las longitudes blancas y las longitudes negras se utilizan códigos diferentes
I 6 I 3 I 7 I 2 I
Algoritmo de Codificación Huffman
El algoritmo desarrollado por Huffman en 1962 para el cálculo de códigos de prefijos con redundancia mínima, consiste en: 1.- Ordenar los símbolos fuente de mayor a menor probabilidad.2.- Unir a los dos símbolos fuentes menos probables en un símbolo
de ayuda y calcular su probabilidad.3.- Ordenar los símbolos de ayuda y los resultantes símbolos fuente
nuevamente de menor a mayor probabilidad y unir los dos símbolos de menor probabilidad en un nuevo símbolo de ayuda y calcular su probabilidad.
4.- Repetir el paso 3 hasta que aparezca un símbolo con la probabilidad 1.
5.- Si se representa la unión de símbolos a través de líneas se obtiene el árbol de codificación de un código de prefijo con k nodos de terminación. Cada nodo posee dos ramas. A cada rama de un nodo se le asigna uno de los dos símbolos de código: 0,1.
Algoritmo de Codificación Huffman
De la asignación de ceros y unos, resulta la palabra de código de cada símbolo fuente.
CODIFICACIÓN FUENTE PARA FAXIMIL
Para la transmisión de señales de fax en blanco y negro cada línea de la señal de video se muestra y cada muestra se cuantiza utilizando un valor de amplitud blanco y negro. Cada muestra presenta un punto blanco y negro. Cada punto tiene un contenido de decisión Ho = 1 bit.Para reducir el tiempo de transmisión a través de una codificación que elimina la redundancia se dividen los puntos en grupos con la misma amplitud y cada grupo se codifica y transmite su longitud. Dicha codificación se denomina “run length coding”. Para codificar las longitudes blancas y las longitudes negras se utilizan códigos diferentes.
CODIFICACIÓN FUENTE PARA FAXIMIL
Si se modelan las longitudes mediante una fuerte discreta sin memoria y además se asume que las longitudes son estadísticamente independientes, entonces el contenido medio de información de las longitudes blancas y negras se pueden expresar de la siguiente manera:
6 3 7 2
CONDICIÓN DE FAXIMIL
Si se modelan las longitudes mediante una fuente discreta sin memoria y además se asume que las longitudes son estadísticamente independientes, entonces el contenido medio de información de las longitudes blancas y negras se pueden expresar de la siguiente manera.
r maxHb = - ? pb ( r ) . log2 pb ( r )
r=1
r maxHn = - ? pn ( r ) . log2 pn ( r )
r=1
CONDICIÓN DE FAXIMIL
Para reducir la complejidad del equipo se codifican solamente las primeras 63 longitudes según Huffman. Las longitudes más grandes son representadas utilizando dos palabras de códigos, donde la primera parte representa la longitud r.64 y la segunda parte el resto de la longitud la cual puede ser cero.
º º º º º º º º º º º ºº º º º º º º º º º º ºº º º º º º º º º º º ºº º º º º º º º º º º ºº º º º º º º º ºº º º º º º º º ºº º º º º º º º º
CODIFICACIÓN FUENTE PARA FAXIMIL
Para la transmisión de señales de fax en blanco y negro cada línea de la señal de video se muestra y cada muestra se cuantiza utilizando un valor de amplitud blanco y negro. Cada muestra presenta un punto blanco y negro. Cada punto tiene un contenido de decisión Ho = 1 bit.
Para reducir el tiempo de transmisión a través de una codificación que elimina la redundancia se dividen los puntos en grupos con la misma amplitud y cada grupo se codifica y transmite su longitud. Dicha codificación se denomina “run length coding”. Para codificar las longitudes blancas y las longitudes negras se utilizan códigos diferentes.
CODIFICACIÓN FUENTE PARA FAXIMIL
26
1
9
2
8
4
60 Blancas
Negras
A26 A9 A8
Codificación:
L = 67 Blancas
11 o 1164
10003
64 11o11+3 100000
CODIFICACIÓN FUENTE PARA FACSIMIL
Otros modelos de fuente para la modificación de señales de f1x se muestran en la figura 12 junto con las entropías correspondiente por cada punto de imagen. Debido a que la entropía representa el limite inferior del índice de transmisión la figura permite una comparación entre los diferentes modelos fuentes. Puntos de líneaLongitudesPalabras de código
3 2 121000 11 001000
CODIFICACIÓN FUENTE PARA FACSIMIL
Palabras de código
Longitudes Longitudes blancas Longitudes negras
0 001010101 00001101111 000111 0102 0111 113 1000 10;::63 00110100 00000110011164 11011 0000001111128 10010 000011001000192 010111 000011001001;:1728 010011011 0000001100101
TABLA DEL CÓDIGO DE HUFFMAN MODIFICADO
MODELOS DE CANAL
Un modelo de canal describe las perturbaciones mediante procesos estocásticos. Con la ayuda de un modelo de canal se puede determinar la capacidad de canal. La capacidad de canal indica el máximo contenido de información trasferible por un canal.
Modelo de canal también se puede utilizar para reducir la probabilidad de error de transmisión de valores cercanos a cero.
MODELOS DE CANAL
1.- Patrones de error en canales reales:
En la figura Nº 1 muestran ejemplos de secuencia con errores de transmisión producidos por canales discretos binarios reales.
Los errores se clasifican en :
a.- Errores de un bit.
b.- Errores de ráfaga.
c.- Mezcla de errores de un bit y de Ráfaga.
MODELOS DE CANAL
Figura 14 a.- secuencia de símbolos binarios con errores de un bit.
Error
Figura 15 b.- Secuencia de símbolos binarios con errores de un bit y de ráfaga.
MODELOS DE CANAL
La operación + corresponde a la adicción modulo dos con la siguiente tabla:
0+0 = 00+1 = 11+0 = 11+1 = 0
Ejemplos:X = 000101101Y = 010101001E = 010000100
MODELOS DE CANAL
El patrón de error contiene unos en las posiciones de los
símbolos binarias donde ocurrieron errores de transmisión y
cero en las otras posiciones.
Error de ráfaga : Secuencia de elementos de códigos para
la cual entran dos elementos de códigos erróneos consecutivos
siempre existen menos de Y elementos de códigos correctos.
En un error de ráfaga el ultimo elemento del código de la
ráfaga y el primer elemento de código de la siguiente ráfaga se
encuentran separados por al menos r elementos de código
correcto.
MODELOS DE CANAL
Longitud de error de ráfagas es el número de elementos
de código contenidos en un error de ráfaga.
Ejemplo de un patrón de error:
00000110011000100000
El patrón de error anterior contiene con r = 2 dos errores
de ráfaga de longitud 2 y un error de un bit.
Si r = 4, dicha secuencia contiene solamente un error de
ráfaga de longitud r = 10. La definición anterior permite
mediante la selección adecuada del valor de r.
CANAL DISCRETO SIN MEMORIA
El modelo de canal discreto sin memoria permite describir
la manera sencilla canales que generan errores de un bit
estadísticamente independiente.
Suponga que la entrada de un canal discreto sin memoria
se excita con la secuencia de símbolos del alfabeto :
A1,A2,...AK..AK.
Sea b1,b2,...b3,...bJ el alfabeto de la secuencia de símbolos
correspondiente a la salida del canal. Un canal discreto sin
memoria se define mediante las probabilidades condicionales
p(bJ / AK ), que dan la probabilidad de que un símbolo Ak se
transforme en un símbolo bj.
CANAL DISCRETO SIN MEMORIA
Sea X = X1,... Xn,...XN una secuencia de entrada, donde Xnrepresenta un símbolo arbitrario del alfabeto A1,...AK,...AK.
Sea Y = Y1,...Yn,...YN la secuencia correspondiente a la salida, del canal, donde Yn representa un símbolo arbitrario del alfabeto b1,...b2,...bJ ,..bJ.
En el caso de un canal discreto sin memoria cada símbolo a la salida del canal, es estadísticamente dependiente del símbolo correspondiente a la entrada del canal. Para una secuencia de N símbolos se cumple :
N
Pn ( y / x ) = P(yn / Xn)
N=1
CANAL SIMÉTRICO Y BINARIO ( C.S.B)
P ( Y/X) = P(y1,...YN / X1,...XN) = P (E1,...EN)
Ejemplo :
P(001 / 011) = p(E1 = 0 ,E2 = 1, E3 = 0)
= (1- p) . p.(1-p)
= (1-p)2 p.
ANTECEDENTESUn aspecto fundamental en los desarrollos de los sistemas multimedia, es el eficiente almacenamiento y la transmision de secuencias de imagenes.
Adicionalmente, el funcionamiento basado en objetos está adquiriendo mayor importancia a medida que son requeridos con la aparición del mpeg – 4.
•En un futuro, el promedio de datos entre 8 y 64 kbps facilitará la transmision a trave’s de canales de telefonía móvil y fija como también sobre la internet.
•Objetivo:los algoritmos estandarizados como elitu-r rec., H261 y h263, se aplcan basados en el procedimiento de las imagenes de entrada.
•Solución: cada imagen es subdividida en objetos bidimensionales de forma fisica aleatoria de diferente movimiento y localizacion. Esto fisica aleatoria de diferentes movimiento y localizacion. Esto permite en primer lugar una mayor presicion de la descripción del mundo real y en segundo lugar el direccionmiento por separado de contenidode imagenes especificas.
CODIFICACION DE VIDEOS A VELOCIDADES MUY BAJAS (8.....64 Kbps)
USANDO MODELOS DE OBJETOS EN 2D
Para cada objeto ,son estimados los parámetros de forma, textura y movimiento bidimencional con respecto a la imagen previa.
Muchos de los cambios entre imágenes sucesivas son descritas
solamente por parámetros de forma y movimiento que pueden ser
transmitidos de manera eficiente, solamente para áreas de imágenes donde esta descripción falla, los parámetros de textura son
transmitidos.
En el lado receptor, la imagen es sintetizada usando los parámetros
transmitidos. Esta solución fue considerada durante el desarrollo del estándar MPEG-4 y fue incluida dentro del modelo de verificación de
vídeo que adoptó el mismo principio de codificación.
ANALISIS / SINTESISCodificación de Audio ( MPEG-4 HILN )
La cuantización y codificación de modelos paramétricos es controlada por un modelo físico que amplía la señal de entrada la cual depende de la sensibilidad del oído humano para la reconstrucción de errores.
En el decodificador para cada objeto de audio, una señal es sintetizada desde el modelo paramétrico del decodificador.
La salida del decodificador es la suma de todas las señales objetos.
La cuantización y codificación de modelos paramétricos es controlada por un modelo físico que amplía la señal de entrada la cual depende de la sensibilidad del oído humano para la reconstrucción de errores.
En el decodificador para cada objeto de audio, una señal es sintetizada desde el modelo paramétrico del decodificador.
La salida del decodificador es la suma de todas las señales objetos.
CODIFICACION DE VIDEO A BAJAS VELOCIDADES(8....64 Kbps) utilizando objetos trimensionales incluyendo modelos tridimensionales predefinidos (Modelos Faciales)
Antecedentes: El estándar MPEG-4 hará posible la codificación de
imágenes basados en contenidos, acceso a la imagen así como también la animación de modelos tridimensionales.
Las velocidades propuestas de 8 hasta 64 Kbps, permiten la
transmisión a través de canales de telefonía fija y móvil así como la red
de INTERNET.
Objetivo : El objetivo de este proyecto es incrementar la eficiencia de codificación utilizando la información del contenido de la escena y
describiendo la geometría tridimensional del mundo real con modelos
de objetos tridimensionales incluyendo modelos predefinidos.
Un modelo tridimensional puede incluir modelos predefinidos comopor ejemplo modelos faciales para cabeza humana. Los modelos tridimensionales adecuados son seleccionados analizando el contenido de la imagen.Los parámetros para la textura, forma y movimiento del objeto y la iluminación de la escenas son estimados automáticamente.
Muchos de los cambios entre dos imágenes sucesivas son descritas solamente por parámetros de forma, movimiento e iluminación que son codificados muy eficientemente.Solamente para áreas de la imagen donde esta descripción falla, los parámetros son de textura son transmitidos.En el lado receptor la imagen es sintetizada utilizando los parámetros transmitidos. Esta investigación es patrocinada por el gobierno Alemán
CODIFICACION DE VIDEOPara aplicaciones de muy baja velocidad ( de 8.........64 kbps ) basados
en modelos de objetos tridimensionales.
Antecedentes : un punto fundamental en los sistemas multimedia actualmente desarrollados es el eficiente almacenamiento, transmisión y manipulación de secuencia de imágenes y escenas tridimensionales. Objetivo : Por cuanto los algoritmos de codificación como el ITU recH261 – H263 asi como el MPEG-4 para vídeo describe los cambios en la secuencias de imagen a través de movimientos bidimensionales paralelos al plano de la imagen , el objetivo de este proyecto es hacer uso de la geometría tridimensional del mundo real con movimientos bidimensionales paralelos al plano de la imagen.
Solución : Para una codificación de imagen eficiente , los cambios que se producen desde una imagen a la siguiente, son descritas por modelos de objetos tridimensionales texturizados y por la rotación y traslación tridimensional.
Los objetos pueden ser articulados y la iluminación de escenas puede
consistir en luz difusa y directa.
Para cada objeto son estimados la textura, el movimiento
tridimensional, forma tridimensional y parámetros específicos ( por
ejemplo, parámetros de mímica para modelos faciales ).
Para cada objeto son estimados la textura, el movimiento
tridimensional, forma tridimensional y parámetros específicos ( por
ejemplo, parámetros de mímica para modelos faciales ).