1 intro-09

32

Upload: elpoderpibe

Post on 25-Jan-2017

298 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1 intro-09
Page 2: 1 intro-09

Lenguaje de programación PHP

Page 3: 1 intro-09

Personal Académico responsable:

Ing. Carlos Perdomo (Director de la Escuela de Ciencia y Tecnología).

Ing. Alcides Franco (Jefe del Departamento de Informática).

Page 4: 1 intro-09

Módulos

1. Servidores de streming**2. Servidores Linux para VoIP.3. Configuración de Servidor VoIP (Asterisk)

Page 5: 1 intro-09

Tecnologías a Utilizar

Windows 2003 Server R2 “OpensSuse” / Centos (Slax/Ubuntu) Asterisk Trixbox

Page 6: 1 intro-09

Módulo IV – Servidores Streaming

6 Semanas

Page 7: 1 intro-09

Evaluación de módulo:

Evaluación escrita individual. (40%) Semana No. 3

Evaluación práctica grupal. (30%)Semana No. 4

Proyecto. (30%)Semana No. 6

Page 8: 1 intro-09

Material didáctico

Page 9: 1 intro-09

El gran desarrollo experimentado por las tecnologías de la información ha creado muy diversas necesidades tanto de conocimiento como de aplicación, requiriendo de esta manera herramientas que suplan estas necesidades.

A medida que las comunicaciones digitales se imponen cada vez más en el mundo de hoy, el procesamiento digital de señales obtiene un interés especial, debido a que este es la base para muchas aplicaciones importantes como la televisión digital, Internet, la multimedia, el sonido digital y en general el entretenimiento.

Hace una década, la posibilidad de difundir video digital destinada al publico en general parecía muy lejana, incluso se pensaba que su introducción no llegaría antes del final de este siglo XX.

La razón fundamental para afirmar esto era el importante flujo de información que se necesitaba transmitir para una imagen de video digitalizada, el cual era de 108 a 270 Mbit/s.

Page 10: 1 intro-09

A partir de finales de los años 80, el rápido desarrollo de eficaces algoritmos de compresión de video, como el estándar JPEG (Joint Photographic Experts Group) para imágenes fijas y, después MPEG (Motion Pictures Experts Group) para imágenes en movimiento, reducirían de forma significativa el flujo necesario para la transmisión de imágenes, lo que cambió radicalmente el panorama al llevar estas cantidades a valores mucho más razonables (de 1.5 a 30 Mbit/s, dependiendo de la resolución de las imágenes en movimiento), al tiempo que los progresos en integración permitían considerar la realización práctica de circuitos de descompresión, así como los circuitos de memoria asociados a un precio asequible.

Page 11: 1 intro-09

1.1 EL SISTEMA VISUAL HUMANO

En algunas aplicaciones del procesamiento digital de imágenes, como en la compresión digital, es necesario entender el sistema visual humano. El comprender las características y las limitaciones del sistema ojo-cerebro puede ayudar a maximizar la efectividad de las operaciones de la compresión digital de imágenes.

Page 12: 1 intro-09

1.1 Estructura física del ojo. El sistema visual humano está compuesto por el ojo y una porción del cerebro que procesa las señales neurológicas que provienen de este. Juntos, el ojo y el cerebro convierten la información óptica en una percepción de una escena visual. El ojo es la cámara del sistema visual humano. Este convierte la información visual en impulsos nerviosos usados por el cerebro.

El ojo en su conjunto, llamado globo ocular, es una estructura casi esférica de aproximadamente 22mm de diámetro. Está rodeado por tres membranas: la córnea y la esclerótica, que constituyen la cubierta exterior, la coroides y la retina. Los rayos de luz generados o reflejados por un objeto primero golpean el ojo en la córnea. La córnea actúa como un lente convexo, refractando los rayos. Esta refracción forma el enfoque inicial de la luz que entra al ojo. La córnea forma una protección transparente que cubre la superficie anterior del ojo. Después de la córnea, los rayos pasan a través de un líquido claro y húmedo llamado el humor acuoso, y después pasan a través del iris y el cristalino. El iris actúa como una apertura variable que controla la cantidad de luz que puede pasar a través del cristalino. El iris es controlado por músculos que lo abren y lo cierran basados en la intensidad promedio del objeto que es observado. En la noche el iris se abre ampliamente, mientras que en un día luminoso se cierra bastante.

Page 13: 1 intro-09

La membrana más interna del ojo es la retina, que cubre la totalidad de la pared posterior. Cuando el ojo está correctamente enfocado, la luz de un objeto exterior al ojo forma su imagen en la retina. La retina está compuesta por fotorreceptores que convierten la intensidad y el color de la luz en señales nerviosas. Existen dos tipos de fotorreceptores, bastones y conos. Los bastones son los más abundantes: entre 75 y 150 millones están distribuidos sobre la superficie retiniana y son los que más responden a la luz.

Page 14: 1 intro-09

1.1.2 Respuesta a la iluminación y discriminación. Debido a que las imágenes digitales se presentan como un conjunto de puntos brillantes, la capacidad del ojo de discriminar entre diferentes niveles de iluminación es una consideración importante para presentar los resultados del procesamiento de la imagen.

La relación entre la intensidad de la luz que entra al ojo y su brillo percibido no es una función lineal. Esto significa que a medida que la intensidad de una fuente luminosa cambia, el observador no percibirá un cambio igual en el brillo. La respuesta de la intensidad real del ojo es más logarítmica, similar a la curva de la Figura 2. De hecho, se ha mostrado experimentalmente que la intensidad de una fuente luminosa debe ser cercana al doble antes de que el ojo pueda detectar que esta ha cambiado. Por lo tanto, los cambios ligeros en la intensidad en regiones oscuras de una imagen tienden a ser más perceptibles que los cambios iguales en regiones brillantes. Esta relación que hay entre la intensidad de la iluminación y el brillo percibido, es conocida como Ley de Weber.

Page 15: 1 intro-09

Figura 1. Respuesta logarítmica del ojo, Ley de Weber Figura 2. Franjas de escala de grises con franjas de igual intensidad Figura 3. Intensidad real de las franjas de escala de grises en la Fig. 3

Page 16: 1 intro-09

1.2 EL SISTEMA AUDITIVO HUMANO

La audición es el resultado de una serie de procesos acústicos, mecánicos, nerviosos y mentales dentro de la combinación oído/cerebro que dan a una persona la impresión de sonido. La impresión que un humano recibe no es idéntica a la forma de onda acústica verdadera presente en el canal auditivo porque parte de la entropía de la onda se pierde.

La agudeza del oído humano es asombrosa, ya que puede detectar cantidades minúsculas de distorsión y aceptar un enorme rango dinámico. El único criterio de calidad de que se dispone consiste en el hecho de que si el oído es incapaz de detectar distorsión alguna, se dice que el sonido es perfecto. Por tanto, el criterio de calidad es completamente subjetivo y sólo se puede comprobar mediante pruebas de audición.

Page 17: 1 intro-09

Como se ve en la Figura, la membrana basilar se estira por la cóclea. Esta membrana varía en masa y rigidez a lo largo de su longitud. En el extremo más próximo a la ventana oval y al tímpano, la membrana es rígida y ligera, así que su frecuencia de resonancia es alta. En el extremo distante, próximo al ápice, la membrana es pesada y suave, y resuena a baja frecuencia. El rango de frecuencias de resonancia disponible determina el rango de frecuencias de la audición humana, que va desde los 20Hz hasta los 20KHz, sin embargo, en la práctica sólo llega hasta los 16 KHz aproximadamente.

Page 18: 1 intro-09

El oído analiza con bandas de frecuencia, conocidas como bandas críticas. Los anchos de bandas críticas dependen de la frecuencia, como se ilustra en la Figura 21. Por debajo de los 500 Hz, el ancho de banda crítico es aproximadamente constante (alrededor de los 100 Hz), mientras que por encima de los 500 Hz crece en proporción a la frecuencia: el ancho de banda crítica centrada en una frecuencia superior a 500 Hz es de alrededor del 20% de la frecuencia central.

Page 19: 1 intro-09

3 FUNDAMENTOS DE LA COMPRESIÓN DE IMÁGENES

El término compresión de datos se refiere al proceso de reducción del volumen de datos necesarios para representar una determinada cantidad de información. Los datos son los medios a través de los que se transporta la información. Se pueden utilizar distintas cantidades de datos para describir la misma cantidad de información. Por lo tanto, hay datos que proporcionan información sin relevancia. Esto es lo que se conoce como redundancia de los datos. La redundancia de los datos es un punto clave en la compresión de datos digitales.

En la compresión digital de imágenes, se pueden identificar y aprovechar tres tipos básicos de redundancias:

– Redundancia de codificación– Redundancia entre pixeles– Redundancia psicovisual

La compresión de datos se consigue cuando una o varias de estas redundancias se reducen o se eliminan.

Page 20: 1 intro-09

La compresión de datos consiste en la reducción del volumen de información tratable (procesar, transmitir o grabar). En principio, con la compresión se pretende transportar la misma información, pero empleando la menor cantidad de espacio.

El espacio que ocupa una información codificada (datos, señal digital, etc.) sin compresión es el cociente entre la frecuencia de muestreo y la resolución. Por tanto, cuantos más bits se empleen mayor será el tamaño del archivo. No obstante, la resolución viene impuesta por el sistema digital con que se trabaja y no se puede alterar el número de bits a voluntad; por ello, se utiliza la compresión, para transmitir la misma cantidad de información que ocuparía una gran resolución en un número inferior de bits.

La compresión de datos se basa fundamentalmente en buscar repeticiones en series de datos para después almacenar solo el dato junto al número de veces que se repite. Así, por ejemplo, si en un fichero aparece una secuencia como "AAAAAA", ocupando 6 bytes se podría almacenar simplemente "6A" que ocupa solo 2 bytes, en algoritmo RLE.

En realidad, el proceso es mucho más complejo, ya que raramente se consigue encontrar patrones de repetición tan exactos (salvo en algunas imágenes). Se utilizan algoritmos de compresión:

– Por un lado, algunos buscan series largas que luego codifican en formas más breves.– Por otro lado, algunos algoritmos, como el algoritmo de Huffman, examinan los caracteres

más repetidos para luego codificar de forma más corta los que más se repiten.– Otros, como el LZW, construyen un diccionario con los patrones encontrados, a los cuales

se hace referencia de manera posterior.

Page 21: 1 intro-09

A la hora de hablar de compresión hay que tener presentes dos conceptos:

Redundancia: Datos que son repetitivos o previsibles

Entropía: La información nueva o esencial que se define como la diferencia entre la cantidad total de datos de un mensaje y su redundancia.

Page 22: 1 intro-09

La información que transmiten los datos puede ser de tres tipos:1. Redundante: información repetitiva o predecible.2. Irrelevante: información que no podemos apreciar y cuya eliminación por

tanto no afecta al contenido del mensaje. Por ejemplo, si las frecuencias que es capaz de captar el oído humano están entre 16/20 Hz y 16.000/20.000 Hz s, serían irrelevantes aquellas frecuencias que estuvieran por debajo o por encima de estos valores.

3. Básica: la relevante. La que no es ni redundante ni irrelevante. La que debe ser transmitida para que se pueda reconstruir la señal.

Teniendo en cuenta estos tres tipos de información, se establecen tres tipologías de compresión de la información:

1. Sin pérdidas reales: es decir, transmitiendo toda la entropía del mensaje (toda la información básica e irrelevante, pero eliminando la redundante).

2. Subjetivamente sin pérdidas: es decir, además de eliminar la información redundante se elimina también la irrelevante.

3. Subjetivamente con pérdidas: se elimina cierta cantidad de información básica, por lo que el mensaje se reconstruirá con errores perceptibles pero tolerables (por ejemplo: la videoconferencia).

Page 23: 1 intro-09

Compresión de audio Digitalización.

El sonido es una onda continua que se propaga a través del aire u otros medios, formada por diferencias de presión, de forma que puede detectarse por la medida del nivel de presión en un punto. Las ondas sonoras poseen las características propias y estudiables de las ondas en general, tales como reflexión, refracción y difracción. Al tratarse de una onda continua, se requiere un proceso de digitalización para representarla como una serie de números. Actualmente, la mayoría de las operaciones realizadas sobre señales de sonido son digitales, pues tanto el almacenamiento como el procesado y transmisión de la señal en forma digital ofrece ventajas muy significativas sobre los métodos analógicos. La tecnología digital es más avanzada y ofrece mayores posibilidades, menor sensibilidad al ruido en la transmisión y capacidad de incluir códigos de protección frente a errores, así como encriptación. Con los mecanismos de decodificación adecuados, además, se pueden tratar simultáneamente señales de diferentes tipos transmitidas por un mismo canal. La desventaja principal de la señal digital es que requiere un ancho de banda mucho mayor que el de la señal analógica, de ahí que se realice un exhaustivo estudio en lo referente a la compresión de datos, algunas de cuyas técnicas serán el centro de nuestro estudio.

Page 24: 1 intro-09

Codificación y Compresión.

Antes de describir los sistemas de codificación y compresión, debemos detenernos en un breve análisis de la percepción auditiva del ser humano, para comprender por qué una cantidad significativa de la información que proporciona el PCM puede desecharse. El centro de la cuestión, en lo que a nosotros respecta, se basa en un fenómeno conocido como enmascaramiento.

El oído humano percibe un rango de frecuencias entre 20 Hz. y 20 Khz. En primer lugar, la sensibilidad es mayor en la zona alrededor de los 2-4 Khz., de forma que el sonido resulta más difícilmente audible cuanto más cercano a los extremos de la escala. En segundo lugar está el enmascaramiento, cuyas propiedades utilizan exhaustivamente los algoritmos más interesantes: cuando la componente a cierta frecuencia de una señal tiene una energía elevada, el oído no puede percibir componentes de menor energía en frecuencias cercanas, tanto inferiores como superiores. A una cierta distancia de la frecuencia enmascaradora, el efecto se reduce tanto que resulta despreciable; el rango de frecuencias en las que se produce el fenómeno se denomina banda crítica (critical band). Las componentes que pertenecen a la misma banda crítica se influyen mutuamente y no afectan ni se ven afectadas por las que aparecen fuera de ella. La amplitud de la banda crítica es diferente según la frecuencia en la que nos situemos y viene dada por unos determinados datos que demuestran que es mayor con la frecuencia. Hay que señalar que estos datos se obtienen por experimentos psicoacústicos (ver apéndice 2), que se realizan con expertos entrenados en percepción sonora, dando origen con sus impresiones a los modelos psicoacústicos.

Page 25: 1 intro-09

La digitalización de la señal mediante PCM es la forma más simple de codificación de la señal, y es la que utilizan tanto los CD como los sistemas DAT. Como toda digitalización, añade ruido a la señal, generalmente indeseable. Como hemos visto, cuantos menos bits se utilicen en el muestreo y la cuantización, mayor será el error al aceptar valores discretos para la señal continua, esto es, mayor será el ruido. Para evitar que el ruido alcance un nivel excesivo hay que emplear un gran número de bits, de forma que a 44'1 Khz. y utilizando 16 bits para cuantizar la señal, uno de los dos canales de un CD produce más de 700 kilobits por segundo (kbps). Como veremos, gran parte de esta información es innecesaria y ocupa un ancho de banda que podría liberarse, a costa de aumentar la complejidad del sistema decodificador e incurrir en cierta pérdida de calidad. El compromiso entre ancho de banda, complejidad y calidad es el que produce los diferentes estándares del mercado y formará la parte esencial de nuestro estudio.

Page 26: 1 intro-09

Nota: Hacer preguntas de aplicación

Page 27: 1 intro-09

Formatos de audio WAV

WAV es el formato de audio digital sin comprimir. Fué el primer formato de audio que existió para PC .Surge como resultado de pasar un archivo de CD-Audio al disco duro del ordenador. Para transformar este archivo a mp3 es necesario un sistema o programa de compresión (encoders).

La diferencia fundamental con el mp3 es el tamaño del fichero, ocupando el formato WAV 12 veces más que el mp3. Actualmente este formato de audio se usa unicamente como paso intermedio entre el CD-Audio y el mp3.

AAC

El formato AAC (Advanced Audio Code) es un sistema de compresión de audio desarrollado por el instituto Fraunhoffer, AT&T, Sony y los laboratorios Dolby. Este sistema aumenta la calidad del mp3, reduciendo en gran medida su tamaño. Es una nueva y revolucionaria forma de codificar y reproducir ficheros desde el disco duro de un ordenador con una calidad que se puede asemejar al CD utilizando bastante menos espacio que un mp3. Ocupa casi un 30 % menos de espacio que el mp3.

Este sistema de compresión de audio se basa casi principalmente en el mismo mecanismo que el mp3, es decir, aprovecha las limitaciones del oído humano para desechar toda la información que no es perceptible, pero aventaja al mp3 en que elimina los defectos que se detectaron posteriormente en dicho formato.

El sector de la industria discográfica está teniendo muy en cuenta este nuevo formato ya que el AAC se ajusta a todas la tecnologías de gestión de los derechos digitales.

La desventaja del AAC es el estar sujeto a patente.

Page 28: 1 intro-09

Formatos de audio MP3

Es el formato de compresión de audio actualmente más utilizado.El mp3 surge de la conversión de un archivo de CD ( formato WAV) mediante la compresión (encoders) del mismo manteniendo una calidad aceptable, aunque con pérdida de algunas frecuencias.

De esta manera se logra un archivo que ocupa menos espacio, lo que tiene dos ventajas, la primera es el ahorro de espacio que esto provoca y la segunda es la rapidez con la que puen ser transmitidos a través de la Red. La compresión de la información auditiva supone sin embargo, una merma perceptible en cuanto a la calidad de los registros de audio, aunque mantiene una buena calidad.

Debido a ese menor espacio, en un CD-ROM se pueden grabar 150 canciones en lugar del número habitual (12 ó 13) en un formato normal (descomprimido).

El instituto Fraunhofer fue la institución que finalmente creó este algoritmo que fue estandarizado bajo el nombre de ISO-Motion Picture Experts Group Audio Layer III, es decir, el famoso mp3. Una canción en este formato puede ocupar entre 3 y 5 Mbytes.

Las hipótesis que usaron los investigadores para el desarrollo del algoritmo de codificación, es decir, para comprimir el sonido lo máximo posible, es que el oído humano tiene un umbral de frecuencias de sonido que puede escuchar y percibe mejor las que están en primer plano de las enmascaradas. Esto permitía eliminar aquellos sonidos que son los menos reconocidos por el oído humano logrando así una compresión mayor. El formato mp3 ha supuesto una revolución para los usuarios informáticos y amantes de la música. Para poder escuchar las canciones en formato mp3 necesitas como mínimo un Pentium a 90 MHZ o similar.

Page 29: 1 intro-09

MP3 Pro

Thomson Multimedia ha desarrollado el MP3Pro, un nuevo algoritmo de codificación con un rendimiento de 128 Kbps ocupando el mismo tamaño que un archivo codificado a la mitad, a 64 Kbps. Mp3Pro ofrece una muy alta calidad ocupando casi la mitad de espacio que el mp3. El formato Mp3Pro será compatible tanto con los antiguos formatos, como con los reproductores de audio. Así, los archivos codificados en mp3 podrán ejecutarse en cualquier reproductor de MP3 Pro.

Page 30: 1 intro-09

LIQUID AUDIO

Más que un formato de audio, es un sistema de distribución global de música digitalizada vía Internet. Permite distribuir y vender música de forma segura y protegida a través de la Red.

Es una gran alternativa al formato MP3 debido a la seguridad que garantiza a las compañías discográfica.Este formato se emplea directamente por ellas o a través de tiendas en la Red que conectan directamente con la discográficas. Permite realizar compras seguras de música a través de Internet ya que está fuertemente protegido contra la piratería. El reproductor de Liquid Audio está disponible gratuitamente en todas las webs que utilizan su sistema, al igual que en la propia de la empresa desarrolladora que ostenta el mismo nombre.

Page 31: 1 intro-09

OGG VORBIS

El formato OGG Vorbis ha surgido frente al problema de las patentes que plantea mp3. Este formato OGG es uno de los candidatos más firmes para sustituir al mp3. Presenta muchas ventajas con respecto al mp3 ya que hace que el sonido suene más natural y a mayor calidad. Lo revolucionario de este formato, es que es un formato abierto sin posibilidad de ser patentado, pues ha sido creado por voluntarios al estilo del software libre y por ello más avanzado tecnológicamente al recibir aportaciones de un grupo de programadores informáticos.Esto supone que se pueda codificar en OGG sin pagar patentes como puede llegar a ocurrir con el mp3.

Sus características más destacadas son que soporta audio de alta calidad, varios canales, lo que situa a OGG a la misma altura actualmente que MP3, MP4 ,AAC y PAC.

Una de las razones para el uso y éxito de este formato es el uso del streaming, ya que varia el bitrate en las emisoras de radio en red según la calidad de la conexión, evitando los frecuentes saltos que sufrimos si escuchamos radio en MP3 con el ancho de banda colapsada.

Page 32: 1 intro-09

WMA

Otro formato de compresión de audio de Microsoft.

Es la evolución de otro formato anterior de MICROSOFT, el ASF, y está pensado especialmente para usar el popular reproductor WINDOWS MEDIA PLAYER. Permite escuchar la música mediante streaming con alta calidad de sonido. Este formato está teniendo una rapida e intensa difusión en la música on line.