diseño y resolución de prácticas para el laboratorio de...
TRANSCRIPT
Departamento de Teoría de la Señal y Comunicaciones
Escuela Técnica Superior de Ingeniería de Sevilla
Universidad de Sevilla
Diseño y Resolución de Prácticas
para el Laboratorio de
Televisión 3D
Proyecto de Fin de Carrera
Autor: Mario Barrios de Haro
Tutor: José Ramón Cerquides Bueno
Sevilla, 3 de Septiembre de 2013
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
2
Este material ha sido registrado bajo la Licencia Creative Commons Atribución
No Comercial Sin Derivadas 3.0 España.
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
3
Índice de Contenidos
Índice de Contenidos .......................................................................................... 3
Estructura del documento................................................................................. 7
1. Introducción .............................................................................................. 8
1.1. Motivación y Objetivos..................................................................... 8
1.2. Material y Métodos .......................................................................... 9
Hardware ........................................................................................ 9 1.2.1.
Software........................................................................................ 12 1.2.2.
Otro Software............................................................................... 14 1.2.3.
1.3. Etapas de Desarrollo y Tiempos .................................................... 14
Estudio Básico sobre 3D.............................................................. 14 1.3.1.
Estudio del Laboratorio............................................................... 15 1.3.2.
Diseño de Prácticas ..................................................................... 15 1.3.3.
Redacción de la Memoria ........................................................... 15 1.3.4.
2. Marco Histórico ...................................................................................... 17
2.1. Primeros Pasos ................................................................................ 17
2.2. Primeros Sistemas de Filmación y Proyección Estereoscópica . 18
2.3. La aparición de Polaroid ................................................................. 19
2.4. La Edad Dorada del 3D (1952 – 1955) .......................................... 19
2.5. La Segunda Oleada del 3D (1960 – 1984) .................................... 20
2.6. El Perfeccionamiento del 3D(1985–2003) ................................... 21
2.7. Resurrección Definitiva (2003 – ¿?) .............................................. 22
2.8. Estado del arte: DVB-3DTV ............................................................ 23
3. Fundamentos de la ciencia visual ......................................................... 26
3.1. Estereovisión.................................................................................... 26
Conceptos de estereovisión ....................................................... 27 3.1.1.
3.2. Paralaje ............................................................................................. 28
4. Aplicación de la Ciencia Visual a la Televisión 3D .............................. 32
4.1. Tipos de Sistemas 3D y métodos aplicados ................................. 32
Sistemas Pasivos .......................................................................... 32 4.1.1.
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
4
Sistemas Anaglíficos .................................................................... 33 4.1.2.
Sistemas Activos .......................................................................... 34 4.1.3.
Sistemas Autoestereoscópicos .................................................. 35 4.1.4.
Lentes Lenticulares ...................................................................... 36 4.1.5.
4.2. Problemas en la visualización de contenidos 3D ........................ 38
5. Diseño y Resolución de Prácticas ......................................................... 40
5.1. Primera Práctica .............................................................................. 40
Resúmen ....................................................................................... 40 5.1.1.
Material implicado ...................................................................... 41 5.1.2.
Esquema de Montaje .................................................................. 41 5.1.3.
Resolución de la Práctica ............................................................ 42 5.1.4.
5.2. Segunda Práctica ............................................................................. 48
Resumen ....................................................................................... 48 5.2.1.
Material Implicado ...................................................................... 48 5.2.2.
Esquema de Montaje .................................................................. 49 5.2.3.
Resolución de la Práctica ............................................................ 50 5.2.4.
Códigos de MATLAB .................................................................... 53 5.2.5.
5.3. Tercera Práctica ............................................................................... 64
Resumen ....................................................................................... 64 5.3.1.
Material implicado ...................................................................... 64 5.3.2.
Esquema de Montaje .................................................................. 65 5.3.3.
Resolución de la Práctica ............................................................ 66 5.3.4.
Códigos de MATLAB .................................................................... 69 5.3.5.
6. Conclusiones ........................................................................................... 71
6.1. Conclusiones a título personal ...................................................... 71
6.2. Conclusiones objetivas ................................................................... 71
7. Referencias .............................................................................................. 73
8. ANEXOS .................................................................................................... 75
8.1. Anexo 1: Enunciados de Prácticas ................................................ 75
8.2. Anexo 2: Resoluciones 1080i – 1080p.......................................... 92
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
5
Índice de Figuras
Figura 1: Cámara de Video JVC ....................................................................... 10
Figura 2: Televisor 3D PANASONIC................................................................. 11
Figura 3: Sistema NVISION de NVIDIA ........................................................... 12
Figura 4: Diagrama de Gantt ........................................................................... 16
Figura 5: Sistema Frame Compatible ............................................................. 24
Figura 6: Sistema Service Compatible............................................................ 25
Figura 7: El proceso de la estereovisión ........................................................ 26
Figura 8: Estereograma lado a lado................................................................ 28
Figura 9: Imagen lenticular .............................................................................. 28
Figura 10: Anaglifo........................................................................................... 28
Figura 11: a) Diferencia de paralajes entre objetos cercanos y lejanos .... 29
Figura 12: b) Diferencia de paralajes entre objetos cercanos y lejanos.... 29
Figura 13: Tipos de paralajes aplicados a estereogramas 3D ..................... 30
Figura 14: Imágenes polarizadas superpuestas (vista sin gafas) ................ 32
Figura 15: Sistema 3D por polarización ......................................................... 32
Figura 16: Gafas Anaglíficas............................................................................. 33
Figura 17: Distancias focales para luz roja y azul ......................................... 34
Figura 18: Sistema de Gafas Activas por Oclusión (Shutter Glasses) ......... 35
Figura 19: Funcionamiento de las Lentes Lenticulares ................................ 36
Figura 20: Funcionamiento de la Barrera de Paralaje ................................. 37
Figura 21: El problema de la acomodación del ojo ...................................... 38
Figura 22: Esquema de Montaje Práctica 1 ................................................... 42
Figura 23: Puntos Homólogos y Paralaje ....................................................... 43
Figura 24: Paralaje frente al ángulo de incidencia ocular ........................... 44
Figura 25: Paralaje para visión al infinito ...................................................... 46
Figura 26: Esquema de Montaje Práctica 2 ................................................... 49
Figura 27: Video Original (Flor.avi) ................................................................. 53
Figura 28: Flor comprimida por columnas .................................................... 57
Figura 29: Flor comprimida por filas .............................................................. 59
Figura 30: Mallado Quincunx .......................................................................... 60
Figura 31: Flor comprimida por Quincunx..................................................... 61
Figura 32: Detalle Quincunx ............................................................................ 62
Figura 33: Flor comprimida por 2D+Delta ..................................................... 63
Figura 34: Esquema de Montaje Práctica 3 ................................................... 65
Figura 35: Anaglifos Rojo/Azul ........................................................................ 66
Figura 36: Anaglifo funcional .......................................................................... 66
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
6
Figura 37: Entorno 3D para Lentes Lenticulares .......................................... 67
Figura 38: Entorno 3D ...................................................................................... 88
Figura 39: Centrar Selección ........................................................................... 89
Figura 40: Para Lentes Lenticulares................................................................ 89
Figura 41: Para Anaglifos ................................................................................. 89
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
7
Estructura del documento
Este documento esta estructurado en 8 Capítulos y 2 Anexos. En este
punto se describe la temática de cada capítulo y anexo así como el nombre de
cada uno de estos.
Introducción. Se explican las motivaciones y objetivos de este proyecto, además
de detallar el material empleado y las fases de desarrollo.
Marco Histórico. En este punto se analizan los hitos más importantes en la
evolución de las técnicas estereoscópicas y su aplicación e implantación en las
grandes pantallas hasta la actualidad.
Fundamentos de la Ciencia Visual. En el segundo capítulo se detallan
ampliamente los fundamentos visuales sobre los que se basa la tecnología 3D.
Se mencionan conceptos, entre otros, como la estereovisión, el paralaje y la
acomodación del ojo.
Aplicación de la Ciencia Visual a la Televisión 3D. En el tercer capítulo se tratará
sobre los distintos tipos de sistemas de visualización de contenidos 3D. Se
detallará el funcionamiento así como las ventajas y desventajas de cada uno.
Entran en esta sección los sistemas activos, pasivos, anaglíficos y
autoestereoscópicos. Un título alternativo y bastante descriptivo también para
esta sección sería el de “Estado del Arte”.
Diseño y Resolución de Prácticas. El cuarto capítulo describe el núcleo de este
proyecto: el proceso de diseño de las prácticas y su resolución.
Conclusiones. Resumen del proyecto resaltando los aspectos más importantes,
las dificultades, el aprendizaje y las conclusiones obtenidas.
Referencias. Se detallan los medios y recursos utilizados para la creación de este
proyecto.
Anexos. En esta última sección se agrupan distintos textos y documentos
complementarios a lo expuesto en la memoria, y que por su extensión,
complejidad o importancia, no se incluyen en la misma.
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
8
Introducción 1.
1.1.Motivación y Objetivos
Aunque a lo largo del siglo XX se han realizado varios intentos por parte
del gremio cinematográfico de incorporar la tecnología 3D a nuestras pantallas,
no ha sido hasta ahora que se ha adoptado una predisposición por parte, tanto
de productores como de espectadores, de acercarse a esta necesaria e
inevitable mejora en la representación de contenidos multimedia. Con este
proyecto se trata de aportar nuestro grano de arena al nuevo y, en teoría,
definitivo impulso por implantar esta ineludible tecnología en el hogar del
espectador.
Este proyecto también supone una motivación personal por afrontar
problemas que no se han “aprendido” en la carrera, es decir, por aprender a
perder el miedo a lo desconocido. La carrera “Ingeniero de Telecomunicación”
de la Universidad de Sevilla, hasta la fecha de adquisición del proyecto, no
incluía una asignatura que impartiera conocimientos acerca de la Televisión 3D.
Es por ello que decidí embarcarme en un proyecto que me ofreciera algo nuevo
y me enseñara, cuanto más, mejor.
En el presente proyecto se abordan los fundamentos y aspectos más
importantes referidos a la tecnología de creación, transmisión y representación
de video e imágenes en 3D. El principal objetivo consiste en hacer llegar y
empapar a los alumnos de El Laboratorio de Televisión 3D de estos conceptos,
para lo cual se desarrollan una serie de prácticas destinadas a ello.
Cada práctica constará de un trabajo previo, en el que se instará al
alumno a investigar y tener una primera toma de contacto con los conceptos
que se desarrollarán en la misma, proporcionando una bibliografía
recomendada; el desarrollo propio de la práctica, en la que el alumno aprenderá
los fundamentos de la percepción 3D, así como de su transmisión y
representación, y, por último el trabajo posterior que consistirá en la redacción
de una memoria acerca de lo visto durante el desarrollo de la práctica
(objetivos, experimentos, conclusiones… etc.) y en la investigación acerca un
contenido adicional que se detallará en la propia práctica y sobre la que no se
recomendará bibliografía alguna.
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
9
La primera práctica tratará sobre los fundamentos de la creación de
imágenes en 3D. Para ello se emplearan imágenes y videos en tiempo real y
pregrabado, de manera que se recoja el mayor número de singularidades en la
ejemplificación. Se aprenderán conceptos básicos como la función del doble
objetivo de la cámara 3D, la transformación de estereograma en imagen
tridimensional, el paralaje y pormenores en la post-edición de contenidos 3D.
La segunda práctica englobará los procedimientos de compresión de video más
habituales (por filas, columnas, quincunx, 2D + delta) y se hará notar la
importancia de los mismos debido al ancho de banda adicional que requiere una
transmisión multimedia 3D. Se buscará que el alumno, haciendo uso de la
herramienta MATLAB, desarrolle el código necesario para tales operaciones y
asiente por completo los conocimientos deseados.
La tercera y última práctica versará sobre la creación, modificación y
análisis de imágenes 3D a partir de entornos 3D artificiales. Se creará un
entorno 3D con el programa Bryce 7.1 (ver Sección 1.2.2.2 Bryce 7.1. Página 13)
sobre el cual se tomarán capturas estereoscópicas y sobre las cuales se
trabajarán conceptos ya familiares y fundamentales como la creación de
diferentes tipos de estereogramas compatibles con los distintos sistemas de
visualización 3D, el paralaje, la percepción de profundidad y el problema de la
acomodación del ojo.
1.2.Material y Métodos
A continuación se mencionan los elementos funcionales que han
formado parte de este proyecto con una breve descripción de los mismos.
Hardware 1.2.1.
La creación y desarrollo de este proyecto se ha realizado en un PC de
sobremesa de la marca Hewlett-Packard modelo Pavilion s7710 con un
procesador AMD Athlon™ 64 X2 Dual Core Processor 3800+ 2GHz con una
memoria RAM de 1GB.
La monitorización de resultados, necesaria debido a la naturaleza del
proyecto exige un equipo compatible con la tecnología de representación 3D,
para lo que se ha dispuesto de:
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
10
Cámara de video digital JVC Everio GS-TD1 3D Full HD.
Televisor PANASONIC Viera TX-P42VT20E con un par de gafas de
oclusión activa modelo TY-EW3D10.
PC con tarjeta de video y gafas NVIDIA 3D VISION y monitor marca
ACER con tecnología 3D.
1.2.1.1. Cámara de Video JVC Everio GS-TD1 Full HD
Esta cámara cuenta con dos objetivos distintos con una separación
aproximadamente igual a la de los ojos humanos (65mm). Así recoge las
imágenes izquierda y derecha (de ahora en adelante, I/D) de cada escena que
posteriormente se emplearán para dar percepción de profundidad.
La grabación de vídeos debe hacerse en formato AVCHD y nunca en MP4
(pues este formato sólo es capaz de ser decodificado por la propia cámara en su
misma pantalla).
Se incorpora, además, para facilitar las tareas de grabación, un trípode
plegable a disposición del laboratorio.
Para más señas consultar la dirección de internet donde se incluyen las
principales características de este elemento:
http://camcorder.jvc.com/product.jsp?modelId=MODL028838&pathId=1
19&page=10&lang=es
1.2.1.2. Televisor PANASONIC Viera TX-P42VT20E
Se trata de un televisor de 42 pulgadas capaz de representar imágenes
estáticas y en movimiento en 3 dimensiones ayudándose para ello de unas gafas
Figura 1: Cámara de Video JVC
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
11
de oclusión activas. El funcionamiento de la tecnología de oclusión activa (active
shutter) es el siguiente:
El televisor 3D, cuando funciona en modo 3D, emite las imágenes I/D de
manera alternada en el tiempo ocupando toda la pantalla con cada una de ellas.
Las gafas se sincronizan con esta alternancia entre imágenes gracias a un enlace
infrarrojo y cuando en el televisor se muestra la imagen D (I), el cristal I (D) de
las gafas se polariza de manera que impide el paso de la imagen al ojo I (D). De
esta manera, jugando con la polarización (típicamente vertical y horizontal)
vemos la imagen I con el ojo I y la imagen D con el ojo D creándose así la ilusión
o efecto 3D. Para más señas consultar la dirección de internet, donde se
incluyen las principales características de este elemento:
http://www.panasonic.es/html/es_ES/Productos/TX-
P42VT20/Especificaciones/5712113/index.html
Figura 2: Televisor 3D PANASONIC
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
12
1.2.1.3. Sistema NVIDIA 3D Vision
Este sistema consta de un software instalable en un ordenador que
estará provisto a su vez de un monitor que soporte la tecnología de
representación 3D por oclusión activa. Además, el sistema incluye unas gafas de
oclusión activa de la marca NVIDIA, así como de un dispositivo retransmisor
infrarrojo para intercomunicar y sincronizar las gafas con la pantalla de la
manera que lo hace el sistema PANASONIC (Ver Televisor PANASONIC Viera TX-
P42VT20E, Página 5)
Para más señas consultar la dirección de internet donde se incluyen las
principales características de este elemento:
http://www.nvidia.es/object/buy-wireless-3d-glasses-es.html
Software 1.2.2.
Para el desarrollo de este proyecto se ha empleado el siguiente software,
sobre el cual se detallará la participación de cada uno:
Lenguaje de Cálculo Técnico MATLAB.
Everio MediaBrowser Edición 3D.
Plataforma Dropbox.
Stereo Movie Maker.
Figura 3: Sistema NVISION de NVIDIA
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
13
1.2.2.1. Lenguaje de Cálculo Técnico MATLAB
La distribución empleada ha sido la R2012a (7.14.0.739) – 32bits. El
principal uso de este software tiene lugar en la práctica 2, donde se crean
codificadores de video según los métodos más habituales de compresión de
video 3D. Para ello, partiendo de una entrada de video estereoscópico, se
obtiene su salida comprimida mediante la generación de un script *.m
1.2.2.2. Bryce 7.1.
Bryce se define como un programa de animación, renderización y
modelado 3D especializado en paisajes. Será usado en el desarrollo de la
práctica 3 para crear entornos 3D sobre los que trabajar. Este software tiene la
particularidad de que es gratuito y se puede descargar desde el siguiente
enlace:
http://bryce.softonic.com/
1.2.2.3. Plataforma Dropbox
La transferencia de archivos entre el PC en el que se desarrolla el
proyecto y el equipo de monitorización de resultados (Ver Sección 1.2.1
Hardware, Página 9), se ha realizado mediante la plataforma Dropbox debido a
que se encuentran en redes distintas. Basa su funcionamiento en el
almacenamiento de archivos organizados en carpetas en la nube.
Para obtener una versión gratuita de esta plataforma se puede acudir a la
siguiente dirección:
https://www.dropbox.com/downloading?src=indexç
1.2.2.4. Stereo Movie Maker
La versión empleada en el proyecto ha sido la Stereo Movie Maker
Ver1.21. Este programa permite manipular con gran facilidad imágenes y videos
estereoscópicos, dando la posibilidad de editarlos para adecuarlos a las
necesidades del proyecto. Más adelante se explicará en detalle la funcionalidad
del mismo.
Para obtener una versión gratuita de este programa se puede acudir a la
siguiente dirección:
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
14
http://stereo.jpn.org/eng/stvmkr/files/stvmkre121.zip
Otro Software 1.2.3.
1.2.3.1. GanttProject
Es una herramienta de código abierto para hacer diagramas de Gantt
como el que aparece en esta memoria (ver Figura 4: Diagrama de Gantt, página
16). Puede descargarse de la siguiente dirección:
http://ganttproject.sourceforge.net/
1.2.3.2. Suite Ofimática Microsoft Office 2010
Este documento así como su correspondiente presentación ha sido
desarrollado con la suite ofimática de Microsoft en su versión 2010. En especial,
se han utilizado los programas Word 2010, PowerPoint 2010 y Visio 2010.
1.3.Etapas de Desarrollo y Tiempos
En este punto se detallan las distintas fases por las que ha pasado este
proyecto. Con ayuda del siguiente diagrama de Gantt, se pretende exponer la
extensión en el tiempo de estas fases.
El proyecto comenzó a desarrollarse en Abril de 2012 y terminó en
Febrero de 2013, con una duración total de 10 meses.
Estudio Básico sobre 3D 1.3.1.
Debido a la índole del proyecto y a la escasez de conceptos relativos al
mismo que ofrece la carrera “Ingeniero de Telecomunicación”, ha sido
necesario tomar un tiempo para aprender los fundamentos de la infraestructura
de la Televisión 3D. Para ello ha sido empleado el libro:
Minoli, Daniel. 3D Television (3DTV) Technology, Systems, and Deployment. Rolling Out the Infrastructure for Next-Generation Entertainment. 1ª ed. Editorial Boca Ratón, 2011. ISBN: 978-1-4398-4066-5.
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
15
En él se recogen tanto los métodos de obtención de imágenes
tridimensionales, como su procesamiento y presentación en diferentes tipos de
formas. El contenido de la obra también se adentra en la evolución de las
diferentes tecnologías en las que se ha basado el 3D, así como ofrece un
detallado avance de las tecnologías predominantes del futuro y el proceso de
implantación en el hogar. Duración: 1 mes.
Estudio del Laboratorio 1.3.2.
Nuevamente, debido a la índole del proyecto, fue necesario establecer
una toma de contacto con los elementos que componen el Laboratorio de
Televisión 3D. Se tomó conciencia de las tecnologías compatibles con los
sistemas existentes en el laboratorio (Ver Sección 1.2.1 Hardware, Páginas 9, 10
y 12). Duración: 1 semana.
Diseño de Prácticas 1.3.3.
Una vez asentados los conocimientos necesarios sobre Televisión 3D y
familiarizado con los elementos del laboratorio, comienza la elaboración de las
prácticas destinadas a los alumnos del mismo. Esta es, como es lógico, la parte
más extensa en duración del proyecto. Por motivos académicos se alargó más
allá de lo previsto. Duración: 1 año y 4 meses.
Se sometió a la práctica totalidad del proceso a una constante revisión y
mejora del mismo, tanto con nuevas ideas como con la desestimación de otras
tantas.
Redacción de la Memoria 1.3.4.
Comprende la redacción del presente documento. Fue la última etapa en
empezar una vez finalizó el desarrollo de la segunda práctica y se redactó a lo
largo de aproximadamente 8 meses.
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
16
Figura 4: Diagrama de Gantt
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
17
Marco Histórico 2.
El texto escrito a continuación comprende un conglomerado de múltiples
fuentes de referencia que se recogen en las citas [1], [2], [3], [4], [5] y [6]:
La aplicación del 3D a Ciencia Visual no es un invento reciente en la
Historia de la Humanidad. Los primeros pasos de esta tecnología se remontan a
1890, y su aplicación directa a películas hasta 1915, pero ha sido
continuadamente relegada a la sombra debido a los costes de producción de la
época para grabar y reproducir contenidos 3D de manera aceptable y a la falta
de estandarización de formatos.
No obstante, la tecnología 3D tuvo uno de sus múltiples apogeos del siglo
XX en los años 50 en las pantallas norteamericanas y más tarde, entre los 80 y
los 90, en el resto del mundo de la mano de los cines IMAX y de la productora
Disney. Durante la década de los 2000, la tecnología 3D fue ganando relevancia
poco a poco, alcanzando su apogeo en 2009 con la proyección de la película más
exitosa de todos los tiempos: Avatar. Desde entonces, la tecnología de
visualización 3D ha arraigado, parece que de forma definitiva, y la prueba más
fehaciente de ello es la presencia, cada vez más común, de pantallas 3D en los
hogares.
2.1.Primeros Pasos
En 1893, William Friese-Greene rellenó la patente por la cual proyectaba
dos películas simultáneas una al lado de la otra y que correspondían a
fotogramas de la misma escena tomadas desde dos ángulos ligeramente
distintos entre sí. Para observar el efecto 3D de este invento era necesario un
estereoscopio, que redirigía los rayos oculares para que cada ojo viera sólo uno
de los dos filmes. Acababa de sentar las bases de la estereoscopía. Sin embargo,
debido a la necesidad de este aparato, el uso en cines o teatros no era algo
posible.
Años más tarde, Frederic Eugene Ives patentó su estereocámara en 1900,
que constaba de dos lentes separadas por 4.45 cm; mismo principio que la
cámara del Laboratorio de Televisión 3D.
En Junio de 1915, Edwin S. Porter y William E. Waddell presentaron varias
baterías de imágenes anaglíficas al público del Teatro Astor de Nueva York. Las
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
18
valoraciones del público fueron tan nefastas que los intentos por implantar el
3D en cines y teatros decayeron bajo mínimos hasta la década de 1950.
No obstante, las iniciativas por mejorar la técnica de la estereoscopía se
sucedían en el tiempo.
2.2.Primeros Sistemas de Filmación y Proyección Estereoscópica
La primera película 3D de pago emitida en cines fue “El Poder del Amor”
(The Power of Love), producida por Harry K. Fairall, en el Hotel Ambassador de
Los Ángeles el 27 de Septiembre de 1922. La película se rodaba en anaglifos
rojo/verde, y para verla eran necesarias gafas anaglíficas. Tras la proyección de
la película para la prensa neoyorquina, la película cayó en el olvido y
actualmente se considera desaparecida.
En Diciembre del mismo año, William Van Doren Kelley, motivado por la
demostración de Fairall antes mencionada, llegó a un acuerdo con Samuel
Rothfarel para proyectar el primero de su serie de cortos en 3D titulados
“Películas del Futuro” (Movies of the Future) en el Teatro Rivoli de Nueva York.
Al mismo tiempo, Laurens Hammond y William F. Cassidy revelaron el
sistema Televista. Este invento consolidó la primera forma de proyección de una
secuencia alternada de fotogramas I/D gracias al uso de dos proyectores
interconectados. El visor, anclado al asiento del espectador, se sincronizaba con
la alternancia de la pantalla para cegar uno u el otro ojo del espectador cuando
procedía. En la actualidad existe su homólogo y es el sistema de gafas activas
por oclusión (shutter glasses). Solo un cine de Nueva York, el Teatro Selwyn y
sólo un show, una serie de cortos y una película (El Hombre de M.A.R.T.E.)
utilizaron esta técnica de estereoscopía.
También en Diciembre de 1922, Frederic E. Ives y Jacob Leventhal
crearon varios cortos que proyectaron bajo el nombre de “Plastigrams”
mediante la técnica del anaglifo rojo/azul. Se sucedieron producciones de cortos
durante tres años más.
Los hitos en la Historia de la Estereoscopía no señalan ningún avance
remarcable más hasta 1933 debido a la Gran Depresión. Fue entonces en París
donde Louis Lumiere retomó el desarrollo de nuevos cortos grabados en
cámaras estereoscópicas. Entre ellos destacó la famosa adaptación 3D que hizo
de la primera proyección de una película en cines “L’Arrivée du Train” donde
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
19
una cámara situada en la vía del tren grababa cómo este avanzaba hacia la
pantalla, causando pavor en los espectadores. La técnica empleada fue,
nuevamente, anaglifos.
2.3.La aparición de Polaroid
El profesor Edwin H. Land, de la Universidad de Harvard, implementó la
técnica de polarización de la luz para reducir ruido de brillo en las fotografías. En
1929 llevó su idea a patente, creando una lámina polarizadora de luz. Tres años
más tarde, llevó al mercado la Lámina Polaroid J para venta al público. Sin
embargo, aunque su idea inicial fue la de reducir el brillo no deseado en las
fotografías, Land fue lo suficientemente imaginativo como para tener la idea de
aplicar sus filtros patentados en la estereoscopía.
En Enero de 1936, Land esgrimió la primera demostración pública de la
aplicación directa de sus filtros Polaroid a la fotografía 3D en el Hotel Waldorf-
Astoria. En esta ocasión, obtuvo gran aceptación por parte del público.
La llegada de los filtros polarizadores patentados por Polaroid supuso un
gran cambio, ya que no solo era posible revelar las películas en color sino que se
sustituía el uso de las gafas con cristales de color rojo y verde por otras con
filtros polarizados de Polaroid, que permitían ver los colores. El inconveniente
de este sistema era que se proyectaba con dos proyectores simultáneamente
sobre la misma pantalla, por lo que era difícil mantener la sincronización;
cualquier reparación en una de las cintas debía repetirse en la otra. Además
requería dos operadores en vez de uno y una pantalla especial, metálica para
que mantuviera la polarización, que en una pantalla normal se perdería.
Durante varios años se sucedieron distintos filmes y spots publicitarios en
Estados Unidos, Alemania e Italia utilizando esta novedosa técnica. Finalmente,
con el comienzo de la II Guerra Mundial, el desarrollo de la estereoscopía se
priorizó con fines militares, con lo que quedó relegada al olv ido de cara al
público.
2.4.La Edad Dorada del 3D (1952 – 1955)
Esta época comienza en 1952, con el estreno de la primera película
estereoscópica en color: Bwana Devil. La práctica totalidad de películas que se
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
20
produjeron a continuación durante este apogeo del 3D se proyectaron
empleando filtros Polaroid.
Las conocidas gafas anaglíficas, durante este tiempo, quedaron relegadas
a los cómics y varios cortos que se produjeron en la época.
Productores como Sol Lesser, Raymond Spottiswoode y James Mage se
introdujeron en el mundo de la filmografía 3D con varios cortos, todos en
Estados Unidos.
El ocaso de este apogeo tuvo lugar entre finales del verano de 1953 y
mediados de la primavera de 1954, periodo con altibajos en los que pareció que
el 3D perduraría para ser abandonado finalmente. Las causas de abandonar la
proyección y creación de contenidos 3D fueron varias: eran necesarios dos
rollos de película en lugar de uno, y además, debían de sincronizarse a la
extrema perfección para poder visualizar la proyección correctamente; se
necesitaban dos operarios para controlar todo este proceso; las gafas perdían
sincronización con una frecuencia relativamente alta; las pantallas de plata
(necesarias para mostrar correctamente las imágenes 3D) tenían un ángulo de
visión bastante estrecho, lo que limitaba el aforo del show. La última película
proyectada en 3D es esta “Edad Dorada” fue “La Venganza de la Criatura”, el 23
de Febrero de 1955. No sería hasta 1960 que se volviera a retomar la
producción generalizada de películas y cortos 3D.
2.5.La Segunda Oleada del 3D (1960 – 1984)
Este nuevo resurgimiento del 3D en las grandes pantallas se debió, en
parte, gracias a Arch Oboler, el productor que introdujo la tecnología Space-
Vision 3D, que lograba filmar películas en 3D en un solo carrete, necesitando
por tanto de un solo proyector con lentes especiales. Utilizaba la técnica
estereoscópica de multiplexión espacial “arriba y abajo”, cuyo nombre
determina las posiciones de frames de cada imagen I/D. Para ver la filmación se
necesitaban gafas polarizadas que mantenían fácilmente la sincronización.
En 1961, la Warner Bros produce la película “The Mask” (La Máscara),
que fue proyectada en 2D, aunque algunas escenas sueltas se proyectaban en
anaglifos 3D rojo/vede mediante Technicolor. Durante los siguientes años, y con
gran aceptación por parte del público, se sucedieron distintas películas.
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
21
En 1970, la empresa Stereovision fundada por Allan Silliphant y Chris
Condon desarrolló una nueva forma de grabar contenidos estereoscópicos,
situando las imágenes I/D lado a lado en un mismo carrete en lugar de
arriba/abajo como venía siendo costumbre.
Louis K. Sher y la productora Stereovision proyectaron la película más
exitosa hasta la fecha en 3D: The Stewardesses. Recaudó más de 27 millones de
dólares en E.E.U.U., lo que equivale a 140 millones actuales. Tras esta película,
otras 36 más la sucederían en los siguientes 25 años, sin haber apenas mejoras
en la corrección de color u otras características debido a la pobre temática que
rodeaba a la inmensa mayoría de las- películas 3D de ésta época: sexo, terror y
gore.
2.6. El Perfeccionamiento del 3D(1985–2003)
No fue hasta 1985 que se introdujo en la filmación de películas 3D el
perfeccionamiento (necesario por otra parte) por parte de IMAX. Con su película
“We Are Born of Stars”, se creó un punto de inflexión, enfatizando en la
corrección matemática y perfeccionamiento del modelado 3D y eliminando gran
parte de la fatiga ocular que venían produciendo este tipo de películas.
Además de esto, IMAX consiguió proyectar películas con un amplísimo
ángulo de visión, lo que permitió una mayor aforo por proyección y un
importante gancho comercial.
En 1986 y en adelante, la Compañía Walt Disney y la comenzó a producir
de manera asidua filmes en 3D. En ese mismo año, la “National Film Board of
Canada Production Transitions” fue la primera presentación del uso de gafas
polarizadas en un cine IMAX. No fue, sin embargo, hasta 1990 la producción de
“Echoes of the Sun” que se usarían gafas de oclusión activa por mult iplexión
temporal. Las tres tecnologías ya mencionadas (multiplexión temporal,
polarización pasiva y activa) compartirían escena en adelante en los cines IMAX.
En 2004, el 54% de los cines (133 de 248) de la compañía IMAX Corp.
estaban preparados para proyectar en 3D. Posteriores avances computacionales
permitieron la llegada de otra nueva generación de filmes usando un nuevo
modelo de proyectores.
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
22
2.7.Resurrección Definitiva (2003 – ¿?)
En 2003, la película dirigida por James Cameron, “Ghosts of the Abyss”
(Fantasmas del Abismo) fue la primera película íntegra en 3D rodada con el
sistema Reality Camera System, que incorporaba las mejores cámaras digitales
de alta definición (no film de rollo de película).
En 2004, “The Polar Express” (El Polar Express), fue la primera película de
animación rodada íntegramente en 3D, aunque en la mayoría de los cines se
proyectó en 2D (solo en 66 de los 3584 cines en los que se proyectó fue en 3D).
El resultado fue que la proyección en 3D recaudó 14 veces más por proyección
que su versión 2D. Era evidente el creciente interés del público por la
proyección en 3D.
En 2006 surge una nueva generación de películas en 3D. Nacen de la
conversión de 2D a 3D; una idea, por el contrario a lo que pueda parecer,
bastante vieja, pero que debido a la tecnología del pasado, no se pudo llevar a
cabo. En este año, IMAX y Warner Bros producen “Superman Returns”,
convertida de la versión original 2D. Actualmente, George Lucas trabaja en una
adaptación de la saga “Star Wars” a 3D.
Durante los siguientes años se sucedieron distintas películas 3D con éxito
en los cines, pero no fue hasta 2009, con la producción de Avatar por James
Cameron, la película más exitosa de todos los tiempos, que se alcanzara el
actual apogeo del 3D. Tras esta provechosa producción, y hasta la actualidad
(2013), se han sucedido numerosas películas con menor, pero no por ello
irrelevante, éxito en los cines.
Finalmente, y como último hito en la Historia de la producción 3D, el 1 de
Octubre de 2010, “Scar3D” fue la primera película emitida bajo demanda en 3D
en las televisiones por cable de los Estados Unidos.
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
23
2.8.Estado del arte: DVB-3DTV
La información presente en esta sección se puede consultar en las
referencias bibliográficas [7] y [8]:
Vista la evolución desde sus comienzos de las distintas tecnologías de
captación y visualización 3D, se describe a continuación el “estado del arte” (es
decir, el punto de desarrollo tecnológico en el que nos encontramos) así como
el futuro próximo previsto.
En la actualidad, el estándar de televisión por excelencia es el High
Definition (HD), es decir, imágenes de alta definición, cuyas resoluciones son de
1080x720p ó 1920x1080i (Sección 8.2 Anexo 2: Resoluciones 1080i – 1080p,
página 92). Las cadenas más representativas tienen un canal de difusión
exclusivo en este formato HD, creciente con el número de televisiones
compatibles con este formato, necesario por otra parte debido al también
creciente tamaño de las mismas. Es por ello que nos encontramos con el primer
obstáculo que debe superar la difusión de contenidos 3D: la transmisión de dos
imágenes simultáneas en HD donde antes lo hacía sólo una.
A finales de 2010 aparece la norma DVB 3D-TV, que recoge diferentes
técnicas de transmisión de contenidos 3D al hogar mediante satélite, cable y
TDT. Surge entonces la primera idea de compatibilizar el método de transmisión
con la tecnología presente en los hogares actualmente (el set top box, STB)
aprovechando la infraestructura ya desplegada. Para hacer compatible la
transmisión de contenido 3D con los set top box de los hogares actuales se
capturan dos imágenes correspondientes a I/D en formato HD. A continuación
se reduce la resolución de éstas a la mitad y se transmiten conjuntamente (lado
a lado o arriba y abajo) en una sola imagen de resolución HD que el televisor
deberá interpretar correctamente mediante alguna técnica de decodificación de
video 3D (ver Figura 5: Sistema Frame Compatible). Como es evidente, la visión
3D de la imagen resultante tendrá la mitad de resolución que cualquiera de las
originales I/D. Además de la pérdida de resolución, se impide la transmisión
simultánea de contenido 2D y 3D, no dando a elegir al consumidor que se ve
obligado a visualizar contenido 3D. Esta idea es la primera de tres fases de la 1º
Generación de la Normativa DVB 3D-TV.
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
24
Como segunda fase de esta 1º Generación, cuyo fin está previsto para
2015, tenemos la “Service Compatible” o Servicio Compatible. La principal
diferencia con respecto a la fase anterior es que ya no se obliga a visualizar
contenido 3D, sino que se modifica el servicio, ofreciendo en un solo canal
contenido FULL HD + 3D. Es decir, en una misma trama se transmite una imagen
FULL HD y contenido adicional para la visualización en 3D (ver Figura 6: Sistema
Service Compatible, página 25Error! Reference source not found.). De esta
manera, los STB actuales serían capaces de interpretar la trama 2D en
resolución HD, pero para visualizar la imagen 2D ó 3D en resolución FULL HD
será necesario una nueva generación de STB, permitiendo también visualizar
solo la trama 2D en FULL HD sin emplear simulcast.
La tercera fase del DVB 3D-TV se llamará Frame-Compatible Compatible.
Se prevé regresar al sistema Frame Compatible introduciéndole una serie de
modificaciones, entre las que destaca el hecho de que, en esta fase, además de
transmitir las imágenes I/D en baja resolución (formato frame compatible), se
transmitirá junto a ellas información suficiente para representar ambas en FULL
HD por separado. De nuevo, los STB actuales no sabrían interpretar esta
información adicional, con lo que sólo serían capaces de obtener una imagen 2D
HD (cosa imposible en Frame Compatible) o una imagen 3D a media resolución.
Una nueva generación de STB se diseñará para interpretar el contenido 2D y 3D
en FULL HD.
El 19 de Junio de 2012, el proyecto JEDI (Just Explore Dimensions),
centrado en desarrollar un sistema de 3DTV de 2º Generación, logró iniciar la
Figura 5: Sistema Frame Compatible
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
25
retransmisión de un canal basado en el sistema de 1º Generación Service
Compatible (frecuencia 10810 MHz, polarización horizontal) consiguiendo así la
difusión de contenidos 3D FULL HD. Este es el último avance conocido hasta la
fecha en la norma DVB 3D-TV.
Figura 6: Sistema Service Compatible
Contenido 2D
Formato FULL HD + info extra para 3D
Contenido 3D FULL HD
STB Actual
STB Futuro
HD
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
26
Fundamentos de la ciencia visual 3.
Veamos ahora en detalle los fundamentos sobre los que se sustenta este
proyecto. Se mencionarán temas como la estereovisión, el paralaje, así como el
uso de la polarización y cromoestereopsis para representar imágenes 3D.
3.1.Estereovisión
El prefijo “estéreo” significa “que tiene profundidad o tres dimensiones”.
Más concretamente, de la RAE [10]:
estéreo-.
elem. compos. Significa 'sólido'. Estereografía, estereoscopio.
Así pues, estereovisión es el proceso que comprende la visión de objetos
sólidos sobre los que se puede apreciar cierta profundidad espacial.
Se dice que es un proceso porque es realmente el proceso -que nuestro
cerebro realiza de manera automática- por el que, mediante dos imágenes del
mismo escenario tomadas desde ángulos distintos (ligeramente diferentes),
aparece una percepción de tridimensionalidad. El par de imágenes ligeramente
diferentes tomadas desde distintos ángulos proviene, en nuestro cuerpo, de los
ojos: al estar en posiciones distintas y mirar hacia un punto del espacio, el
ángulo de incidencia de los rayos que nacen en los ojos y mueren en el punto
será distinto.
Figura 7: El proceso de la estereovisión
El mejor ejemplo para reproducir lo arriba expuesto es acercar el dedo
índice de la mano a los ojos (a 10 cm aprox.). A continuación, y sin moverlo,
Izq Der
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
27
observar el dedo solo con el ojo izquierdo e, inmediatamente, observarlo solo
con el ojo derecho. Se aprecia claramente que el dedo “cambia de posición”. Sin
embargo la fusión de ambas imágenes ligeramente distintas es la que nos da la
percepción de profundidad espacial, lo que ocurre si abrimos ambos ojos. Este
efecto queda representado el la Figura 7: El proceso de la estereovisión.
En conclusión, la información de profundidad de un estereograma reside,
de alguna manera, en la diferencia entre las imágenes I/D tomadas. Para más
señas, véase Sección 3.2 Paralaje, Página 28.
Conceptos de estereovisión 3.1.1.
A continuación se definen los conceptos más relevantes de la
estereovisión [11].
Estereograma o estereopar. Es el nombre que recibe cualquier asociación entre
las imágenes I/D tomadas desde distintos ángulos. Las asociaciones pueden
presentar los estereogramas en modo lado a lado, arriba y abajo, imágenes
superpuestas con polarización, con codificación de color (Anaglifos), en
multiplexión temporal… En las Figuras Figura 8Figura 9, página 28, se puede
apreciar un estereograma del tipo lado a lado, un Anaglifo y una imagen
lenticular. En secciones posteriores (ver Sección 4.1.Tipos de Sistemas 3D y
métodos aplicados, Página 32) se entrará en detalle sobre los distintos tipos de
asociaciones.
Estereoscopía. Es la técnica que crea la ilusión de profundidad espacial a partir
de un par de estereogramas.
Estereoscópico. Es el término que describe la experiencia visual de percepción
de profundidad.
Estereoplexión. Es el mecanismo que toma los dos canales de información del
estereograma (I/D) y los funde en uno solo sin aumentar el ancho de banda.
Acomodación. Es el proceso por el cual, cambios en la potencia dióptrica del cristalino provocan la formación de una imagen nítida en la retina. Más adelante se detalla el problema de la acomodación en 3D.
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
28
Vergencia. Se denomina vergencia al movimiento ocular e direcciones
opuestas. La convergencia se da cuando los rayos oculares se cruzan en algún punto por delante del observador. La divergencia cuando esto ocurre en un punto por detrás del observador.
Figura 8: Estereograma lado a lado
Figura 10: Anaglifo
3.2.Paralaje
Se define paralaje [12] como la distancia espacial relativa que existe entre
puntos homólogos de las dos imágenes que conforman un estereograma plano.
El ángulo de paralaje es aquel para el que los rayos que provienen de dos ojos
convergen en un punto del espacio tridimensional.
Figura 9: Imagen lenticular
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
29
Éste es el concepto más importante en lo que a la representación de la
profundidad en imágenes 3D se refiere. Sin paralaje no hay percepción de
espacio tridimensional. Un estereograma, aunque contenga dos imágenes, si
tiene paralaje cero (en todo su espacio), no provocará el efecto visual de
profundidad.
Dicho esto, si observamos un escenario como el de la Figura 11: a)
Diferencia de paralajes entre objetos cercanos y lejanos , veremos que la
distancia relativa entre homólogos varía en función de la distancia de
profundidad a la que se encuentre del observador dicho punto en el espacio real
tridimensional. Este hecho se recoge en la Figura 12: b) Diferencia de paralajes
entre objetos cercanos y lejanos, donde se han superpuesto las imágenes I/D.
Por tanto, objetos más lejanos al observador variarán poco de posición
comparando las imágenes I/D, con lo que su paralaje será pequeño. De la misma
forma, objetos más cercanos al observador variarán mucho su posición relativa,
con lo que su paralaje será mayor. Nótese que a través del paralaje podremos
inferir la distancia al objeto.
I D
Figura 11: a) Diferencia de paralajes entre objetos cercanos y lejanos
Figura 12: b) Diferencia de paralajes entre objetos cercanos y lejanos
Sin embargo, el paralaje no es una medida absoluta, sino que debe
encontrarse dentro de un rango aceptable que permita la acomodación del ojo.
El ojo humano (o más bien el cerebro) no está preparado para admitir valores
altos de paralaje, generando en el observador una visión incómoda y a veces
imposible. Si el paralaje es demasiado pequeño (en módulo), no se apreciara
profundidad. Usando una cámara 3D que consta de dos lentes, se puede ajustar
el paralaje y hacerlo tender a valores positivos o negativos, causando
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
30
hiperparalaje o hipoparalaje, además de una posible desacomodación y estrés
ocular.
Cuando observamos el efecto de una imagen tridimensional en una
pantalla plana podemos decir que estamos percibiendo profundidad en la
misma, con lo que habrá objetos que aparezcan por delante de la pantalla, otros
que lo hagan en la misma pantalla y otros que lo hagan por detrás de la misma.
Nótese que el objeto no está realmente por detrás de la pantalla, sino que es la
sensación que da. Esto se consigue cuando se juega con el paralaje de manera
adecuada: valores negativos de paralaje harán que aparezcan objetos por
delante de la pantalla, mientras que un valor de paralaje de cero representará
los objetos a la misma profundidad que la pantalla. Valores positivos provocarán
que los objetos aparezcan por detrás de la pantalla.
Figura 13: Tipos de paralajes aplicados a estereogramas 3D
Cuando el paralaje positivo es igual a la separación de los ojos humanos
(65mm aprox.) ocurre que los rayos oculares permanecen paralelos para
enfocar la imagen, que aparece representada en el infinito. Si el paralaje
positivo toma valores mayores que la distancia interocular humana aparece el
Paralaje Negativo
Imagen I
Imagen D
Ojo I
Ojo D
Paralaje Cero
Imágenes I y D
Ojo I
Ojo D
Ojo I
Ojo D
Ojo I
Ojo D
Imagen I
Imagen D
Paralaje Positivo
El objeto aparece aqui
El objeto aparece aqui
El objeto aparece detrás de la pantalla, donde se cortan las prolongaciones de los rayos.
Imagen I
El ojo no se acomoda
Paralaje Divergente
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
31
llamado paralaje divergente, que impide la acomodación del ojo para formar el
objeto tridimensional tal y como aparece en la Figura 13: Tipos de paralajes
aplicados a estereogramas 3D, página 30.
PFC: DISEÑO Y RESOLUCIÓN DE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
32
Aplicación de la Ciencia Visual a la Televisión 3D 4.
Una vez comprendidos los conceptos sobre los que se basa el
funcionamiento de la visión tridimensional, se va a pasar a discutir cómo aplicar
éstos conceptos para adaptarlos a los requisitos de las tecnologías 3D
disponibles actualmente.
4.1.Tipos de Sistemas 3D y métodos aplicados
Sistemas Pasivos 4.1.1.
Su principal característica [13] consiste en plantear las imágenes en la
pantalla de manera que las gafas no necesiten de ningún tipo de electrónica
activa. De esta manera, las gafas se caracterizan por ser baratas, ligeras y por no
causar fatiga o estrés ocular, ya que la imagen que llega al ojo no se ve
interrumpida de manera brusca y periódica. La técnica pasiva por excelencia
requiere el uso de
Figura 14: Imágenes polarizadas
superpuestas (vista sin gafas)
Figura 15: Sistema 3D por polarización
polarización circular de distintos sentidos o el uso de polarización lineal
(vertical/ horizontal) para imágenes I/D. De esta manera, en los sistemas pasivos
se emiten en una misma pantalla las imágenes superpuestas con distinta
polarización –mediante el uso de filtros polarizadores situados en la propia
pantalla- y simultáneamente, y, mediante el uso de gafas polarizadas (cada
lente atiende a un tipo de polarización), se consigue observar con cada ojo la
imagen correspondiente para lograr el efecto 3D. Este efecto puede apreciarse
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
33
en la Figura 14: Imágenes polarizadas superpuestas (vista sin gafas) y Figura 15:
Sistema 3D por polarización, Página 32.
El principal inconveniente consiste en que las dos imágenes se muestran
en la pantalla de manera simultánea, con lo que cada frame necesita dos píxeles
para cada punto en lugar de uno. Esto se traduce en una pérdida de la mitad de
la resolución de la imagen, aunque, como ventaja, la fatiga ocular generalmente
asociada a los sistemas activos no existe.
Sistemas Anaglíficos 4.1.2.
Se refiere a la técnica [14] por la cual, las imágenes provenientes de cada
lente I/D, pasan por un filtro de color hasta convertirse en tonos rojo/cian,
rojo/azul, amarillo/azul, naranja/azul, rojo/verde o verde/magenta que son las
combinaciones más típicas, siendo esta última la que mejores resultados de
color ofrece.
Una vez convertidas, las imágenes se superponen (ver
Figura 10: Anaglifo, página 28) en una pantalla -preferentemente de
alta reflexión lumínica, aunque cualquier pantalla convencional sirve- para
evitar la generación de fantasmas, que se explican más abajo. Para decodificar
la imagen son necesarias lentes 3D de colores rojo/cian, rojo/azul, o cualquiera
que sea la codificación de las imágenes. Arriba, en la Figura 16: Gafas
Anaglíficas se pueden observar las primeras. La lente de color rojo no dejará
pasar el rojo y la lente cian no dejará pasar al cian. De esta manera a cada ojo
llega una de las dos imágenes generando como se ha venido diciendo hasta
ahora, la sensación de profundidad.
Los inconvenientes de esta técnica de estereoscopía son varios. Por un
lado está la aparición de fantasmas, que se dan cuando las lentes anaglíficas no
bloquean por completo la capa de color que deben, filtrándose por tanto, la
Figura 16: Gafas Anaglíficas
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
34
imagen debida y parte de la indebida. El efecto sería similar a mirar una imagen
anaglífica sin lentes: aparecen contornos semitransparentes que dan el aspecto
de un fantasma en la imagen.
Por otro lado está el problema inherente que conlleva usar lentes de
distintos colores. Al atravesar una lente, la luz roja no tiene la misma distancia
focal que la luz azul (ver Figura 17: Distancias focales para luz roja y azul). Al
usar estas lentes, se está forzando a un ojo a enfocar a distinta distancia que el
otro. Además de esto, y más importante todavía es el hecho de que la
intensidad lumínica de las imágenes I/D (rojo/cian) es distinta, con lo que una
pupila deberá abrirse más que la otra para acomodar la imagen. Estos dos
factores degradan progresivamente la visión, cosa que no ocurre con el uso de
sistemas pasivos.
Como solución al problema de la diversidad focal de la luz se introducen
dioptrías en las lentes rojas con el fin de hacer coincidir las distancias focales.
Distancias focales
Luz roja/azul
Figura 17: Distancias focales para luz roja y azul
Sistemas Activos 4.1.3.
El funcionamiento de estos sistemas se basa [15] en el uso de gafas de
oclusión activas (en inglés, shutter glasses). La pantalla muestra cada imagen I/D
de manera alternada en el tiempo, usando para ello todo el espacio disponible
(resolución total). Las gafas, mediante algún enlace infrarrojo, de
radiofrecuencia o por cable, se sincronizan con la frecuencia de refresco de la
pantalla, tapando el ojo izquierdo cuando se muestra en pantalla la imagen
derecha y viceversa. La frecuencia de refresco habitual de las gafas es de 120Hz
(60Hz para cada ojo, habitual en 2D), con lo que la pantalla debe ser compatible
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
35
con esta característica. La técnica que se usa para tapar cada lente en cada
momento es la polarización. En la Figura 18: Sistema de Gafas Activas por
Oclusión (Shutter Glasses) se puede ver gráficamente el funcionamiento global
de este tipo de sistemas.
Derecha
Izquierda
Derecha
Izquierda
t
f = 160 Hz
Sistemas Autoestereoscópicos 4.1.4.
La principal cualidad de este tipo de sistemas es la ausencia de gafas [16]
u otro medio auxiliar para visualizar contenidos 3D. Se encuentran en fase de
desarrollo y de momento se aplican en pequeñas pantallas, como cámaras de
video o teléfonos celulares debido a su pobre eficacia tanto en resolución como
en brillo. Otra de las cualidades de los sistemas autoestereoscópicos es que
algunos ofrecen más de dos puntos de vista (hasta 9 ó 10). No obstante,
sistemas basados en lentes lenticulares o barreras de paralaje tienen
típicamente un solo usuario debido a sus aplicaciones, con lo que estos tipos de
sistemas ofrecen solo dos vistas.
Llegados a este punto, es importante remarcar que el término
autoestereoscópico se refiere a sistemas holográficos y volumétricos, aunque
por convención se ha acabado extendiendo en el lenguaje común a los ya
mencionados arriba sistemas basados en lentes lenticulares o en barreras de
paralaje, que se pasan a describir a continuación por ser los que, actualmente,
se fabrican para venta al usuario, aunque de manera tímida por el momento.
Figura 18: Sistema de Gafas Activas por Oclusión (Shutter Glasses)
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
36
Lentes Lenticulares 4.1.5.
Según la RAE:
Lenticular.
adj. Parecido en la forma a la semilla de la lenteja.
La lentes lenticulares son lentes de forma lenticular (de lenteja) que,
dispuestas en array en una pantalla de plástico transparente, consiguen
direccionar la luz en haces de dos direcciones distintas.
Esta cualidad es aprovechable para los sistemas de imágenes 3D si se
consigue que un haz coincida con uno de los ojos de un observador y el otro haz
con el otro ojo del observador. De esta manera, disponiendo las dos imágenes
superpuestas y multiplexadas espacialmente (ver Figura 9: Imagen lenticular,
Página 28) y aplicando esta capa de lentes transparentes a la pantalla, se
consigue que un grupo píxeles alternos (pertenecientes a una de las dos
imágenes multiplexadas) se vean con un ojo y que el resto de píxeles se vea con
el otro. Así se consigue que cada ojo observe una imagen 2D distinta,
combinándolas en otra 3D. El esquema de funcionamiento queda recogido en la
Figura 19: Funcionamiento de las Lentes Lenticulares.
El principal inconveniente de esta tecnología es que la imagen 3D solo se
observará correctamente desde un único punto específico del espacio,
Figura 19: Funcionamiento de las Lentes Lenticulares
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
37
limitando por tanto la experiencia visual y haciéndolo inaprovechable para
grandes pantallas con múltiples espectadores.
4.1.5.1. Barreras de Paralaje
Son bastante más usados en la práctica que las lentes lenticulares aunque
también necesitan que el observador se encuentre en el punto exacto del
espacio para visualizar las imágenes 3D. Una ventaja frente a las lentes
lenticulares es que permiten ver adecuadamente imágenes 2D (buen brillo y
resolución).
La barrera de paralaje es una rejilla de cristal líquido situada entre la
fuente de luz y la imagen de la pantalla con hendiduras que coinciden con
ciertas columnas de dicha imagen como se aprecia en la Figura 20:
Funcionamiento de la Barrera de Paralaje.
Cuando se visualizan contenidos 3D, la barrera de paralaje se activa
mediante voltaje e impide el paso de luz a ciertas columnas de píxeles, de
manera que, desde la posición óptima, el ojo izquierdo y derecho ven diferentes
Figura 20: Funcionamiento de la Barrera de Paralaje
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
38
imágenes, ya que estas se hallarán, al igual que en las Lentes Lenticulares,
multiplexadas espacialmente.
4.2.Problemas en la visualización de contenidos 3D
Como se ha venido viendo a lo largo de este texto, se han enumerado
varias causas por las que puede aparecer fatiga, estrés o degradación visual,
bien por culpa del sistema de visualización en el caso de anaglifos (Sección 4.1.2
Sistemas Anaglíficos, Página 33) o en el de los sistemas activos (Sección 4.1.3
Sistemas Activos, Página 34), bien por problemas achacables a la calidad
estereoscópica de dichos contenidos. Sin embargo, hasta ahora se ha obviado
una causa inherente a todas las tecnologías de visualización 3D, debido a algo
que todas tienen en común: la proyección de imágenes sobre una pantalla de
dos dimensiones.
Posición aparente
Posición real
Ojo I
Ojo D
Imagen D
Imagen I
Figura 21: El problema de la acomodación del ojo
Cuando el ojo humano percibe profundidad (posicional y estructural) en
un objeto tridimensional, el cerebro, además de inferir esta distancia de
profundidad (ver Figura 7: El proceso de la estereovisión, página 26 y Figura 21:
El problema de la acomodación del ojo), ordena al ojo a enfocar la vista a esa
distancia. La cuestión es, que esa distancia no es real, es sólo una percepción
que proviene de la disparidad entre las imágenes I/D [17]. La verdadera
distancia es la que hay entre el observador y la pantalla sobre la que se
proyectan los contenidos 3D. De esta manera, al tratar de enfocar a una
distancia equivocada, el ojo obtiene una imagen desenfocada (el efecto es como
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
39
volverse miope de repente). Esta información viaja al cerebro, en forma de
realimentación, y es utilizada, como en un bucle, para reenfocar la vista hasta
obtener un contorno nítido. Este desacuerdo entre el ojo y el cerebro provoca
fatiga o estrés ocular.
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
40
Diseño y Resolución de Prácticas 5.
A continuación se pasa a describir el proceso de diseño y creación de
cada una de las 3 prácticas que se han diseñado para el Laboratorio de
Televisión 3D.
Como prólogo a las memorias, se ha redactado un documento
informativo bajo el título “Antes de empezar…” que describe y explica de
manera breve el funcionamiento de los equipos que se van a emplear en las
prácticas. Es un documento que se entrega junto a la práctica 1 y se encuentra
en el 8.1 Anexo 1: Enunciados de Prácticas, página 77.
Para visualizar el enunciado íntegro de cada práctica de que se dispondrá
en el laboratorio, véase el 8.1 Anexo 1: Enunciados de Prácticas, página 75.
5.1.Primera Práctica
Como se ha venido diciendo hasta ahora, debido a la falta de
conocimientos acerca de estereoscopía y demás conceptos de la Ciencia Visual
(mucho menos sus aplicaciones al 3D), la primera práctica versa sobre los
aspectos más básicos del 3D: se estudiará a fondo cómo se logra la percepción
3D, qué es el paralaje y cuáles son sus implicaciones, entre otras cosas. Es
natural que, dada la naturaleza formativa de esta primera práctica, la extensión
de los resultados del laboratorio sea breve y concisa, dejando para el trabajo
posterior la mayor parte del tiempo.
Resúmen 5.1.1.
Para empezar, se muestra un video 3D introductorio de muestra que se
halla en la memoria interna de la videocámara. Esto sirve tanto de motivación al
alumno como de primera toma de contacto con el sistema de visión 3D del
laboratorio.
Una vez comprobada la sensación de ver contenidos 3D en un televisor,
se pasa a visualizar la captación de la cámara en tiempo real en el mismo, y a
realizar una serie de cortos experimentos para comprender el funcionamiento
del sistema.
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
41
A continuación se reproducirán videos y fotos pregrabados de la
memoria interna de la cámara en el televisor, para estudiar el ya mencionado
concepto de “paralaje”. Se comprarán las diferentes fotografías y se realizarán,
de nuevo, una serie de experimentos cortos para asentar este concepto clave en
la estereoscopía.
Por último, se estudiará una importante cualidad del contenido 3D: la
imposibilidad de hacer zoom en un video que ya ha sido grabado. Se
comprobará dicha imposibilidad y se inferirá el por qué de esta singularidad.
Material implicado 5.1.2.
En el desarrollo de esta práctica serán necesarios:
Televisor 3D-HD PANASONIC
Gafas de oclusión activas
Videocámara 3D-HD JVC
Esquema de Montaje 5.1.3.
En la Figura 22: Esquema de Montaje Práctica 1, página 42, se detalla la
conexión necesaria de los equipos para la correcta realización de esta práctica.
La videocámara se conectará mediante el cable HDMI provisto en la caja de la
misma al puerto HDMI-4 del televisor, sintonizando éste a ese canal desde el
botón del mando a distancia “SOURCE”. De esta manera, la captación de la
cámara será vista en el televisor en tiempo real. Para reproducir un video
pregrabado de la memoria de la cámara en el televisor, no hay más que darle a
“PLAY” en el menú de la cámara.
Para ver correctamente los contenidos 3D en el televisor son necesarias
las gafas de oclusión activa que dispone el laboratorio.
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
42
Resolución de la Práctica 5.1.4.
A continuación se muestra la resolución de la práctica en el laboratorio de cada
una de las cuestiones planteadas:
Grabación y reproducción de imágenes en 3D
a) Cuando reproducimos en el televisor 3D una imagen tridimensional,
las gafas se oscurecen. ¿A qué es debido este efecto?
La mitad del tiempo, cada lente permanece polarizada de manera que no deja pasar luz (es así como las gafas permiten ver solo la imagen I o D de manera alterna, ya que se sincroniza con el televisor). El efecto óptico resultante es un leve oscurecimiento de la misma.
b) Comprobar qué ocurre cuando tapamos uno de los objetivos de la
cámara. ¿Por qué ocurre esto?
El resultado es que se graba solo la imagen I o D. Como consecuencia, cuando tratemos de ver la imagen 3D en el televisor, se apreciará únicamente aquella imagen cuyo objetivo no ha sido tapado, ergo, solo
Conexión puerto HDMI-4
PANASONIC
Gafas de OclusiónEnlace infrarrojo
Figura 22: Esquema de Montaje Práctica 1
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
43
se apreciara una imagen 2D entremezclada con otra totalmente en negro.
c) ¿Y si grabamos sujetando la cámara de manera que los objetivos de la
misma estén uno encima del otro? ¿Se reproducirá correctamente en modo LADO A LADO o en modo ARRIBA Y ABAJO?
Se reproducirá correctamente en modo LADO A LADO, con la salvedad de que las imágenes grabadas estarán “tumbadas”. Si la cámara graba en un modo determinado, no es alterable girándola.
Paralaje (Parallax)
a) El paralaje es...
La distancia entre dos puntos correspondientes (homólogos) en las
imágenes I/D superpuestas. Ver Figura 23: Puntos Homólogos y Paralaje, Página 43.
b) Cuanto más lejos se encuentra un objeto en la realidad, ¿mayor/menor? es el paralaje del mismo.
Menor. Si tenemos en cuenta que el paralaje es la distancia entre puntos homólogos de las imágenes I/D, al alejarnos mucho de un objeto, el
ángulo de incidencia de los rayos oculares se hace más pequeño, con lo que la imagen I/D se hacen más parecida reduciéndose el paralaje.
Figura 23: Puntos Homólogos y Paralaje
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
44
α
β D
ista
nci
a h
ori
zon
tal
ojos
Figura 24: Paralaje frente al ángulo de incidencia ocular
c) Si un objeto presenta paralaje negativo, aparecerá representado por delante/detrás de la pantalla. Si su paralaje es positivo, aparecerá
delante/detrás de la misma.
Delante. Detrás. El paralaje es la distancia que hay entre dos puntos homólogos pertenecientes a las imágenes I/D si las superponemos en un mismo fotograma. El paralaje puede ser positivo (la distancia entre I y D
medida desde I a D es positivo y por tanto converge entre la pantalla y el ojo), negativo (la distancia entre I y D medida desde D a I es positivo y por tanto converge entre la pantalla y el infinito o nula (no hay distancia entre puntos homólogos y converge sobre la pantalla). Ver Figura 13: Tipos de paralajes aplicados a estereogramas 3D, página 30.
d) Cuando un objeto se acerca demasiado a la cámara, su percepción 3D (ignora el desenfoque) en pantalla... (Comprobar con la cámara).
Se desvirtúa. Esto es así porque el paralaje necesario para representar el objeto se sale del rango admisible por el ojo humano (65 mm).
e) La distancia focal de la cámara es, aproximadamente de 80 cm (comprobar experimentalmente) y da la distancia mínima para la cual la percepción 3D de las imágenes...
Comienza a ser correcta. Al no haber enfoque, el paralaje se difumina
igualmente, generando menos sensación de profundidad en general (que no menos paralaje).
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
45
f) Desactivando simplemente el ajuste automático de paralaje de la
cámara (y no tocándolo más) ¿qué le ocurre a los objetos muy lejanos cuando se graba una escena con objetos cercanos y objetos muy lejanos a la vez?
Los objetos demasiados lejanos no presentan paralaje alguno, al estar la
escala afectada por los objetos cercanos, con lo que no dan percepción de profundidad. Es decir, en comparación con el alto paralaje que presentan objetos cercanos, la cámara pierde en sensibilidad desvirtuando objetos lejanos.
g) En base a lo anterior, explicar qué ocurre cuando ajustamos manualmente el paralaje a valores extremos (positivo o negativo).
Si situamos el paralaje al máximo, la percepción 3D se arruina, no permitiendo a nuestro ojo acomodarse a la profundidad deseada, provocando malestar y estrés ocular debido a que percibiremos paralajes superiores a 65 mm. La imagen se visualizaría de manera “correcta” si los rayos oculares divergieran, situación que no es posible para el ojo humano convencional.
h) Deducir qué ocurre cuando el paralaje de un objeto es igual a la distancia interocular (65mm). ¿Dónde queda representado el objeto? ¿Por qué? ¿Qué ocurre si aumentamos más el paralaje?
El objeto se representa en el infinito, porque para enfocar la vista hacia ese objeto nuestros rayos oculares deben permanecer paralelos para observar un punto (ya que la distancia entre las imágenes superpuestas para ese mismo punto es igual a la distancia entre nuestros ojos),
haciendo que los rayos oculares se crucen en el infinito. En la Figura 25: Paralaje para visión al infinito, página 46 se detalla este caso. Si aumentáramos más el paralaje, p. ej. a 80mm, los rayos oculares deberían divergir para enfocar ese objeto, lo cual, es en general, imposible o difícil de conseguir.
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
46
Ojo I
Imagen I
Imagen D
La separación de homólogos iguala a la de los ojos. Los rayos
son paralelos y el objeto aparece en el infinito
65 mm 65 mm
Figura 25: Paralaje para visión al infinito
i) Comprobar si un desenfoque deliberado de la imagen estropea la percepción 3D de la misma. ¿Por qué? ¿Cuándo, aproximadamente se dejará de percibir profundidad?
La percepción 3D no se estropea hasta que el desenfoque es comparable
al paralaje del objeto representado. Es decir, cuando el paralaje queda anulado por el desenfoque.
Efectos del ZOOM 3D
a) ¿Por qué cree que no permite hacer tal operación? ¿Sería posible hacer lo mismo en un vídeo grabado en 2D?
El problema de hacer un zoom de este tipo, esto es, en postproducción, es que el efecto 3D queda mermado. En un video en 2D no hay problema como ya sabemos.
b) ¿Guardan la coherencia que deberían de guardar las imágenes I/D o aparecen elementos discordantes entre una imagen y otra?
Se observa que las imágenes divergen mucho y algunas zonas de las mismas dejan de tener coherencia alguna con su recíproca.
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
47
c) ¿Por qué un zoom en postproducción merma el efecto 3D de una
imagen y sin embargo un zoom en tiempo real no? Explíquelo también detalladamente en la memoria.
En postproducción, al hacer zoom ampliamos la imagen incluyendo al paralaje. El resultado sería que el paralaje aumentaría a valores,
probablemente, incómodos. Es decir, una imagen cuyo paralaje máximo fuera de 40 mm, al hacer un zoom doble aumentaría hasta 80 mm haciendo imposible su percepción tridimensional.
El zoom de cámara en tiempo real ajusta el paralaje a medida que hace zoom para que el efecto anterior no aparezca. El ajuste del paralaje no es más que una corrección en tiempo real del ángulo de incidencia de los rayos que proyectan las lentes.
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
48
5.2.Segunda Práctica
En esta ocasión, la práctica de laboratorio se centrará en el procesado de
imágenes 3D estereoscópicas para hacerlas llegar al hogar a través de la Red de
Televisión. Se reproducirán mediante MATLAB los principales métodos de
compresión y se analizarán sus características mediante comparación.
Resumen 5.2.1.
La práctica empieza con una breve introducción y una motivación: ¿por
qué se comprimen las imágenes 3D para mandarlas por la red? Se espera que el
propio alumno llegue a alguna hipótesis e intuya cuáles serían las consecuencias
de ignorar este bache.
En el siguiente punto de la práctica se describirán brevemente al alumno
los distintos métodos de compresión más habituales y se le instará,
mostrándole el resultado deseado, a que diseñe cada algoritmo compresor en
MATLAB.
Como colofón, se realizará un breve resumen, comparando la eficacia y
dificultad de implementación de los distintos métodos de compresión.
Material Implicado 5.2.2.
En el desarrollo de esta práctica serán necesarios:
Puesto de trabajo de Laboratorio: Ordenador Personal.
Software de Cálculo Técnico MATLAB.
Ordenador 3D con gafas activas NVIDIA NVISION.
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
49
Esquema de Montaje 5.2.3.
Cada puesto de trabajo dispondrá de una instalación del software
MATLAB, desde el cual se llevará a cabo la mayor parte de la práctica realizando
los pasos descritos en la memoria de la misma. Una vez obtenidos los resultados
deseados, estos se transferirán al servidor del laboratorio vía LAN para
posteriormente acceder a ellos desde el Ordenador 3D.
Puestos de Trabajo
Servidores
Ordenador 3D
Figura 26: Esquema de Montaje Práctica 2
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
50
Resolución de la Práctica 5.2.4.
Sin compresión alguna, necesitamos transmitir, como se vio en la práctica anterior, las imágenes izquierda y derecha de la captación para inducir la percepción de profundidad. Llegados a este punto, ¿por qué
cree que es importante, si no indispensable, a la hora de transmitir medios 3D a través de la red de TV, el hecho de comprimir en la medida de lo posible los contenidos visuales?
En la red de TV, como en cualquier otra, el ancho de banda cuesta
dinero. Así nuestra meta es tratar de, con el mismo ancho de banda con el que transmitíamos medios 2D, transmitir medios 3D. Se hace necesario comprimir y perder resolución en las imágenes tridimensionales a costa de encajarlas en el mismo ancho de banda.
¿Cuál es el % de información que necesitamos transmitir de forma adicional para añadir 3D a una imagen 2D si no usamos compresión alguna? Desprecie el audio y demás datos de streaming.
Tenemos que transmitir no una, sino dos imágenes pertenecientes a cada ojo: Usamos el doble de ancho de banda para transmitir contenidos 3D. Así, necesitamos añadir, un 100% adicional.
Compresión por columnas
¿Cuál es el % de información que necesitamos transmitir de forma
adicional para añadir 3D a una imagen 2D si usamos compresión por
columnas?
Original (versión 2D)
Comprimida (estereoscópica)
% Adicional para transmitir
1623/2=811.5 KB ~1064 KB ~31.1 %
El código de este compresor se puede consultar en la Sección 5.2.5 Códigos de MATLAB, página 53. Asimismo se encontrarán los resultados arrojados por dicho compresor.
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
51
Compresión por filas
¿Cuál es el % de información que necesitamos transmitir de forma
adicional para añadir 3D a una imagen 2D si usamos compresión por
filas?
El código de este compresor se puede consultar en la Sección Sección
5.2.5 Códigos de MATLAB, página 53. Asimismo se encontrarán los resultados arrojados por dicho compresor.
Mallado Quincunx
¿Cuál es el % de información que necesitamos transmitir de forma
adicional para añadir 3D a una imagen 2D si usamos compresión por
filas?
El código de este compresor se puede consultar en la Sección 5.2.5 Códigos de MATLAB, página 53. Asimismo se encontrarán los resultados arrojados por dicho compresor.
Compresión 2D + Delta
¿Cuál es el % de información que necesitamos transmitir de forma
adicional para añadir 3D a una imagen 2D si usamos compresión por
filas?
Original (versión 2D) Comprimida (estereoscópica)
% Adicional para transmitir
1623 / 2 = 811.5 KB ~1024 KB ~26.2 %
Original (versión 2D) Comprimida (superpuesta)
% Adicional para transmitir
1623 / 2 = 811.5 KB ~1155 KB ~42.3 %
Original (versión 2D) Comprimida (2D+Delta)
% Adicional para transmitir
1623 / 2 = 811.5 KB ~1527 KB ~88.2 %
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
52
El código de este compresor se puede consultar en la Sección 5.2.5
Códigos de MATLAB, página 53. Asimismo se encontrarán los resultados arrojados por dicho compresor.
…En Resumen
Llegados a este punto, rellene el siguiente cuadro e inclúyalo en su
memoria:
% adicional BW Pérdida Resolución Complejidad
Filas ~ 20 – 25 % Grande 2-3
Columnas ~ 20 – 25 % Grande 2-3
Quincunx ~ 30 – 40 % Pequeña 4
2D+Delta ~ 60 – 90 % Ninguna 1
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
53
Códigos de MATLAB 5.2.5.
A continuación se presentan unos códigos de MATLAB válidos para la
correcta resolución de la práctica:
Se pide, en este punto, generar el código MATLAB para comprimir dos
imágenes por distintos métodos. Para ello se procederá a crear un programa
modular, en el que el primer módulo permitirá que se abran y cierren (guarden)
videos como si fueran matrices de píxeles. Este modulo será invariable para
todos los tipos de compresión de video de la práctica.
El segundo módulo del programa contendrá el algoritmo propio de cada técnica
de compresión.
La resolución se ha supuesto sobre un video titulado “Flor.avi”,
representado en la Figura 27: Video Original (Flor.avi), sobre el que se ha
ejecutado la aplicación Stereo Movie Maker (ver Sección 1.2.2.4 Stereo Movie
Maker, Página 13) para separar el estereograma en dos videos
correspondientes a los lados I/D.
Además, debido a problemas de espacio y dimensionamiento de matrices
en MATLAB, ha sido necesario crear un módulo previo que limita el número
máximo de frames del video a comprimir. Se presenta a continuación bajo el
nombre de “100frames.m”:
Figura 27: Video Original (Flor.avi)
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
54
%Esta función recorta un video a la capacidad máxima que
%MATLAB va a soportar en términos de edición (100 frames)
clear all;
% Creamos un manejador de video y rellenamos una estructura de
% video con los frames del original
%-------------------------------------------------------------
MANEJADOR = VideoReader('Flower.avi');
ESCRITOR = VideoWriter ('Flor.avi');
vidFrames = read(MANEJADOR, [1 100]);
for k = 1 : 100
mov(k).cdata = vidFrames(:,:,:,k);
mov(k).colormap = [];
end
% Se guarda el nuevo archivo de video de nombre 'Flor.avi'
%---------------------------------------------------------
open (ESCRITOR);
writeVideo (ESCRITOR, mov);
close (ESCRITOR);
5.2.5.1. Diseño del módulo principal
Se presenta a continuación el código generado seguido de una
descripción detallada del mismo. Debido a que el módulo principal de cada
compresor es el mismo variando sólo la llamada al módulo de compresión,
únicamente se comentará dicho módulo una vez, especificando el nombre de
archivo y variación del código en cada caso para adaptarlo a su correspondiente
módulo de compresión.
clear all;
% Creamos los manejadores de video
%---------------------------------
MANEJADOR_I = VideoReader('Flor_I.avi');
MANEJADOR_D = VideoReader('Flor_D.avi');
ESCRITOR = VideoWriter ('Resultado.avi');
numFrames = get(MANEJADOR_I, 'numberOfFrames');
% Se leen los frames del video
%-----------------------------
vidFrames_I = read(MANEJADOR_I, [1 numFrames]);
vidFrames_D = read(MANEJADOR_D, [1 numFrames]);
% Creamos una estructura de video. Los frames se almacenan en el
% campo CDATA, de tamaño Alto x Ancho x 3RGB x Numero de frames
%---------------------------------------------------------------
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
55
for k = 1 : numFrames
mov_I(k).cdata = vidFrames_I(:,:,:,k);
mov_I(k).colormap = [];
mov_D(k).cdata = vidFrames_D(:,:,:,k);
mov_D(k).colormap = [];
end
% Aplicamos a cada frame la compresion requerida
%-----------------------------------------------
for i = 1 : numFrames
FRAME_I = mov_I(i).cdata;
FRAME_D = mov_D(i).cdata;
stereo(i).cdata = Compresioncol (FRAME_I, FRAME_D);
stereo(i).cdata = uint8(stereo(i).cdata);
stereo(i).colormap = [];
end
% Grabamos el archivo de video resultante
%----------------------------------------
open (ESCRITOR);
writeVideo (ESCRITOR, stereo);
close (ESCRITOR);
% Mostramos las imágenes I y D comprimidas
%-----------------------------------------
hf = figure;
set(hf, 'position', [400 150 MANEJADOR_I.Width
MANEJADOR_I.Height]);
for i=1:5
movie(hf, stereo, 1, MANEJADOR_I.FrameRate);
end
close all;
Primeramente se crean los llamados manejadores de video, que
permiten etiquetar un video abierto con la función “VideoReader” bajo un
nombre determinado, en nuestro caso MANEJADOR_I y MANEJADOR_D,
empleados para las versiones I/D del video.
A continuación se abre un video inexistente en modo escritura para
volcar el resultado final de la compresión. Así, el manejador de video del
resultado será ESCRITOR, mientras que el nombre del archivo correspondiente
será “Resultado.avi”. Este paso se realiza mediante la función “VideoWriter”.
Es siguiente paso lógico es leer el número total de frames de que dispone
el video (100 como máximo) y almacenarlos, uno a uno mediante la función
“read” en las variables vidFrames_I y vidFrames_D. Una vez almacenados, se
crea una estructura mov_I y otra mov_D, normalizada para videos, que constará
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
56
de los campos cdata y colormap, de los que solo emplearemos cdata
almcenando el contenido de vidFrames.
El último paso es aplicar, frame a frame, mediante un bucle, la
compresión requerida. Para ello en cada iteración se leerá un frame de cada
lado I/D y se mandarán al módulo que contiene el algoritmo de compresión,
devolviendo este un array llamado stereo que contiene los frames comprimidos
de las versión I/D “pegadas” según el tipo de compresión empleada. En nuestro
caso de compresión por columnas se hará en modo lado a lado.
Finalmente, se grabarán los resultados arrojados en la variable stereo en
el archivo “Resultado.avi” empleando para ello su manejador ESCRITOR. A
modo de comprobación se incluye la línea de código para visualizar los
resultados en MATLAB.
5.2.5.2. Diseño de los módulos de compresión
Se presenta a continuación el código generado para cada uno de los
módulos de compresión, seguido de una descripción detallada del mismo.
Compresión por columnas
El nombre correspondiente a este archivo es “Compresioncol.m”. El
correspondiente módulo principal es el archivo “VideoCol.m”, mostrado más
arriba.
% Esta función toma frames por separado de cada lado y los
comprime por columnas, unificando los resultados en un nuevo
frame llamado 'stereo'
%---------------------------------------------------------------
function stereo = Compresioncol(FRAME_I, FRAME_D)
% FRAME %Esta es la imagen original
%Cada pixel son 3 números RGB en fila
%hay el triple de columnas por tanto.
% Eliminar Columnas alternas
%--------------------------
IMI = FRAME_I;
IMD = FRAME_D;
[nf,nc] = size (IMI);
ncc = ceil(nc/3);
stereo = [nf, ncc, 3];
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
57
k=1;
for ii=1:2:nc/3
for j=1:nf
stereo(j,k,1)=IMI(j,ii,1);
stereo(j,k,2)=IMI(j,ii,2);
stereo(j,k,3)=IMI(j,ii,3);
end
k=k+1;
end
for ii=2:2:nc/3
for j=1:nf
stereo(j,k,1)=IMD(j,ii,1);
stereo(j,k,2)=IMD(j,ii,2);
stereo(j,k,3)=IMD(j,ii,3);
end
k=k+1;
end
La estructura general de este módulo de compresión seguirá el esquema
de recibir dos frames simultáneos de las versiones I/D del video original y crear
un array vacío llamado “stereo” sobre el que se volcarán, píxel a píxel el
contenido de los frames originales ya comprimidos. Como resultado, este
módulo entrega al módulo principal el array “stereo”, correspondiente este
únicamente a un solo frame del video resultante final. Es decir, se realiza una
compresión frame a frame.
El algoritmo compresor va leyendo columnas alternas del frame izquierdo
y rellenándolas en columnas contiguas de stereo. Una vez terminado de leer el
frame izquierdo se hace lo propio con el derecho. Para evitar confusiones se han
Figura 28: Flor comprimida por columnas
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
58
renombrado FRAME_I y FRAME_D como IMI y IMD respectivamente dentro de
los módulos.
El resultado de aplicar la compresión por columnas se refleja en la Figura
28: Flor comprimida por columnas, Página 57.
Compresión por filas
El nombre correspondiente a este archivo es “Compresionfilas.m”. El
correspondiente módulo principal es el archivo “VideoFil.m”. La modificación
necesaria con respecto al módulo principal descrito más arriba será la llamada al
módulo de compresión como ya se dijo:
% Aplicamos a cada frame la compresion requerida
%-----------------------------------------------
for i = 1 : numFrames
FRAME_I = mov_I(i).cdata;
FRAME_D = mov_D(i).cdata; stereo(i).cdata = Compresionfilas (FRAME_I, FRAME_D);
stereo(i).cdata = uint8(stereo(i).cdata);
stereo(i).colormap = [];
end
A continuación el módulo de compresión “Compresionfilas.m”.
function stereo = Compresionfilas(FRAME_I, FRAME_D)
% FRAME %Esta es la imagen original
%Cada pixel son 3 numeros RGB en fila
%hay el triple de columnas por tanto.
%Eliminar filas alternas
[nf,nc] = size (FRAME_I);
nfc = ceil (nf/2);
stereo = [nfc , nc*2, 3]; %Crea Matriz comprimida en filas
j=1;
for i=1:2:nf
for k=1:nc/3
stereo(j,k,1) = FRAME_I (i,k,1);
stereo(j,k,2) = FRAME_I (i,k,2); %Se copian los
valores RGB
stereo(j,k,3) = FRAME_I (i,k,3);
end
j=j+1; %alternas de la original
end
j=1;
for i=2:2:nf
for k=1:nc/3
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
59
stereo(j,k+nc/3,1) = FRAME_D (i,k,1);
stereo(j,k+nc/3,2) = FRAME_D (i,k,2); %Se copian
los valores RGB
stereo(j,k+nc/3,3) = FRAME_D (i,k,3);
end
j=j+1; %alternas de la
original
end
De nuevo, y de manera parecida al anterior, se toman dos frames simultáneos
del video original, se crea un array llamado “stereo” y, leyendo filas alternas del
frame izquierdo y después del frame derecho, se van rellenando en filas
contiguas del array “stereo”. Igual que antes, por cada frame de video original
se accede una vez al módulo de compresión.
El resultado de la compresión por filas se recoge en la Figura 29: Flor
comprimida por filas:
Compresión por mallado Quincunx
El nombre correspondiente a este archivo es “mixQX.m”. El
correspondiente módulo principal es el archivo “VideoQX.m”. La modificación
necesaria con respecto al módulo principal descrito más arriba será la llamada al
módulo de compresión como ya se dijo:
% Aplicamos a cada frame la compresion requerida %---------------------------------------------- for i = 1 : numFrames FRAME_I = mov_I(i).cdata; FRAME_D = mov_D(i).cdata; stereomix(i).cdata = mixQX (FRAME_I, FRAME_D); stereomix(i).cdata = uint8(stereomix(i).cdata); stereomix(i).colormap = []; end
Figura 29: Flor comprimida por filas
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
60
Este es un caso especial de compresión. En los anteriores métodos se
veía que al comprimir por filas o columnas, eliminábamos la mitad de cada
frame, con el consecuente ahorro de espacio o ancho de banda mínimo
necesario. El mallado Quincunx elimina diagonales alternas, generando lo que
podría ser un “tablero de ajedrez”, como se puede apreciar en la Figura 30:
Mallado Quincunx.
Es por ello que al eliminar los cuadrados negros de la imagen y conservar
los blancos, no supone apenas una pérdida en el tamaño (en bytes) del video.
Esto es debido a que las actuales técnicas de compresión de video se basan en
la correlación de dos píxeles adyacentes para ahorrar en información.
Introduciendo estos cambios tan abruptos eliminamos información del píxel
eliminado por un lado pero perdemos también la ventaja de la correlación de
píxeles adyacentes. El resultado es que el tamaño del video apenas varía. Para
eliminar esta traba y para poder comparar realmente el peso del video
resultante con los anteriores métodos, se aplicará un mallado complementario a
los frames izquierdos y derechos, superponiendo ambas imágenes en una sola.
De esta manera sigue existiendo el beneficio de la correlación de píxeles
adyacentes.
El algoritmo correspondiente al módulo de compresión es el que sigue:
Figura 30: Mallado Quincunx
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
61
function stereomix = mixQX (FRAME_I, FRAME_D)
stereomix = FRAME_D; [nf,nc] = size (FRAME_D);
% Superponemos un mallado Quincunx de la imagen izquierda sobre
la derecha. for i=1:2:nc/3 for j=1:2:nf stereomix (j,i,1) = FRAME_I (j,i,1); stereomix (j,i,2) = FRAME_I (j,i,2); stereomix (j,i,3) = FRAME_I (j,i,3); end
end
for i=2:2:nc/3 for j=2:2:nf stereomix (j,i,1) = FRAME_I (j,i,1); stereomix (j,i,2) = FRAME_I (j,i,2); stereomix (j,i,3) = FRAME_I (j,i,3); end end
En lugar de realizar dos mallados, se toma un frame, en este caso el
derecho y se superpone un mallado Quincunx del izquierdo. Este resultado se
recoge en el array “stereomix” y queda reflejado en la Figura 31: Flor
comprimida por Quincunx. En la Figura 32: Detalle Quincunx, página 62, se
puede apreciar un zoom de postproducción, en el que se ve en detalle el
mallado verde sobre fondo negro.
Figura 31: Flor comprimida por Quincunx
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
62
Compresión 2D+Delta
El nombre correspondiente a este archivo es “CompresionDelta.m”. El
correspondiente módulo principal es el archivo “videodelta.m”. La modificación
necesaria con respecto al módulo principal descrito más arriba será la llamada al
módulo de compresión como ya se dijo:
% Aplicamos a cada frame la compresion requerida %---------------------------------------------- for i = 1 : numFrames FRAME_I = mov_I(i).cdata; FRAME_D = mov_D(i).cdata; stereomix(i).cdata = CompresionDelta (FRAME_I, FRAME_D); stereomix(i).cdata = uint8(stereomix(i).cdata); stereomix(i).colormap = []; end
Este es, con diferencia, el método de compresión más sencillo de realizar
(y el que menos resultados da). El algoritmo de compresión se reduce a
transmitir por el canal la imagen izquierda y la imagen diferencia entre izquierda
y derecha. Esta imagen diferencia recibe el nombre de “Imagen Delta” y
consiste en la resta aritmética de la conversión a escala de números de los
colores de cada píxel, píxel a píxel. Es decir, cada píxel se corresponde con un
número entre 0 y 255 en función de su color. La imagen delta resta pixel a pixel
obteniendo un nuevo color. Si la imagen izquierda y derecha no difieren mucho
una de la otra en ciertos píxeles, el resultado de la imagen delta serán píxeles en
negro (o elementos a 0 en la matriz de color). Usando técnicas de reducción de
matrices es posible comprimir esta matriz que contará con un gran número de
ceros entre sus elementos. Además (y fortuitamente), debido a la compresión
mpeg de los fotogramas, dos píxeles consecutivos en espacio o tiempo que sean
muy similares se verán igualados reduciendo la carga en bits. Esta es la
Figura 32: Detalle Quincunx
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
63
compresión que observamos del 20% en nuestros resultados, y no otra, ya que
se sale de nuestro objetivo aprender técnicas de reducción de matrices.
El algoritmo correspondiente al módulo de compresión es el que sigue:
function stereo = CompresionDelta (FRAME_I, FRAME_D)
% FRAME %Esta es la imagen original
%Cada pixel son 3 numeros RGB en fila
%hay el triple de columnas por tanto.
DELTA = FRAME_D - FRAME_I;
[nf, nc] = size (FRAME_D);
for i=1:nf
for j=1:nc/3
stereo (i,j,1) = FRAME_I (i,j,1);
stereo (i,j,2) = FRAME_I (i,j,2);
stereo (i,j,3) = FRAME_I (i,j,3);
end
for j=1:nc/3
stereo (i,j+nc/3,1) = DELTA (i,j,1);
stereo (i,j+nc/3,2) = DELTA (i,j,2);
stereo (i,j+nc/3,3) = DELTA (i,j,3);
end
end
El resultado de aplicar este método de compresión se recoge en la Figura
33: Flor comprimida por 2D+Delta. Se ha representado el fotograma izquierdo
acompañado del fotograma delta dispuestos en formato side-by-side.
Figura 33: Flor comprimida por 2D+Delta
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
64
5.3.Tercera Práctica
La tercera y última práctica llevará al alumno a entender en profundidad
los conceptos adquiridos en 3D mediante su puesta en práctica. Se creará un
entorno 3D artificial mediante el programa Bryce 7.1 desde el que se realizarán
diferentes experimentos ayudándose de MATLAB para comprobar de primera
mano los conceptos antes mencionados.
Resumen 5.3.1.
En primer lugar, mediante el programa Bryce 7.1, se creará un entorno
artificial en 3D.
Una vez creado, empieza la fase de experimentación consistente en
obtener un fotograma estereoscópico del propio entorno y comprimirlo de la
misma forma que se hizo en la Práctica 2 respondiendo, desde un punto de vista
tecnológico, al por qué de dicha operación. Además, se añade una nueva forma
de codificación: codificación anaglífica.
Por último, se realizarán diferentes pruebas con el entorno y la captación
de imágenes del mismo relacionadas con el paralaje y la acomodación ocular.
Material implicado 5.3.2.
En el desarrollo de esta práctica serán necesarios:
Puesto de trabajo de Laboratorio: Ordenador Personal.
Software de Entorno 3D: Bryce 7.1.
Software de Cálculo Técnico MATLAB.
Ordenador 3D con gafas activas NVIDIA NVISION.
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
65
Esquema de Montaje 5.3.3.
Cada puesto de trabajo dispondrá de una instalación del software Bryce
7.1, desde el cual se llevará a cabo la mayor parte de la práctica realizando los
pasos descritos en la memoria de la misma. Una vez obtenidos los resultados
deseados, estos se transferirán al servidor del laboratorio vía LAN para
posteriormente acceder a ellos desde el Ordenador 3D.
Puestos de Trabajo
Servidores
Ordenador 3D
Figura 34: Esquema de Montaje Práctica 3
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
66
Resolución de la Práctica 5.3.4.
En primer lugar se crea un entorno cualquiera que cuente con objetos prediseñados cercanos, intermedios y lejanos y se dota de unas texturas prediseñadas cualesquiera.
Obtención de Anaglifo
Generamos dos códigos de MATLAB nuevos necesarios para obtener 2 imágenes filtradas a rojo y azul a partir de las imágenes I/D tomadas de nuestro entorno 3D. El código correspondiente se encuentra en la
El resultado arrojado por la función “Anaglifos.m” es el siguiente:
Figura 35: Anaglifos Rojo/Azul
Posteriormente se aplica la función “mallado_qx” desarrollada en la anterior práctica:
Figura 36: Anaglifo funcional
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
67
Obtención de imagen autoestereoscópica
A partir de las mismas imágenes I/D de nuestro entorno 3D, se aplica el código “Lenticular.m”, cuyo resultado es:
Figura 37: Entorno 3D para Lentes Lenticulares
Experimento 1: Comprobar el efecto del intercambio I/D.
En la representación lado a lado, se pide comprobar qué le ocurre a la percepción tridimensional cuando intercambiamos las imágenes I/D. Anote los efectos observados y justifíquelos en detalle.
Al intercambiar de sitio las dos imágenes, ocurre que el efecto de profundidad se invierte. Los objetos que parecían salir entran en la pantalla y viceversa. Esto es debido a que al intercambiar las imágenes estamos invirtiendo el signo del paralaje, que es el que da la percepción
de profundidad. Así lo que aparecía delante de la pantalla (paralaje negativo) aparecerá más allá de la pantalla (paralaje positivo).
Experimento 2: Efectos de modificar el entorno 3D en el paralaje.
En la representación lenticular, se pide comprobar el efecto de mover (en profundidad) diferentes objetos del entorno 3D creado con Bryce en el paralaje (No se pide añadir nuevos objetos, sino moverlos). Anotar los resultados observados al:
Traer un objeto del fondo al frente. Mover un objeto del frente al fondo.
Posicionar en el centro del entorno (cercano a la bola roja creada en el paso 1 de la página 3) un objeto que estaba lejos del mismo (en términos
de profundidad espacial).
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
68
En los dos primeros casos, el paralaje invierte de su valor original, con lo
que se pasa de percibir al objeto dentro (fuera) de la pantalla a hacerlo fuera (dentro). En el tercer caso, debido a que la referencia de paralaje está en el centro de nuestro entorno 3D, todo objeto que se posicione allí tendrá paralaje aproximadamente cero. Aparecerá como lo haría una imagen 2D: en la propia pantalla sin profundidad.
Experimento 3: Exceso de separación de objetivos
Con la representación lado a lado, comprobar qué ocurre cuando tomamos dos instantáneas de nuestro entorno 3D demasiado separadas. ¿Qué le ocurre al paralaje para objetos cercanos, medios y lejanos? Trate de visualizar la imagen con ayuda de un monitor 3D y anote sus observaciones.
Al tomar dos capturas demasiado separadas en ángulo, el paralaje de los objetos cercanos y lejanos aumentará a valores demasiado grandes, haciendo imposible la visualización de la imagen en el monitor 3D, ya que el paralaje es tanto mayor como los es el ángulo de incidencia (véase Figura 24: Paralaje frente al ángulo de incidencia ocular, página
44. El paralaje de los objetos situados cerca del centro se verá invariado. En definitiva, aumenta el MÓDULO del paralaje.
Experimento 4: El problema de la acomodación del ojo
Visualice el estereograma lado a lado con ayuda de un monitor 3D y gafas. Concéntrese en enfocar la vista en objetos muy cercanos o muy lejanos de manera que aprecie con total nitidez los contornos de los mismos hasta que el estrés ocular se lo impida. Obviando la fatiga
causada por la conmutación de las gafas (por otro lado inapreciable en tan poco tiempo de exposición), ¿a que cree que se debe esta incomodidad? ¿Por qué aparece este efecto? ¿Por qué algunas personas tardan más en sufrir este tipo de fatiga? Explíquelo de manera detallada.
Cuando visualizamos contenido 3D, obtenemos una sensación de profundidad que el cerebro interpreta como real. Al tratar de enfocar la vista en objetos lejanos o cercanos, el cerebro interpretará que están lejos de la pantalla (bien hacia dentro de la pantalla, bien hacia fuera). De esta manera, para enfocar la vista en ese objeto, el cerebro hará que
el ojo trate de enfocar a la distancia a la que infiere que está dicho objeto, cuando realmente esta proyectado en una pantalla 2D a una distancia fija. Este desacuerdo genera fatiga ocular: el cerebro manda una orden de acomodación al ojo y descubre que se equivoca (el objeto aparece desenfocado en la retina), forzando la vista. Algunas personas
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
69
no sufren tan rápidamente este efecto porque están acostumbradas a
“engañar” al cerebro y enfocar la vista sobre la pantalla mirando a objetos lejanos/cercanos. Esto se consigue con experiencia. Este efecto puede verse con más claridad en la Figura 21: El problema de la acomodación del ojo, página 38.
Códigos de MATLAB 5.3.5.
A continuación se muestra el código correspondiente a la obtención del
anaglifo. Primeramente se dispone del archivo “Anaglifos.m” que toma dos
imágenes tipo “bmp” como entrada y devuelve las mismas filtradas a rojo/azul y
superpuestas mediante un mallado quincunx:
%Funcion principal
clear all;
Izq = imread ('Imagen I.bmp');
Der = imread ('Imagen D.bmp');
[ROJO, AZUL] = Colores (Izq, Der);
Mallado_qx (ROJO, AZUL);
Este programa llama a dos funciones “Colores.m”, que filtra las dos
imágenes a rojo y azul, y “mallado_qx.m”, que las mezcla (Sección 5.2.5.2 Diseño
de los módulos de compresión). Se presenta solo, por tanto, la función
“Colores.m”:
%Funcion que asigna una escala de rojos y
%azules a segun que imagen.
function [ROJO, AZUL] = Colores (Izq, Der);
ROJO = Der;
AZUL = Izq;
[nf, nc] = size (ROJO);
for i=1:nf
for j=1:nc/3
ROJO(i,j,1) = ROJO (i,j,1);
ROJO(i,j,2) = 0;
ROJO(i,j,3) = 0;
end
end
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
70
for i=1:nf
for j=1:nc/3
AZUL(i,j,1) = 0;
AZUL(i,j,2) = AZUL (i,j,2);
AZUL(i,j,3) = AZUL (i,j,3);
end
end
AZUL = uint8 (AZUL);
ROJO = uint8 (ROJO);
figure();
image (ROJO);
figure();
image (AZUL);
imwrite (ROJO, 'rojo.bmp');
imwrite (AZUL, 'azul.bmp');
A continuación se presenta el código correspondiente a la creación de la
imagen lenticular. Se toman dos imágenes I/D en formato “bmp” y se mezclan
por columnas alternas mediante el programa “Lenticular.m”:
clear all;
IMI = imread ('Imagen I.bmp');
IMD = imread ('Imagen D.bmp');
% figure();
% image(IMI);
% hold on; %Esta es la imagen original
%Cada pixel son 3 numeros RGB en fila
%hay el triple de columnas por tanto.
%Eliminar Columnas alternas
[nf,nc] = size (IMI);
ncc = ceil(nc/3);
IMmod = [nf , ncc, 3];
IMmod = IMD;
for i=1:2:nc/3
for j=1:nf
IMmod(j,i,1)=IMI(j,i,1);
IMmod(j,i,2)=IMI(j,i,2);
IMmod(j,i,3)=IMI(j,i,3);
end
end
%Representamos la imagen comprimida:
figure();
IMmod=uint8(IMmod);
image(IMmod);
imwrite (IMmod, 'Imagen Modificada.bmp');
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
71
Conclusiones 6.
6.1.Conclusiones a título personal
La realización de este proyecto de Televisión 3D ha supuesto para mi
persona un desafío a muchos niveles, tanto en lo intelectual como en lo
personal.
Por un lado, el hecho de enfrentarse a un Proyecto de Fin de Carrera ya
debería bastar y dar por satisfecho a cualquier aspirante a ingeniero: dar cara a
cara con un problema real al que hay que buscar una solución y conseguirlo
supone un gran esfuerzo y una verdadera toma de contacto con el mundo
laboral.
A lo anterior debo añadir que, embarcarme en un proyecto sobre un
tema del que jamás he tenido la menor noción como es el mundo de la
Televisión (y más allá todavía el de la Televisión 3D) me ha supuesto un reto de
incalculable valor. Pocas veces he tenido la oportunidad de aprender desde cero
sobre un tema y realizar un trabajo tan completo. Es por ello que considero un
acierto haber elegido este proyecto.
6.2.Conclusiones objetivas
Este proyecto buscaba diseñar una batería de prácticas para el
Laboratorio de Televisión 3D, para lo cual se han diseñado un total de 3
prácticas estructuradas de manera que el alumno consiga un máximo
aprendizaje sobre la materia.
Las prácticas constan de trabajo previo (un estudio breve antes de cada
práctica), un desarrollo en el laboratorio, y un trabajo posterior. Además cada
práctica basa su trabajo en el aprendizaje de la anterior, de manera que los
conceptos se van arrastrando a lo largo de todo el curso. Para garantizar el
verdadero entendimiento de los mismos, en cada práctica se tratan desde un
punto de vista distinto.
En la primera práctica se tratan los conceptos básicos de Televisión 3D a un
nivel básico, mostrando sus efectos en aplicaciones reales de video. La segunda
práctica toma algunos de los conceptos de la primera práctica y otros nuevos y
PFC: DISEÑO Y RESOLUCIÓNDE PRÁCTICAS PARA EL LABORATORIO DE TELEVISIÓN 3D
72
los implementa en distintas aplicaciones de compresión de video. La tercera
práctica muestra, en tiempo diferido, las implicaciones e interrelaciones de los
conceptos anteriores en el resultado final: la pantalla que verá el usuario final
del video 3D.
Referencias 7.
[1] http://www.en.wikipedia.org/3D_television
[2] http://www.en.wikipedia.org/3D_television
[3] http://www.all-about-3dtv.com/history-of-3d-tv.html
[4] http://www.theguardian.com/film/2009/aug/20/3d-film-
history
[5] http://www.history.com/this-day-in-history/first-color-3-d-film-opens
[6] http://widescreenmovies.org/WSM11/3D.htm
[7] RODRÍGUEZ López, Jorge. Radiodifusión de la 2º Generación
de 3DTV. Hispasat. http://es.slideshare.net/LTIM_UIB/radiodifusin-de-la-2-generacin-de-3dtv-10463795
[8] http://www.dvb.org/technology/standards/a154_DVB-3DTV_Spec.pdf
[9] http://www.dvb.org/technology/standards/A154-3_DVB-3DTV-Service-Compatible.pdf
[10] http://lema.rae.es/drae/srv/search?key=est%C3%A9reo
[11] MINOLI, Daniel. 3D Television (3DTV) Technology, Systems, and Deployment. Rolling Out the Infrastructure for Next-Generation Entertainment. 1ª ed. Boca Ratón, 2011. ISBN: 978-1-4398-4066-5. Capítulo 2. Páginas 39 – 44.
[12] MINOLI, Daniel. 3D Television (3DTV) Technology, Systems, and Deployment. Rolling Out the Infrastructure for Next-Generation Entertainment. 1ª ed. Boca Ratón, 2011. ISBN: 978-1-4398-4066-5. Capítulo 2. Páginas 44 – 49.
[13] MINOLI, Daniel. 3D Television (3DTV) Technology, Systems,
and Deployment. Rolling Out the Infrastructure for Next-Generation Entertainment. 1ª ed. Boca Ratón, 2011. ISBN: 978-1-4398-4066-5. Capítulo 3. Páginas 85 – 87.
74
[14] MINOLI, Daniel. 3D Television (3DTV) Technology, Systems, and Deployment. Rolling Out the Infrastructure for Next-Generation Entertainment. 1ª ed. Boca Ratón, 2011. ISBN: 978-1-4398-4066-5. Capítulo 3. Páginas 87 – 89.
[15] MINOLI, Daniel. 3D Television (3DTV) Technology, Systems, and Deployment. Rolling Out the Infrastructure for Next-
Generation Entertainment. 1ª ed. Boca Ratón, 2011. ISBN: 978-1-4398-4066-5. Capítulo 3. Página 87.
[16] MINOLI, Daniel. 3D Television (3DTV) Technology, Systems, and Deployment. Rolling Out the Infrastructure for Next-Generation Entertainment. 1ª ed. Boca Ratón, 2011. ISBN:
978-1-4398-4066-5. Capítulo 3. Páginas 94 – 97.
[17] MINOLI, Daniel. 3D Television (3DTV) Technology, Systems, and Deployment. Rolling Out the Infrastructure for Next-Generation Entertainment. 1ª ed. Boca Ratón, 2011. ISBN: 978-1-4398-4066-5. Capítulo 3. Páginas 113 – 114.
75
ANEXOS 8.
8.1.Anexo 1: Enunciados de Prácticas
A continuación se presentan los enunciados de prácticas íntegros, tal y como se
entregarán a los alumnos del Laboratorio de Televisión 3D. La práctica 1 contiene una
breve introducción a los elementos del Laboratorio que se emplearán durante las
prácticas.
76
Práctica 1
Introducción a la 3DTV: Aspectos fundamentales
de las imágenes tridimensionales
77
Antes de empezar...
Se detalla a continuación una breve memoria de los elementos que atañen a las prácticas de 3DTV, obviando aquellos equipos del laboratorio que no interferirán en el desarrollo de las mismas (véase servidores, modulador, switchers...) El Laboratorio de Televisión Digital ha adquirido 3 equipos basados en tecnología 3D que debemos conocer antes de realizar las prácticas de curso:
Televisor 3D PANASONIC TX-P42VT20E.
Ordenador 3D con tecnología NVIDIA 3D VISION. Cámara 3D JVC Everio GS-TD1.
A continuación los aspectos más importantes de cada elemento:
Televisor 3D
Se trata de un televisor capaz de representar imágenes estáticas y en movimiento en 3 dimensiones ayudándose para ello de unas gafas activas de oclusión. El funcionamiento de la tecnología de oclusión activa (active shutter) es el siguiente: El televisor 3D, cuando funciona en modo 3D, emite las imágenes izquierda y derecha (I/D) de
manera alternada en el tiempo. Las gafas se sincronizan con esta alternancia entre imágenes gracias a un enlace infrarrojo y cuando en el televisor se muestra la imagen D (I), el cristal I (D) de
las gafas se polariza de manera que impide el paso de la imagen al ojo I (D). De esta manera, vemos la imagen I con el ojo I y la imagen D con el ojo D creándose así la ilusión o efecto 3D.
Para ver correctamente imágenes en 3D en el televisor 3D debemos activar, en opciones 3D, la
opción LADO A LADO.
Ordenador 3D La tecnología empleada por el ordenador 3D así como por las gafas 3D VISION es exactamente la
misma que por el Televisor 3D.
Cámara 3D La captación de imágenes en 3 dimensiones se hace posible cuando una misma escena se graba desde 2 o mas puntos distintos. Para emular el efecto de visión 3D que en nosotros es natural debido a la existencia de dos ojos, la cámara cuenta con dos objetivos distintos con una separa ción aproximadamente igual a la de los ojos humanos (65mm). Así recoge las imágenes I/D de cada escena que posteriormente se mandaran a un monitor con tecnología 3D de alternancia de imágenes I/D (como nuestro televisor 3D u ordenador 3D). La grabación de vídeos debe ser en formato AVCHD y nunca en MP4 (pues este formato solo es
capaz de ser decodificado por la propia cámara en su pantalla).
78
Primera Práctica
Objetivos
Esta práctica pretende acercar al alumno por primera vez a la tecnología de representación de imágenes en 3 dimensiones (3D). Al finalizar la misma, el alumno comprenderá en profundidad el
funcionamiento de, al menos, dos tecnologías distintas de representación de imágenes en 3D. Para ello se emplearán los nuevos equipamientos con los que cuenta el laboratorio de Televisión Digital: cámara de grabación 3D, Televisor y ordenador 3D y gafas de oclusión. También deberá echar mano de la documentación que estime oportuna para complementar los conocimientos requeridos por la práctica.
Trabajo Previo
Es obligatorio leer, antes de la práctica, sobre la temática siguiente:
Antes de empezar...
Esteroscopía.
Paralaje. Acomodación del ojo humano.
Uso de la polarización en tecnologías 3D. Oclusión en 3D y reconstrucción de imágenes 3D.
Se recomienda, aunque no es obligatorio ni necesario, seguir el guión de estos puntos a través del libro disponible en biblioteca: Minoli, Daniel. “Capítulo 2”. 3D Television (3DTV) Technology, Systems, and Deployment. Rolling Out the Infrastructure for Next-Generation Entertainment. Editorial: Boca Raton : Taylor & Francis,
2011.
Trabajo Posterior
El alumno deberá redactar una memoria de cada práctica en la que se expliquen los diferentes conceptos vistos durante la misma, así como cualquier dato obtenido y las implicaciones que ello tenga. Se deja a discreción del alumno decidir el guión a seguir en la memoria, debiendo incluir los siguientes puntos:
Objetivos de la práctica. Breve descripción de lo que se pretende que el alumno aprenda en la práctica.
Desarrollo de experimentos en el laboratorio. Descripción del trabajo realizado en el laboratorio explicando los conceptos vistos en el mismo y justificando los datos obtenidos. Se sugiere el uso de diagramas si procede. Procurar entrar en detalle y, si es necesario, ir
más allá de lo explicado en la práctica usando la bibliografía o internet.
Adicional. Explicar el funcionamiento de otras dos tecnologías de visión 3D (distintas a la del laboratorio): 3D pasivo y 3D sin gafas.
Conclusiones. Conclusiones extraídas por el alumno.
79
Desarrollo de la Práctica
Realice las anotaciones que considere oportunas. Este documento no es entregable, sino para su uso personal.
Grabación y reproducción de imágenes en 3D
Para la realización de este apartado conectar la cámara 3D al puerto HDMI-4 del televisor 3D y encenderla sin grabar, viendo en el televisor la captación de la cámara.
El modo de representación de imágenes en nuestro televisor es de alternancia temporal I/D con gafas de activas de oclusión por polarización. Para más señas leer “Antes de empezar...” acerca del funcionamiento del televisor 3D. a) Cuando reproducimos en el televisor 3D una imagen tridimensional, las gafas se oscurecen. ¿A qué es debido este efecto?
b) Comprobar qué ocurre cuando tapamos uno de los objetivos de la cámara. ¿Por qué ocurre esto?
Sabemos que la cámara capta las imágenes I/D y por tanto para reproducirlas en el televisor 3D lo
configuramos como LADO A LADO.
c) ¿Y si grabamos sujetando la cámara de manera que los objetivos de la misma estén uno encima del otro? ¿Se reproducirá correctamente en modo LADO A LADO o en modo ARRIBA Y ABAJO?
Paralaje (Parallax)
En la cámara 3D se encuentran los vídeos y las fotos correspondientes a esta práctica. Para ver
fotos/videos, seleccionar la cámara en modo foto/video y pulsar “ver galería” (Abajo a la izquierda de la pantalla).
Se analizarán a continuación dichos archivos para comprender las implicaciones que tienen
diversos parámetros en la percepción 3D de imágenes. El alumno debe dar cuenta de la importancia del concepto de paralaje. Para ello: Se abrirán sucesivos archivos de imágenes (y se pondrá el televisor en modo 3D LADO A LADO y se visualizará cada imagen tanto con ayuda de las gafas 3D como sin ellas. Para asentar los siguientes conceptos, se realizará una reproducción en tiempo real de la vista de la cámara. Realizar las anotaciones pertinentes en función a lo observado: a) El paralaje es... b) Cuanto más lejos se encuentra un objeto en la realidad, ¿mayor/menor? es el paralaje del mismo.
c) Si un objeto presenta paralaje negativo, aparecerá representado por delante/detrás de la
pantalla. Si su paralaje es positivo, aparecerá delante/detrás de la misma.
80
d) Cuando un objeto se acerca demasiado a la cámara, su percepción 3D (ignora el desenfoque) en pantalla... e) La distancia focal de la cámara es, aproximadamente de cm (comprobar experimentalmente) y da la distancia mínima para la cual la percepción 3D de las imágenes...
f) Desactivando simplemente el ajuste automático de paralaje de la cámara (y no tocándolo más) ¿qué le ocurre a los objetos muy lejanos cuando se graba una escena con objetos cercanos y
objetos muy lejanos a la vez?
g) En base a lo anterior, explicar qué ocurre cuando ajustamos manualmente el paralaje a valores extremos (positivo o negativo).
h) Deducir qué ocurre cuando el paralaje de un objeto es igual a la distancia interocular (65mm). ¿Dónde queda representado el objeto? ¿Por qué? ¿Qué ocurre si aumentamos más el paralaje? i) Comprobar si un desenfoque deliberado de la imagen estropea la percepción 3D de la misma. ¿Por qué? ¿Cuándo, aproximadamente se dejará de percibir profundidad?
Efectos del ZOOM 3D
Ahora se comprobará el efecto y la diferencia que tiene hacer zoom sobre una imagen 3D ya
grabada, esto es, en postproducción, y en tiempo real (en la cámara).
En primer lugar se reproduce en el televisor 3D el vídeo ya grabado en la memoria de la cámara 3D. Prueba a hacer zoom con el mando de la televisión o con los controles de la cámara.
a) ¿Por qué crees que no permite hacer tal operación? ¿Sería posible hacer lo mismo en un vídeo
grabado en 2D? A continuación, reproducir de nuevo el mismo vídeo pero configurando las opciones de
reproducción 3D del televisor en AUTOMÁTICO. Ahora deberían mostrarse las imágenes correspondientes I/D grabadas por los objetivos I/D de la cámara 3D. Es lo que se llama una
representación estereoscópica de la misma. Prueba a hacer zoom al máximo (zoom 3) con el mando del televisor (botón ASPECTO).
b) ¿Guardan la coherencia que deberían de guardar las imágenes I/D o aparecen elementos
discordantes entre una imagen y otra?
c) ¿Por qué un zoom en postproducción merma el efecto 3D de una imagen y sin embargo un zoom en tiempo real no? Explícalo también detalladamente en la memoria.
81
Práctica 2
Tratamiento de imágenes 3DTV: Compresión y transmisión de imágenes al hogar
82
Segunda Práctica
Objetivos Esta práctica tiene por objetivo principal provocar una aproximación superficial del alumno a las
distintas técnicas de compresión de imágenes que se emplean en la realidad para transmitirlas por la red de TV. Además, se busca también que el alumno averigüe, por cuenta propia y echando
mano de la documentación actualizada que considere oportuna, la tendencia del mercado 3D así como las tecnologías en vías de desarrollo.
Trabajo Previo Es obligatorio leer, antes de la práctica, sobre la temática siguiente:
Técnicas de compresión de imágenes 3D:
◦ Multiplexión espacial (por columnas, por filas y mallado quincunx)
◦ Multiplexión temporal.
◦ 2D + Delta y Video + capa de profundidad (V+D ó Video plus Depth).
Fase de Trama Compatible y Fase de Servicio Compatible en 3DTV (DVB-3DTV).
Tratamiento de vídeos en MATLAB: funciones VideoReader, read, VideoWriter, writeVideo, set y movie. Estructuras de vídeo (campos .cdata y .colormap).
Se recomienda, aunque no es obligatorio ni necesario, seguir el guión del primero de estos 3 puntos a través del libro disponible en biblioteca: Minoli, Daniel. “Capítulo 4”. 3D Television (3DTV) Technology, Systems, and Deployment. Rolling
Out the Infrastructure for Next-Generation Entertainment. Editorial: Boca Ratón : Taylor & Francis, 2011.
Trabajo Posterior El alumno deberá redactar una memoria de cada práctica en la que se expliquen los diferentes conceptos vistos durante la misma, así como cualquier dato obtenido y las implicaciones que ello
tenga. Se deja a discreción del alumno decidir el guión a seguir en la memoria, debiendo incluir los siguientes puntos:
Objetivos de la práctica. Breve descripción de lo que se pretende que el alumno aprenda
en la práctica. Desarrollo de experimentos en el laboratorio. Descripción del trabajo realizado en el
laboratorio explicando los conceptos vistos en el mismo y justificando los datos obtenidos. Se sugiere el uso de diagramas si procede. Procurar entrar en detalle y, si es necesario, ir
más allá de lo explicado en la práctica usando la bibliografía o internet.
Adicional. Se pide que el alumno investigue sobre las nuevas tecnologías de representación 3D que están por llegar, así como la evolución en la transmisión de imágenes tridimensionales al hogar y la tendencia de la cuota del mercado 3D. Además, deberá incluir en la memoria el código de MATLAB correspondiente a los 4 métodos de compresión
vistos en la práctica: compresión por filas, columnas, quincunx y 2D+Delta.
Conclusiones. Conclusiones extraídas por el alumno.
Desarrollo de la Práctica Realice las anotaciones que considere oportunas. Este documento no es entregable, sino para su uso personal. En esta práctica, se va a proceder a implementar mediante el uso de MATLAB los distintos métodos
de compresión de imágenes que se mencionan en la lectura previa de la misma.
Sin compresión alguna, necesitamos transmitir, como se vio en la práctica anterior, las imágenes izquierda y derecha de la captación para inducir la percepción de profundidad. Llegados a este
punto, ¿por qué cree que es importante, si no indispensable, a la hora de transmitir medios 3D a través de la red de TV, el hecho de comprimir en la medida de lo posible los contenidos visuales?
¿Cuál es el % de información que necesitamos transmitir de forma adicional para añadir 3D a una imagen 2D si no usamos compresión alguna? Desprecie el audio y demás datos de streaming.
Compresión por columnas
Se trata de eliminar columnas alternas de cada uno de los frames y enviarlas a la red. En la carpeta
de la práctica se encuentran los archivos “Flor_I.avi” “Flor_D.avi”. Se trata de dos archivos de video correspondientes a las imágenes izquierda y derecha y provienen del archivo de video original
fuente “Flor.avi”.
Proceda a completar el código de MATLAB que falta para realizar la compresión en cuestión. Una vez hecho, ejecute el código y obtenga, esta vez, un fichero de video estereoscópico como se
muestra en la figura de manera que se pueda comparar con su homólogo original:
¿Cuál es el % de información que necesitamos transmitir de forma adicional para añadir 3D a una imagen 2D si usamos compresión por columnas?
Original (versión 2D) Comprimida (estereoscópica) % Adicional para transmitir
NOTA: Guarde la función de compresión por columnas, ya que se requerirá en la siguiente práctica.
84
Compresión por filas
Se trata de eliminar columnas alternas de cada uno de los frames y enviarlas a la red. En la carpeta de la práctica se encuentran los archivos “Flor_I.avi” “Flor_D.avi”. Se trata de dos archivos de video correspondientes a las imágenes izquierda y derecha y provienen del archivo de video original fuente “Flor.avi”. Proceda a completar el código de MATLAB que falta para realizar la compresión en cuestión. Una vez hecho, ejecute el código y obtenga, esta vez, un fichero de video estereoscópico como se muestra en la figura de manera que se pueda comparar con su homólogo original:
¿Cuál es el % de información que necesitamos transmitir de forma adicional para añadir 3D a una imagen 2D si usamos compresión por filas?
Original (versión 2D) Comprimida (estereoscópica) % Adicional para transmitir
Mallado Quincunx
Se trata de eliminar diagonales alternas de cada uno de los frames y enviarlo a la red. En la carpeta de la práctica se encuentran los archivos “Flor_I.avi” y “Flor_D.avi”. Se trata de dos archivos de video correspondientes a las imágenes izquierda y derecha y provienen del archivo de video original fuente “Flor.avi”. Proceda a completar el código de MATLAB que falta para realizar la compresión en cuestión. Una vez hecho, ejecute el código y obtenga, esta vez, un fichero de video con cada frame comprimido de un lado superpuesto al frame comprimido del otro lado como se muestra en la figura, de manera que se pueda comparar con su homólogo original:
¿Cuál es el % de información que necesitamos transmitir de forma adicional para añadir 3D a una imagen 2D si usamos compresión por filas?
85
Original (versión 2D) Comprimida (superpuesta) % Adicional para transmitir
Compresión 2D + Delta
Se trata en este caso último de tomar las imágenes izquierda y derecha de un frame
estereoscópico y transmitir una de ellas tal cual y el fotograma delta. Este fotograma no es más que la diferencia entre la imagen que transmitimos y la que no transmitimos (I — D ó D — I). La
idea será transmitir por tanto, la imagen, en nuestro caso, derecha y la imagen delta. En la carpeta de la práctica se encuentran los archivos “Flor_I.avi” y “Flor_D.avi”. Se trata de dos archivos de
video correspondientes a las imágenes izquierda y derecha y provienen del archivo de video original fuente “Flor.avi”. Proceda a completar el código de MATLAB que falta para realizar la compresión en cuestión. Una vez hecho, ejecute el código y obtenga, esta vez, un fichero de video con cada frame como se muestra en la figura, de manera que se pueda comparar con su homólogo original:
¿Cuál es el % de información que necesitamos transmitir de forma adicional para añadir 3D a una imagen 2D si usamos compresión por filas?
Original (versión 2D) Comprimida (2D+delta) % Adicional para transmitir
…En resumen
Llegados a este punto, rellene el siguiente cuadro e inclúyalo en su memoria:
% adicional de BW Pérdida de resolución Complejidad Computacional
Compresión Filas Compr. Columnas
Mallado quincunx 2D + Delta
86
Práctica 3
Generación y análisis de estereogramas a partir de entornos 3D creados artificialmente.
87
Tercera Práctica
Objetivos Durante el desarrollo de esta práctica se buscará que el alumno compruebe experimentalmente el
proceso de visualización de imágenes 3D, generando para ello con un software especial entornos 3D. Se obtendrán diferentes representaciones estereoscópicas del entorno creado a partir de la
edición manual de las capturas. Posteriormente, se trabajará con las imágenes comprobando sobre ellas el efecto de modificar el entorno 3D creado. De esta manera, se as entarán por completo los
conceptos mencionados en la práctica 1.
Trabajo Previo Es obligatorio leer (en profundidad), antes de la práctica, sobre la temática siguiente:
Tutorial breve para principiantes en Bryce 7.1. El Paralaje. Tipos y Signo del Paralaje. Mallado Quincunx.
Sistemas 3D Pasivos (por polarización de imágenes).
Sistemas 3D Activos (por multiplexión temporal – oclusión activa).
Sistemas basados en Anaglifos. Sistemas Autoestereoscópicos (Lentes Lenticulares y Barreras de Paralaje).
Se recomienda, aunque no es obligatorio ni necesario, seguir los cuatro últimos puntos a través del
libro disponible en biblioteca:
Minoli, Daniel. “Capítulos 2 y 3”. 3D Television (3DTV) Technology, Systems, and Deployment. Rolling Out the Infrastructure for Next-Generation Entertainment. Editorial: Boca Ratón : Taylor &
Francis, 2011.
Trabajo Posterior El alumno deberá redactar una memoria de cada práctica en la que se expliquen los diferentes conceptos vistos durante la misma, así como cualquier dato obtenido y las implicaciones que ello
tenga. Se deja a discreción del alumno decidir el guión a seguir en la memoria, debiendo incluir los siguientes puntos:
Objetivos de la práctica. Breve descripción de lo que se pretende que el alumno aprenda
en la práctica. Desarrollo de experimentos en el laboratorio . Descripción del trabajo realizado en el
laboratorio explicando los conceptos vistos en el mismo y justificando los datos obtenidos. Se sugiere el uso de diagramas si procede. Procurar entrar en detalle y, si es necesario, ir
más allá de lo explicado en la práctica usando la bibliografía o internet. Adicional. Se pide que el alumno investigue y compare las ventajas y desventajas de cada
uno de los tipos de sistemas sobre los que se ha leído en esta práctica, dando una opinión
personal y justificada sobre cuál cree que será el mercado dominante en un futuro próximo (3-5 años) y más lejano (15-20 años). Considere los sistemas autoestereoscópicos en su predicción. Además deberá incluir el código MATLAB pedido en es ta práctica
Conclusiones. Conclusiones extraídas por el alumno.
88
Desarrollo de la Práctica Realice las anotaciones que considere oportunas. Este documento no es entregable, sino para su uso personal.
Generación de estereogramas planos En esta primera parte el alumno debe generar, mediante el Software de edición 3D Bryce 7.1, un entorno tridimensional en el que se aprecien objetos de distinto tamaño y forma y a diferentes distancias. A modo de ejemplo se ofrece en la Figura 38: Entorno 3D un entorno suficientemente válido:
Una vez creado el entorno, se procederá a fotografiarlo desde dos puntos relativamente cercanos
simulando una cámara 3D como la que dispone el laboratorio. Para ello deberá seguir los siguientes pasos:
1. Crear, en el centro aproximado del entorno, una esfera roja de pequeño tamaño.
2. Seleccionar dicha esfera 3. En el cuadro de control de cámara, seleccionar la opción “Center to selection” (ver Figura
39: Centrar SelecciónError! Reference source not found.). 4. Encuadrar la cámara donde se desee hacer la primera de las capturas.
5. Renderizar. 6. File > Export Image. 7. Pulsar ctrl a la vez que se maneja el control de cámara. Esto hace que la cámara se desplace
solo en horizontal apuntando a la esfera creada en el paso 1. Desplazar la cámara para tomar un ángulo de captación ligeramente distinto al anterior (prueba y error).
8. Repetir 5 y 6
Figura 38: Entorno 3D
89
Guardar estas imágenes con el subfijo I/D dependiendo si es la vista izquierda o derecha del entorno 3D. A continuación se procederá a crear distintos tipos de estereogramas:
Imagen para usar en sistemas con Lentes Lenticulares o Barreras de Paralaje. Se deben alternar columnas de cada imagen sin compresión espacial.
Anaglifo. Explicado más abajo.
Lado a lado con compresión espacial. Se puede modificar el código MATLAB de la práctica 2 para tratar con imágenes en lugar de video.
En las Figuras Figura 40 yFigura 41 e muestran los resultados deseados de este experimento:
Figura 39: Centrar Selección
Figura 40: Para Lentes Lenticulares
Figura 41: Para Anaglifos
90
A modo de ayuda se detallan las siguientes funciones útiles para el código pedido:
Función imread o A = imread (‘Nombre de Archivo’): Carga en ‘A’ la imagen
como si fuera una matriz de pixeles de tamaño FILAS X
COLUMNAS X 3(COLORES RGB) en formato uint8.
Función Imwrite o imwrite (A, ‘Nombre de Archivo’): Guarda con ‘Nombre de
Archivo’ la imagen cargada en A con formato uint8.
Función uint8 o A = uint8 (A): Convierte la matriz A, donde se ha
cargado una imagen y se ha modificado posteriormente, al
formato (NECESARIO) entero sin signo tamaño 8 bits.
ANAGLIFO: Se realizará en los siguientes pasos:
1. Crear una función que tome las dos imágenes I/D y las convierta a escalas de rojo (para la D) y azul y verde (para la I). La principal cuestión es que una imagen se estructura como una matriz de N filas x N columnas x 3 Columnas. Estas tres columnas corresponden a la intensidad de los colores RGB, con lo que la información del rojo solo estará en la primera de estas tres columnas, y el verde y azul en la segunda y tercera respectivamente.
2. Crear una función que tome estas dos imágenes y las superponga una encima de la otra
mediante el mallado quincunx visto en la práctica anterior.
3. Se recomienda aplicar, con algún software de edición de imágenes, una corrección del
+40% de brillo y +20% de contraste al anaglifo resultante.
Análisis de estereogramas planos En esta segunda parte de la práctica se va a proceder a modificar el entorno tridimensional para
comprobar sus efectos en el paralaje que se obtiene en el estereograma. Para analizar con facilidad y desde cualquier terminal dichos efectos se utilizará la representación para sistemas de Lentes
Lenticulares o con Barreras de Paralaje (Figura 40: Para Lentes Lenticulares). Se utilizará la representación lado a lado para comprobar los resultados en el monitor 3D.
Experimento 1: Comprobar el efecto del intercambio I/D
En la representación lado a lado, se pide comprobar qué le ocurre a la percepción tridimensional cuando intercambiamos las imágenes I/D. Anote los efectos observados y justifíquelos en detalle.
Experimento 2: Efectos de modificar el entorno 3D en el paralaje. En la representación lenticular, se pide comprobar el efecto de mover (en profundidad) diferentes objetos del entorno 3D creado con Bryce en el paralaje (No se pide añadir nuevos objetos, sino moverlos). Anotar los resultados observados al:
Traer un objeto del fondo al frente.
Mover un objeto del frente al fondo.
Posicionar en el centro del entorno (cercano a la bola roja creada en el paso 1 de la página 3) un objeto que estaba lejos del mismo (en términos de profundidad espacial).
91
Comprobar ahora, en la representación lado a lado y con un monitor 3D, los efectos descritos. Experimento 3: Exceso de separación de objetivos Con la representación lado a lado, comprobar qué ocurre cuando tomamos dos instantáneas de nuestro entorno 3D demasiado separadas. ¿Qué le ocurre al paralaje para objetos cercanos, medios y lejanos? Trate de visualizar la imagen con ayuda de un monitor 3D y anote sus
observaciones.
Experimento 4: El problema de la acomodación del ojo Visualice el estereograma lado a lado con ayuda de un monitor 3D y gafas. Concéntrese en enfocar
la vista en objetos muy cercanos o muy lejanos de manera que aprecie con total nitidez los contornos de los mismos hasta que el estrés ocular se lo impida. Obviando la fatiga causada por la
conmutación de las gafas (por otro lado inapreciable en tan poco tiempo de exposición), ¿a que cree que se debe esta incomodidad? ¿Por qué aparece este efecto? ¿Por qué algunas personas tardan más en sufrir este tipo de fatiga? Explíquelo de manera detallada. Incluya, muy detalladamente en la memoria, estos cuatro experimentos con ayuda de diagramas y/o esquemas.
92
8.2.Anexo 2: Resoluciones 1080i – 1080p
En un formato de imagen 16:9 (relación de aspecto horizontal sobre vertical), la
resolución 1080 da la cantidad de líneas horizontales ( o la longitud en píxeles verticales)
que contiene una imagen, implicando por dicha relación de aspecto, 1920 líneas verticales.
La principal diferencia entre 1080i y 1080p no está en la resolución en sí, que de
hecho es la misma, sino en la tasa de refresco. Un video estándar tiene una tasa de
refresco de 60Hz, esto es, la imagen se redibuja en un fotograma nuevo por completo 60
veces por segundo. El modo 1080p (pixel) consiste en esto exactamente. Todos los píxeles
de la imagen se renuevan 60 veces cada segundo (o una vez cada 16ms).
Sin embargo el modo 1080i (interlaced) renueva filas alternas en cada ciclo, de
manera que en un primer ciclo se renuevan las líneas pares y en el siguiente las impares,
obteniéndose una tasa de refresco equivalente de 30Hz. De esta manera se observa una
imagen superpuesta a otra imagen que tuvo lugar 16 ms antes. El mayor riesgo de
interferencia se da cuando se pasa de un fotograma claro a otro oscuro de manera
repentina, con lo que no alberga excesivo problema.