una aproximación a la visión la visión, david marr laboratorio de inteligencia artificial mit,...

25
Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Upload: asuncion-navarrete-barbero

Post on 02-Feb-2016

223 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Una aproximación a la visión

La Visión, David Marr

Laboratorio de Inteligencia Artificial

MIT, años 70

Page 2: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Neurofisiología

• Entender el conexionado, los sensores, los mecanismos.

• Encontrar la imagen neural y la imagen física.

• Existe la “Neurona Abuela”?

• Donde se producen los niveles de integración?

Page 3: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Psicofísica

• Estudios comportamentales.

• Experimentos que intentas aislar los diferentes aspectos. Por ejemplo los estereogramas de Julezs.

• Permite encontrar reglas o leyes de cómo funciona la visión en términos más generales?

Page 4: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Aproximación computacional.

• Hacer programas (algoritmos) que resuelven problemas visuales sencillos o simplificados.

• Por ejemplo: detección de bordes en un conjunto de estructuras poligonales de color mate (Horn). Con la esperanza de poder generalizar después.

Page 5: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Marr y Poggio (‘77)

• Aproximación como un problema de análisis de información.

• Independencia de la realización particular de una solución concreta en el cerebro o en una máquina.

• Es una aproximación arriba-abajo con niveles diversos engarzados.

Page 6: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Representación y Descripción.

• Representación: Sistema formal para hacer explícitas ciertas entidades o tipos de información y una descripción de cómo el sistema lo hace.

• Descripción: Resultado de emplear una representación para describir una entidad.– Ej: números arábigos o romanos. Son mejores o

peores para hacer ciertas cosas (*, +)...

Page 7: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Proceso

• Significados restringido a los asociados a máquinas de procesamiento de información.

• Hay que escoger la representación adecuada para las entidades a manipular por ese proceso (entrada y salida)

• Un algoritmo para implementar el proceso.– Serie, paralelo, más robusto, más eficiente...

Page 8: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Tres niveles

• La explicación de la visión debe ser coherente a diferentes niveles: desde la neurona a la representación global.

• Teoría del cálculo: Procesamiento de la información

• Algoritmo y representación: psicofísica

• Realización física: neuroanatomía y neurofisiología

Page 9: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Teoría de cálculo

• Cual es el objetivo?

• Porqué es apropiado?

• Cuál es la lógica de la estrategia mediante la que se la puede llevar a cabo?

Page 10: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Representación y algoritmo

• Cómo puede implementarse esta teoría de cálculo?

• Cuál es la representación de la entrada y la salida?

• Cuál es el algoritmo para la transformación?

Page 11: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Implementación física

• Cómo puede realizarse físicamente esta representación y algoritmo?

• Solución biológica

• Solución informática

• Figura 6.1

Page 12: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Visión

• “Proceso que a partir de imágenes del mundo externo produce una representación útil al observador y no está ensombrecida por información irrelevante”.

• Puede concebirse como una proyección de una representación en otra: – Entrada: distribución de intensidad de luz

detectada por los fotorreceptores en la retina

Page 13: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Marco teórico

• Tabla 1.1

Page 14: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Factores responsables de la intensidad en una imagen

• Geometría de la escena

• Punto de observación (geometría del observador)

• Reflectancia de las superficies

• Iluminación de la escena

Page 15: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Procesamiento visual inicial

• Obtener representaciones adecuadas a los cambios y estructuras de la imagen:– detección de cambios de intensidad– representación y análisis de la estructura

geométrica local– detección de efectos de iluminación (por ej.

transparencia)

Page 16: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Qué representación?

• Debe incluir “marcadores de lugar” que puedan derivarse de las imágenes de modo fiable.

• Atributos: orientación, brillo, tamaño, posición.

• Deben corresponder con cambios físicos reales.

Page 17: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Supuestos físicos

• “El mundo está formado por superficies lisas con funciones de reflectancia (FR) cuya estructura espacial se puede elaborar”

• Organización jerárquica: “A menudo la organización espacial de la FR de una superficie ha sido generada por varios procesos diferentes, actuando a escalas distintas”

Page 18: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Supuestos físicos

• Similitud:” Los elementos generados en una superficie dada por un proceso generador de reflectancia que actúa en una escala dada tienden a ser más similares entre sí en su tamaño, contraste local, color y organización espacial que otros elementos de esta superficie”

• Se puede medir dentro de una escala...

Page 19: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Supuestos físicos

• Continuidad espacial: “A menudo las señales generadas en una superficie por un único proceso se organizan espacialmente”

• La continuidad en la superficie debe reflejarse de algún modo en la continuidad de los marcadores...

Page 20: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Supuestos físicos

• Continuidad de las discontinuidades: Las localizaciones de las discontinuidades en profundidad u orientación de las superficies son suaves.

• La cohesión de la materia implica que los objetos existen y tienen límites...

Page 21: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Supuestos físicos

• Continuidad de flujo: si la dirección del movimiento es discontinua en más de un punto (por ejemplo en una línea) entonces estamos frente al límite de un objeto.

Page 22: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Los ceros

• Detección de los cambios de intensidad:– Ocurren a diferentes escalas– Un cambio brusco de I equivale a un cero de la

segunda derivada.

• Figura 2.12 (detección de ceros con el operador laplaciano .Negro es negativo y blanco positivo, cruces por cero).

• Figs 2.17 y 2.23

G2

Page 23: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Qué relaciones espaciales hacer explícitas?

• Intensidad local media.• Tamaño medio• Densidad• Orientación local• Distancias locales de los elementos

agrupados.• Orientación local de los elementos agrupados.

Page 24: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Procesos de agrupamiento

• Construir marcadores de lugar que capten la estructura a mayor escala de la función de reflectancia de la superficie.

• Detectar cambios en los parámetros medidos asociados con estos marcadores y que indiquen cambios de orientación o distancia al observador

• Elaborar marcadores y encontrar límites.

• Figs. 2.5, 2.6, 2.33 y 2.34

Page 25: Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

• Tabla 3.2

• Tabla 3.3

• tabla 4.1