una aproximación a la visión la visión, david marr laboratorio de inteligencia artificial mit,...

Post on 02-Feb-2016

223 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Una aproximación a la visión

La Visión, David Marr

Laboratorio de Inteligencia Artificial

MIT, años 70

Neurofisiología

• Entender el conexionado, los sensores, los mecanismos.

• Encontrar la imagen neural y la imagen física.

• Existe la “Neurona Abuela”?

• Donde se producen los niveles de integración?

Psicofísica

• Estudios comportamentales.

• Experimentos que intentas aislar los diferentes aspectos. Por ejemplo los estereogramas de Julezs.

• Permite encontrar reglas o leyes de cómo funciona la visión en términos más generales?

Aproximación computacional.

• Hacer programas (algoritmos) que resuelven problemas visuales sencillos o simplificados.

• Por ejemplo: detección de bordes en un conjunto de estructuras poligonales de color mate (Horn). Con la esperanza de poder generalizar después.

Marr y Poggio (‘77)

• Aproximación como un problema de análisis de información.

• Independencia de la realización particular de una solución concreta en el cerebro o en una máquina.

• Es una aproximación arriba-abajo con niveles diversos engarzados.

Representación y Descripción.

• Representación: Sistema formal para hacer explícitas ciertas entidades o tipos de información y una descripción de cómo el sistema lo hace.

• Descripción: Resultado de emplear una representación para describir una entidad.– Ej: números arábigos o romanos. Son mejores o

peores para hacer ciertas cosas (*, +)...

Proceso

• Significados restringido a los asociados a máquinas de procesamiento de información.

• Hay que escoger la representación adecuada para las entidades a manipular por ese proceso (entrada y salida)

• Un algoritmo para implementar el proceso.– Serie, paralelo, más robusto, más eficiente...

Tres niveles

• La explicación de la visión debe ser coherente a diferentes niveles: desde la neurona a la representación global.

• Teoría del cálculo: Procesamiento de la información

• Algoritmo y representación: psicofísica

• Realización física: neuroanatomía y neurofisiología

Teoría de cálculo

• Cual es el objetivo?

• Porqué es apropiado?

• Cuál es la lógica de la estrategia mediante la que se la puede llevar a cabo?

Representación y algoritmo

• Cómo puede implementarse esta teoría de cálculo?

• Cuál es la representación de la entrada y la salida?

• Cuál es el algoritmo para la transformación?

Implementación física

• Cómo puede realizarse físicamente esta representación y algoritmo?

• Solución biológica

• Solución informática

• Figura 6.1

Visión

• “Proceso que a partir de imágenes del mundo externo produce una representación útil al observador y no está ensombrecida por información irrelevante”.

• Puede concebirse como una proyección de una representación en otra: – Entrada: distribución de intensidad de luz

detectada por los fotorreceptores en la retina

Marco teórico

• Tabla 1.1

Factores responsables de la intensidad en una imagen

• Geometría de la escena

• Punto de observación (geometría del observador)

• Reflectancia de las superficies

• Iluminación de la escena

Procesamiento visual inicial

• Obtener representaciones adecuadas a los cambios y estructuras de la imagen:– detección de cambios de intensidad– representación y análisis de la estructura

geométrica local– detección de efectos de iluminación (por ej.

transparencia)

Qué representación?

• Debe incluir “marcadores de lugar” que puedan derivarse de las imágenes de modo fiable.

• Atributos: orientación, brillo, tamaño, posición.

• Deben corresponder con cambios físicos reales.

Supuestos físicos

• “El mundo está formado por superficies lisas con funciones de reflectancia (FR) cuya estructura espacial se puede elaborar”

• Organización jerárquica: “A menudo la organización espacial de la FR de una superficie ha sido generada por varios procesos diferentes, actuando a escalas distintas”

Supuestos físicos

• Similitud:” Los elementos generados en una superficie dada por un proceso generador de reflectancia que actúa en una escala dada tienden a ser más similares entre sí en su tamaño, contraste local, color y organización espacial que otros elementos de esta superficie”

• Se puede medir dentro de una escala...

Supuestos físicos

• Continuidad espacial: “A menudo las señales generadas en una superficie por un único proceso se organizan espacialmente”

• La continuidad en la superficie debe reflejarse de algún modo en la continuidad de los marcadores...

Supuestos físicos

• Continuidad de las discontinuidades: Las localizaciones de las discontinuidades en profundidad u orientación de las superficies son suaves.

• La cohesión de la materia implica que los objetos existen y tienen límites...

Supuestos físicos

• Continuidad de flujo: si la dirección del movimiento es discontinua en más de un punto (por ejemplo en una línea) entonces estamos frente al límite de un objeto.

Los ceros

• Detección de los cambios de intensidad:– Ocurren a diferentes escalas– Un cambio brusco de I equivale a un cero de la

segunda derivada.

• Figura 2.12 (detección de ceros con el operador laplaciano .Negro es negativo y blanco positivo, cruces por cero).

• Figs 2.17 y 2.23

G2

Qué relaciones espaciales hacer explícitas?

• Intensidad local media.• Tamaño medio• Densidad• Orientación local• Distancias locales de los elementos

agrupados.• Orientación local de los elementos agrupados.

Procesos de agrupamiento

• Construir marcadores de lugar que capten la estructura a mayor escala de la función de reflectancia de la superficie.

• Detectar cambios en los parámetros medidos asociados con estos marcadores y que indiquen cambios de orientación o distancia al observador

• Elaborar marcadores y encontrar límites.

• Figs. 2.5, 2.6, 2.33 y 2.34

• Tabla 3.2

• Tabla 3.3

• tabla 4.1

top related