clasificación y descripción
TRANSCRIPT
03/10/15 Héctor Alejandro Montes 1
Tratamiento de imágenes
ClasificaciClasificación y Descripciónón y Descripción
Héctor Alejandro MontesHéctor Alejandro [email protected]@fi.uaemex.mx
http://fi.uaemex.mx/h.a.monteshttp://fi.uaemex.mx/h.a.montes
03/10/15 Héctor Alejandro Montes 2
AdvertenciaNo use estas diaposit ivas comoreferencia única de estudio durante estecurso. La información contenida aquí esuna guía para las sesiones de clase yde estudio futuro. Para obtenerinformación más completa, refiérase ala bibliografía listada en la últimadiapositiva.
03/10/15 Héctor Alejandro Montes 3
Introducción
Una imagen considerada píxel a píxel contienemucha información.
Ya sabemos que mucha de esta información esredundanteDe ahí que podamos comprimir al almacenar……pero incluso lo comprimido puede representar
mucha información…
03/10/15 Héctor Alejandro Montes 4
Introducción
Los algoritmos de visión y/o análisis deimágenes normalmente no estáninteresados en toda la informaciónpresente en la imagen píxel a píxel,sino en algunas características quepermitan identificar a los objetosfotografiados.
03/10/15 Héctor Alejandro Montes 5
Introducción
Debemos por tanto describir los objetosfotografiados, no como un conjunto depíxeles, sino como un conjunto decaracterísticas de interés
Y a partir de esta descripción, podemosclasificar los objetos
03/10/15 Héctor Alejandro Montes 6
Introducción
¿Cómo reducir toda la información de unaimagen a un conjunto reducido decaracterísticas de interés (descriptores) ya partir de estas identificar los objetos deinterés?
Representación / Descripción
Clasificación
03/10/15 Héctor Alejandro Montes 7
Representación
Pueden ser:Internos: El objeto o región segmentada es descrito
a partir de características extraídas de los píxelesque conforman la región
Principalmente enfocado a propiedades regionalesEjemplo: color, textura, etc…
Externos: El objeto o región segmentada esdescrito a partir de características extraídas de suborde o filo.
Principalmente enfocada a carácterísticas de formaEjemplo: Concavidades, orientación, etc…
03/10/15 Héctor Alejandro Montes 8
Descripción
La descripción consiste en expresar unarepresentación, como un conjunto decaracterísticas de interés
El conjunto de píxeles que representan elobjeto ha sido posiblemente segmentado de la imagen original con anterioridad.
03/10/15 Héctor Alejandro Montes 9
Representación vs Descripción
“Una región de píxeles puede serrepresentada por su contorno y estecontorno puede ser descrito porcaracterísticas como su longitud, elnúmero de concavidades que presenta,etc…”
[GonzalezYWoods]
03/10/15 Héctor Alejandro Montes 10
Clasificación
La clasificación consiste en determinarel tipo de objeto a partir de suscaracterísticas
Se puede llevar a cabo por técnicasestadísticas, reconocimiento de patrones,texturas, etc…
03/10/15 Héctor Alejandro Montes 11
I. Descriptores de Entorno yRegión
03/10/15 Héctor Alejandro Montes 12
Representación
Un buena representación es invariante acambios en:
Tamaño
Traslación
Rotación
03/10/15 Héctor Alejandro Montes 13
Representaciones decontorno
Algunas representaciones de contornoson:Chain codesPolígonos de perímetro mínimoFirmasSegmentos de contornoEsqueletos (discutido en morfología)
03/10/15 Héctor Alejandro Montes 14
Representaciones decontorno
Chain codes:Representan el
contorno como unsecuencia devectores
Podemos usar 4- o 8-conectividad.
03/10/15 Héctor Alejandro Montes 15
Representaciones decontorno
Chain codes:
Los vectores secodifican según suorientación
03/10/15 Héctor Alejandro Montes 16
Representaciones decontorno
Chain codes:
Se elige un puntoinicial
Y el contorno seexpresa como lasecuencia de losvectores
0,0,0,7,7,…,2,1,0,2
03/10/15 Héctor Alejandro Montes 17
Representaciones decontorno
Chain code:Las cadenas suelen ser muy largas
La reducción de información a tratar es casi nula
Variaciones por ruido, o segmentacionespoco precisas provocan cambios en lacadena no representativos del contorno
No es invariante al tamañoLa elección de píxel inicial puede ser difícil
03/10/15 Héctor Alejandro Montes 18
Representaciones decontorno
Polígonos de perímetro mínimo:Se intenta reducir el borde a una serie de
segmentos
La idea es como un tablero sobre el que clavamostachuelas y una liga que puede ajustarsealrededor de esas tachuelas.
La liga define el perímetro mínimo para envolver alas tachuelas.
03/10/15 Héctor Alejandro Montes 19
Representaciones decontorno
Polígonos de perímetro mínimo:Las tachuelas se colocan sobre una rejilla
imaginaria arbitraria.Rejillas con cuadros más amplios dan lugar a
menos segmentos pero mayor error.En el caso extremo, la rejilla coincide con los
píxeles originales, y entonces es similar a chaincode, donde los segmentos sólo van de unpíxel al contiguo
03/10/15 Héctor Alejandro Montes 20
Representaciones decontorno
Polígonos de perímetro mínimo:
Rejilla de 11 píxeles con offset de 3
03/10/15 Héctor Alejandro Montes 21
Representaciones decontorno
Polígonos de perímetro mínimo:
Rejilla de 11 píxeles con offset de 3
03/10/15 Héctor Alejandro Montes 22
Representaciones decontorno
Polígonos de perímetro mínimo:
Rejilla de 6 píxeles con offset de 2
03/10/15 Héctor Alejandro Montes 23
Representaciones decontorno
Polígonos de perímetro mínimo:
Rejilla de 6 píxeles con offset de 2
03/10/15 Héctor Alejandro Montes 24
Representaciones decontorno
Polígonos de perímetro mínimo: Imagen obtenida de:[GonzalezWoods,2002]
03/10/15 Héctor Alejandro Montes 25
Representaciones decontorno
Polígonos de perímetro mínimo:Son robustas a pequeños ruidos en el
contorno.
No son invariantes al tamaño.
La elección de la rejilla es crítica y podríaafectar a la rotación
03/10/15 Héctor Alejandro Montes 26
Representaciones decontorno
Firmas:
Se toma un centroide.
El contorno se expresacomo la funciónr=f()
03/10/15 Héctor Alejandro Montes 27
Representaciones decontorno
La firma es invariante a la traslación
La firma se puede hacer invariante al tamaño normalizando la función a un rango de salida [0,1]
La firma se puede hacer invariante a la rotación tomando como eje de partida el primer eigenvector (vector de máxima varianza)
La descripción de la función r=f() puede ser compleja
03/10/15 Héctor Alejandro Montes 28
Representaciones decontorno
Segmentos de contornoSe trata básicamente de hallar el cerco
convexo (convex hull) del objetoBasado en la triangulación de Delaunay
Convex Hull o Alpha ShapeUna aproximación sencilla al Convex Hull se
puede obtener mediante dilatación
03/10/15 Héctor Alejandro Montes 29
Representaciones decontorno
Segmentos de contorno
03/10/15 Héctor Alejandro Montes 30
Representaciones decontorno
Segmentos de contorno
Proyección 3D PCA de unespacio 5D con 181.000puntos
03/10/15 Héctor Alejandro Montes 31
Descriptores
Llamamos descriptores a aquellascaracterísticas que nos permitendescribir de forma única un conjunto oregión de píxeles que representan unobjeto fotografiado.
03/10/15 Héctor Alejandro Montes 32
Descriptores
Reducen la información de miles depíxeles a unos cuantos datos, lo cual esmás tratable computacionalmente
Una vez elegida la representación está sedescribe mediante el uso de losdescriptores
03/10/15 Héctor Alejandro Montes 33
Descriptores
Algunos descriptores sencillos:Longitud del bordeDiámetro del objetoEjes mayor y menorRectángulo básicoNúmeros de formaDescriptores de FourierOtros…
03/10/15 Héctor Alejandro Montes 34
Descriptores
Longitud de un bordeNúmero de píxeles que forman el borde
Diámetro de un borde
Donde D(pi,pj) es la distancia entre dos puntos delborde - no necesariamente Euclidiana
DiamB =maxi , j
[D pi , p j ]
03/10/15 Héctor Alejandro Montes 35
Descriptores
Eje mayor (major axis)Segmento que conecta a los dos puntos pi y pj que definen el
diámetro
Eje menor (minor axis)Segmento perpendicular al eje mayor y que define el
rectángulo mínimo que encuadra al objeto
Rectángulo básicoEs el rectángulo definido por los ejes mayor y menor
03/10/15 Héctor Alejandro Montes 36
Descriptores
Números de formaSe obtiene a partir del
Chain Code simplementecontando el número decambios de direcciones,en el sentido de lasagujas del reloj
Ejemplo: Pasar de 0 a 1 en4- conectividad requiere3 saltos.
03/10/15 Héctor Alejandro Montes 37
Descriptores
Números de formaSe llama orden n del número de forma a número de
elementos que tenga la cadena formadaLos números de forma más básicos para ordenes bajos
están ya muy estudiados
chain code suele tomarse como cíclica y el primerdígito del número de forma se calcula entre elúltimo píxel y el inicial
03/10/15 Héctor Alejandro Montes 38
Descriptores
Números de forma: Unejercicio simpleCalcular el número de
forma para el borde dela imagen
Sol: 20010162…
03/10/15 Héctor Alejandro Montes 39
Descriptores
Descriptores de FourierBasados en la descomposición compleja de
Fourier
Los descriptores de Fourier son los coeficientes cn de la serie de Fourier
x t = ∑n=−∞
∞
cn ejnw0 t
cn=1T ∫0
T
x t e jnw0 t
03/10/15 Héctor Alejandro Montes 40
Descriptores
Descriptores de FourierLos diferentes píxeles (x,y) del borde se
expresan como si fuesen númeroscomplejos x+jy, y se entienden como unasecuencia (señal discreta)
El borde se puede reconstruir a partir de latransformada inversa de Fourier
03/10/15 Héctor Alejandro Montes 41
Descriptores
Descriptores de FourierReducen mucho la información
Se puede reconstruir el borde con tanta precisióncomo se desee
Dan lugar a los wavelets
Gracias a la FFT (Transformada Rápida de Fourier)ya no suponen una carga computacional extrema
03/10/15 Héctor Alejandro Montes 42
Descriptores
Imagen obtenida de:[GonzalezWoods,2002]
03/10/15 Héctor Alejandro Montes 43
Descriptores
Descriptores de FourierSon invariantes a la rotación si el punto de
inicio es el mismo
Son invariantes a la traslación
Pueden ser invariantes al tamaño con unasencilla normalización
03/10/15 Héctor Alejandro Montes 44
II. Reconocimiento dePatrones
03/10/15 Héctor Alejandro Montes 45
¿Qué es el Reconocimientode patrones?
El punto central es la clasificación de objetosSe encarga de extraer información que permita
establecer propiedades de o entre conjuntos dedichos objetos.
Dos posibles enfoques o procedimientos:Estadístico - Basada en probabilidadSintáctico - Utiliza la teoría de lenguajes formales
03/10/15 Héctor Alejandro Montes 46
¿Qué es el Reconocimientode patrones?
Los objetos deben clasificarse acorde aunas características o variables.
Las características se entienden como lasdimensiones de un espacio n-dimensional de búsquedasiendo n el número de variables o
características
03/10/15 Héctor Alejandro Montes 47
¿Qué es el Reconocimientode patrones?
Un patrón es un punto en el espacio debúsqueda que toma unos valoresdeterminados en cada dimensión.Cada patrón representa a un objeto
Los diferentes objetos se agrupan enclases.
03/10/15 Héctor Alejandro Montes 48
Reconocimiento depatrones
03/10/15 Héctor Alejandro Montes 49
Selección de Variables
Consiste en determinar cuál es elconjunto de características másadecuado para describir a los objetos.Es crítico para mejorar la clasificaciónPuede aumentar/disminuir el rendimientoSuele requerir de técnicas de reducción de
la dimensionalidadPCA, MDS, CCA, …
03/10/15 Héctor Alejandro Montes 50
Selección de Variables
Más información sobre selección de variables ytécnicas de reducción de dimensionalidad:“A survey of dimension reduction techniques” Fodor, Imola
K. Center for Applied Scientific Computing June 2002
“A review of Dimension Reduction Techniques” Carreira-Perpiñán Technical Report CS-96-09 University of Sheffield1997
03/10/15 Héctor Alejandro Montes 51
Tipos de aprendizaje
Por la forma de aprendizaje, la clasificación selleva a cabo de forma:
Supervisada - Al sistema se le pasa una muestrade la que ya se conoce la clasificación
Alto riesgo de overfitting.
No supervisada - El sistema no tiene informaciónde una muestra clasificada a priori
03/10/15 Héctor Alejandro Montes 52
Tipos de aprendizaje
Por el número de clases de objetos finales, laclasificación se lleva a cabo de forma:
Restringida - El número de clases en la que seestructurará la muestra está previamente definido.
Libre - El número de clases en la que seestructurará la muestra depende exclusivamentede los datos.
03/10/15 Héctor Alejandro Montes 53
Tipos de aprendizaje
Por el resultado de la partición, laclasificación puede ser:
Hard (Dura) - Cada objeto se asigna a unaclase
Fuzzy (Difusa) - Los objetos se asignan atodas las clases pero con un grado depertenencia determinado
03/10/15 Héctor Alejandro Montes 54
Estrategias de Clasificación
JerárquicaDivisivaAglomerativa
ReagrupamientoDefinida por cercanía de los puntos (patrones) en el
espacio de búsqueda
Combinatoria
03/10/15 Héctor Alejandro Montes 55
Estrategias de Clasificación
Más información sobre estrategias declasificación:“Data Clustering: A Review”, Jain, Murty and Flynn
ACM Computing Surveys, Vol. 31, No. 3, pp 264-323 Sep 1999
“Algorithms for Data Clustering” Jain and DubesEd. Prentice Hall (1988)
03/10/15 Héctor Alejandro Montes 56
Etapas de un proceso dereconocimiento de patronesSelección de variables.
Diseño del clasificador.
Aplicación del modelo.
Interpretación de resultados.