matrices de coocurrencia borja-david-eng

Upload: borchi-vlc

Post on 14-Jul-2015

259 views

Category:

Documents


0 download

TRANSCRIPT

Mster en Teledeteccin. Procesado de imgenes. Diciembre 2011.

1

Estudio e implementacin de matrices de coocurrenciaVaquero-Ventura, B., Vinu-Viss, D.. Universidad de Valencia El estudio de la caracterizacin de la textura, o estudio de las relaciones entre pxeles, tiene diversos mtodos de aplicacin, siendo por mtodos estructurales si se obtienen patrones primitivos para describir la agrupacin de los texeles, o unidades mnimas de textura, hasta conformar la textura en s misma. Este mtodo, sin embargo, no es suficiente para presentar la complejidad de las texturas. Los mtodos espectrales, por otra parte, utilizan la transformada de Fourier, pero no consiguen extraer demasiada informacin si las texturas son heterogneas o de naturaleza aleatoria. Finalmente, por los mtodos estadsticos, una textura se puede considerar como una medida de la intensidad local expresada por regiones. Por los mtodos estadsticos de primer orden se calculan principalmente la media, varianza y desviacin tpica de los valores originales de gris de la imagen, sin tener en cuenta la relacin con otros pxeles. Los mtodos de segundo orden consideran la relacin de coocurrencia entre grupos de dos pxeles de la imagen original, segn una distancia definida. Uno de estos mtodos, y de los ms utilizados, es el de las matrices de coocurrencia, GLCM en sus siglas inglesas (Gray Level Co-ocurrence Matrix), que describe la probabilidad en que los valores de los pxeles ocurren en el vecino en una ventana pequea. Llegado este punto se puede pasar de la valoracin cualitativa de la textura a una cuantificacin de la variacin espacial del tono segn distintos descriptores, clculos probabilsticos de segundo orden de las propiedades texturales. En el presente estudio se han diferenciado tres zonas de una imagen segn sus texturas calculadas mediante matrices de coocurrencia. II. MTODOS Abstract-Calculating the textures of an image and the second-order statistics methods to interpret the coocurrence matrix between short lists of two pixels, its possible difference the areas of the image. Homogeneity, contrasts, correlation, entropy and energy for each area and in diverse directions have been compared, using the suitable algorithms and establishing conclusions to help to the prediction of the textures in these areas of difficult interpretation according of their textural characteristics. Key-words-textural features, matrix of cooccurrence, texture, GLCM I. INTRODUCCIN I bien la textura es un concepto tradicionalmente

S

difcil de definir en los trabajos de teledeteccin, por su comprensin intuitiva y su valoracin cualitativa, se puede considerar como la repeticin de un patrn estructural, no local, estadstico y sujeto a distorsiones. Estos conceptos hacen referencia a la distribucin de valores de intensidad a nivel espacial y, en un nivel prctico, el estudio de la textura de una imagen puede ayudar a segmentarla en zonas homogneas, simular objetos o clases en la escena, recuperar caratersticas de orientacin y forma e identificar objetos. Por tanto, se considera que el estudio de la informacin a nivel espacial, en contraposicin a la respuesta espectral, puede ser adecuado cuando por la resolucin espacial de la imagen cada pxel contiene parte de la informacin de un todo, o si se considera que la clasificacin de un pxel puede variar si se analiza por separado o en relacin a sus vecinos. Siguiendo la definicin de Haralick [1], una textura est definida por la uniformidad, densidad, grosor, rugosidad, regularidad, intensidad y direccionalidad de las medidas discretas del tono en los pxeles y de sus relaciones espaciales. (Haralick et al., 1973). En un aspecto ms concreto, en una imagen digital las propiedades de la textura dependen de tres conceptos: la frecuencia de los cambios de tono en los pxeles, la direccin o direcciones de este cambio y el contraste entre un pxel y sus vecinos, pero independiente del tono de gris o del color de la imagen [2].

A. Se han seleccionado tres zonas aparentemente distintas de la imagen, de igual tamao. Una zona de agua, otra urbana u otra forestal. Sobre ellas se aplican las matrices de concurrencia para un punto y para una determinada distancia y en distintas orientaciones. Para analizar la textura de las zonas de la imagen se crean las GLCM, definiendo para cada una de ellas la condicin: requisito lgico que debe cumplir cada pxel para ser relacionado con su vecino.

Mster en Teledeteccin. Procesado de imgenes. Diciembre 2011.

2

-

la direccin: orientacin espacial en 0, 45, 90 y 135. Estas cuatro direcciones se transforman en ocho, aadiendo su contrarias por ser matrices simtricas. La distancia de estudio segn el par pxeles referencia y vecino.

La homogeneidad (4) hace referencia a la igualdad de las caractersticas de los pxeles por la expresin (4) donde Pi,j es la probabilidad de coocurrencia para los valores de gris i,j, y siendo mayores los valores cuanto ms cercanos estn de la matriz principal y menores segn se va alejando. Por ltimo, la entropa (5) es la medida de la aleatoreidad en la matriz de coocurrencia. (5) donde a menores probabilidades de coocurrencia, el valor absoluto del logaritmo es mayor. La entropa es baja si los pxeles son relativamente parecidos. III. RESULTADOS

-

Cada una de las matrices definidas cumple las siguientes condiciones: es cuadrada tiene el mismo nmero de filas y columnas que el nmero de bits de la imagen, donde si los datos de una imagen, dependiente de n bits, es 2n, el nmero de celdas de la matriz es de (2n x 2n). es simtrica respecto de la diagonal, lo que permite que los mismos valores se dan a ambos lados de la diagonal principal y se generan las ocho direcciones antes mencionadas (se produce una normalizacin de la matriz inicial).

-

B. Una vez que la matriz definida a realizado los clculos de coocurrencia, se puede extraer informacin de estos resultados mediante descriptores, obteniendo hasta cinco datos probabilsticos basados en las medidas de textura propuestas por Haralick [1]. El contraste (1) es la medida de la variacin local de la imagen. Informa sobre los cambios bruscos y tiende a aumentar segn los pxeles se alejan de la diagonal principal de la matriz de coocurrencia: (1) donde Pi,j es la probabilidad de coocurrencia para los valores de gris i,j, a un distancia dada. Las superficies ms homogneas presentan un menor contaste. La correlacin (2) se basa en el principio de que los pxeles dentro de un mismo objeto son ms parecidos entre s que entre otros objetos, y los pxeles ms cercanos estn ms relacionados entre s que con los ms lejanos. (2) donde i,j son las medias y i,j son las varianzas de los niveles de gris. Con valores [-1,1], ser mayor cuando la varianza es baja, cuando se encuentran cerca de la diagonal principal. La energa (3) indica la suavidad de la textura, con valores [0,1], 1 en el caso de texturas suaves. (3)

En la siguiente imagen se indica las zonas elegidas para el estudio: Fluvial (azul), Urbana (rojo) y Forestal (verde). La imagen esta orientada al Norte y la composicin de color en falso color para diferenciar mejor la vegetacin. El tamao de cada zona es de 50x50 pxeles.

N

Los offsets utilizados son los siguientes :0 0 0 0 1 ; 0 2 0 3; 0 4 0 5; 0 6 0 7; 0 8 9

Las matrices de concurrencia para las distintas zonas muestran en una primera impresin los resultados que se esperan encontrar: en zonas alejadas para las tres texturas la concurrencia es menor, especialmente en las zonas urbana y forestal. Adems se intuye que la textura fluvial es ms suave, por la poca variabilidad de sus matrices.

Mster en Teledeteccin. Procesado de imgenes. Diciembre 2011.

3

La homogeneidad en el agua disminuye en valores muy pequeos relativamente, incluso en zonas alejadas del pxel de referencia, por lo que la superficie es muy homognea segn sus altos valores. En las otras zonas, la heterogeneidad ya intuida en los anteriores descriptores se indica por medio de valores bajos segn se alejan del pxel de referencia.

En el estudio del contraste las zona homognea fluvial presenta una superficie sin cambios bruscos, slo algunos motivados por la presencia de orillas o de cambios en la textura por efectos naturales. En las zonas urbana y forestal, sin embargo, aumenta mucho, como cabra esperar por la heterogeneidad de los elementos que las conforman.

La entropa en el agua es muy baja, lo que indica la poca aleatoriedad de los pxeles, que son muy parecidos y con mayores probabilidades de concurrencia. Los valores altos para las zonas urbana y forestal indican alta aleatoreidad.

La correlacin es coherente en las tres zonas, disminuyendo a medida que los elementos se alejan del pxel de referencia.

IV.

CONCLUSIONES

Este estudio ha tenido como base, la seleccin de manera visual tres zonas homogneas a priori. Los resultados se ajustan a lo esperado. Las medidas de energa, homogeneidad y entropa permiten distinguir entre zonas iguales o heterogneas. Considerndose por los datos obtenidos que una zona con una textura menos normalizada tendr valores muy altos de contraste, bajos de correlacin desde las proximidades del pxel de referencia, bajos de energa y homogeneidad segn se alejan de este pxel, y altos de entropa.

La energa, que indica la suavidad de la texturas es muy constante en el agua, siendo todo lo contrario en las zonas urbana y forestal, que son rugosas y con multitud de formas internas.

V.

BIBLIOGRAFA

[1] Haralick R.M, Shanmugan K. & Dinstein I., 1973, Textural features for image classification, IEEE Transaction on System, Man and Cybernetics, Vol SMC- 3 N=C2=B0 6, pp 610-621. [2] M. Presutti, La matriz de co-ocurrencia en la clasificacin multiespectral: tutorial para la enseanza de medidas texturales en cursos de grado universitario, Agosto, 2004, Sao Leopoldo, Brasil. Gonzales R.C & Woods R. E, Digital Image Processing 3rd. edi. Prentice Hall, 2008. Petrou M. & Garca. P, Dealing with texture, Wiley & Sons, 2006.