clasificador genÉrico de objetos en imÁgenes etm+ · forma de la firma espectral de 12 objetos...
TRANSCRIPT
613
RESUMEN
Se describe un algoritmo de clasificación genérico, basado en la
forma de la firma espectral de 12 objetos presentes en las imáge-
nes del sensor ETM+ del satélite Landsat 7. El algoritmo es un
árbol de decisión que no requiere de campos de entrenamiento
para llevar a cabo la clasificación, ya que se fundamenta en
operaciones Booleanas que identifican los objetos por formas ca-
racterísticas de su firma espectral. El algoritmo ha sido utilizado
con éxito en la estimación de superficies sembradas de cultivos
e identificación de cuerpos de agua en imágenes que cubren casi
la totalidad de la República Mexicana.
Palabras clave: Árboles de decisión, clasificación, sensores re-
motos.
INTRODUCCIÓN
Todo objeto sobre la superficie terrestre emite o refleja constantemente energía electromagnéti-ca. La fracción de energía incidente que refleja
una cobertura terrestre se denomina reflectividad, la cual cambia en función de la longitud de onda. La distribución de la reflectividad como función de la longitud de onda se denomina firma espectral; ésta va-ría también por la influencia de otros factores como la turbidez atmosférica, temperatura, actividad biológica y geometría sol-sensor. La firma espectral es diferente para los distintos tipos de cobertura y caracteriza a los objetos sobre la superficie terrestre, por lo que es posible lograr, hasta cierto punto, su discriminación. El análisis de imágenes provenientes de sensores remotos tiene como fin obtener información acerca de objetos, áreas o fenómenos sobre la superficie terrestre. Estos sensores miden la intensidad de la energía emitida o reflejada por los objetos sobre muestras del espectro electromagnético denominadas bandas espectrales. Hay un proceso de interpretación entre esta medición y las características que se desea identificar, este proceso depende de los objetivos es-tablecidos.
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
GENERIC OBJECT CLASIFICATOR ON ETM+ IMAGES
Luis A. Palacios-Sánchez, Fernando Paz-Pellat, José L. Oropeza-Mota, Benjamín Figueroa-Sandoval,
Mario Martínez-Menes, Carlos A. Ortiz-Solorio y Adolfo Exebio-García
Hidrociencias. Campus Montecillo. Colegio de Postgraduados. 56230. Km. 36.5 Carretera México-Texcoco, Montecillo, Estado de México. ([email protected])
ABSTRACT
An algorithm of generic classification is described based on the
form of the spectral signature of 12 objects present on the images
of the ETM+ sensor of Landsat 7 satellite. The algorithm is a
decision tree that does not require training areas to carry out
the classification, since it is backed up by Boolean operations,
which identify the objects by the characteristic forms of their
spectral signature. The algorithm has been successfully used
in estimations of crop areas and in the identification of water
bodies in images that cover almost all México.
Key words: Decision trees, classification, remote sensors.
INTRODUCTION
Every object on the earth’s surface constantly emits or reflects electromagnetic energy. The incident fraction of energy which reflects a
surface coverage is called reflectance, which changes according to wavelength. The distribution of reflectance as function of the wavelength is called spectral signature; and varies also by the influence of other factors, such as atmospheric turbidity, temperature, biological activity, and geometry sun-sensor. The spectral signature is different for the distinct types of coverage and characterizes the objects on the earth’s surface; that is why it is possible to achieve –up to a certain degree– their discrimination. The analysis of images originating from remote sensors has the objective to obtain information about objects, areas, or phenomena on the earth’s surface. These sensors measure the intensity of the energy emitted or reflected by the objects over samples of the electromagnetic spectrum called spectral bands. There is a process of interpretation between this measurement and the characteristics whose identification is desired; this process depends on the objectives established. One of the most important applications of this type of analysis is generating thematic maps, where each pixel of the image is labeled by a classification rule, which specifies the type of object that exists in the reference zone of the labeled pixel (Cortijo et al., 1997). In natural resource studies, the identification of
Recibido: Diciembre, 2004. Aprobado: Mayo, 2006.Publicado como ARTÍCULO en Agrociencia 40: 613-626. 2006.
614
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
VOLUMEN 40, NÚMERO 5
Una de las aplicaciones más importantes de este tipo de análisis es la generación de mapas te-máticos, en los cuales cada píxel de la imagen se etiqueta mediante una regla de clasificación, que especifica el tipo de objeto que hay en la zona que referencia el píxel etiquetado (Cortijo et al., 1997). Para estudios de recursos naturales, es importante la identificación de objetos que van desde cuerpos de agua, vegetación, suelo, nubes, hasta la identifi-cación específica de tipos de suelos, y comunidades de vegetación. Existen dos tipos de clasificación temática: con supervisión y sin supervisión (Schowengerdt, 1997; Jensen, 2000). En la clasificación con supervisión, los píxeles se asignan a clases predefinidas que tienen puntos de control terrestre denominados campos de entrenamiento. En estos campos de entrenamiento el algoritmo estima las características espectrales de la clase que representa, para posteriormente tratar de asignar una clase a todos los píxeles de una imagen (Chulhee y Landgrebe, 1991; McCauley, 1995). En la clasificación sin supervisión no se utilizan campos de entrenamiento como base para la clasificación, y las clases se construyen a partir de las agrupa-ciones espectrales existentes en la imagen. La idea básica que subyace en estos métodos, llamados de agrupamiento, es que los píxeles de una clase deben tener valores espectrales similares, mientras que los de diferentes clases deberían tener valores diferen-tes y distinguibles. Adicionalmente existen métodos híbridos, que combinan características de ambos, como los de supervisión parcial, basados en ponde-raciones de agrupaciones espectrales no supervisadas (Byeungwoo y Landgrebe, 1999). El objetivo de este trabajo fue presentar un sis-tema de clasificación con supervisión que identifica objetos predefinidos, con base en la forma de la res-puesta espectral, de manera rápida, eficiente y sin necesidad de muestras de campo. La investigación se orientó a encontrar la forma más rápida y barata para identificar objetos genéricos, como vegetación, suelo desnudo, nubes y agua. Barata implicaba no realizar muestreos de campo, y rápida el procesamiento ma-sivo de imágenes del satélite Landsat 7. El resultado es un algoritmo simple de identificación de patrones, pero que cumple con los objetivos.
MATERIALES Y MÉTODOS
Las firmas espectrales detectadas por los sensores remotos se
pueden representar como vectores con n componentes, en los que
cada componente es el valor resultante de aplicar una función de
respuesta del sensor a una banda de muestreo del espectro electro-
magnético.
objects, such as water bodies, vegetation, soil, clouds, and even the specific identification of soil or crops types vegetation communities, is important. There are two types of thematic classification: with and without supervision (Schowengerdt, 1997; Jensen, 2000). In the classification with supervision, the pixels are assigned to predefined classes having ground control points called training areas. In these training areas, the algorithm estimates the spectral characteristics of the class it represents, in order to subsequently try to assign a class to all the pixels of an image (Chulhee and Landgrebe, 1991; McCauley, 1995). In the classification without supervision, training areas are not used a base for classification, and the classes are constructed starting with the spectral clusters existing in the image. The basic idea underlying these methods, called clustering, is that the pixels of one class must have similar spectral values, whereas those of different classes should have different and distinguishable values. Additionally, there are hybrid methods, which combine the characteristics of both, like those of partial supervision, based on weighting of unsupervised spectral clustering (Byeungwoo and Landgrebe, 1999). The objective of this study was to present a classification system with supervision, which identifies predefined objects based on the form of spectral response, fast, efficiently, and without the need of field samples. The research was oriented to find the fastest and cheapest way of identifying generic objects, such as vegetation, bare soil, clouds, and water. Cheap implied not conducting field samplings, and fast, mass processing of Landsat 7 satellite images. The result is a simple algorithm of pattern identification, but which achieves the objectives.
MATERIALS AND METHODS
The spectral signatures detected by remote sensors can be
represented as vectors with n components, where each component
is the value resulting from applying a sensor response function to a
sampling band of the electromagnetic spectrum.
X X X X X i nnT
i i=⎡⎣ ⎤⎦ ∀ ∈ =1 2 1 2, ,..., , ; , ,...,Θ (1)
Xi is a random variable belonging to the set of values Θi that takes
band i; these variables represent the pixels which form an image in
matrix array. The typical values of this set for the Thematic Mapper
(TM, n=7) and Enhanced Thematic Mapper (ETM+, n=8) sensors
of the Landsat satellites are Θi={0, 1,…, 255}. The observation
space might be defined by (Cortijo et al., 1997):
Φ Θ=⊗=i
n
i1
(2)
where ⊗ denotes the Cartesian product.
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
615PALACIOS-SÁNCHEZ et al.
X X X X X i nnT
i i=⎡⎣ ⎤⎦ ∀ ∈ =1 2 1 2, ,..., , ; , ,...,Θ (1)
Xi es una variable aleatoria perteneciente al conjunto de valores Θi
que toma la banda i; estas variables representan los píxeles que en
arreglo matricial forman una imagen. Los valores típicos de este
conjunto para los sensores Thematic Mapper (TM, n=7) y Enhan-
ced Thematic Mapper (ETM+, n=8) de los satélites Landsat, son
Θi={0, 1,…, 255}. El espacio de observaciones estaría definido por
(Cortijo et al., 1997):
Φ Θ=⊗=i
n
i1
(2)
donde ⊗ denota el producto cartesiano.
Un sistema de clasificación tiene dos componentes críticas: un
conjunto de clases (cultivo, suelo, agua, etc.) y un conjunto de
reglas –o sistema– para la asignación de las clases. Sin un conjunto
claro y definido de reglas, la asignación de las clases a los diferentes
tipos de características es arbitraria e inconsistente. Adicionalmen-
te, un sistema de clasificación debe satisfacer las restricciones de
ser mutuamente excluyente y exhaustivo. Un sistema es mutuamente
excluyente si cualquier punto en la imagen cae en una y sólo una
categoría definida (clase), y totalmente exhaustivo si a todos los
píxeles de una imagen les corresponde una clase.
Para un sistema de clasificación se debe definir un conjunto
de clases Ω={ }−ω ω ω ω1 2 1, ,... , ,k k donde en la clase ωk estarían
todas las observaciones que no se puedan asignar con certeza a las
otras k−1 clases.
Un clasificador o sistema de clasificación se define por la fun-
ción:
f f: , ,Φ Ω Ω→ ∀ ( )∈X X (3)
Para que cumpla con las restricciones planteadas, el clasificador
debe ser una partición de Φ en k subconjuntos disjuntos R1, R2,…,
Rk:
Φ= ∪ ∩ =∅∀ ≠{ }∀ ∈ ⇒ ( )=i i i j i iR R R i j X R Xf ω (4)
donde i varía desde 1 hasta k.
A las Ri se les denomina regiones de decisión, y a las fronteras
entre éstas fronteras de decisión.
Los árboles de decisión se encuentran dentro de los métodos de
clasificación con supervisión, cuyo objetivo final es construir una
regla de decisión con base en un conjunto de aprendizaje (Breiman
et al., 1984). En este trabajo la asignación de una clase a un vector
X se realizó mediante la evaluación de una serie de condiciones
lógicas sobre los valores o transformaciones de las variables Xi. Es-
tas condiciones forman un árbol binario que recursivamente genera
particiones del espacio de observaciones, hasta alcanzar los nodos
terminales denominados hojas, los cuales están compuestas por las
regiones Ri.
A classification system has two critical components: a set of
classes (crop, soil, water, etc.) and a set of rules –or system– for
the assignment to the classes. Without a clear and well-defined set of
rules, the assignment of classes to the different types of characteristics
is arbitrary and inconsistent. In addition, a classification system must
satisfy the restrictions of being mutually exclusive and exhaustive. A
system is mutually exclusive if any point in the image falls in one,
and only one, definite category (class), and fully exhaustive, if all
the image pixels receive a class label.
For a classification system, a set of classes
Ω={ }−ω ω ω ω1 2 1, ,... , ,k k must be defined, where in class ωk
would be all the observations that cannot be assigned with certainty
to the other k−1 classes.
A classifier, or classification system, is defined by the
function:
f f: , ,Φ Ω Ω→ ∀ ( )∈X X (3)
In order to fulfill the proposed restrictions the classifier must be
a partition of Φ in k disjointed subsets R1, R2,…, Rk:
Φ= ∪ ∩ =∅∀ ≠{ }∀ ∈ ⇒ ( )=i i i j i iR R R i j X R Xf ω (4)
where i varies from 1 to k.
The Ri’s are called decision regions, and the borders between
them, decision borders.
The decision trees are within the classification methods with
supervision, whose final objective is to build a decision rule,
based on learning sets (Breiman et al., 1984). In this paper,
the assignment of a class to a X vector was carried out through
the evaluation of a series of logical conditions on the values or
transformations of the Xi variables. These conditions form a binary
tree, which recursively generates partitions of the observation
space, until reaching the terminal nodes, called leaves, composed
by the Ri regions.
Definition of classes
To formulate the classification system, the classes making up
the Ω set are defined. In the present study, 13 thematic classes were
established, shown in Table 1.
The selection of classes was made considering that they might
be utilized as masks in algorithms of atmospheric correction, for
algorithms of crop classification, and identification of forests, water
bodies, etc. The advantage is that in the end one counts on a set
of 13 classes, starting from a group whose dimension is defined in
Equation (2); which makes it possible to carry out histograms and
pixel counts for the assess of areas.
Definition of observation space
The observation space is made up of the first 7 bands of the
ETM+ sensor, located on Landsat 7 satellite, but the algorithm
616
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
VOLUMEN 40, NÚMERO 5
Cuadro 2. Características de las bandas del sensor ETM+.Table 2. Characteristics of ETM+ sensor bands.
Banda Rango espectral Centro de banda Resolución espacial
(micrómetros) (micrómetros) (m)
1 (Azul, ρ1) 0.450 - 0.515 0.48 302 (Verde, ρ2) 0.525 - 0.605 0.57 303 (Rojo, ρ3) 0.630 - 0.690 0.66 304 (IRC, ρ4) 0.780 - 0.900 0.84 305 (IRM1, ρ5) 1.550 - 1.750 1.65 306 (IRT, BT) 10.400 - 12.500 11.45 607 (IRM2, ρ7) 2.090 - 2.350 2.22 308 (Pancromática) 0.520 - 0.900 0.71 15
IRC=Infrarrojo Cercano; IRM=Infrarrojo Medio; IRT=Infrarrojo Térmico, BT=Brillantez Térmica IRC=Near Infrared; IRM=Medium Infrared; IRT=Thermal Infrared; BT=Thermal Brightness.
Definición de clases
Para formular el sistema de clasificación se definen las clases
que componen el conjunto Ω. En el presente trabajo se establecieron
13 clases temáticas, que se muestran en el Cuadro 1.
La selección de las clases se realizó considerando que podrían
ser utilizadas como máscaras en algoritmos de corrección atmosfé-
rica, para algoritmos de clasificación de cultivos e identificación de
bosques, cuerpos de agua, etc. La ventaja es que al final se cuenta
con un conjunto de 13 clases a partir de un conjunto cuya dimen-
sión está definida en la ecuación (2); con las que es posible realizar
histogramas y conteos de píxeles para la estimación de superficies.
Definición del espacio de observaciones
El espacio de observaciones está formado por las primeras 7
bandas del sensor ETM+ ubicado en el satélite Landsat 7, pero el
algoritmo es aplicable a las 7 bandas equivalentes del sensor TM
del satélite Landsat 5 o a cualquier sensor que cuente con bandas
de muestreo similares. Las características de las bandas del sensor
ETM+ se muestran en el Cuadro 2.
Es un requisito que los valores digitales se conviertan a reflec-
tividad medidas en superficie, por lo que es necesario que se les
aplique un proceso de corrección atmosférica. Algunas clases pueden
is applicable to the 7 bands equivalent to the TM sensor of
Landsat 5 satellite or to any sensor that counts on bands of similar
samplings. The characteristics of the ETM+ sensor are shown in
Table 2.
It is a requirement that the digital values shall be converted into
reflectance measured on the surface, for which it is necessary that a
process of atmospheric correction should be applied. Some classes
may be identified without the atmospheric correction process, like
dark vegetation and that of high coverage, water, snow, mist,
and clouds, that is why it can be utilized recursively firstly, for
calculating input variables in the atmospheric correction algorithm,
and subsequently, running it again with the bands transformed by
the corrector.
Band 6 must be transformed to the same spatial resolution
as the others and convert to thermal brightness (BT), in Kelvin
degrees, by means of the procedure explained in the Landsat 7
Users’ Scientific Manual (NASA, 2001).
Definition of the classification function
The classification function is based on the identification of
characteristics of the form of the spectral signature for each class,
therefore it is essential to analyze their form and variations for each
class.
Cuadro 1. Clases temáticas propuestas.Table 1. Proposed thematic classes.
Número Nombre Observaciones
0 Sin datos Las partes de la imagen que no tienen información 1 Sombra Sombras proyectadas por nubes y relieve topográfico 2 Nube Nubes densas 3 Bruma Calina, neblina y nubes poco densas 4 Hielo Glaciares y nieve 5 Agua Cuerpos de agua 6 Asfalto/arena oscura Poblaciones y suelos arenosos oscuros 7 Suelo Suelo desnudo y vegetación senescente o muerta 8 Veg. Cob. Baja Vegetación con baja cobertura del suelo 9 Veg. Cob. Media Vegetación con mediana cobertura del suelo 10 Veg. Cob. Alta Vegetación con alta cobertura del suelo 11 Veg. Oscura Vegetación oscura (bosques, pantanos) 12 Otros Todo valor que no corresponde a las anteriores
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
617PALACIOS-SÁNCHEZ et al.
Figura 1. Firmas espectrales típicas de cinco clases de suelo. (Adaptado de Stoner y Baumgartner 1981).
Figure 1. Typical spectral signatures of five soil classes (Adapted from Stoner and Baumgartner, 1981).
identificarse sin el proceso de corrección atmosférica, como la vege-
tación oscura y de alta cobertura, agua, nieve, bruma y nubes; por
lo que se puede utilizar de manera recursiva para, primero, calcular
las variables de entrada en el algoritmo de corrección atmosférico y
posteriormente correrlo de nuevo con las bandas transformadas por el
corrector.
La banda 6 debe transformarse a la misma resolución espacial
que las otras y convertirse a brillantez térmica (BT), en grados
Kelvin, mediante el procedimiento explicado en el Manual Científi-
co de Usuarios de Landsat 7 (NASA, 2001).
Definición de la función de clasificación
La función de clasificación tiene como base la identificación
de características de la forma de la firma espectral para cada clase,
por lo que es esencial analizar la forma y variaciones de las firmas
espectrales para cada clase.
Suelos
En la Figura 1 se muestran las firmas espectrales de los cinco
tipos de suelos de acuerdo con la clasificación por patrones es-
pectrales (Stoner y Baumgartner, 1981). Estos autores clasificaron
espectralmente a los suelos, en función de sus patrones típicos, en
cinco clases: 1) suelos de textura moderadamente fina y dominados
por materia orgánica; 2) suelos de textura moderadamente gruesa
y afectados por materia orgánica; 3) suelos lateríticos, dominados
por hierro; 4) suelos ricos en hierro; y, 5) suelos ricos en materia
orgánica.
El rasgo característico de los tres primeros tipos es un incre-
mento en la reflectividad de las bandas visibles al infrarrojo medio
1 (IRM1) y que el infrarrojo medio 2 (IRM2) es menor al IRM1.
Para suelos ricos en hierro y materia orgánica (4 y 5), los rasgos
mencionados son poco marcados o inexistentes, aunque presentan
el patrón típico de que las bandas visibles tienen incrementos en re-
flectividad (azul<verde<rojo), y las bandas del infrarrojo son muy
similares entre sí. El patrón espectral más característico de un suelo
es un incremento en la reflectividad de las bandas visibles. Para los
tipos de suelos 1 a 3, este patrón incremental se presenta hasta el
IRM1. En la Figura 2 se muestra el efecto del contenido de agua
en el suelo en los patrones espectrales para los tipos de suelo 1 a 3.
Algo similar sucede para los patrones de los tipos de suelo 4 y 5. En
general, el incremento en el contenido de agua del suelo no cambia
los patrones espectrales de éstos, sólo el valor de la reflectividad
(Lobell y Asner, 2002).
Vegetación
La vegetación viva puede subdividirse en subclases para discri-
minar mejor la vegetación natural y cultivos, especialmente la aso-
ciada a baja cobertura y hojas caducifolias. Se utilizó el modelo de
simulación de reflectividad de doseles de 2 capas MCRM2 (Kuusk,
2001), para simular el comportamiento espectral de diferentes culti-
vos utilizando como fondo suelos del tipo 3 (el resultado es similar
Soils
Figure 1 shows the spectral signatures of the five soil types
according to the classification by spectral patterns (Stoner and
Baumgartner, 1981). These authors classified the soils spectrally,
according to their typical patterns, into five classes: 1) soils of
moderately fine texture, dominated by organic matter; 2) soils of
moderately thick texture, affected by organic matter; 3) lateritic
soils, dominated by iron; 4) soils rich in iron; 5) soils rich in
organic matter.
The characteristic trait of the three first types is an increment in
the reflectance in the visible bands at medium infrared 1 (IRM1) and
that medium infrared 2 (IRM2) is lower than IRM1. For soils rich
in iron and organic matter (4 and 5), the mentioned traits are little
marked or nonexistent, though they have the typical pattern of the
visible bands, showing increase in reflectance (blue<green<red),
and the bands of infrared are very similar among them. The
most characteristic spectral pattern of a soil is an increment in
the reflectance of the visible bands. For soil types 1 to 3, this
incremental pattern is presented up to the IRM1. In Figure 2, the
effect of water content in the soil is shown in the spectral patterns
for soil types 1 to 3. Something similar occurs for the patterns of
soil types 4 and 5. In general, the increment in soil water content
does not change their spectral patterns, only the value of reflectance
(Lobell and Asner, 2002).
Vegetation
Live vegetation can be subdivided in subclasses to better discern
natural vegetation and crops, especially the one associated to low
coverage and deciduous leaves. The reflectance simulation model of
two-layer canopies, MCRM2 (Kuusk, 2001), was used to simulate
the spectral behavior of different crops, utilizing type 3 soils as
background (the result is similar for the other soils). Figure 3 shows
the result obtained for alfalfa (Medicago sativa), rice (Oryza sativa),
maize (Zea mays), and potato (Solanum tuberosum) for different
618
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
VOLUMEN 40, NÚMERO 5
para los otros suelos). La Figura 3 muestra el resultado para alfalfa
(Medicago sativa), arroz (Oryza sativa), maíz (Zea mays) y papa
(Solanum tuberosum), para diferentes índices de área foliar y por
consiguiente del porcentaje de cobertura del suelo.
Del análisis de la Figura 3 se detectan varios patrones básicos
en el desarrollo de un cultivo. El primer patrón que se puede ob-
servar, es que la reflectividad de la banda verde es mayor que las
de las bandas azul y roja. El segundo patrón observado es que el
valor máximo de reflectividad en los suelos desnudos y con cober-
tura vegetal baja corresponde a la banda IRM1, mientras que en
suelos con cobertura vegetal media a alta, el máximo corresponde
a la banda del infrarrojo cercano (IRC); el valor de reflectividad
en esta última banda, se incrementa en función de la cobertura
vegetal hasta alcanzar un valor de saturación. El tercer patrón se
observa en el comportamiento de la reflectividad de las bandas in-
frarrojas conforme aumenta la cobertura vegetal. Para coberturas
vegetales del suelo bajas a medias, las líneas que unen los valores
de reflectividad IRC, IRM1 e IRM2, presentan una concavidad
hacia arriba, mientras que para coberturas altas, la concavidad es
hacia abajo. En el caso de la vegetación de alta cobertura oscura,
típica de bosques sombreados o pantanos con suelos de alto con-
tenido de humedad, la reflectividad en la banda azul no supera el
10%, la del IRM1 el 15% y la IRC el 30%.
Agua
La Figura 4 muestra dos patrones espectrales típicos de cuerpos
de agua, uno con agua clara y profunda y otro con gran contenido
de sólidos en suspensión.
Se ha observado que el agua de mar tiene una reflectividad
menor a la de los cuerpos de agua terrestres (bajo condiciones si-
milares). Un patrón caraterístico de los cuerpos de agua clara (pro-
ducto de la absorción de la radiación recibida), es la poca o nula
reflectividad en el infrarrojo, especialmente en el infrarrojo medio
(Jensen, 2000). Este rasgo diferencia a los cuerpos de agua de los
suelos y la vegetación, de acuerdo a los patrones discutidos ante-
riormente. Los patrones espectrales básicos de los cuerpos de agua
leaf area index and, consequently, for the percentage of ground
coverage.
From the analysis of Figure 3, several basic patterns in the
development of a crop are detected. The first pattern that can be
observed is that the reflectance of the green band is higher than
in the blue and red bands. The second observed pattern is that the
maximum value of reflectance on bare soils and with low vegetal
coverage corresponds to band IRM1, whereas in soils with medium
to high vegetal coverage, the maximum corresponds to the band
of near infrared (IRC): the value of reflectance in this last band
increases according to the vegetal coverage until reaching a saturation
value. The third pattern is observed in the reflectance behavior
of the infrared bands, as vegetal coverage increases. For low and
medium vegetal soil covers, the lines that join the reflectance values
IRC, IRM1, and IRM2, have an upward concavity, while for high
coverage, the concavity is downward. In the case of vegetation of
dark high coverage, typical for shady forests or marsh with soils
of high moisture content, the reflectance in the blue band does not
surpass 10%, in IRM1 15%, and in IRC 30%.
Water
Figure 4 shows two typical spectral patterns of water bodies,
one with clear and deep water, and another with high content of
solids in suspension.
It has been observed that sea water has less reflectance
than that of terrestrial water bodies (under similar conditions).
A characteristic pattern of clear water bodies (product of the
absorption of received radiation) is the scarce or zero reflectance in
infrared, especially in medium infrared (Jensen, 2000). This trait
differentiates the water bodies from soils and vegetation, according
to the previously discussed patterns. The basic spectral patterns of
the water bodies are the almost general situation of Blue<Green
reflectance and the decreasing pattern in the reflectance of infrareds
(including generally also green and red). The reflectance of a water
body depends on the size of the water column (depth) and on the
substrate of the bed.
Shadows
The spectral signature of shadows is very similar to that of water
and, under certain conditions, it is impossible to differentiate them.
The objects that cast shadows are mainly clouds and topographic
elevations. Clouds have different density levels, that go from very
light –such as cirrus– up to dense –like cumulonimbus– reasons
for which a threshold must be specified, from which an object is
considered to have the shadow of a cloud.
Figure 5 presents the spectrum of two shadows of dense clouds
on vegetation and soils. It can be appreciated that what corresponds
to the shadow cast on vegetation, has a maximum in IRC, which
agrees with the reflectance of the diffuse light in this band. The
shadow projected on the soil has a spectral signature that does not
differ from the one shown in Figure 4 for clear water without
sediments.
Figura 2. Efecto de la humedad en la reflectividad del suelo.Figure 2. Moisture effect on soil reflectance.
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
619PALACIOS-SÁNCHEZ et al.
Figura 3. Firmas espectrales de cultivos en diferentes etapas de desarrollo.Figure 3. Spectral signature of crops at different stages of development.
son la situación, casi general, de que la reflectividad Azul<Verde
y el patrón decreciente en la reflectividad de los infrarrojos (inclu-
yendo también generalmente al verde y rojo). La reflectividad de un
cuerpo de agua es dependiente del espesor de la columna de agua
(profundidad) y del substrato del lecho.
Sombras
La firma espectral de las sombras es muy similar a la del
agua y, bajo ciertas condiciones, es imposible diferenciarlas.
Los objetos que proyectan sombras son principalmente nubes y
elevaciones topográficas. Las nubes tienen diferentes niveles de
densidad, que van de muy ligeras, como los cirrus, hasta muy
densas como los cumulo nimbus, por lo que se debe especificar
un umbral a partir del cual se considera que un objeto tiene som-
bra de nube.
En la Figura 5 se presenta el espectro de dos sombras de
nubes densas sobre vegetación y suelos. Se puede apreciar que la
Clouds, ice, and mist
Clouds and ice have high reflectance in the visible bands that
causes their white color, while mist has a translucent grayish
aspect, which makes it possible to see the subjacent object. These
three objects have the characteristic that their thermal brightness
is very low, compared to the rest of the objects; therefore, the
IRT band transformed to BT is utilized for their identification.
The spectral signature of clouds and ice must adjust to the
saturation of the bands in the ETM+ sensor (and TM), that is
why it is convenient to analyze directly the signature of Landsat
images.
In Figure 6, the spectral signature of clouds, mist, and ice
is shown as well as a spectrum that shows the theoretical sensor
saturation for the date when the image was taken.
On the image it is observed that in the case of snow, IRM1 and
IRM2 bands have little reflectance, a situation associated to water
in liquid state. The saturation values of the ETM+ sensor generate
620
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
VOLUMEN 40, NÚMERO 5
correspondiente a la sombra proyectada sobre vegetación, tiene un
máximo en el IRC, que corresponde a la reflectividad de la luz
difusa en esta banda. La sombra proyectada sobre el suelo tiene
una firma espectral que no difiere de la mostrada en la Figura 4
para agua clara sin sedimentos.
Nubes, hielo y bruma
Las nubes y el hielo tienen una alta reflectividad en las bandas
visibles, a lo que se debe su color blanco, mientras que la bruma
presenta un aspecto grisáceo translúcido, en el que es posible ver el
objeto subyacente. Estos tres objetos tienen la característica de que
su brillantez térmica es muy baja comparada con los demás objetos,
por lo que se aprovecha la banda IRT transformada a BT para su
identificación. La firma espectral de las nubes y el hielo deben ajus-
tarse a la saturación de las bandas en el sensor ETM+ (y TM), por
lo que en este caso es conveniente analizar directamente las firmas
de imágenes Landsat.
En la Figura 6 se presenta la firma espectral de las nubes, bru-
ma y hielo, así como un espectro que muestra la saturación teórica
del sensor para la fecha en que se tomó la imagen.
En la imagen se observa que en el caso de la nieve las ban-
das IRM1 e IRM2 presentan poca reflectividad, situación que se
asocia con el agua en estado líquido. Los valores de saturación
del sensor ETM+ generan una firma espectral muy similar a la
de la vegetación vigorosa, pero con valores muy altos de reflec-
tividad.
Asfalto y arena oscura
El asfalto y la arena oscura tienen valores similares de reflecti-
vidad, por lo que es difícil lograr una separación adecuada y gene-
ralizable a cualquier imagen. También es posible confundirlas con
determinados tipos de suelo, pero es posible lograr su separación
debido a que los valores de reflectividad son similares para todas las
bandas, esto es, existe poco contraste, por lo que se ven de color
gris. En la Figura 7 se presentan las firmas espectrales de estos dos
objetos.
a spectral signature, very similar to that of vigorous vegetation, but
with very high values of reflectance.
Asphalt and dark sand
Asphalt and dark sand have similar reflectance values, for which
it is difficult to attain an adequate and generalizable separation for
any image. It is possible as well to get confused with certain types
of soil, but one can also achieve their separation due to the fact that
the reflectance values are similar for all the bands, that is, there is
little contrast, therefore, they look gray. Figure 7 shows the spectral
signature of these two objects.
Classification of algorithm
Based on the form of the spectral signatures of the presented
objects, a classification algorithm was formulated, which is detailed
subsequently. First, a series of auxiliary variables were defined,
generated from the reflectance values ((ρλ, λ=1, 2, 3, 4, 5, and 7)
and the thermal brightness BT, which are presented next:
Figura 4. Firma espectral del agua.Figure 4. Spectral signature of water.
Figura 5. Firma espectral de las sombras proyectadas sobre ve-getación y suelo.
Figure 5. Spectral signature of shadows cast on vegetation and soil.
Figura 6. Firmas espectrales de nubes, hielo y bruma.Figure 6. Spectral signatures of clouds, ice and mist.
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
621PALACIOS-SÁNCHEZ et al.
Algoritmo de clasificación
Con base en la forma de las firmas espectrales de los objetos
mostrados se formuló un algoritmo de clasificación, el cual se de-
talla a continuación. Primero se definieron una serie de variables
auxiliares generadas a partir de los valores de reflectividad (ρλ,
λ=1, 2, 3, 4, 5 y 7) y la brillantez térmica BT, las cuales se pre-
sentan a continuación:
is=
− − −( )+ + +( )
( * )
( * )
3
31 4 5 7
1 4 5 7
ρ ρ ρ ρ
ρ ρ ρ ρ (5)
Brillo=
+ρ ρ1 3
2 (6)
ndvi=
−( )+( )
ρ ρ
ρ ρ4 3
4 3 (7)
ig=
+ +( )+ +( )
ρ ρ ρ
ρ ρ ρ4 5 7
1 2 3 (8)
La variable is permite identificar cuerpos de agua y sombras;
un valor alto indica que existe un mayor contraste entre la reflecti-
vidad de la banda azul y la reflectividad de las bandas infrarrojas,
tal como se observa en las Figuras 4 y 5. La variable brillo es
el promedio de reflectividad de las bandas azul y roja, las cuales
corresponden a las bandas de absorción por actividad fotosinté-
tica; esta variable ayuda a la discriminación de los objetos en
función de su brillantez. El ndvi (normalized difference vegetation
index), es el índice de vegetación de la diferencia normalizada y
representa una relación entre la reflectividad de la banda roja y la
banda infrarroja cercana; permite la identificación de vegetación
y su grado de cobertura del suelo. La variable ig, es la relación
entre la reflectividad de las bandas de la porción infrarroja y la
reflectividad de la porción visible del espectro electromagnético, y
auxilia en la identificación de objetos con poco contraste entre las
bandas visibles e infrarrojas, como el asfalto y algunas sombras y
bruma.
Con base en estas variables y los valores de reflectividad, se
generaron condiciones lógicas a partir de la forma de las firmas es-
pectrales, las cuales usan alguna característica de estas firmas para
formar una partición del espacio de observaciones.
En la Figura 8 se presentan las condiciones lógicas, donde el
símbolo ∩ corresponde al Y lógico y el símbolo ∪ al O lógico. UT
es un umbral térmico (temperatura en °K) que permite identificar
las nubes, hielo y bruma, en función de las condiciones climáticas
de la imagen.
En la Figura 9 se presenta el algoritmo de clasificación genérica
de objetos, donde se utilizan las variables y condiciones previa-
mente definidas, así como umbrales de reflectividad y brillantez
térmica.
Se codificó un programa en lenguaje C++ para realizar la
clasificación genérica. El programa lee inicialmente el umbral tér-
mico y las matrices de reflectividad de las siete bandas. Después
is=
− − −( )+ + +( )
( * )
( * )
3
31 4 5 7
1 4 5 7
ρ ρ ρ ρ
ρ ρ ρ ρ (5)
Brightness=
+ρ ρ1 3
2 (6)
ndvi=
−( )+( )
ρ ρ
ρ ρ4 3
4 3 (7)
ig=
+ +( )+ +( )
ρ ρ ρ
ρ ρ ρ4 5 7
1 2 3 (8)
The variable is contributes to identify water bodies and shadows;
a high value indicates that there is a higher contrast between
reflectance of the blue band and the reflectance of infrared bands, as
observed in Figures 4 and 5. The variable brightness is the average
of reflectance of the blue and red bands, which correspond to the
bands of absorption by photosynthetic activity; this variable helps
to discern the objects according to their brightness. The ndvi is the
normalized difference vegetation index and represents a relationship
between the reflectance of the red and the near infrared band;
it helps in the identification of vegetation and its degree of soil
coverage. The variable ig is the relationship between the reflectance
of the bands of infrared portion and the reflectance of the visible
portion of the electromagnetic spectrum, and it helps to identify
objects with little contrast between visible and infrared bands, like
asphalt and some shadows and mist.
Based on these variables and the reflectance values, logical
conditions were generated from the form of spectral signatures, using
a characteristic of these to form a partition of the observation space.
In Figure 8 the logical conditions are shown, where the symbol
∩ corresponds to the logical Y and the symbol ∪ to the logical O.
UT is a thermal threshold (temperature in °K), that allows to identify
the clouds, ice, and mist, according to the climatic conditions of the
image.
Figure 9 shows the algorithm of generic object classification,
where variables and previously defined conditions are utilized as
well as thresholds of reflectance and thermal brightness.
Figura 7. Firma espectral del asfalto y arenas oscuras.Figure 7. Spectral signature of asphalt and dark sands.
622
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
VOLUMEN 40, NÚMERO 5
cond is ndvi
cond is ndvi
1 0 2 0 01 0 2
2 0 2 0 01= >( )∩ <( )∩ <( )
= >( )∩ ≥
. . .
. .
ρ
11 0 2
0 2 0 5
1
1 7
( )∩ <( )
= >( )∩ <( )∩ <( )[ ]∪
>
ρ
ρ ρ
.
. .cond3 Brillo BT UT ndvi
(( )∩ >( )∩ <( )⎡⎣ ⎤⎦
= ≥( )
= > +(
ρ ρ
ρ ρ
ρ ρ ρ
2 3
4 5
5 4 7
0 1
0 5
ndvi
cond4
cond5
.
. * ))( )= > +( )
= >( )∩ <( )
cond6
cond7 ig ig
cond8
ρ ρ ρ4 3 50 35 0 65
1 0 1 3
. * . *
. .
== >( )∩ <( )
=+( )+( )
<
= <( )∩
ρ ρ
ρ ρ
ρ ρ
ρ ρ
1 2
5 7
2 3
4
0 6
10 0 3
BT UT
cond9
cond
.
. 55 10 15 0 1<( )∩ <( ). .ρ
Figura 8. Condiciones lógicas para la clasificación.Figure 8. Logical conditions for classification.
calcula las variables auxiliares y las condiciones lógicas para cada
píxel. Finalmente, clasifica la escena con base en el algoritmo de
la Figura 9 y el resultado se guarda en una matriz con los valores
numéricos del Cuadro 1, que corresponden a cada objeto genérico
identificado.
RESULTADOS Y DISCUSIÓN
Debido a que las operaciones del algoritmo son de carácter Booleano, su ejecución es bastante rápida, tarda alrededor de 4 minutos en analizar una escena completa del sensor ETM+ (PC Intel Pentium III, 750 MHz). En comparación, un algoritmo de clasi-ficación temática como el de máxima verosimilitud o el análisis de agrupamientos, puede tardar un par de horas en procesar una escena completa. En la Figura 10 se presenta una porción de la escena 25/47 del sis-tema de referencia mundial versión 2 (WRS2, por sus siglas en inglés), donde es posible observar la ciudad de Puebla en la parte central izquierda y el Pico de Orizaba en la parte central derecha. También es posi-ble ver la presa de almacenamiento de Valsequillo y el Distrito de Riego 030. La imagen está generada con las bandas 1-4-7 (Azul, IRC e IRM2), para simular los colores primarios azul, verde y rojo; de esta manera se forma una imagen en falso color infrarrojo, donde la vegetación vigorosa resalta en color verde, mientras que el hielo se ve de color azul intenso. También se muestra el resultado de la clasificación genérica, don-de se puede apreciar la identificación de las clases y compararla con la imagen en falso color. La precisión de un proceso de clasificación se refiere al grado de concordancia entre las clases de la imagen y un conjunto de datos de referencia. Para estimar de manera cuantitativa esta precisión, se construyó una matriz de error a partir de estos conjuntos de datos. La matriz consiste de un arreglo cuadrado de números ordenados en columnas e hile-ras que especifican el número de unidades muestrales asignadas a una categoría por el proceso de clasifica-ción, en relación con la categoría de referencia. Las columnas corresponden al conjunto de referencia, mientras que las hileras corresponden a las clases generadas en el proceso. Debido a la característica del algoritmo de clasificación y a que no es necesa-rio tener puntos de control terrestre para realizar el proceso, fue posible utilizar el método de muestreo aleatorio estratificado para formar la matriz de error a partir del resultado de la clasificación. El tamaño de la muestra se estimó mediante la fórmula para una distribución multinomial (Congalton y Green, 1999), para un nivel de confianza de 95% y una precisión de 5%:
A program in C++ language was coded in order to carry
out generic classification. The program initially reads the thermal
threshold and the reflectance matrices of the seven bands. Then
it calculates the auxiliary variables and the logical conditions for
each pixel. Finally, it classifies the scene based on the algorithm
of Figure 9, and the result is kept in a matrix with the numerical
values of Table 1, corresponding to each identified generic
object.
RESULTS AND DISCUSSION
Since the operations of the algorithm are of Boolean character, their execution is rather fast; analyzing a complete ETM+ sensor scene (PC Intel Pentium III, 750 MHz) lasts around 4 minutes. In comparison, an algorithm of thematic classification like that of maximum likelihood or the analysis of clustering, may last a couple of hours in processing a complete scene. Figure 10 presents a segment of scene 25/47 of the World Reference System version 2 (WRS2), where the city of Puebla can be observed at the central left part, and the Pico de Orizaba at the central right part. Also the Valsequillo reservoir and Irrigation District 030 can be seen. The image is generated with the bands 1-4-7 (Blue, IRC, and IRM2) in order to simulate the primary colors blue, green, and red; this way, an image in false infrared color was created, where the vigorous vegetation is emphasized in green, while ice is seen in intense blue. The result of the generic classification is shown as well, where the identification of the classes can be appreciated and compared with the image in false color. The accuracy of a classification process refers to the degree of agreement between the classes of the image and a set of reference data. In order to estimate this accuracy quantitatively, a matrix of error was
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
623PALACIOS-SÁNCHEZ et al.
Figura 9. Algoritmo de clasificación genérica de objetos.Figure 9. Algorithm of generic object classification.
nB
bii i=
−( )⎛
⎝⎜⎜
⎞
⎠⎟⎟ =max , , ,...,
Π Π11 2 122 (9)
donde Πi es la fracción de superficie correspondien-te a la clase i; B es el valor de la distribución χ2(1,
0.995833)=8.21; b=0.05. Mediante este procedimiento se estimó un tamaño de muestra de 733, pero se ajustó a 732 al seleccionar 61 muestras por clase. Las mues-tras de suelos y los diferentes niveles de cobertura de la vegetación se obtuvieron a partir de datos de campo del Distrito de Riego 030, Valsequillo, mientras que las demás categorías se tomaron a partir de fotointer-pretación de la imagen Landsat.
Los valores en la diagonal principal de la matriz de error, esto es, donde coinciden las etiquetas de re-ferencia y clasificación, corresponden a los aciertos del proceso. La precisión global de la clasificación
constructed starting from these data sets. The matrix consists of a square with numbers arranged in columns and lines, specifying the sample number of units, assigned to a category by classification process, related to the reference category. The columns correspond to the reference set, while the lines correspond to the classes generated in the process. Due to the characteristic of the classification algorithm, and since ground control points are not needed to carry out the process, it was possible to use the method of stratified random sampling to form the error matrix from the classification result. Sample size was estimated by the formula for multinomial distribution (Congalton and Green, 1999), for a 95% confidence level and 5% precision.
nB
bii i=
−( )⎛
⎝⎜⎜
⎞
⎠⎟⎟ =max , , ,...,
Π Π11 2 122 (9)
624
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
VOLUMEN 40, NÚMERO 5
SombraNubeBrumaHieloAguaAsfalto/arena osc.SueloVeg. baja cob.Veg. media cob.Veg. alta.cob.Veg. oscuraOtros
Falso color infrarrojo (R=7, V=4, A=1) Resultado de la clasificación genérica
Figura 10. Resultado de la clasificación genérica de objetos.Figure 10. Result of the generic object classification.
se obtiene dividiendo la suma de los valores de la diagonal principal entre el tamaño de la muestra, que para esta clasificación fue de 92.3%. Dividiendo el número de aciertos de una clase entre el número total de muestras en la columna se obtiene la precisión del productor del mapa y es un indicador de los erro-res de inclusión (errores de comisión), mientras que cuando se divide por el total de muestras en la hilera correspondiente, se obtiene la precisión del usuario, que es un indicador del error de exclusión (errores de omisión). En el Cuadro 4 se presenta la precisión del productor y del usuario para las 12 clases, así como la superficie estimada para cada clase.
where Πi is the fraction of the surface corresponding to class i; B is the value of distribution χ2(1,
0.995833)=8.21; b=0.05. By this procedure a sample size of 733 was estimated, but it was fitted to 732 at selecting 61 samples per class. The soil samples and the different levels of vegetation coverage were obtained from the field data of Irrigation District 030, Valsequillo, whereas the rest of the categories were taken from the photo interpretation of the Landsat image.
The values on the main diagonal of the error matrix, that is, where the labels of reference and
Cuadro 3. Matriz de error de la clasificación genérica de objetos.Table 3. Error matrix of the generic object classification.
Referencia
Clases Sombra Nube Bruma Hielo Agua Asfalto/ Suelo Veg. Veg. Veg. Veg. Otros Total
Ar.Osc. Baja C. Media C. Alta C. Osc.
Sombra 54 0 0 0 4 2 0 0 0 0 2 0 63Nube 0 58 0 3 0 0 0 0 0 0 0 3 64Bruma 0 0 55 2 2 0 0 0 0 0 0 1 60Hielo 0 1 0 52 0 0 0 0 0 0 0 0 53Agua 5 0 3 4 55 0 0 0 0 0 0 0 66Asfalto/Ar.Osc. 2 0 2 0 0 55 1 0 0 0 0 0 60Suelo 0 0 0 0 0 4 57 4 0 0 0 0 65Veg. Baja C. 0 0 0 0 0 0 3 57 2 0 0 0 62Veg. Media C. 0 0 0 0 0 0 0 0 58 2 0 0 60Veg. Alta C. 0 0 0 0 0 0 0 0 1 59 0 0 60Veg. Osc. 0 0 0 0 0 0 0 0 0 0 59 0 59Otros 0 2 1 0 0 0 0 0 0 0 0 57 60Total 61 61 61 61 61 61 61 61 61 61 61 61 732
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
625PALACIOS-SÁNCHEZ et al.
El algoritmo no siempre separa las sombras de los cuerpos de agua, debido a que tienen firmas espec-trales muy parecidas. En estos casos hay que utilizar métodos geométricos que calculen la proyección de sombras sobre la superficie terrestre, para diferenciar las dos clases. El hielo es otra clase con valores de la precisión del productor bajos, ya que existe confusión con las nubes y en los límites de la nieve con otras cla-ses se confunde con el agua. En términos generales, la clasificación genérica de objetos tiene una precisión bastante alta comparada con los métodos tradicionales de clasificación. Combinado con estadísticas de producción agrícola y sistemas de información geográficos, el algoritmo se ha utilizado con éxito en la cuantificación de superfi-cies de cultivos bajo riego en zonas áridas y semiári-das, así como en la identificación de cuerpos de agua en las Unidades de Riego para el Desarrollo Rural (Colegio de Postgraduados, 2000-2002)1, y en varias zonas de riego con fuentes de agua subterránea.
CONCLUSIONES
En este trabajo se ha presentado un algoritmo de clasificación genérica, que permite identificar 12 ob-jetos de interés para el estudio de los recursos natu-rales. El algoritmo no requiere campos de entrena-miento ni análisis de agrupaciones para realizar la clasificación. Es del tipo de árboles de decisión, en el que las reglas de clasificación se basan en opera-ciones boleanas que identifican los objetos por for-mas características de su firma espectral. Por lo mis-mo, la clasificación la realiza de una manera rápida y precisa en relación con algoritmos de clasificación tradicionales como son el de máxima verosimilitud
classification coincide, correspond to the correct decisions of the process. The global accuracy of classification is obtained dividing the sum of values of the main diagonal by the sample size, which was 92.3% for this classification. Dividing the number of correct classified samples of one class by the total number of samples in the column, the map producer’s accuracy is obtained, which is an indicator of the inclusion errors, whereas at dividing by the total of samplings in the corresponding line, user’s accuracy is obtained, indicator of the exclusion errors (omission errors). Table 4 shows producer’s and user’s accuracy for the 12 classes, as well as the estimated surface for each class. The algorithm does not always separates the shadows of the water bodies, because they have very similar spectral signatures. In these cases geometrical methods have to be used, which calculate the projection of shadows on the earth’s surface, in order to differentiate the two classes. Ice is another class with low values of producer’s accuracy, since there is confusion with clouds, and at the limits of snow with other classes it is confused with water. In general terms, generic object classification has rather high precision compared with the traditional classification methods. Combined with statistics of agricultural production and geographic information systems, the algorithm has been utilized successfully in quantifying of crop areas under irrigation in arid and semi-arid zones, as well as in the identification of water bodies in Irrigation Units for Rural Development (Colegio de Postgraduados, 2000-2002)1, and in several irrigation zones with underground water sources.
CONCLUSIONS
In this paper, an algorithm of generic classification has been presented, which permits to identify 12 objects of interest for the study of natural resources. The algorithm does not require training areas or clustering analysis to carry out the classification. It is the type of decision trees, on which the classification rules are based on Boolean operations, which identify the objects by the characteristic forms of their spectral signature. Likewise, the classification is carried out fast and precisely in relation with traditional classification algorithms, such as the one of maximum likelihood or of clustering analysis. The algorithm has been used successfully in the estimate of surfaces sown with crops and in the identification of water bodies.
—End of the English version—
Cuadro 4. Precisiones del productor y del usuario.Table 4. Producer’s and user’s accuracy.
Precisión (%) SuperficieNúm. Clase Productor Usuario (ha)
1 Sombra 88.5 85.7 29 531 2 Nube 95.1 90.6 61 979 3 Bruma 90.2 91.7 76 737 4 Hielo 85.2 98.1 893 5 Agua 90.2 83.3 1488 6 Asfalto/Ar.Osc. 90.2 91.7 25 957 7 Suelo 93.4 87.7 60 458 8 Veg. Baja C. 93.4 91.9 254 858 9 Veg. Media C. 95.1 96.7 578 589 10 Veg. Alta C. 96.7 98.3 517 657 11 Veg. Osc. 96.7 100.0 111 143 12 Otros 93.4 95.0 138
1 Colegio de Postgraduados. 2000-2002. Estimación de Superficies Regadas y Volúmenes Utilizados en Unidades de Riego Mediante Técni-cas de Percepción Remota. Trabajo realizado por convenio de participación para la Comisión Nacional del Agua.
626
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
VOLUMEN 40, NÚMERO 5
o de análisis de agrupaciones. El algoritmo se ha utilizado con éxito en la estimación de superficies sembradas de los cultivos y en la identificación de cuerpos de agua.
LITERATURA CITADA
Breiman L., J. Friedman, R. Olshen, and C. Stone. 1984. Classification and Regression Trees. Wadsworth International Group. 368 p.
Byeungwoo J., and D. Landgrebe. 1999. Partially supervised classification using weighted unsupervised clustering. IEEE Transactions on Geoscience and Remote Sensing. Vol. 37, No. 2. pp: 1073-1079.
Congalton, R. G., and K. Green, 1999. Assessing the Accuracy of Remotely Sensed Data: Principles and Practices. Lewis Publishers, Boca Raton, FL. 160 p.
Cortijo, F. J., N. Pérez de la Blanca, J. Abad, and S. Damas. 1997. A comparison of multispectral image classifiers using high-dimensional simulated data sets. VII National Symposium on Pattern Recognition and Image Analysis, Barcelona (Spain). pp: 365-370.
Cheng H., and C. A. Bouman. 2001. Multiscale Bayesian Segmentation Using a Trainable Context Model. IEEE Transactions on Image Processing, Vol. 10, No. 4. pp: 511-525.
Chulhee L., and D. Landgrebe. 1991. Fast multistage likelihood classification. IEEE Transactions on Geoscience and Remote Sensing, Vol. 29, No. 4, pp: 509-517.
Jensen, J. R. 2000. Remote Sensing of the Environment: An Earth Resource Perspective. Upper Saddle River, New Jersey. Prentice Hall. 544 p.
Kuusk, A. 2001. A two-layer canopy reflectance model. Journal of Quantitative Spectroscopy and Radiative Transfer. Volume 71, Issue 1. pp: 1-9.
Lobell D., and G. Asner. 2002. Moisture effects on soil reflectance. Soil Scientific American Journal 66: 722-727.
McCauley, D. 1995. Comparison of scene segmentations and classifications. SMAP, ECHO, and maximum likelihood. IEEE Transactions on Geoscience & Remote Sensing, Vol. 33, No. 6: 1313-1316.
Moore, G. K. 1978. Satellite Surveillance of Physical Water Quality Characteristics, en Proc. Twelfth International Symposium on Remote Sensing of Environment, Environmental Research Institute of Michigan, Ann Harbor, MI. pp: 445-462.
NASA. 2001. Landsat 7 Science Data Users Handbook, http://ltpwww.gsfc.nasa.gov/IAS/handbook/handbooktoc.html. Noviembre de 2004.
Schowengerdt, R. A. 1997. Remote Sensing-Models and Methods for Image Processing. Academic Press. 522 p.
Stoner, E. R., and M. F. Baumgardner. 1981. Characteristic variations in reflectance of surface soils. Soil Scientific American Journal 45: 1161-1165.