anÁlisis multivariado para riesgos -...
TRANSCRIPT
TRIMESTRE 1:
ANÁLISIS MULTIVARIADO PARA RIESGOS
PROFESOR: LUIS E. NIETO BARAJAS
EMAIL: [email protected]
URL: http://allman.rhon.itam.mx/~lnieto
Maestría en administración de riesgos
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 2
Análisis Multivariado para riesgos
OBJETIVO: Presentar los principales métodos del análisis multivariado,
haciendo énfasis en el área de administración de riesgos. Discutir casos
prácticos que involucren el tratamiento de grandes bases de datos.
TEMARIO (EXTENDIDO):
1. Introducción.
1.1 Aplicaciones de los métodos multivariados
1.2 Organización de los datos
1.3 Variables, vectores y matrices aleatorias
1.4 Repaso de álgebra matricial
2. Análisis exploratorio multivariado
2.1 Estadística multivariadas descriptivas
2.2 Análisis gráfico
3. La distribución normal multivariada
3.1 Propiedades
3.2 Estimación máximo verosímil
3.3 Validación del supuesto de normalidad
3.4 Transformaciones para conseguir normalidad
4. Análisis de componentes principales
4.1 Componentes principales poblacionales
4.2 Reducción de la variabilidad muestral con CP
4.3 Gráficas de los componentes principales
4.4 Inferencias asintóticas para λi y ei.
5. Análisis de clasificación (discriminante)
5.1 Clasificación de dos poblaciones
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 3
5.2 Análisis discriminante de Fisher
5.3 Modelo logístico
5.4 Árboles de clasificación
5.5 Redes neuronales
6. Análisis de cúmulos
6.1 Medidas de similaridad
6.2 Métodos jerárquicos
6.3 Métodos no jerárquicos
7. Temas opcionales
7.1 Análisis de factores
7.2 Cópulas
7.3 Análisis de correlación canónica
7.4 Escalamiento multidimensional
7.5 Análisis de correspondencias
REFERENCIA BÁSICA:
Johnson, R. A. & Wichern, D. W. (2002). Applied Multivariate Statistical
Analysis. Prentice Hall: London.
REFERENCIAS ADICIONALES:
Anderson, T.W. (2003). An Introduction to Multivariate Statistical
Analysis. Wiley: New York.
Bluhm, C., Overbeck, L. & Wagner, C. (2003). An Introduction to Credit
Risk Modelling. Chapman & Hall: London.
Elizondo, A. (2003). Medición integral del riesgo de crédito. Limusa:
México.
Hand, D. J. & Jacka, S. D. (1998). Statistics in Finance. Wiley: New York.
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 4
Jobson, J. D. (1991). Applied Multivariate Data Analysis. Springer: New
York.
Johnson, D. E. (2000). Métodos multivariados aplicados. ITP International
Thomson Editores: México.
Mardia, K., Kent, J.T. & Bibby, J.M. (1980). Multivariate Analysis.
Academic Press.
Morrison, D. F. (1978). Multivariate Statistical Methods. McGraw-Hill:
Japan.
Press, S. J. (1982). Applied Multivariate Analysis. Krieger Publishing
Company: Florida.
Venables, W. N. & Ripley, B. D. (1998). Modern Applied Statistics with
S-PLUS. Springer: New York.
Seber, G.A.F. (1984). Multivariate Observations. Wiley: New York.
PAQUETES ESTADÍSTICOS: En el curso habrá un paquete estadístico básico,
el cual servirá como herramienta para comprender mejor los conceptos
presentados en clase. Este paquete básico no es exclusivo, si el alumno así
lo desea, puede auxiliarse de cualquier otro paquete estadístico.
Paquete básico: R
Paquetes auxiliares: Splus, SPSS, Statgraphics, Minitab, Matlab
EVALUACIÓN: El curso se avaluará de la siguiente manera:
Examen Parcial - 40%
Trabajo Final - 20%
Examen Final - 40%
Tareas
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 5
1. Introducción
¿Qué es el análisis multivariado?
Definición: Análisis Multivariado. Es la parte de la Estadística que se
dedica al estudio de mediciones simultáneas de varias variables. Provee
una metodología para el análisis de este tipo de datos.
El análisis multivariado es mucho más complicado que el análisis
univariado y muchas veces no existe una generalización directa.
Generalmente en análisis multivariado el investigador se dedica a analizar
una base de datos ya existente sin haber controlado el proceso de obtención
de los datos ni la elección de variables a analizar (diseño de experimentos y
diseño muestral).
Algunos de los métodos multivariados están basados en un modelo
probabilístico (normal multivariada), sin embargo existen algunos otros
que sólo están basados en argumento intuitivos.
1.1 Aplicaciones de los métodos multivariados
Las aplicaciones de los métodos multivariados se han incrementado
tremendamente en los últimos años y han expandido las áreas de
aplicación.
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 6
Los objetivos para los cuales se han usado los métodos multivariados más
comúnmente son:
1) Reducción de datos o simplificación estructural
2) Clasificación y agrupación: tanto individuos como variables
3) Investigar la dependencia entre variables
4) Predicción
5) Pruebas de hipótesis
Aplicaciones de los métodos multivariados al análisis de riesgos:
1) Z−Score: Análisis de clasificación o análisis discriminante.
Se usa para determinar cuando una empresa es sana o tiene alta
probabilidad de quiebra.
Ref: Elizondo (2003), Cap. 1.
2) Scoring: Componentes principales.
Se usa para evaluar (calificar) el riesgo de una empresa o una cartera o
un individuo.
Ref: Elizondo (2003), Cap. 3.
3) Probabilidad de incumplimiento: Modelos logísticos.
Se usa para modelar la probabilidad de incumplimiento en carteras de
crédito.
Ref: Elizondo (2003), Cap. 2.
4) Modelos de correlaciones (CreditMetrics, KMV-Model): Análisis de
factores.
Se usa para determinar factores comunes en un grupo de variables.
Ref: Bluhm, et al. (2003).
5) Distribuciones de pérdida conjuntas: Cópulas.
Expresar pérdidas conjuntas en términos de pérdidas marginales.
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 7
Ref: Bluhm, et al. (2003).
1.2 Organización de los datos
Los datos multivariados surgen cuando un investigador selecciona un
número p≥1 de variables o características a medir.
Los valores de estas variables están medidas para cada individuo, elemento
o unidad experimental.
NOTACIÓN:
p = número de variables
n = número de individuos
Xij = j-ésima variable del i-ésimo individuo
xij = valor observado de la j-ésima variable del i-ésimo individuo
⇒ Si tenemos n mediciones de p variables, es decir, i=1,...,n y j=1,....,p
=
np2n1n
p22221
p11211
xxx
xxxxxx
X
L
MOMM
L
L
X=matriz de datos
Los renglones de la matriz X corresponden a las medicines de las p
variables para cada individuo i, , i=1,...,n. Es decir,
( )ip2i1i'i x,...,x,xx = .
Nota: Todos los vectores son vectores columna.
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 8
A lo largo de este curso usaremos dos (o más) bases de datos financieras
para ilustrar los métodos multivariados:
1) Datos de precios de acciones (Stock-Price data):
Consiste de tasas de retorno semanales para 5 acciones que cotizan en la
bolsa de Nueva York, de enero de 1975 a diciembre de 1976.
Xij = Tasas de retorno en la semana i de la acción j
Yij = Precio de cierre de la acción j en la semana i (en viernes)
⇒ j,1i
j,1iijij Y
YYX
−
−−=
2) Datos financieros de compañías de servicio (Public Utility Data):
Consiste de mediciones financieras de 22 compañías de servicio público
en E. U. en 1975.
3) Datos de “Credit Scoring” (Credit Data):
Consiste de 113 observaciones de 10 características para el
otorgamiento de crédito hipotecario.
o Nota: Las observaciones de datos multivariados deben de ser
independientes de un individuo a otro.
1.3 Variables, vectores y matrices aleatorias
Recordemos:
o X es una variable aleatoria si X es una función medible con dominio en el
espacio muestral (Ω) y contradominio en los números reales (ℜ ), i.e.,
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 9
(Ω, ℑ ,P)→X(ℜ ,ß,Px)
X es medible ⇔ Para todo B ∈ ß, ℑ∈∈ωΩ∈ω=− B)(X:)B(X 1
o X es un vector aleatorio de dimensión p si ( ) pp1 :X,,X'X ℜ→Ω= K
medible.
En Estadística, generalmente obtenemos una muestra aleatoria de la
variable de interés. Si la variable de interés es un vector aleatorio, entonces
una m.a. es una colección (X1,…,Xn) de vectores aleatorios independientes
e idénticamente distribuidos tal que ( )ip2i1ii X,,X,X'X K= , i=1,…,n.
En forma matricial, la m.a. se puede expresar como:
=
np2n1n
p22221
p11211
XXX
XXXXXX
X
L
MOMM
L
L
,
donde cada Xij es una v.a., i=1,…,n, j=1,…,p.
NATURALEZA de las v.a.’s:
Sabemos que una v.a. X puede ser tanto continua como discreta. En el caso
ultivariado los vectores aleatorios ( )p1 X,,X'X K= pueden ser:
I. Continuos: Si Xj es una v.a. continua para todo j=1,…,p
II. Discretos: Si Xj es una v.a. discreta para todo j=1,…,p
III. Mixtos: Si Xj es una v.a. continua para algún j’ y Xj es discreta para j≠j’
o Nota: El término mixto también se usa en el contexto de una sola v.a. en
donde una parte es discreta y otra parte es continua.
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 10
DISTRIBUCIONES DE VECTORES Y MATRICES ALEATORIAS:
o Sea ( )p1 X,,X'X K= un vector aleatorio de dimensión p×1, entonces
( )p1X,,X x,,xfp1
KK es la función de densidad conjunta
( ) ( )pp11p1X,,X xX,,xXPx,,xFp1
≤≤= KKK es la función de distribución
conjunta
o Independencia: X1,…,Xp son v.a. independientes si y solo si
( ) ( ) ( )pXp1Xp1X,,X xfxfx,,xf1p1
LKK = , ó
( ) ( ) ( )pXp1Xp1X,,X xFxFx,,xF1p1
LKK =
o Sea
=
'X
'X'X
X
n
2
1
M una matriz aleatoria tal que ( )ip2i1ii X,,X,X'X K= son
vectores aleatorios independientes, entonces la función de densidad
conjunta es
( ) ( ) ( )∏∏==
==n
1iip1iX,,X
n
1ii'XX x,,xf'xfxf
ip1iiKK
y la función de distribución conjunta es
( ) ( )∏=
=n
1ii'XX 'xFxF
i
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 11
VALORES ESPERADOS Y VARIANZAS:
o Recordemos: Sea X una v.a. de dimensión 1×1, entonces
( )
==µ∑
∫∞
∞−
discreta es X si ,)x(xf
continua es X si ,dx)x(xfXE
x
X
( )( ) ( )
( ) ( )
µ−
µ−==σ
∑
∫∞
∞−
discreta es X si ,xfx
continua es X si ,dxxfxXVar
x
2
2
2X
Nota: ( ) ( ) ( ) 222 XEXEXVar µ−=µ−=
o Sea ( )21 X,X'X = un vector aleatorio de dimensión 2×1, entonces
Covarianza:
( ) ( )( ) ( ) 212122112112 XXEXXEX,XCov µµ−=µ−µ−==σ ,
donde, ( )jj XE=µ , j=1,2
( )( ) ( )
( )( ) ( )
µ−µ−
µ−µ−=σ∑
∫∞
∞−
discretasson Xy X si ,x,xfxx
continuasson Xy X si ,dxdxx,xfxx
21x
21X,X2211
212121X,X2211
12
21
21
¿Qué pasa cuando X1 es continua y X2 es discreta?
Coeficiente de correlación:
2211
1212 σσ
σ=ρ , con 112 ≤ρ
o Si X1 y X2 son v.a.’s independientes ⇒ ( ) 0X,XCov 21 = ( ρ12=0 )
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 12
Nota: La implicación inversa no es cierta generalmente, sólo en el caso
normal bivariado.
o Sea ( )p1 X,,X'X K= un vector aleatorio de dimensión p×1, entonces
Vector de medias:
µ
µµ
=
==µ
p
2
1
p
2
1
)X(E
)X(E)X(E
)X(EMM
Matriz de varianzas y covarianzas:
( )
µ−µ−µ−
µ−
µ−µ−
=Σ pp2211
pp
22
11
X,...,X,X
X
XX
EM
( ) ( )( ) ( )( )( )( ) ( ) ( )( )
( )( ) ( )( ) ( )
µ−µ−µ−µ−µ−
µ−µ−µ−µ−µ−
µ−µ−µ−µ−µ−
=Σ
2pp22pp11pp
pp222
221122
pp1122112
11
XXXXX
XXXXXXXXXX
E
L
MOMM
L
L
σσσ
σσσσσσ
=Σ
pp2p1p
p22221
p11211
L
MOMM
L
L
Nota: Σ=Var(X) =Cov(X,X) y Σ’ =Σ
o Es importante reescribir la información dada por Σ en términos
estandarizados
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 13
( )iii XVar=σ y ( )jiij X,XCov=σ
⇒ ( )jjii
ijjiij X,XCorr
σσ
σ==ρ , i,j=1,...,p.
Esta información se puede escribir en una matriz:
Matriz de correlaciones:
ρρ
ρρρρ
==Ρ
1
11
)X(Corr
2p1p
p221
p112
L
MOMM
L
L
o Si definimos a V1/2, la matriz de desviaciones estándar, como
σ
σσ
=
pp
22
11
2/1
00
0000
V
L
MOMM
L
L
⇒ 2/12/1
2/12/1
VVVV
−− Σ=ΡΡ=Σ
PROPIEDADES DE ESPERANZAS Y VARIANZAS:
Sean X y Y dos vetores aleatorios de dimensión p×1 y sean A y B
matrices constantes de dimensión p×p, entonces
1) E(A)=A
2) E(AX+BY) =AE(X)+BE(Y)
3) E(AXb’) =AE(X)b’, b=vector de constantes de dimensión p×1
4) E(X’AX)=E(X)’AE(X)+trAVar(X)
5) Var(A) =0
6) Var(AX) =AVar(X)A’
7) Cov(AX,BY) =ACov(X,Y)B’
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 14
1.4 Repaso de álgebra matricial
Sugerencia: Ver apéndice de conocimientos básicos de álgebra matricial
(Suplemento 2A de Jonson & Wichern, 2002).
Algunos resultados importantes que necesitaremos a lo largo del curso son:
o Descomposición espectral de una matriz: A(p×p)
∑=
λ=ΡΛΡ=p
1iiii 'ee'A ,
donde ( )p21 e,,e,e K=Ρ , ei = i-ésimo eigenvector de A
I'' =ΡΡ=ΡΡ (i.e., Ρ es ortonormal)
λ
λλ
=Λ
p
2
1
00
0000
L
MOMM
L
L
, λi=i-ésimo eigenvalor de A
o Inverso de una matriz: A(p×p)
∑=
−−
λ=ΡΡΛ=
p
1iii
i
11 'ee1'A
debido a que ( )( ) ( ) I''I''AA 11 =ΡΡ=ΡΡ=ΡΛΡΡΡΛ= −−
Nota: Otra forma de calcular A−1 es:
)A(Adj)Adet(
1A 1 =− , donde )'A(Cofac)A(Adj =
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 15
o Raíz cuadrada de una matriz: A(p×p), λi > 0, para i=1,...,p (i.e., A definida
positiva)
∑=
λ=ΡΡΛ=p
1iiii
2/12/1 'ee'A
tal que ( )( ) ( ) A'''AA 2/12/12/12/1 =ΡΛΡ=ΡΡΛΡΡΛ=
o Desigualdad de Cauchy Schwartz: Sean x, y dos vectores de dimensión
p×1, entonces
( ) ( )( )y'yx'xy'x 2 ≤
con igualdad si y solo si x=cy, para algun c escalar.
DEM...
o Teorema: Maximización de formas cuadráticas en la esfera unitaria.
Sea B(p×p) una matriz definida positiva con eigenvalores 0p21 >λ≥λ≥λ L
y correspondientes eigenvectores e1,e2,...,ep. Entonces,
10x x'xBx'xmax λ=
≠ (se alcanza cuando x=e1)
p0x x'xBx'xmin λ=
≠ (se obtiene cuando x=ep)
Más aún,
1ke,,ex x'xBx'xmax
k1+
⊥λ=
K (se obtiene cuando x=ek+1, k=1,...,p−1)
donde ⊥=ortogonal (perpendicular).
DEM...
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 16
o Nota: Para un x≠0, si x'x
xxxx0 == , i.e. x0 es el vector normalizado de x
(x0 se encuentra en el círculo unitario) ⇒ 00 Bx'xx'x
Bx'x=
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 17
2. Análisis exploratorio multivariado
2.1 Estadísticas multivariadas descriptivas
Las estadísticas multivariadas descriptivas sirven para apreciar la
información contenida en un conjunto de datos mediante el cálculo de
ciertos números resumen (estadísticas).
Nos concentraremos en estadísticas descriptivas de localización, dispersión
y de relación lineal.
Formalmente, un conjunto de datos es una realización de una muestra
aleatoria n21 X,...,X,X de tamaño n de una distribución multivariada. Es
decir,
( )ip2i1i'i X,...,X,XX = para i=1,...,n.
Cada Xi es un vector aleatorio de dimensión p×1.
o Finalmente, el conjunto de datos X se puede escribir como:
=
np2n1n
p22221
p11211
XXX
XXXXXX
X
L
MOMM
L
L
,
donde X es una matriz aleatoria.
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 18
MEDIA MUESTRAL: Vector de dimensión p×1
∑=
=n
1iiX
n1X ,
es decir,
++
=
=
np
2n
1n
p1
12
11
p
2
1
X
XX
X
XX
n1
X
XX
XM
LMM
.
Esto implica que, para j=1,...,p
∑=
=n
1iijj X
n1X .
Propiedades:
( ) µ=XE ,
donde µ es el vector de medias poblacional de dimensión p×1
( ) ( ) Σ==n1XVar
n1XVar i ,
donde Σ es la matriz de varianzas y covarianzas de Xi.
DEM...
R: mean, colMeans, apply−mean
VARIANZA MUESTRAL: Matriz de dimensión p×p
( )( )
−−−
= ∑=
n
1i
'ii XXXX
1n1S ,
que en términos matriciales se puede escribir como:
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 19
( ) ( )'X1X'X1X1n
1S ' −−−
= ,
donde ( )1,,1'1 1n K=× . Alternativamente,
=
pp2p1p
p22221
p11211
SSS
SSSSSS
S
L
MOMM
L
L
,
donde, ( )∑=
−−
=n
1i
2jijjj XX
1n1S , para j=1,2,...,p, y
( )( )∑=
−−−
=n
1ijijkikkj XXXX
1n1S , para k≠j=1,2,...,p.
Propiedades:
( ) Σ=SE ,
donde Σ es la matriz de varianzas y covarianzas poblacional
DEM...
R: var
o Varianza generalizada: Existen dos formas para resumir la información de
la matriz S:
1) )Sdet(S =
2) tr(S)
Casos particulares:
a) Si n≤p ⇒ |S|=0
b) Si Var(a’X)>0 para todo a≠0 y p<n ⇒ Rango(S)=p y |S|>0, c.p.1
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 20
CORRELACIÓN MUESTRAL: La correlación muestral no tiene una expresión
en forma de producto de matrices, pero
=
1rr
r1rrr1
R
2p1p
p221
p112
L
MOMM
L
L
donde, jjkk
kjkj SS
Sr = , para k≠j=1,2,...,p.
Propiedades:
1) -1 ≤ rkj ≤ 1
2) ( ) Ρ≠RE .
R: cor
OTRAS ESTADÍSTICA DESCRIPTIVAS: Cuantiles, cuartiles, coeficientes de
variación, etc. pueden ser calculados para cada una de las variables como
en el caso univariado.
R: summary
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 21
2.2 Análisis gráfico
DIAGRAMAS DE DISPERSIÓN (bidimensional).
Este tipo de diagrama consiste en graficar simultáneamente en dos
dimensiones diagramas de dispersión entre todas las posibles parejas de
variables.
R: plot, pairs
DIAGRAMAS DE DISPERSIÓN (tridimensional)
Este tipo de diagrama consiste en graficar en tres dimensiones tres
variables simultáneamente.
R: brush, Graph > 3D Plot > 3D Scatter Plot
DIAGRAMA DE BURBUJAS (tridimensional)
Este tipo de diagrama consiste en graficar en dos dimensiones tres
variables en forma de burbujas de la siguiente manera: El eje de las X's
corresponde a una de las variables, el eje de las Y's corresponde a otra de
las variables, y la tercer variable quedará representada por el tamaño de la
burbuja.
R: symbols
DIAGRAMA DE ESTRELLAS (multidimensional)
Suponga que los datos toman valores no negativos con p≥2. En dos
dimensiones se pueden construir círculos (imaginarios) de una radio fijo
con p rayos igualmente espaciados saliendo del centro del círculo. Las
longitudes de los rayos representan el valor de las variables. Los rayos
pueden ser conectados para formar una estrella. Cada estrella representa
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 22
una observación multivariada. El orden de las variables es en contra de las
manecillas del reloj empezando a las 3 horas (esto varia dependiendo del
paquete). Es recomendable estandarizar las variables antes de hacer el
diagrama:
jj
jijijij S
XXZX
−=→ , i=1,...,n, j=1,...,p.
R: stars
CARAS DE CHERNOFF (multidimensional)
Chernoff sugirió representar observaciones p−variadas como una cara
bidimensional, cuyas características (forma de la cara, curvatura de la boca,
largo de la nariz, tamaño del ojo, posición de la pupila, etc.) están
determinadas por los valores de las p variables. Distinto ordenamiento de
las variables dan una representación diferente.
R: faces
DIAGRAMA DE ANDREWS (multidimensional)
Este tipo de diagrama consiste en representar a la observación i-ésima de
un vector aleatorio p-variado ( )ip2i1i'i x,...,x,xx = como una función, i.e.,
L+++++= )t2cos(x)t2(senx)tcos(x)t(senx2
x)t(f 5i4i3i2i1i
i
para π<<π− t .
El diagrama de Andrews se construye graficando las n funciones fi(t),
i=1,...,n sobre una misma gráfica en dos dimensiones. Es recomendable
estandarizar las variables. Distintos ordenamientos de las variables dan
representaciones diferentes.
PROFESOR: LUIS E. NIETO BARAJAS
Maestría: Administración de riesgos Análisis multivariado para riesgos 23
NOTAS FINALES:
Los diagramas de estrellas, las caras de Chernoff y el diagrama de
Andrews nos sirven para resolver los siguientes objetivos:
o Encontrar una agrupación inicial de individuos
o Detectar observaciones multivariadas extremas
o Verificar o validar una agrupación obtenida por algún método de obtención
de cúmulos (cluster analysis).