Download - Componentes Principales
![Page 1: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/1.jpg)
Componentes Principales
![Page 2: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/2.jpg)
• Karl Pearson
![Page 3: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/3.jpg)
• Objetivo: dada una matriz de datos de dimensiones nxp que representa los valores de p variables en n individuos, investigar si es posible representar los individuos mediante r variables (r<p) con poca (o ninguna si es posible) pérdida de información.
![Page 4: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/4.jpg)
Nos gustaría encontrar nuevas variables Z, combinación lineal de las X originales, tales que:
• r de ellas contengan toda la información
• las restantes p-r fuesen irrelevantes
![Page 5: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/5.jpg)
Primera interpretación de componentes principales:Representación gráfica óptima de los datos
![Page 6: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/6.jpg)
xi
a
zi
ri
Proyección de un punto en una dirección: maximizar la varianza de la proyección equivale a minimizar las distancias
xiT
xi = riT ri+ zT
i zi
![Page 7: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/7.jpg)
![Page 8: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/8.jpg)
Minimizar las distancias a la recta es lo mismo que maximizar la varianza de los puntos proyectados(estamos suponiendo datos de media cero)
![Page 9: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/9.jpg)
Segunda interpretación de componentes: Predicción óptima de los datos
Encontrar una variable zi =a’Xi que sea capaz de prever lo mejor posible el vector de variables Xi en cada individuo.
Generalizando, encontrar r variables, zi =Ar Xi , que permitan prever los datos Xi para cada individuo lo mejor posible, en el sentido de los mínimos cuadrados
Puede demostrarse que la solución es que zi =a’Xi tenga varianzamáxima.
![Page 10: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/10.jpg)
Recta que minimiza las distancias ortogonales, proporciona los ejes del elipsoide que contiene a la nube de puntos
Tercera interpretación: Ejes del elipsoide que contiene a la nube de puntos
Coincide con la idea de regresión ortogonal de Pearson
![Page 11: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/11.jpg)
![Page 12: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/12.jpg)
![Page 13: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/13.jpg)
![Page 14: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/14.jpg)
Ejemplo. Datos de gastos de familias EPF
![Page 15: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/15.jpg)
Segundo componente
![Page 16: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/16.jpg)
Ejemplo gastos EPF
![Page 17: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/17.jpg)
![Page 18: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/18.jpg)
![Page 19: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/19.jpg)
Propiedades de los CP
![Page 20: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/20.jpg)
Propiedades
• Conservan la varianza generalizada
• Conservan la varianza efectiva
![Page 21: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/21.jpg)
Propiedades• La variabilidad explicada es la
proporción del valor propio a la suma
![Page 22: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/22.jpg)
PropiedadesLa covarianza entre los componentes y las variables es proporcional al vector propio que define el componente
Y como
![Page 23: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/23.jpg)
Propiedades
• Las covarianzas entre los componentes y las
variables son proporcionales al vector propio y el factor de proporcionalidad es el valor propio
![Page 24: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/24.jpg)
Propiedades
![Page 25: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/25.jpg)
Propiedades
![Page 26: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/26.jpg)
CP como predictores óptimos
Queremos prever cada fila de la matriz
Mediante un conjunto de variables
Con el mínimo error
![Page 27: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/27.jpg)
CP como predictores óptimos
Dado el vector a el coeficiente c se obtiene por regresión
Para obtener a tenemos que minimizar
Con lo que
![Page 28: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/28.jpg)
CP como predictores óptimos
![Page 29: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/29.jpg)
CP como predictores óptimosEl resultado de la aproximación es
![Page 30: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/30.jpg)
CP como predictores óptimos
Y en general, la mejor aproximación de la matriz con otra de Rango r<p es
![Page 31: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/31.jpg)
• Los CP son los predictores óptimos de las variables originales
• La aproximación de CP puede aplicarse a cualquier matriz aunque tengamos más variables que observaciones
![Page 32: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/32.jpg)
Propiedades• En lugar de trabajar con la matriz de varianzas
podemos hacerlo con la de correlaciones• Esto equivale a trabajar con variables
estandarizadas
![Page 33: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/33.jpg)
CP sobre correlaciones
![Page 34: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/34.jpg)
Ejemplo Inves
![Page 35: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/35.jpg)
Ejemplo Inves
![Page 36: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/36.jpg)
![Page 37: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/37.jpg)
Ejemplo Medifis
![Page 38: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/38.jpg)
![Page 39: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/39.jpg)
![Page 40: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/40.jpg)
Ejemplo mundodes
![Page 41: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/41.jpg)
Ejemplo Mundodes
![Page 42: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/42.jpg)
![Page 43: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/43.jpg)
Ejemplos para análisis de imagenes
![Page 44: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/44.jpg)
![Page 45: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/45.jpg)
En lugar de tener que transmitir 16 matrices de N2
16 370,6
16
Pixeles transmitimos un vector 16x3 con los valores de los componentes y una matriz 3xN2 con los vectores propiosDe esta manera ahorramos:
Ahorramos el 70% . Si en lugar de 16 imágenes tenemos100 el ahorro puede ser del 95%
![Page 46: Componentes Principales](https://reader037.vdocuments.co/reader037/viewer/2022102420/56813aab550346895da2a641/html5/thumbnails/46.jpg)
Generalización
• Buscar direcciones de proyección interesantes desde algun punto de vista.
• Esta es la idea de Projection Pursuit. Buscar proyecciones que produzcan distribuciones de los datos tan alejadas de la normalidad como sea posible.