a.c.p-expo-senso

14
ANÁLISIS DE COMPONENTES PRINCIPALES UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE INGENIERIA PESQUERA Y ALIMENTOS ESCUELA PROFESIONAL DE INGENIERIA DE ALIMENTOS INTEGRANTES: ALATA SIHUES, ISABEL ARANA ESPINOZA , GERARDO HUILLCA CATCOPARCO,JOSE LUIS SALCEDO HIDALGO, SUSAN SULCA LUJAN, GISELA

Upload: gerald-paul-chumpitaz-huanqui

Post on 09-Dec-2015

2 views

Category:

Documents


1 download

DESCRIPTION

ANALISIS DE COMPONENTES Y PRINCIPIOSINTRODUCCIONPRINCIPIOSESTUDIO

TRANSCRIPT

ANÁLISIS DE COMPONENTES PRINCIPALES

UNIVERSIDAD NACIONAL DEL CALLAOFACULTAD DE INGENIERIA PESQUERA Y

ALIMENTOSESCUELA PROFESIONAL DE INGENIERIA DE ALIMENTOS

INTEGRANTES: ALATA SIHUES, ISABEL ARANA ESPINOZA , GERARDO HUILLCA CATCOPARCO,JOSE

LUIS SALCEDO HIDALGO, SUSAN SULCA LUJAN, GISELA

Transformar un conjunto de variables (variables originales) en un nuevo conjunto de variables (componentes principales), no correlacionadas que representen la mayor variabilidad posible de las variables originales.

OBJETIVO

Para explicar fenómenos cuya información se cifra en muchas variables más o menos correlacionadas. Reducir la dimensión del número de variables inicialmente consideradas en el análisis. Las nuevas variables pueden ordenarse según la información que llevan.

INTERÉS

No, es un Análisis Multivariado que tiene que ver con relaciones matemáticas entre varias mediciones hechas a un mismo objeto (producto alimenticio).

Este análisis no es un método estadístico que lleva a la decisión sobre una hipótesis , o a la estimación de una probabilidad.

Sin embargo se utilizan para simplificar gran cantidad de datos a un conjunto de variables y mostrar la interrelación que guardan, para facilitar su interpretación.

¿EL ACP ES UN MÉTODO ESTADÍSTICO?

El conjunto original de variables en (que miden información común)

ANÁLISIS DE COMPONENTES PRINCIPALES

En otro conjunto de nuevas variables no correlacionadas entre sí (que no tenga repetición o redundancia en la información) llamado “conjunto de componentes principales”

Para estudiar las relaciones que se presentan entre P variables correlacionadas se tienen que transformar :

Al graficar los datos sobre un eje bidimensional, la varianza de mayor tamaño del conjunto de datos es capturada en el primer eje (llamado el Primer Componente Principal), la segunda varianza más grande es el segundo eje, y así sucesivamente para el tercero y cuarto, siendo cada uno perpendicular.

El análisis de componentes principales puede resumir la mayor parte de la variabilidad de un juego de datos de multicomponentes a una cuantas variables importantes.

En lugar de requerir 10 a 20 componentes sensoriales para describir un producto alimenticio, el análisis de componentes principales reduce este número a dos o tres componentes principales que sirven para diferenciar entre dichos productos.

POR EJEMPLO

El número de componentes principales que de alguna manera pudieran reemplazar a las variables originales, sin mucha pérdida de información, depende del problema en particular.

¿CUÁNTOS COMPONENTES PRINCIPALES SON SUFICIENTES?

EN GENERAL

Se desea que el porcentaje de la variabilidad explicada por los r primeros componentes sea de al menos el 80% .

Un análisis de componentes principales tiene sentido si existen altas correlaciones entre las variables, ya que esto es indicativo de que existe información redundante y, por tanto, pocos factores explicarán gran parte de la variabilidad total.

FASES DE UN ANÁLISIS DE COMPONENTES PRINCIPALES

La elección de los factores se realiza de tal forma que el primero recoja la mayor proporción posible de la variabilidad original; el segundo factor debe recoger la máxima variabilidad posible no recogida por el primero, y así sucesivamente. Del total de factores se elegirán aquéllos que recojan el porcentaje de variabilidad que se considere suficiente. A éstos se les denominará componentes principales.

Una vez seleccionados los componentes principales, se representan en forma de matriz. Cada elemento de ésta representa los coeficientes factoriales de las variables (las correlaciones entre las variables y los componentes principales). La matriz tendrá tantas columnas como componentes principales y tantas filas como variables.

Análisis de la matriz de correlaciones

Selección de los factores

Análisis de la matriz factorial

Los principales inconvenientes que presenta el análisis de componentes principales:

DESVENTAJA

Es que no existe ningún criterio racional para decidir que variabilidad deben recoger los componentes principales.

Los componentes dependen de la escala de medición No se permite tener en cuenta la variabilidad existente entre

los datos que se pueda deber al azar.

APLICACIÓN DEL ANÁLISIS DE COMPONENTES PRINCIPALES EN EL DESARROLLO DE PRODUCTOS

La aplicación del análisis de componentes principales en un problema de desarrollo de productos. El posicionamiento de cinco formulaciones de mermelada de mora fue estudiado tomando cuatro variables sensoriales: sabor, color, aroma y textura.

Cada una de las diferentes formulaciones fue evaluada por el panel entrenado (siete jueces). Los resultados representados por el promedio de cada una de las cuatro variables sensoriales se presentan en la Tabla 1.

AROMA COLOR SABOR TEXTURA

M1 10 15 18 11

DON SERAFIN

16 17 24 16

M3 13 13 20 14

M4 12 20 10 25

MALLOA 12 11 14 11

Tabla 1. Resultados de las cuatro variables sensoriales

La Tabla 2 presenta el promedio global, la desviación estándar y el coeficiente de variación para las cuatro variables evaluadas.

PROMEDIO DESVIACIÓN ESTANDAR

CV%

AROMA 12.6 2.19 17

COLOR 15.2 3.49 23

SABOR 17.2 5.40 31

TEXTURA 15.4 5.77 37

Tabla 2. Resultado del promedio global, desviación estándar y cv%

Con el propósito de evaluar el grado de asociación entre las cuatro variables sensoriales se ha determinado la matriz de correlación de Pearson, presentada en la Tabla 3

Se pone en evidencia una alta correlación positiva entre textura y color. Este resultado implica que las mermeladas con mejor textura normalmente son mermeladas con un buen color. Así mismo se observa una correlación importante y además positiva entre el sabor y el aroma. Se debe notar también que el coeficiente entre textura y sabor es negativo, este resultado implica que una mermelada calificada con buen sabor corresponde normalmente a una mermelada con mala textura y viceversa

AROMA COLOR SABOR

COLOR 0.1760.777

SABOR 0.6000.285

-0.2010.745

TEXTURA 0.1940.755

0.8630.059

-0.4600.426

Tabla 3. Correlaciones del aroma, color, sabor y textura

Contenido de la celda: Correlación de Pearson

De los cuatro puntos de varianza original, el primer componente explica 2.075 que representa prácticamente el 52% de la varianza original. El segundo componente explica 1.565 (39%) de la varianza original. Los otros dos componentes explican porcentajes significativamente más bajos comparativamente a los dos primeros componentes. Si observamos en la columna “acumulado” de la tabla 4, el primer plano factorial (componente 1 y componente 2), el valor 91% representa el porcentaje de la varianza total explicada por los dos primeros componentes

La Tabla 4 presenta los resultados del ACP en términos de la varianza total inicial explicada por cada uno de los componentes.

Tabla 4. Análisis de componente principal: aroma, color, sabor y textura

Análisis de los valores y vectores propios de la matriz de correlación

VALOR PROPIO

2.0754 1.5655 0.3283 0.0308

PROPORCIÓN

0.519 0.391 0.082 0.008

ACUMULADA 0.519 0.910 0.992 1.00

Si se toma en cuenta como criterio de retención de componentes, aquellos cuyo valor propio (Eigen value) es superior a la unidad, el ACP considera a los dos primeros componentes. En términos prácticos, el problema inicialmente representado en un hiper espacio de cuatro dimensiones ha sido reducido al plano, rescatando más del 90% de la varianza original. Este resultado implica que el posicionamiento de las mermeladas se podrá representar en un plano.