guÍa prÁctica para realizar pls’s en statistica (versiones 7 en adelante)

Post on 29-Jan-2016

217 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

En el módulo NIPALS Algorithm

Si la respuesta es categórica

Para hacer crossvalidations; cambiamos los valores V-fold: V value: indicando el número de particiones (folds) Seed: ese número para seleccionar diferentes grupos de muestras al azar

… lo demás, mejor lo dejamos tal y como está por defecto

Solapa Quick

Resultado de la crossvalidación. NS indica que esa componente (la última) ya no es significativa.La podemos quitar con el botón rectangular “Remove last”.

Para la cuantificación de cómo de “ruidosas” son las diferentes unidades muestrales (separación de los patrones de covariación definidos por el PLS)

Solapa Advanced

Para interpretar el significado de las componentes elegidas atendiendo a las variables X’s e Y’s (si hay varias variables respuesta)

Para una estima de ‘outliers’ en las variables X’s e Y’s

Para estimar las posiciones de las muestras (casos) en cada componente

Para obtener las predicciones (¡ojo! escaladas partiendo de las Y’s originales a media=0 y sd=1) del modelo teniendo en cuenta las componentes seleccionadas arriba. El cuadrado de la desviación estándard de las predicciones coincide con la R2Y acumulada del modelo.

GUÍA PRÁCTICA PARA REALIZAR PLS’s EN TANAGRA

Primero …Seleccionamos nuestro conjunto de datos dentro de una hoja de MS-Excel.Incluimos en la primera fila el nomber de las variables

Segundo …Vamos a la solapa de complementos dentro de una hoja de MS-Excel.Seleccionamos TANAGRA y Execute

Al abrirse TANAGRA en una ventana independiente de programa …

Damos click en este icono ... y aparecerá debajo de Dataset

Simultáneamente emergerá esta ventana.

Seleccionaremos las variables predictoras en el panel izquierdo y con la flecha roja las pasamos al panel derecho INPUT.

Hacemos lo mismo para la(s) respuesta(s) que pasamos a TARGET.

click en OK.

Seleccionamos el componente PLS …y dentro de éste la opción PLSR.

A continuación damos click con el botón derecho sobre PLSR 1 y seleccionamos Parameters…

Aparecerá una ventana emergente con las solapas: Parameters Output Report

Seleccionamos el número de componente PLS que queremos obtener

Marcamos las tresopciones

Marcamos las cincoopciones

…y damos click en OK

Volvemos a dar click con el botón derecho del ratón

sobre PLSR 1…

y pulsamos Execute

¡¡ HECHO !!

Explicación de la variable respuesta Y por las sucesivas componentes o Latent Factors Current: por esa componente Cumulative: acumulado (1, 1+2, 1+2+3, …)

Retención de información de las variables predictoras X’s por las sucesivas componentes o Latent Factors Current: por esa componente Cumulative: acumulado (1, 1+2, 1+2+3, …)

… y los RESULTADOS SON:

En Component podemos seleccionarCopy results

para copiar todos los resultados y pegarlos en MS-Excel o el programa de texto que queramos

… y los RESULTADOS SON:

Con Wh tenemos los pesos

Cuyos cuadrados dentro de cada componente suman 1y nos indican su contenido informativo en esa componente afectando a la respuesta Y

Con VIP tenemos una indicación de cómo varía la importancia de cada variable en la secuencia de componentesFactor 1 … solo considera F1Factor 2 … considera el conjunto de F1 y F2Factor 3 … considera el conjunto de F1, F2 y F3…..

… y los RESULTADOS SON:Volvemos a dar al icono de Define statuspara abrir otra opción de selección de datosaplicable a PLSR 1

Seleccionamos con el botón derechoParameters

… y a continuación veremos las variables continuas (C) que se refieren a las componentes Y (Utilde) o de las X’s (las t).

Luego nos vamos al componente Data visualizationy seleccionamos el módulo View dataset…que arrastramos sin soltarlo hasta colgarlo deDefine status 2

Para acabar damos doble click en View dataset

… y los RESULTADOS SON:

Nos sale una ventana azul cobalto con los datos

Que podemos de nuevo copiar para pegarlos en MS-Excel o el programa de texto que queramos

… y los RESULTADOS SON:

Seleccionamos otra opción de análisis dentro del componente PLS llamadaPLS Selección que arrastramos sin soltar hasta colgarla del análisis PLSR 1

… y los RESULTADOS SON:

Con el botón derecho sobre PLS Selection 1 entramos en Parameters

… y los RESULTADOS SON:

Seleccionamos el número de grupos (#folds) para la

crosvalidación5, 10, …

Seleccionamos la regla de parada Q2 para elegir las componentes

significativas teniendo en cuenta su robustez y reproducibilidad

… y los RESULTADOS SON:

Damos doble click … y sale …

… y los RESULTADOS SON:

El número de componentes significativas es …

Sólo una (la primera) esSignificativa atendiendo a la robustez del significado de las componentes construidas con las variables X’s.

Pero por si acaso …podemos quedarnos con las dos primeras y valorar como de significativas son las relaciones U1 con T1 U2 con T2

… y los RESULTADOS SON:

Una regresión múltiple con la respuesta Y y las dos componentes X’s t1 y t2puede efectuarse con el módulo “Multiple linear regression” dentro del componente Regression.

Ambas componentes son muy significativas

top related