doc-uba-ppt-4-b

24
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL Titular: Agustín Salvia MÓDULO 4 B ANÁLISIS FACTORIAL SEMINARIO DE POSGRADO

Upload: ariana-karen-salome-ramos

Post on 24-Oct-2014

112 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: doc-uba-ppt-4-b

ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN

SOCIAL

Titular: Agustín Salvia

MÓDULO 4 B

ANÁLISIS FACTORIAL

SEMINARIO DE POSGRADO

Page 2: doc-uba-ppt-4-b

ANÁLISIS FACTORIAL

Identificación de estructuras subyacentes

Reducción de información

EN LA INVESTIGACIÓN SOCIAL SE TRABAJA CON MUCHOS CONCEPTOS COMPLEJOSCONCEPTOS COMPLEJOS QUE

NO SON DIRECTAMENTE OBSERVABLES

Creación de variables resumen

USOS MÁS FRECUENTES

Page 3: doc-uba-ppt-4-b

El Análisis Factorial es una técnica que consiste en resumir la información contenida en una matriz de datos con V variables. Para ello se identifican un reducido número de factores F, siendo el número de factores menor que el número de variables. Los factores representan a la variables originales, con una pérdida mínima de información.

El modelo del Análisis Factorial se expresa como una combinación lineal de factores no directamente observables: Xij = F1i ai1 + F2i ai2+....+Fki aik + Vi

ANÁLISIS FACTORIAL

Page 4: doc-uba-ppt-4-b

El Análisis Factorial (método factor principal) supone que existe un factor común subyacente a las variables.

Este método busca factores que expliquen la mayor parte de la varianza común. La varianza común es la parte de la variación de la variable que es compartida con las otras variables. La varianza única es la parte de la variación de la variable que es propia de esa variable.

ANÁLISIS FACTORIAL

FACTOR PRINCIPAL

Page 5: doc-uba-ppt-4-b

El Análisis Factorial (método componentes principales) no supone que existe un factor común subyacente a las variables.

El Análisis de Componentes Principales busca hallar combinaciones lineales de las variables originales que expliquen la mayor parte de la variación total. El primer factor o componente sería aquel que explica una mayor parte de la varianza total, el segundo factor sería aquel que explica la mayor parte de la varianza restante, y así sucesivamente.

ANÁLISIS FACTORIAL

COMPONENTES PRINCIPALES

Page 6: doc-uba-ppt-4-b

Para que el Análisis Factorial tenga sentido deberían cumplirse dos condiciones básicas:

Parsimonia e Interpretabilidad

Según el principio de parsimonia el número de factores debe ser lo más reducido posible y estos deben ser susceptibles de interpretación sustantiva. Una buena solución factorial es aquella que es sencilla e interpretable.

ANÁLISIS FACTORIAL

Page 7: doc-uba-ppt-4-b

ANÁLISIS FACTORIAL

Se asume que los factores únicos no están correlacionados entre sí ni con los factores comunes.

Se puede distinguir entre Análisis Factorial Exploratorio, donde no se conocen los factores "a priori“ sino que se identifican por el análisis factorial y, por otro lado estaría el Análisis Confirmatorio donde se propone "a priori" un modelo, según el cual hay unos factores que representan mejor a las variables originales.

Page 8: doc-uba-ppt-4-b

1- Calcular la matriz de correlaciones entre todas las variables (conocida habitualmente

como matriz R).

2- Extracción de los factores necesarios para representar los datos. Análisis de la matriz de cargas.

3- Rotación de los factores con objeto de facilitar la interpretación. Representación gráfica.

4- Calcular las puntuaciones factoriales de cada individuo.

ANÁLISIS FACTORIALPASOS EN EL ANALISIS FACTORIAL

Page 9: doc-uba-ppt-4-b

REQUISITOS PARA SU UTILIZACIÓN

Selección de variables que formen conjuntos correlacionados.

Variables deben estar en escala métrica.

Un mínimo de 100 casos

ANÁLISIS FACTORIAL

Page 10: doc-uba-ppt-4-b

ANÁLISIS FACTORIALEJEMPLO

Se intentan conocer los determinantes de los ingresos de la ocupación principal de los asalariados. Dado que se supone que estos están asociados a un conjunto de características de la persona y del puesto. Dado que el conjunto de variables es grande y se sospecha que algunas de ellas están muy relacionadas, por lo que parece conveniente antes del análisis intentar determinar si existen subconjuntos diferenciados de ellas.

Page 11: doc-uba-ppt-4-b

EXAMEN DE LA MATRIZ DE CORRELACIONES

1- El primer paso en el Análisis Factorial será calcular la matriz de correlaciones entre todas las variables que entran en el análisis.

2- Una vez que se dispone de esta matriz cabe examinarla para comprobar si sus características son adecuadas para realizar un Análisis Factorial.

3- Uno de los requisitos que deben cumplirse para que el Análisis Factorial tenga sentido es que las variables estén altamente correlacionadas.    

ANÁLISIS FACTORIAL

Page 12: doc-uba-ppt-4-b

EXAMEN DE LA MATRIZ DE CORRELACIONES

ANÁLISIS FACTORIALEJEMPLO

Correlation Matrix

1,000 ,281 ,136 ,379

,281 1,000 -,101 ,554

,136 -,101 1,000 ,164

,379 ,554 ,164 1,000

,000 ,000 ,000

,000 ,000 ,000

,000 ,000 ,000

,000 ,000 ,000

Tamaño delestablecimiento

Nivel de Instrucción

Edad

Calificación laboral

Tamaño delestablecimiento

Nivel de Instrucción

Edad

Calificación laboral

Correlation

Sig. (1-tailed)

Tamañodel

establecimiento

Nivel deInstrucción Edad

Calificación laboral

Page 13: doc-uba-ppt-4-b

El Análisis Factorial extrae una matriz factorial:F 1 F 2

1 P11 P21

2 P12 P22

• Cada columna es un factor y cada fila una variable.  Los elementos Pij pueden interpretarse como índices de correlación entre el factor i y la variable j.

• Estos coeficientes reciben el nombre de pesos o cargas factoriales. Las cargas indican el peso de cada variable en cada factor. Lo ideal es que cada variable cargue alto en un factor y bajo en los demás.

ANÁLISIS FACTORIALMATRIZ DE CARGA

FACTORIAL

Page 14: doc-uba-ppt-4-b

ANÁLISIS FACTORIALEJEMPLO

Component Matrixa

,680 ,202

,775 -,412

,185 ,931

,859 1,103E-02

Tamaño delestablecimiento

Nivel de Instrucción

Edad

Calificación laboral

1 2

Component

Extraction Method: Principal Component Analysis.

2 components extracted.a.

Page 15: doc-uba-ppt-4-b

• El cuadrado de una carga factorial indica la proporción de la varianza explicada por un factor en una variable particular.

• La suma de los cuadrados de los pesos de cualquier columna de la matriz factorial es lo que denominamos eigenvalues, indica la cantidad total de varianza que explica ese factor.

• Las cargas factoriales pueden tener como valor máximo 1, por tanto el valor máximo que puede alcanzar el valor propio es igual al número de variables.

ANÁLISIS FACTORIALEIGENVALUES (VALORES

PROPIOS)

Page 16: doc-uba-ppt-4-b

EXTRACCIÓN DE MATRIZ FACTORIAL

ANÁLISIS FACTORIALEJEMPLO

Communalities

1,000 ,504

1,000 ,771

1,000 ,900

1,000 ,738

Tamaño delestablecimiento

Nivel de Instrucción

Edad

Calificación laboral

Initial Extraction

Extraction Method: Principal Component Analysis.

Total Variance Explained

1,836 45,910 45,910 1,836 45,910 45,910 1,821 45,531 45,531

1,077 26,913 72,823 1,077 26,913 72,823 1,092 27,292 72,823

,702 17,544 90,367

,385 9,633 100,000

Component1

2

3

4

Total% of

VarianceCumulativ

e % Total% of

VarianceCumulativ

e % Total% of

VarianceCumulativ

e %

Initial EigenvaluesExtraction Sums of Squared

Loadings Rotation Sums of Squared Loadings

Extraction Method: Principal Component Analysis.

Page 17: doc-uba-ppt-4-b

• Se denomina "comunalidad" a la proporción de la varianza explicada por los factores comunes en una variable. La comunalidad es la suma de los pesos factoriales al cuadrado en cada una de las filas.

• El Análisis Factorial comienza sus cálculos a partir de lo que se conoce como matriz reducida compuesta por los coeficientes de correlación entre las variables y con las comunalidades en la diagonal.

• Como la comunalidad no se puede saber hasta que se conocen los factores, este resulta ser uno de los problemas del Análisis Factorial.

ANÁLISIS FACTORIALCOMUNALIDADES

Page 18: doc-uba-ppt-4-b

La matriz factorial presenta un número de factores superior al necesario para explicar la estructura de los datos. Generalmente hay un conjunto reducido de factores, los primeros, que son los que explican la mayor parte de la variabilidad total. Los otros factores suelen contribuir relativamente poco.

Existen diversos criterios para determinar el número de factores a conservar. Uno de los más utilizados es la regla de Kaiser: "conservar aquellos factores cuyos valores propios (eigenvalues) son mayores a la unidad". Este criterio tiende a sobreestimar el número de factores.

ANÁLISIS FACTORIALNUMERO DE FACTORES A

CONSERVAR

Page 19: doc-uba-ppt-4-b

ANÁLISIS FACTORIALEJEMPLO

Scree Plot

Component Number

4321

Eig

en

valu

e

2,0

1,5

1,0

,5

0,0

Page 20: doc-uba-ppt-4-b

La matriz factorial resulta difícil de interpretar pues no queda claro en que factor satura cada variable. Para facilitar la interpretación se realizan lo que se denominan rotaciones factoriales, la cual consiste en hacer girar los ejes de coordenadas, que representan a los factores, hasta conseguir que se aproxime al máximo a las variables en que están saturados. La saturación de factores transforma la matriz factorial inicial en otra denominada matriz factorial rotada, de más fácil interpretación. La matriz factorial rotada es una combinación lineal de la primera y explica la misma cantidad de varianza inicial.

ANÁLISIS FACTORIALROTACIONES

FACTORIALES

Page 21: doc-uba-ppt-4-b

La matriz factorial debe reunir las siguientes características:  1- Cada factor debe tener unos pocos pesos altos y los otros próximos a 0.  2- Cada variable no debe estar saturada más que en un factor.  3- Los factores distintos deben presentar distribuciones de cargas altas y bajas distintas.

Con la rotación factorial aunque cambie la matriz factorial las comunalidades no se alteran, sin embargo, cambia la varianza explicada por cada factor. Existen varios métodos de rotación: ortogonales para factores independientes (Varimax) y oblicuos para factores correlacionados (Oblimin).

ANÁLISIS FACTORIALEVALUACIÓN DE LA MATRIZ

ROTADA

Page 22: doc-uba-ppt-4-b

MATRIZ ROTADA

ANÁLISIS FACTORIALEJEMPLO

Rotated Component Matrixa

,645 ,296

,826 -,298

5,196E-02 ,947

,849 ,132

Tamaño delestablecimiento

Nivel de Instrucción

Edad

Calificación laboral

1 2

Component

Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.

Rotation converged in 3 iterations.a.

Component Transformation Matrix

,990 ,141

-,141 ,990

Component1

2

1 2

Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.

Page 23: doc-uba-ppt-4-b

ANÁLISIS FACTORIALEJEMPLO

Component Plot in Rotated Space

Component 1

1,0,50,0-,5-1,0

Co

mp

on

en

t 2

1,0

,5

0,0

-,5

-1,0

calificación laboral

edad

nivel de instrucción

tamaño del estableci

Page 24: doc-uba-ppt-4-b

Dos cuestiones pueden ayudar a la interpretación y reconocimiento de los factores: 1) Ordenar la matriz rotada de forma que las variables con saturaciones altas en un factor aparezcan juntas. 2) Eliminar las variables con cargas factoriales bajas (aquellas por debajo de 0,25).

Llamaremos variable compleja a aquella que satura altamente en más de un factor y que no debe ser utilizada para identificar los factores. Factores bipolares, son aquellos en los que unas variables cargan positivamente y otras tienen carga negativa.

ANÁLISIS FACTORIAL

INTERPRETACIÓN DE RESULTADOS