analisis factorial

9
Análisis factorial Hace el análisis hasta que se sature la información Cuanto se tiene que aportar para sacar lo máximo que pueda P value -> los factores son o no suficientes Se contradice porque tiene que estar presente en uno pero en otro no voy a preferir que el factor este concentrado en un solo lado Factor 1 Factor 2 Alfabetismo 0.723 -0.621 Idh 0.872 -0.487 Alfabetismo se contradice pero Idh no Análisis de un factor Uniquenesses: //aporta alfabetismo esperanza_vida idh ingresos nbi_almenosuna pobreza_extrema pobreza_total 0.122 0.108 0.005 0.005 0.086 0.354 0.096 Loadings: Factor1 alfabetismo 0.937 esperanza_vida 0.944 idh 0.998 ingresos 0.998 nbi_almenosuna -0.956 pobreza_extrema -0.804 pobreza_total -0.951 Factor1 SS loadings 6.227 Proportion Var 0.890 // porcentaje que explica Test of the hypothesis that 1 factor is sufficient. Lo recomendable es que el componente o factor explique más del 50%

Upload: mayi-morales-gomez

Post on 14-Jul-2016

9 views

Category:

Documents


0 download

DESCRIPTION

Analisis factorial en Rstudio y SPSS

TRANSCRIPT

Análisis factorial

Hace el análisis hasta que se sature la información

Cuanto se tiene que aportar para sacar lo máximo que pueda

P value -> los factores son o no suficientes

Se contradice porque tiene que estar presente en uno pero en otro no voy a preferir que el factor este concentrado en un solo lado

Factor 1 Factor 2

Alfabetismo 0.723 -0.621

Idh 0.872 -0.487

Alfabetismo se contradice pero Idh no

Análisis de un factor

Uniquenesses: //aportaalfabetismo esperanza_vida idh ingresos nbi_almenosuna pobreza_extrema pobreza_total 0.122 0.108 0.005 0.005 0.086 0.354 0.096

Loadings: Factor1alfabetismo 0.937 esperanza_vida 0.944 idh 0.998 ingresos 0.998 nbi_almenosuna -0.956 pobreza_extrema -0.804 pobreza_total -0.951

Factor1SS loadings 6.227Proportion Var 0.890 // porcentaje que explica

Test of the hypothesis that 1 factor is sufficient.The chi square statistic is 124.89 on 14 degrees of freedom.The p-value is 6.92e-20 // el factor es suficiente porque es menor a 0.05

Si bien es suficiente el análisis de un factor me agrupa dos grandes grupos (desarrollo y necesidades) pero es muy riesgoso porque la participación de determinadas variables es muy pequeña (especialmente idh e ingresos)

Lo recomendable es que el componente o factor explique más del 50%

Si me dan a elegir modelos?Se rechaza el modelo porque su autovalor de un factor es pequeñoPorque se contradice la participación de unas variables

Aunque se explique bastante si las variables se contradicen

Al utilizar un factor si bien es suficiente para explicar, me agrupa dos grupos pero seria muy riesgos usarlo porque la participación de algunas variables es muy pequeña … a pesar de tal problema ¿lo usaría? Evaluar eso.

Uniquenesses: // participación de pea gini, etc. Aportan bastantealfabetismo densidad esperanza_vida gini idh ingresos ipse_actual ipse_futura ipsp_actual ipsp_futura nbi_almenosuna 0.091 0.825 0.105 0.755 0.005 0.005 0.437 0.005 0.870 0.699 0.035 pea pobreza_extrema pobreza_total 0.905 0.076 0.005

Loadings: Factor1 Factor2 Factor3alfabetismo 0.853 -0.176 -0.389 densidad 0.127 -0.287 -0.277 esperanza_vida 0.888 -0.194 -0.263 gini -0.485 idh 0.950 -0.219 -0.216 ingresos 0.949 -0.225 -0.215 ipse_actual 0.728 0.178 ipse_futura 0.978 0.196 ipsp_actual -0.258 0.242 ipsp_futura -0.104 0.538 nbi_almenosuna -0.872 0.136 0.431 pea -0.126 0.156 0.233 pobreza_extrema -0.674 0.685 pobreza_total -0.849 0.136 0.506

Factor1 Factor2 Factor3SS loadings 5.6 2.152 1.433Proportion Var 0.4 0.154 0.102Cumulative Var 0.4 0.554 0.656

Lo recomendable es que el componente o factor explique más del 50%

Test of the hypothesis that 3 factors are sufficient.The chi square statistic is 99.54 on 52 degrees of freedom.The p-value is 8.06e-05 // significativo, se puede hacer el analisis con 3 factores

Podría descartar las variables que se contradicen: Pobreza_extremaPobreza_total

Densidad está presente en los 3 factores pero no se posiciona fuertemente… no es importante (no tiene un peso fuerte en alguno de los 3 factores) -> está bien condicionada

Con 3 factores se encuentra algunos problemasEl primer factor esta compuesto por todo lo que tiene que ver con desarrollo y también necesidades básicas, pero esta sola (no esta pobreza porque se contradice con el factor 3). Si quiero incluir a pobreza que hago? Saco el factor 3… evaluar… en el factor 3 hay alguna variable con mucha fuerza? No, tal vez puede quitarse

Segundo componente / factorPercepción de la situación política futura y las variables económica, solo estas pesan tanto que aportan este grado de información, tal vez solo convenga pedir dos factores y no 3, pues ahí se contradicen

2 factores

Uniquenesses: alfabetismo densidad esperanza_vida gini idh ingresos ipse_actual ipse_futura ipsp_actual ipsp_futura nbi_almenosuna 0.091 0.911 0.105 0.804 0.005 0.005 0.946 0.943 0.900 0.924 0.036 pea pobreza_extrema pobreza_total 0.932 0.076 0.005

Loadings: Factor1 Factor2alfabetismo -0.737 0.604 densidad -0.287 esperanza_vida -0.643 0.694 gini 0.195 -0.398 idh -0.630 0.775 ingresos -0.628 0.776 ipse_actual 0.133 -0.192 ipse_futura 0.108 -0.213 ipsp_actual 0.173 -0.266 ipsp_futura -0.277 nbi_almenosuna 0.786 -0.588 pea 0.256

Lo recomendable es que el componente o factor explique más del 50%

pobreza_extrema 0.921 -0.276 pobreza_total 0.841 -0.537

Factor1 Factor2SS loadings 4.166 3.158Proportion Var 0.298 0.226Cumulative Var 0.298 0.523

Test of the hypothesis that 2 factors are sufficient.The chi square statistic is 138.12 on 64 degrees of freedom.The p-value is 2.28e-07

No me convino pedir 2 factores porque alfabetismo se empezó a contaradecir, asi como otras variables. Todas las variables empezaron a no indicar información. Mejor quedarse con dos factores

Un factor

Uniquenesses: alfabetismo densidad esperanza_vida gini idh ingresos ipse_actual ipse_futura ipsp_actual ipsp_futura nbi_almenosuna 0.122 0.939 0.107 0.814 0.005 0.005 0.946 0.946 0.903 0.957 0.087 pea pobreza_extrema pobreza_total 0.957 0.354 0.096

Loadings: Factor1alfabetismo -0.937 densidad -0.248 esperanza_vida -0.945 gini 0.431 idh -0.998 ingresos -0.998 ipse_actual 0.232 ipse_futura 0.232 ipsp_actual 0.311 ipsp_futura 0.208 nbi_almenosuna 0.956 pea 0.209 pobreza_extrema 0.804 pobreza_total 0.951

Factor1SS loadings 6.766Proportion Var 0.483 // solo explica el 48%

Lo recomendable es que el componente o factor explique más del 50%

Test of the hypothesis that 1 factor is sufficient.The chi square statistic is 218.61 on 77 degrees of freedom.The p-value is 1.7e-15

Tuvo sus costos: si bien no se contradice, me agrupa las mismas variables (desarrollo y necesidades), el problema es que el factor no explica mas del 50%

Entonces, al final solo convino usar 3 factores y eliminar una variable

Iniciamos el análisis con las 7 variables, al incluir 7 más, las nuevas no tienen mucho peso… entonces me hubiera quedado con las mismas 7 variables. Si me dan ese modelo con 14 variables no lo tomo pues no explica mucho, además seria riesgoso hablar de algunas variables pues tienen muy poca participación

En este análisis tengo que ver: Si el factor es suficiente Que me explica el factor (si se contradice o no) Como ha sido la participación de la variable

Método de máxima verosimilitudA través de factorizaciones sucesivas se obtiene un conjunto de factores donde cada uno de ellos explica a su vez tanta varianza como sea posible en la matriz de correlaciones de la población

Requisitos: muestras grandes y hacer pruebas de normalidadVentaha: se pueden obtener test de estadísticos para la significancia de cada factor extraido

Análisis componentes // es más fácil :v y se suele usar -> spss isi Análisis factorial // es más para establecer una afirmación Análisis de máxima verosimilitud // busca la máxima varianza -> r plz

Verosimilitud en SPSS

Comunalidades

Inicial Extracción

IDH ,956 ,926

esperanza_vida ,901 ,873

Alfabetismo ,911 ,914

pobreza_total ,981 ,978

pobreza_extrema ,913 ,803

NBI al menos una ,963 ,975

Método de extracción: máxima probabilidad.

Lo recomendable es que el componente o factor explique más del 50%

Todas están bien extraidas porque es mayor a 0.05Varianza total explicada

Factor

Autovalores iniciales Sumas de extracción de cargas al cuadrado

Total % de varianza % acumulado Total % de varianza % acumulado

1 5,535 92,255 92,255 5,469 91,154 91,154

2 ,280 4,658 96,914

3 ,085 1,420 98,333

4 ,055 ,924 99,257

5 ,030 ,505 99,762

6 ,014 ,238 100,000

Método de extracción: máxima probabilidad.

Matriz factoriala

Factor

1

IDH -,962

esperanza_vida -,934

Alfabetismo -,956

pobreza_total ,989

pobreza_extrema ,896

NBI al menos una ,987

Método de extracción: máxima

probabilidad.

a. 1 factores extraídos. 6

iteraciones necesarias.

Prueba de bondad de ajuste

Chi-cuadrado gl Sig.

37,207 9 ,000

Matriz de coeficiente de

puntuación factorial

Factor

1

IDH -,110

esperanza_vida -,062

Lo recomendable es que el componente o factor explique más del 50%

Alfabetismo -,093

pobreza_total ,381

pobreza_extrema ,038

NBI al menos una ,332

Método de extracción: máxima

probabilidad.

Método de rotación: Varimax con

normalización Kaiser.

Hago la ecuaciónF1 : -0.110(IDH) – 0.062(esperanza_vida

Permite los que tienen el valor mayor a 1 en el spss, en el r te permite jugar mas

Normalización del factor: La prueba el factor tenga la máxima correlaciones entre ellas (ello le importa para realizar los cálculos y a partir de ella evalua cuanto va a partircipar)Chi2 : para ver si el factor es estadísticamente significativo

Uniquenesses: alfabetismo esperanza_vida idh nbi_almenosuna pobreza_extrema pobreza_total 0.086 0.127 0.074 0.025 0.197 0.022

Loadings: Factor1alfabetismo -0.956 esperanza_vida -0.934 idh -0.962 nbi_almenosuna 0.987 pobreza_extrema 0.896 pobreza_total 0.989

Factor1SS loadings 5.469Proportion Var 0.912

Test of the hypothesis that 1 factor is sufficient.The chi square statistic is 37.21 on 9 degrees of freedom.The p-value is 2.42e-05

Lo recomendable es que el componente o factor explique más del 50%