ecuaciÓn de predicciÓn del promedio de esperanza de vida la estadÍstica aplicada es la...

32
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA DISCIPLINA DE LAS MATEMÁTICAS APLICADAS EN CONSTANTE DESARROLLO Y EVOLUCIÓN. ¿CÓMO SE CONSTRUYEN LOS MODELOS EN EL CAMPO DE LAS CIENCIAS SOCIALES? TEORÍAS DATOS EMPÍRICOS MODELOS

Upload: maite-bellon

Post on 13-Feb-2015

23 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS.

ES UNA DISCIPLINA DE LAS MATEMÁTICAS APLICADAS EN CONSTANTE DESARROLLO Y EVOLUCIÓN.

¿CÓMO SE CONSTRUYEN LOS MODELOS EN EL CAMPO DE LAS CIENCIAS SOCIALES?

TEORÍAS

DATOS EMPÍRICOS

MODELOS

Page 2: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

HIPÓTESIS: SUPUESTO O CONJETURA A PROBAR.

1) DESCRIPTIVAS

2) ASOCIATIVAS

3) DE CAUSA-EFECTO

LAS PRUEBAS DE HIPÓTESIS TIENEN COMO OBJETIVO:

DETERMINAR SI UNA CONJETURA HECHA ACERCA DE ALGUNA CARACTERÍSTICA DE LA POBLACIÓN ESTÁ FIRMEMENTE SUSTENTADA POR LA INFORMACIÓN CONTENIDA EN UNA MUESTRA REPRESENTATIVA DE ESA POBLACIÓN.

Page 3: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

ANÁLISIS DE REGRESIÓN:

BUSCA ESTABLECER RELACIONES (CAUSALES) ENTRE UNA VARIABLE DEPENDIENTE (Y) Y UN CONJUNTO DE VARIABLES EXPLICATIVAS : { X1, X2,...,Xp-1}

ES UNA TÉCNICA ESTADÍSTICA QUE NOS PERMITE:

-PREDECIR A Y EN TÉRMINOS DE X1, X2,...,Xp-1

-EXPLICAR LA VARIABILIDAD DE Y EN TÉRMINOS DE X1, X2,...,Xp-1

-CONTROLAR Y EN TÉRMINOS DE VARIABLES EXPLICATIVAS DE CONTROL.

MODELO:

Yi = B0 + B1Xi + ei i = 1,...,n

Page 4: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

MODELO:

Yi = B0 + B1Xi + ei i = 1,...,n

Y: VARIABLE DEPENDIENTE (CUANTITATIVA)

X: VARIABLE EXPLICATIVA (CUALQUIER TIPO)

e : ERROR

B0, B1 : PARÁMETROS

SUPUESTOS:

1) NORMALIDAD (ALEATORIEDAD)

2) HOMOCEDASTICIDAD

3) LINEALIDAD

Page 5: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

HIPÓTESIS: EL PROMEDIO DE ESPERANZA DE VIDA ESTÁ EN FUNCIÓN DE LAS SIGUIENTES OCHO VARIABLES:

reg1: Es la indicadora de los Estados que se localizan en la región norte del país. (Baja California, Baja California Sur, Coahuila, Chihuahua, Durango Nuevo León, Sinaloa, Sonora, Tampico y Zacatecas).

 reg2:Es la indicadora de los Estados que se localizan en la región centro del país. (Aguascalientes, Colima, Distrito Federal, Guanajuato, Hidalgo, Jalisco, México, Michoacán, Morelos, Nayarit, Puebla, Querétaro, San Luis Potosí y Tlaxcala).

reg3: Es la indicadora de los Estados que se localizan en la región sur del país. (Veracruz, Chiapas, Oaxaca, Quintana Roo, Yucatán, Guerrero, Campeche y Tabasco).

Page 6: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

pibe: producto interno bruto de cada uno de los estados a precios de 1993 medido en millones de pesos

promesco: promedio en años de la escolaridad de la población de 15 años y más.

ingprom: ingreso promedio mensual de preceptores en miles de pesos.

pobdh: porcentaje de la población por entidad federativa que es derechohabiente. Es decir la población que se encuentra afiliada a las instituciones de seguridad social.

agricult: porcentaje de la población ocupada en el sector primario por entidad federativa. El sector primario comprende las actividades económicas relacionadas con la agricultura, ganaderia, silvicultura,caza y pesca.

Page 7: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

VARIABLE DEPENDIENTE:

espvida: número de años que en promedio se espera viva un recién nacido.

Ejemplo de datos para Aguascalientes y Baja California respectivamente (fuente: INEGI, 2004):

0 1 75.3 17.99 8.1 5,086 54.7 11.4

1 0 75.9 48.12 8 8,328 50.3 5.6

reg1 reg2 espvida pibe promesco

ingprom pobdh Agricult

Page 8: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

PROCEDIMIENTO:

1.- SE LLEVÓ A CABO UN ANÁLISIS EXPLORATORIO DE TODOS LOS DATOS SIN ENCONTRARSE DATOS FALTANTES O VALORES ATÍPICOS.

2.- SE CALCULO LA MATRIZ DE CORRELACIÓN PARA LOS 32 ESTADOS DELA REPÚBLICA MEXICANA, CON LOS SIGUIENTES RESULTADOS:

Page 9: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

| espvida reg1 reg2 pibe promesco ingprom pobdh agricult

___________________________________________________________________

espvida | 1.0000

reg1 | 0.4657 1.0000

reg2 | 0.1340 -0.5946 1.0000

pibe | 0.4656 -0.0313 0.2438 1.0000

promesco | 0.8628 0.2904 0.1102 0.6117 1.0000

ingprom | 0.8053 0.6532 -0.2122 0.3476 0.6076 1.0000

pobdh | 0.8305 0.6491 -0.2095 0.2454 0.7582 0.7345 1.0000

agricult | -0.9197 -0.2917 -0.1670 -0.5143 -0.8743 -0.7159 -0.7538 1.0000

____________________________________________________________________

Page 10: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

3.- SELECCIÓN DEL MODELO HACIA ATRÁS (FORWARD )

Primer modelo: todas las 8 variables explicativas:

Source | SS df MS Number of obs = 32

-------------+----------------------------------------- F( 7, 24) = 64.80

Model | 17.474195 7 2.49631357 Prob > F = 0.0000

Residual | .924578992 24 .038524125 R-squared = 0.9497

-------------+------------------------------------------

Total | 18.398774 31 .593508838

 

 

Page 11: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

espvida | Coef. Std. Err. t P>|t| [95% Conf. Interval]

___________________________________________________________

reg1 | .3028919 .1451065 2.09 0.048 .0034068 .6023771

reg2 | .390707 .0977955 4.00 0.001 .1888671 .5925469

pibe | -.0004662 .0008486 -0.55 0.588 -.0022176 .0012852

promesco | .2154642 .1077838 2.00 0.057 -.0069907 .437919

ingprom | .0001466 .000053 2.77 0.011 .0000372 .000256

pobdh | .0087986 .006398 1.38 0.182 -.0044061 .0220034

agricult | -.0179587 .0065679 -2.73 0.012 -.0315142 -.0044031

cons | 72.21501 .920475 78.45 0.000 70.31524 74.11478

___________________________________________________________

En esta primer modelo de regresión el pibe tiene el mayor valor p, superior al valor de la significancia establecido de .05 por lo tanto es la primera variable que sale del modelo y volvemos a realizar el análisis de regresión.

Page 12: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

regress espvida reg1 reg2 promesco ingprom pobdh agricult

 

Source | SS df MS Number of obs = 32

-------------+------------------------------------------- F( 6, 25) = 77.72

Model | 17.4625684 6 2.91042806 Prob > F = 0.0000

Residual | .936205597 25 .037448224 R-squared = 0.9491

-------------+-------------------------------------------

Total | 18.398774 31 .593508838

 

Page 13: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

_____________________________________________________________________

espvida | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+---------------------------------------------------------------------------------------

reg1 | 3088759 .1426623 2.17 0.040 .0150575 .6026943

reg2 | .3876284 .0962617 4.03 0.000 .1893737 .5858832

promesco | .1836927 .0896752 2.05 0.051 -.0009968 .3683822

ingprom | .0001392 .0000505 2.75 0.011 .0000351 .0002433

pobdh | .0100153 .005918 1.69 0.103 -.002173 .0222036

agricult | -.0182367 .0064563 -2.82 0.009 -.0315338 -.0049397

cons | 72.41943 .8300683 87.25 0.000 70.70988 74.12899

-----------------------------------------------------------------------------------------------------

LA SIGUIENTE VARIABLE A ELIMINAR ES pobdh YA QUE NO TIENE EL NIVEL DE SIGNIFICANCIA ESTABLECIDO (.O5). NUEVAMENTE SE REALIZA EL ANÁLISIS DE REGRESIÓN CON LOS SIGUIENTES RESULTADOS:

Page 14: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

regress espvida reg1 reg2 promesco ingprom agricult

 

Source | SS df MS Number of obs = 32

-------------+----------------------------------------- F( 5, 26) = 86.49

Model | 17.3553143 5 3.47106287 Prob > F = 0.0000

Residual | 1.04345964 26 .040133063 R-squared = 0.9433

-------------+------------------------------------------

Total | 18.398774 31 .593508838

Page 15: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

espvida | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+-----------------------------------------------------------------------------------

reg1 | .4261471 .1290956 3.30 0.003 .1607873 .6915069

reg2 | .372568 .099226 3.75 0.001 .168606 .5765299

promesco | .23679 .0869668 2.72 0.011 .0580271 .4155528

ingprom | .0001383 .0000523 2.64 0.014 .0000308 .0002459

agricult | -.0213731 .0064025 -3.34 0.003 -.0345336 -.0082126

cons | 72.48742 .858302 84.45 0.000 70.72316 74.25169

---------------------------------------------------------------------------------------------------

COMO PODEMOS OBSERVAR TODAS LAS VARIABLES EN ESTE MODELO CUMPLEN CON LA EXIGENCIA DE PRECISIÓN DE TENER UNA SIGNIFICANCIA ESTADÍSTICA PARA LOS VALORES t .05

 

Page 16: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

4.- VALIDACIÓN DEL MODELO FINAL: ANÁLISIS DE RESIDUOS, VALORES ATÍPICOS, OBSERVACIONES INFLUYENTES Y MULTICOLINEALIDAD.

4.1 ANÁLISIS DE RESIDUOS

PARA LA NORMALIDAD O ALEATORIEDAD DE LOS RESIDUOS ESTANDARIZADOS SE OBTUVIERON LOS SIGUIENTES RESULTADOS:

Skewness/Kurtosis tests for Normality

------- joint ------

Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2

-------------+-----------------------------------------------------------------------------

rst | 0.099 0.927 2.97 0.2260

 

Page 17: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

-3-2

-10

12

Sta

ndar

dize

d re

sidu

als

-2 -1 0 1 2Inverse Normal

Page 18: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

0.1

.2.3

.4D

ensity

-2 -1 0 1Standardized residuals

Page 19: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

Breusch-Pagan / COOKS-Weisberg test for heteroskedasticity

Ho: Constant variance

Variables: fitted values of espvida

 

chi2(1) = 0.16

Prob > chi2 = 0.6879

 

En este caso vemos que no se rechaza la hipótesis nula, es decir, en este caso no hay problemas de heteroscedasticidad, las varianzas son homogéneas.

Page 20: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

GRÁFICA DE RESIDUOS ESTANDARIZADOS-3

-2-1

01

2S

tandard

ized r

esid

uals

73 74 75 76Fitted values

Page 21: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

4.2 ANÁLISIS DE VALORES ATÍPICOS

EL CRITERIO DE DETECCIÓN DE ESTOS VALORES ES PARA RESIDUOS ESTANDARIZADOS (rst) MAYORES A 2.5 QUE EN TÉRMINOS DE PROBABILIDAD ES DE .9876

COMO SE VIÓ EN LA GRÁFICA ANTERIOR HAY UNA OBSERVACIÓN ATÍPICA QUE CORRESPONDE AL ESTADO DE QUERÉTARO.

4.3 ANÁLISIS DE OBSERVACIONES INFLUYENTES.

EMPLEANDO EL ESTADÍSTICO DE DISTANCIAS DE COOKS

Di 4/n Di Fp.n-p(0.95) Y CON LAS GRÁFICAS RESPECTIVAS ES POSIBLE IDENTIFICAR CASOS CON VALORES ALTOS.

NUEVAMENTE ES EL ESTADO DE QUERÉTARO UNA OBSERVACIÓN INFLUYENTE AL IGUAL QUE TAMAULIPAS.

Page 22: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

4.4 MULTICOLINEALIDAD. SE PRESENTA CUANDO LOS Bi ESTÁN CORRELACIONADOS. EL ESTADÍSTICO DE PRUEBA SE LLAMA FACTOR DE INFLACIÓN DE LA VARIANZA (VIF). SI VIF 10 HAY PROBLEMAS DE MULTICOLINEALIDAD.

Variable | VIF

----------------+-------------

agricult | 6.56

promesco | 4.36

ingprom | 3.77

reg1 | 2.85

reg2 | 1.93

-------------+----------------------

Mean VIF | 3.89

 No existen problemas de multicolinealidad.

Page 23: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

MODELO ALTERNATIVO FINAL

EN ESTE MODELO SE HAN ELIMINADO A LOS ESTADOS DE TAMAULIPAS Y QUERÉRATO. LOS RESULTADOS SON LOS SIGUIENTES:

Source | SS df MS Number of obs = 30

-------------+----------------------------------------- F( 5, 24) = 123.36

Model | 17.5556093 5 3.51112187 Prob > F = 0.0000

Residual | .683080975 24 .028461707 R-squared = 0.9625

-------------+--------------------------------------------

Total | 18.2386903 29 .628920355

Page 24: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

-------------------------------------------------------------------------------------------------------------

espvida | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+------------------------------------------------------------------------------------

reg1 | .4315045 .1129538 3.82 0.001 .1983793 .6646297

reg2 | .3890436 .084346 4.61 0.000 .214962 .5631252

promesco | .2115511 .0739807 2.86 0.009 .0588625 .3642398

ingprom | .0001427 .000046 3.10 0.005 .0000478 .0002375

agricult | -.0238405 .0055735 -4.28 0.000 -.0353437 -.0123372

_cons | 72.73745 .7398237 98.32 0.000 71.21052 74.26437

TODAS LAS SIGNIFICANCIAS PARA LOSVALORES DE t SON MENORES AL .05

PASEMOS A LA EVALUACIÓN DE ESTE MODELO.

Page 25: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

ANÁLISIS DE RESIDUOS:

1.- LOS RESIDUOS ESTÁN NORMALMENTE DISTRIBUIDOS. EL VALOR DE 2 = 2.73 Y UN VALO DE p = .2549 NO SE RECHAZA LA Ho.

2.-PARA LA HOMOSCEDASTICIDAD, EL RESULTADO DE LA PRUEBA FUE:

Breusch-Pagan / COOKS-Weisberg test for heteroskedasticity

Ho: Constant variance

Variables: fitted values of espvida

 

chi2(1) = 2.61

Prob > chi2 = 0.1065 NO SE RECHAZA LA Ho, ES DECIR, NO HAY PROBLEMAS DE HETEROSCEDASTICIDAD

Page 26: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

3.- VALORES ATÍPICOS: NO HAY NINGUNA OBSERVACIÓN MAYOR A 2.5

4.- OBSERVACIONES INFLUYENTES. AL APLICAR EL ESTADÍSTICO DE COOKS LOS ESTADOS DE CHIAPAS Y EL DISTRITO FEDERAL RESULTARON CON PROBLEMAS.

5.- MULTICOLINEALIDAD. NO SE TUVO PROBLEMAS. 

Variable | VIF 1/VIF

-------------+----------------------

agricult | 6.67 0.150000 TODOS LOS VALORES TIENEN UN FACTOR

promesco | 4.36 0.229342 DE INFLACIÓN DE LAVARIANZA (VIF) 10

ingprom | 3.98 0.251341

reg1 | 2.82 0.354094

reg2 | 1.84 0.543076

-------------+----------------------

Mean VIF | 3.93

Page 27: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

ANÁLISIS DE LA DECISIÓN FINAL:

Al eliminar a Chiapas y el Distrito Federal, hacer el modelo y validarlo nuevamente tenemos observaciones influyentes, estamos perdiendo información y con ello el valor de R2

disminuye. Por ello se tomó la decisión de crear dos variables indicadoras para las observaciones influyentes de Querétaro y Tamaulipas y volver a obtener el modelo de regresión con los siguientes resultados:

Source | SS df MS Number of obs = 32

-------------+------------------------------ F( 7, 24) = 88.92

Model | 17.715693 7 2.53081329 Prob > F = 0.0000

Residual | .683080975 24 .028461707 R-squared = 0.9629

-------------+------------------------------

Total | 18.398774 31 .593508838

Page 28: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

espvida | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+--------------------------------------------------------------------------------

reg1 | .4315045 .1129538 3.82 0.001 .1983793 .6646297

reg2 | .3890436 .084346 4.61 0.000 .214962 .5631252

indquere | -.5290672 .1792217 -2.95 0.007 -.8989625 -.1591718

indtamau | -.355178 .1849542 -1.92 0.067 -.7369047 .0265488

promesco | .2115511 .0739807 2.86 0.009 .0588625 .3642398

ingprom | .0001427 .000046 3.10 0.005 .0000478 .0002375

agricult | -.0238405 .0055735 -4.28 0.000 -.0353437 -.0123372

_cons | 72.73745 .7398237 98.32 0.000 71.21052 74.26437

--------------------------------------------------------------------------------------------------

 La indicadora Tamaulipas (indtamau) esta a más del 5% por ello debemos regresarla a su región de origen y nos queda la siguiente regresión FINAL.

Page 29: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

Source | SS df MS Number of obs = 32

-------------+--------------------------------------------- F( 6, 25) = 93.11

Model | 17.6107329 6 2.93512215 Prob > F = 0.0000

Residual | .788041099 25 .031521644 R-squared = 0.9572

-------------+----------------------------------------------

Total | 18.398774 31 .593508838

 ---------------------------------------------------------------------------------------------

espvida | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+---------------------------------------------------------------------------------

reg1 | .3804491 .115531 3.29 0.003 .1425086 .6183897

reg2 | .4012269 .0885129 4.53 0.000 .2189312 .5835225

indquere | -.5367571 .1885628 -2.85 0.009 -.9251095 -.1484048

promesco | .2313325 .0770977 3.00 0.006 .0725469 .3901181

ingprom | .0001624 .0000471 3.45 0.002 .0000653 .0002595

agricult | -.0211333 .0056748 -3.72 0.001 -.0328208 -.0094459

_cons | 72.43623 .7608776 95.20 0.000 70.86917 74.00328

Page 30: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

LA ECUACIÓN AJUSTADA DEL MODELO FINAL SIN ELIMINAR A NINGÚN ESTADO Y CREANDO LA INDICADORA DE QUERÉTARO ES LA SIGUIENTE:

 PROMEDIO DE ESPERANZA DE VIDA= 72.43+ .38044reg1+ .40122 reg2+.231332promesco+.0001624ingprom -.021133agricult -.5367indquere

La interpretación es la SIGUIENTE: LA ESPERANZA DE VIDA EMPIEZA CON UNA BASE DE 72.43 AÑOS PARA LOS ESTADOS DEL SUR, SI PERTENECE A LOS ESTADOS DEL NORTE SE LE AGREGA .38044 AÑOS Y SI SE PERTENECE AL CENTRO SE LE SUMA .40122 AÑOS. PARA CUALQUIER ESTADO POR CADA AÑO MÁS DE ESTUDIO SE LE AGREGA A LA ESPERANZA DE VIDA .231333 DE AÑOS. POR CADA 1000 PESOS DE AUMENTO EN EL INGRESO MENSUAL SE LE SUMA .0001624 Y FINALMENTE POR CADA PUNTO PORCENTUAL QUE AUMENTE LA POBLACIÓN DEDICADA A LAS ACTIVIDADES PRIMARIAS LA ESPERANZA DE VIDA DISMINUYE EN .021133.

NOTA SI ESTAMOS REALIZANDO EL ANÁLISIS PARA QUERÉTARO SE LE DEBE RESTAR .5367 AL PROMEDIO DE LA ESPERANZA DE VIDA..

Page 31: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

VALIDACIÓN INTERNAPara los Estados del Norte vamos a obtener los coeficientes de variación Coeficiente de Variación

Esperanza de Vida .5869% Promedio de Escolaridad 5.9870% Ingreso Promedio 23.31% Porcentaje población dedicado a actividades primarias 64.77%

Para los Estados del Centro los coeficientes de variación Coeficiente de Variación Esperanza de Vida .7537% Promedio de Escolaridad 12.3207% Ingreso Promedio 21.15% Porcentaje población dedicado a actividades primarias 54.62%

Para los Estados del Sur los coeficientes de variación Coeficiente de Variación Esperanza de Vida .8727% Promedio de Escolaridad 10.63% Ingreso Promedio 20.58% Porcentaje población dedicado a actividades primarias 36.05%

Page 32: ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA

ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA

Del análisis empírico de los datos para el año 2004 podemos obtener como conclusiones que el promedio de esperanza de vida es mayor en el los Estados de Norte del país a diferencia de los Estados del Sur, sin embargo, la diferencia es en general de 1.5 años más, sin embargo dentro de los Estados del Sur encontramos Estados como Chiapas que tienen dos años menos de vida con respecto a la media de los Del Norte. Así mismo los datos también nos sirvieron para ver los niveles de educación que son mucho más altos en el Norte con un promedio de 8 años de estudio para personas de 15 años en adelante aunque por ejemplo el Distrito Federal tiene 10 años de estudio mientras que el de menos valor de la República Mexicana es Chiapas con 5.8 años. Con respecto al ingreso el Norte es el de más altos ingresos siendo el estado de Baja California el mayor con 8328 pesos y el menor Chiapas con 2773. Finalmente en el Sur es donde hay más población dedicada a las actividades del sector primario siendo Oaxaca en donde casi el 60% de la población se dedicada a este tipo de actividades y el que menos es Baja California (dedicada al turismo).

Llama la atención que el producto interno bruto de cada Estado no hay servido para explicar la esperanza de vida, la teoría nos dice lo contrario, a mayor PIB mejor calidad de vida y con ello el aumento en la esperanza de vida. Otra variable fue el porcentaje de la población derechohabiente, la atención a la salud está relacionada con los años de vida.