práctica evaluable_solución

15
1. Descripción general de los ingresos mensuales netos del sustentador principal de la unidad familiar en situación laboral de actividad en la Comunidad Autónoma del estudio. A continuación presento los principales estadísticos descriptivos de la variable “ingresos mensuales netos del sustentador principal de la unidad familiar en situación laboral de actividad” de la comunidad de Asturias recogidos en la siguiente tabla: Estadísticos Importe exacto de los ingresos mensuales netos del sustentador principal N Válidos 460 Perdidos 0 Media 1585,58 Error típ. de la media 38,431 Mediana 1500,00 Moda 1400 Desv. típ. 824,246 Varianza 679381,870 Asimetría 1,680 Error típ. de asimetría ,114 Curtosis 7,659 Error típ. de curtosis ,227 Rango 7463 Mínimo 120 Máximo 7583 Suma 729366 Percentiles 25 1000,00 50 1500,00 75 2100,00 Los ingresos netos mensuales del sustentador principal medios para esta provincia son de 1.585,58€. Los ingresos más corrientes son de 1.400€. Los ingresos mínimos son de 120€, y los máximos son de 7.583€. En total, los ingresos percibidos ascienden a 729.366€. A continuación también muestro el histograma, que nos mostrará si el peso de los ingresos se encuentra distribuido equitativamente, o se inclina hacia unos ingresos superiores o inferiores:

Upload: francisco-javier-el-hannati-lopez

Post on 14-Feb-2016

1 views

Category:

Documents


0 download

DESCRIPTION

notas

TRANSCRIPT

Page 1: Práctica Evaluable_Solución

1. Descripción general de los ingresos mensuales netos del sustentador principal de

la unidad familiar en situación laboral de actividad en la Comunidad Autónoma del

estudio.

A continuación presento los principales estadísticos descriptivos de la variable “ingresos

mensuales netos del sustentador principal de la unidad familiar en situación laboral de

actividad” de la comunidad de Asturias recogidos en la siguiente tabla:

Estadísticos

Importe exacto de los ingresos mensuales netos del

sustentador principal

N Válidos 460

Perdidos 0

Media 1585,58

Error típ. de la media 38,431

Mediana 1500,00

Moda 1400

Desv. típ. 824,246

Varianza 679381,870

Asimetría 1,680

Error típ. de asimetría ,114

Curtosis 7,659

Error típ. de curtosis ,227

Rango 7463

Mínimo 120

Máximo 7583

Suma 729366

Percentiles 25 1000,00

50 1500,00

75 2100,00

Los ingresos netos mensuales del sustentador principal medios para esta provincia son de

1.585,58€. Los ingresos más corrientes son de 1.400€. Los ingresos mínimos son de 120€, y los

máximos son de 7.583€. En total, los ingresos percibidos ascienden a 729.366€. A continuación

también muestro el histograma, que nos mostrará si el peso de los ingresos se encuentra

distribuido equitativamente, o se inclina hacia unos ingresos superiores o inferiores:

Page 2: Práctica Evaluable_Solución

Como podemos ver, hay una mayor cantidad de ingresos inferiores, por lo tanto el gráfico se

encuentra “inclinado” a la izquierda.

2. Considerando el factor nivel de estudios del sustentador principal de forma

aislada, ¿tiene una incidencia significativa sobre el nivel medio de ingresos de dicho

sustentador?

Para comprobar si la variable explicativa “nivel de estudios del sustentador principal” tiene

incidencia sobre la variable dependiente “ingresos mensuales netos del sustentador principal de

la unidad familiar en situación laboral de actividad”, realizamos un análisis ANOVA y

comparamos el resultado del p-valor con el nivel de significación elegido (5%) para ver si

rechazamos o no la hipótesis nula:

ANOVA

Importe exacto de los ingresos mensuales netos del sustentador principal

Suma de

cuadrados gl

Media

cuadrática F Sig.

Inter-grupos 37646410,864 3 12548803,621 20,870 ,000

Intra-grupos 2,742E8 456 601293,569

Total 3,118E8 459

En este caso, nuestras hipótesis nula y alternativa son:

Ho=Las medias son similares, y por tanto no hay dependencia

H1=Las medias son distintas, y por tanto existe dependencia

Page 3: Práctica Evaluable_Solución

Como podemos comprar, el valor-p es de 0% y es inferior a nuestro nivel de significación de 5%.

Por lo tanto rechazamos la Ho, y concluimos que existe relación de dependencia entre las dos

variables. Otra manera de comprobarlo sería también a través del valor F en tablas, comparando

el valor F del ANOVA con el valor en tablas. Sin embargo, para que este supuesto se mantenga,

además se han de cumplir las tres hipótesis básicas del ANOVA: Homocedasticidad, Normalidad

e Independencia. Nosotros partimos de la base de que se cumple la independencia. En el siguiente

ejercicio, comprobaremos si se cumple la Normalidad y la Homocedasticidad

3. ¿Cumple las hipótesis básicas el ANOVA del nivel de estudios sobre el nivel de

Ingresos de dicho sustentador?

Para comprobar si se cumple la normalidad, nos fijamos en los estadísticos de Kolmogorov-

Smirnov y Saphiro-Wilk. En la siguiente tabla aparecen los resultados de ambos:

Pruebas de normalidad

Ocupación que

desempeña

(reducida)

Kolmogorov

-Smirnova

Shapiro

-Wilk

Estadístico gl Sig.

Estadí

stico gl Sig.

Importe exacto de los ingresos

mensuales netos del sustentador

principal

directores y

gerentes

,125 20 ,200* ,927 20 ,133

técnicos y

profesionales

,131 101 ,000 ,920 101 ,000

empleados de

tipo

administrativo

y trabajadores

de servicios y

comercio

,077 108 ,135 ,974 108 ,034

artesanos,

trabajadores

cualificados de

otros sectores,

operadores y

montadores

,091 186 ,001 ,814 186 ,000

trabajadores

en

ocupaciones

elementales

,125 45 ,074 ,905 45 ,001

a. Corrección de la significación de

Lilliefors

*. Este es un límite inferior de la

significación verdadera.

De nuevo, planteamos nuestras hipótesis nula y alternativa:

Page 4: Práctica Evaluable_Solución

Ho= Las medias son similares y por tanto hay normalidad

H1=Las medias son distintas y no hay normalidad

Según el estadístico de Kolmogorov-Smirnov, la normalidad si se cumple para todos los casos

menos el de técnicos y profesionales y los artesanos, trabajadores cualificados de otros sectores,

operadores y montadores. El de Saphiro-Wilk, por el contrario, dice que solo se cumple para el

caso de directores y gerentes. Por tanto decimos que la normalidad, en media, se cumple según el

estadístico de Kolmogorov-Smirnov.

Ahora, para comprobar si se cumple la homocedasticidad, vamos a fijarnos en el estadístico de

Levene, que aparecen en la siguiente tabla:

Prueba de homogeneidad de varianzas

Importe exacto de los ingresos mensuales netos del

sustentador principal

Estadístico de

Levene gl1 gl2 Sig.

2,589 3 456 ,052

De nuevo, planteamos nuestras hipótesis nula y alternativa:

Ho=Las varianzas son similares y por tanto se cumple la homocedasticidad

H1=Las varianzas no son iguales, por lo tanto no hay homocedasticidad

Para nuestro caso, vemos que sí que se cumple, ya que el p-valor es superior al nivel de

significación que hemos establecido. Por lo tanto, podemos concluir que se cumplen ambas

hipótesis, y los resultados que indica el ANOVA serán válidos.

4. Si la respuesta de la pregunta 2 es afirmativa, ¿qué niveles concretos de estudios

hacen que los ingresos, en media, varíen significativamente respecto al resto?

Para poder comprobar que niveles de estudios en concreto afectan al nivel de ingresos, nos

serviremos de las pruebas de HSD Tuckey o de Games-Howell. HSD Tuckey se utiliza cuando

asumimos varianzas iguales, y Games-Howell cuando asumimos varianzas desiguales. En nuestro

caso, se cumple la hipótesis de homocedasticidad y, por tanto, utilizaremos Tuckey. Los

resultados son los siguientes:

Page 5: Práctica Evaluable_Solución

Comparaciones múltiples

Variable dependiente:Importe

exacto de los ingresos mensuales

netos del sustentador principal

(I) Estudios

completad

os

(reducida)

(J)

Estudios

completad

os

(reducida)

Difere

ncia de

media

s (I-J)

Error

típico Sig.

Intervalo

de

confianza

al 95%

Límite

inferior

Límite

superi

or

HSD de Tukey sin

estudios o

con

estudios de

primer

grado

educación

secundaria

, primer

ciclo

-

68,933

120,0

87

,940 -378,58 240,71

educación

secundaria

, segundo

ciclo

-

261,84

9

135,8

97

,218 -612,26 88,56

educación

superior

-

703,39

9*

124,0

95

,000 -1023,38 -

383,42

educación

secundaria

, primer

ciclo

sin

estudios o

con

estudios

de primer

grado

68,933 120,0

87

,940 -240,71 378,58

educación

secundaria

, segundo

ciclo

-

192,91

6

103,0

47

,242 -458,62 72,79

educación

superior

-

634,46

6*

86,89

2

,000 -858,52 -

410,41

educación

secundaria

, segundo

ciclo

sin

estudios o

con

estudios

de primer

grado

261,84

9

135,8

97

,218 -88,56 612,26

Page 6: Práctica Evaluable_Solución

educación

secundaria

, primer

ciclo

192,91

6

103,0

47

,242 -72,79 458,62

educación

superior

-

441,55

0*

107,6

91

,000 -719,23 -

163,87

educación

superior

sin

estudios o

con

estudios

de primer

grado

703,39

9*

124,0

95

,000 383,42 1023,3

8

educación

secundaria

, primer

ciclo

634,46

6*

86,89

2

,000 410,41 858,52

educación

secundaria

, segundo

ciclo

441,55

0*

107,6

91

,000 163,87 719,23

*. La diferencia de medias es

significativa al nivel 0.05.

Lo que hace esta tabla es dividirnos los datos en cuatro grupos. Luego, saca un p-valor que

compara las medias entre los diferentes casos. Y entonces planteamos la hipótesis nulas o

alternativas:

Ho=Las medias son iguales, y entonces no existe diferencia en los ingresos

H1=Las medias son distintas, y entonces existen diferencias en los ingresos

De esta comparación extraemos que existen diferencias en los ingresos entre las personas que han

cursado educación superior y todas las demás.

5. ¿Hay que confirmar los resultados con pruebas alternativas? ¿Por qué? En caso

afirmativo, hágalo y explique el resultado.

No sería necesario, ya que nuestras variables cumplen las propiedades de homocedasticidad y

normalidad, y entonces podemos considerar el resultado del ANOVA válido. Sin embargo, si este

no fuera el caso, tendríamos que utilizar la prueba de Brown-Forsythe y el estadístico de Welch.

Page 7: Práctica Evaluable_Solución

6. Desde el punto de vista técnico, ¿qué nivel de fiabilidad nos merecen los resultados

obtenidos en el estudio de la incidencia del nivel de estudios sobre el nivel de ingresos

del sustentador principal?

Como se cumplen las hipótesis del ANOVA, podemos considerar que la fiabilidad de los

resultados es alta.

7. Considerando el factor ocupación que desempeña el sustentador principal de

forma aislada, ¿tiene una incidencia significativa sobre el nivel medio de ingresos de

dicho sustentador?

De nuevo, para comprobar la incidencia de la ocupación en los ingresos percibidos, realizamos

un análisis de ANOVA. Los resultados son los siguientes:

ANOVA

Importe exacto de los ingresos mensuales netos del sustentador principal

Suma de

cuadrados gl

Media

cuadrática F Sig.

Inter-grupos 71791758,747 4 17947939,687 34,020 ,000

Intra-grupos 2,400E8 455 527570,372

Total 3,118E8 459

Nuestras hipótesis nula y alternativa son:

Ho=Las medias son similares, y por tanto no hay dependencia

H1=Las medias son distintas, y por tanto existe dependencia

Como el p-valor es inferior al nivel de significación que hemos elegido, rechazamos la hipótesis

nula y, por tanto, diremos que existe dependencia. A continuación comprobamos las propiedades

del ANOVA de Normalidad y Homocedasticidad (suponemos que existe linealidad).

8. ¿Cumple las hipótesis básicas el ANOVA de tipo de ocupación sobre el nivel de

ingresos de dicho sustentador?

Para estudiar la normalidad realizamos una prueba de Kolmogorov-Smirnov y Shapiro-Wilk. Los resultados son los siguientes:

Page 8: Práctica Evaluable_Solución

Pruebas de normalidad

Ocupación que

desempeña

(reducida)

Kolmogorov

-Smirnova

Shapiro

-Wilk

Estadístico gl Sig.

Esta

dísti

co gl Sig.

Importe exacto de los ingresos

mensuales netos del sustentador

principal

directores y

gerentes

,125 20 ,200* ,927 20 ,133

técnicos y

profesionales

,131 101 ,000 ,920 10

1

,000

empleados de

tipo

administrativo

y trabajadores

de servicios y

comercio

,077 108 ,135 ,974 10

8

,034

artesanos,

trabajadores

cualificados de

otros sectores,

operadores y

montadores

,091 186 ,001 ,814 18

6

,000

trabajadores

en

ocupaciones

elementales

,125 45 ,074 ,905 45 ,001

a. Corrección de la significación de

Lilliefors

*. Este es un límite inferior de la

significación verdadera.

Las hipótesis nula y alternativa son:

Ho= Las medias son similares y por tanto hay normalidad

H1=Las medias son distintas y no hay normalidad

Como vemos, se cumple la hipótesis nula para todos los casos menos el de técnicos y

profesionales y artesanos, trabajadores cualificados de otros sectores, operadores y

montadores, y por tanto en media existe normalidad. Ahora, vamos a comprobar la

Homocedasticidad con el estadístico de Levene. Los resultados son los siguientes:

Page 9: Práctica Evaluable_Solución

Prueba de homogeneidad de varianzas

Importe exacto de los ingresos mensuales netos del

sustentador principal

Estadístico de

Levene gl1 gl2 Sig.

5,153 4 455 ,000

Nuestras hipótesis nula y alternativa son:

Ho=Las varianzas son similares y por tanto se cumple la homocedasticidad

H1=Las varianzas no son iguales, por lo tanto no hay homocedasticidad

Como vemos, rechazamos la hipótesis alternativa y, por tanto, no hay homocedasticidad. Por lo

tanto no podremos validar los resultados del ANOVA, y tendremos que optar por una prueba

alternativa

9. Si la respuesta de la pregunta 7 es afirmativa, ¿qué tipos concretos de ocupaciones

hacen que los ingresos, en media, varíen significativamente respecto al resto?

Para este caso, como estamos asumiendo varianzas desiguales, nos fijaremos en el estadístico de

Games-Howel:

Page 10: Práctica Evaluable_Solución

Comparaciones múltiples

Variable dependiente:Importe

exacto de los ingresos mensuales

netos del sustentador principal

(I)

Ocupación

que

desempeñ

a

(reducida)

(J)

Ocupación

que

desempeñ

a

(reducida)

Diferen

cia de

medias

(I-J)

Error

típico Sig.

Intervalo

de

confianza

al 95%

Límite

inferior

Límite

superi

or

Games-Howell directores y

gerentes

técnicos y

profesional

es

134,62

8

246,5

91

,981 -590,58 859,84

empleados

de tipo

administrat

ivo y

trabajador

es de

servicios y

comercio

892,64

4*

237,2

39

,009 186,18 1599,1

1

artesanos,

trabajador

es

cualificado

s de otros

sectores,

operadore

s y

montadore

s

724,81

0*

237,4

91

,043 17,87 1431,7

5

trabajador

es en

ocupacion

es

elementale

s

1458,2

94*

240,1

27

,000 746,09 2170,5

0

técnicos y

profesional

es

directores

y gerentes

-

134,62

8

246,5

91

,981 -859,84 590,58

Page 11: Práctica Evaluable_Solución

empleados

de tipo

administrat

ivo y

trabajador

es de

servicios y

comercio

758,01

6*

101,4

19

,000 478,36 1037,6

7

artesanos,

trabajador

es

cualificado

s de otros

sectores,

operadore

s y

montadore

s

590,18

2*

102,0

08

,000 309,11 871,26

trabajador

es en

ocupacion

es

elementale

s

1323,6

66*

108,0

02

,000 1025,23 1622,1

0

empleados

de tipo

administrati

vo y

trabajadore

s de

servicios y

comercio

directores

y gerentes

-

892,64

4*

237,2

39

,009 -1599,11 -

186,18

técnicos y

profesional

es

-

758,01

6*

101,4

19

,000 -1037,67 -

478,36

artesanos,

trabajador

es

cualificado

s de otros

sectores,

operadore

s y

montadore

s

-

167,83

4

76,68

6

,187 -378,42 42,75

Page 12: Práctica Evaluable_Solución

trabajador

es en

ocupacion

es

elementale

s

565,65

0*

84,49

6

,000 331,07 800,23

artesanos,

trabajadore

s

cualificado

s de otros

sectores,

operadores

y

montadore

s

directores

y gerentes

-

724,81

0*

237,4

91

,043 -1431,75 -17,87

técnicos y

profesional

es

-

590,18

2*

102,0

08

,000 -871,26 -

309,11

empleados

de tipo

administrat

ivo y

trabajador

es de

servicios y

comercio

167,83

4

76,68

6

,187 -42,75 378,42

trabajador

es en

ocupacion

es

elementale

s

733,48

4*

85,20

1

,000 497,32 969,64

trabajadore

s en

ocupacione

s

elementale

s

directores

y gerentes

-

1458,2

94*

240,1

27

,000 -2170,50 -

746,09

técnicos y

profesional

es

-

1323,6

66*

108,0

02

,000 -1622,10 -

1025,2

3

empleados

de tipo

administrat

ivo y

trabajador

es de

servicios y

comercio

-

565,65

0*

84,49

6

,000 -800,23 -

331,07

Page 13: Práctica Evaluable_Solución

artesanos,

trabajador

es

cualificado

s de otros

sectores,

operadore

s y

montadore

s

-

733,48

4*

85,20

1

,000 -969,64 -

497,32

*. La diferencia de medias es

significativa al nivel 0.05.

Esta prueba nos dice que existen diferencia de ingresos entre directivos y gerentes y el resto de

ocupaciones (salvo técnicos y profesionales), entre técnicos y profesionales y el resto de

ocupaciones (salvo directores y gerentes), entre empleados de tipo administrativo y

trabajadores de servicios y comercio y el resto de ocupaciones (salvo artesanos,

trabajadores cualificados de otros sectores, operadores y montadores), entre artesanos,

trabajadores cualificados de otros sectores, operadores y montadores (salvo empleados

de tipo administrativo y trabajadores de servicios y comercio) y entre trabajadores en

ocupaciones elementales y el resto de ocupaciones.

10. ¿Hay que confirmar los resultados con pruebas alternativas? ¿Por qué? En caso

afirmativo, hágalo y explique el resultado.

Si, ya que no se cumple la hipótesis de homocedasticidad. Por ello es necesario realizar la prueba

alternativa de Welch y Brown-Forsythe:

Pruebas robustas de igualdad de las medias

Importe exacto de los ingresos mensuales netos del sustentador principal

Estadísticoa gl1 gl2 Sig.

Welch 42,990 4 101,139 ,000

Brown-Forsythe 30,567 4 91,719 ,000

a. Distribuidos en F asintóticamente.

Nuestras hipótesis nula y alternativa son:

Ho=Las medias son similares, y por tanto no hay dependencia

H1=Las medias son distintas, y por tanto existe dependencia

Como vemos, rechazamos la hipótesis nula, y entonces concluimos que si hay dependencia.

Page 14: Práctica Evaluable_Solución

11. Desde el punto de vista técnico, ¿qué nivel de fiabilidad nos merecen los

resultados obtenidos en el estudio de la incidencia del tipo de ocupación sobre el

nivel de ingresos del sustentador principal?

Los resultados no son muy fiables ya que no se cumple la hipótesis de homocedasticidad. Sin

embargo, hemos podido realizar una prueba alternativa, con lo que la igualmente podrían

aceptarse.

12. Realice un estudio conjunto de la incidencia del nivel de estudios y tipo de

ocupación sobre el ingreso medio del sustentador principal de la unidad familiar (en

situación laboral de activo). ¿Qué capacidad de explicación de la variación del

ingreso del sustentador principal tiene el modelo así planteado, considerado

globalmente?

Para ver la capacidad de explicación del modelo en los ingresos, nos fijaremos en el estadístico

ETA cuadrado, que aparece recogido en la siguiente tabla:

Pruebas de los efectos inter-sujetos

Variable dependiente:Importe exacto de los ingresos mensuales netos del sustentador principal

Origen

Suma de

cuadrados tipo

III gl

Media

cuadrática F Sig.

Eta al cuadrado

parcial

Modelo corregido 93497932,278a 19 4920943,804 9,917 ,000 ,300

Intersección 3,203E8 1 3,203E8 645,535 ,000 ,595

ESTUDREDSP 10225550,960 3 3408516,987 6,869 ,000 ,045

OCUPARED 20180957,351 4 5045239,338 10,167 ,000 ,085

ESTUDREDSP *

OCUPARED

12580223,093 12 1048351,924 2,113 ,015 ,054

Error 2,183E8 440 496223,513

Total 1,468E9 460

Total corregida 3,118E8 459

a. R cuadrado = ,300 (R cuadrado corregida = ,270)

Según este ETA cuadrado, el modelo corregido solo sería capaz de explicar el 30% de las

variaciones que se producen en los ingresos.

13. ¿Cuál de los dos factores tiene una mayor capacidad para explicar el ingreso del

sustentador principal de la unidad familiar? ¿El nivel de estudios o el tipo de

ocupación?

De nuevo, nos fijamos en las tablas del ETA cuadrado. Ahora nos fijamos en la incidencia

individual de cada variable explicativa. Vemos que el nivel de estudios es capaz de explicar el

45% de las variaciones en los ingresos, mientras que la ocupación es capaz de explicar el 85%.

Por lo tanto, la ocupación tiene mayor capacidad de explicar las variaciones en ingresos que el

nivel de educación.

Page 15: Práctica Evaluable_Solución

14. ¿Existe una influencia significativa de la interacción de ambos factores sobre el

ingreso del sustentador principal de la unidad familiar?

Conjuntamente, las dos alcanzan una ETA cuadrado de 54%, es decir, más de la mitad de las

variaciones en los ingresos. No es un buen resultado, pero tampoco es uno malo.

15. ¿Qué conclusiones, desde el punto de vista económico, extraería del trabajo

realizado?

Del trabajo que hemos realizado, extraemos que los ingresos sí que dependen en gran medida

de la ocupación y del nivel de educación recibida. Además, las personas con mayor nivel de

educación y en puestos que requieren más conocimientos reciben mayor salario que el resto.