práctica evaluable_solución
DESCRIPTION
notasTRANSCRIPT
1. Descripción general de los ingresos mensuales netos del sustentador principal de
la unidad familiar en situación laboral de actividad en la Comunidad Autónoma del
estudio.
A continuación presento los principales estadísticos descriptivos de la variable “ingresos
mensuales netos del sustentador principal de la unidad familiar en situación laboral de
actividad” de la comunidad de Asturias recogidos en la siguiente tabla:
Estadísticos
Importe exacto de los ingresos mensuales netos del
sustentador principal
N Válidos 460
Perdidos 0
Media 1585,58
Error típ. de la media 38,431
Mediana 1500,00
Moda 1400
Desv. típ. 824,246
Varianza 679381,870
Asimetría 1,680
Error típ. de asimetría ,114
Curtosis 7,659
Error típ. de curtosis ,227
Rango 7463
Mínimo 120
Máximo 7583
Suma 729366
Percentiles 25 1000,00
50 1500,00
75 2100,00
Los ingresos netos mensuales del sustentador principal medios para esta provincia son de
1.585,58€. Los ingresos más corrientes son de 1.400€. Los ingresos mínimos son de 120€, y los
máximos son de 7.583€. En total, los ingresos percibidos ascienden a 729.366€. A continuación
también muestro el histograma, que nos mostrará si el peso de los ingresos se encuentra
distribuido equitativamente, o se inclina hacia unos ingresos superiores o inferiores:
Como podemos ver, hay una mayor cantidad de ingresos inferiores, por lo tanto el gráfico se
encuentra “inclinado” a la izquierda.
2. Considerando el factor nivel de estudios del sustentador principal de forma
aislada, ¿tiene una incidencia significativa sobre el nivel medio de ingresos de dicho
sustentador?
Para comprobar si la variable explicativa “nivel de estudios del sustentador principal” tiene
incidencia sobre la variable dependiente “ingresos mensuales netos del sustentador principal de
la unidad familiar en situación laboral de actividad”, realizamos un análisis ANOVA y
comparamos el resultado del p-valor con el nivel de significación elegido (5%) para ver si
rechazamos o no la hipótesis nula:
ANOVA
Importe exacto de los ingresos mensuales netos del sustentador principal
Suma de
cuadrados gl
Media
cuadrática F Sig.
Inter-grupos 37646410,864 3 12548803,621 20,870 ,000
Intra-grupos 2,742E8 456 601293,569
Total 3,118E8 459
En este caso, nuestras hipótesis nula y alternativa son:
Ho=Las medias son similares, y por tanto no hay dependencia
H1=Las medias son distintas, y por tanto existe dependencia
Como podemos comprar, el valor-p es de 0% y es inferior a nuestro nivel de significación de 5%.
Por lo tanto rechazamos la Ho, y concluimos que existe relación de dependencia entre las dos
variables. Otra manera de comprobarlo sería también a través del valor F en tablas, comparando
el valor F del ANOVA con el valor en tablas. Sin embargo, para que este supuesto se mantenga,
además se han de cumplir las tres hipótesis básicas del ANOVA: Homocedasticidad, Normalidad
e Independencia. Nosotros partimos de la base de que se cumple la independencia. En el siguiente
ejercicio, comprobaremos si se cumple la Normalidad y la Homocedasticidad
3. ¿Cumple las hipótesis básicas el ANOVA del nivel de estudios sobre el nivel de
Ingresos de dicho sustentador?
Para comprobar si se cumple la normalidad, nos fijamos en los estadísticos de Kolmogorov-
Smirnov y Saphiro-Wilk. En la siguiente tabla aparecen los resultados de ambos:
Pruebas de normalidad
Ocupación que
desempeña
(reducida)
Kolmogorov
-Smirnova
Shapiro
-Wilk
Estadístico gl Sig.
Estadí
stico gl Sig.
Importe exacto de los ingresos
mensuales netos del sustentador
principal
directores y
gerentes
,125 20 ,200* ,927 20 ,133
técnicos y
profesionales
,131 101 ,000 ,920 101 ,000
empleados de
tipo
administrativo
y trabajadores
de servicios y
comercio
,077 108 ,135 ,974 108 ,034
artesanos,
trabajadores
cualificados de
otros sectores,
operadores y
montadores
,091 186 ,001 ,814 186 ,000
trabajadores
en
ocupaciones
elementales
,125 45 ,074 ,905 45 ,001
a. Corrección de la significación de
Lilliefors
*. Este es un límite inferior de la
significación verdadera.
De nuevo, planteamos nuestras hipótesis nula y alternativa:
Ho= Las medias son similares y por tanto hay normalidad
H1=Las medias son distintas y no hay normalidad
Según el estadístico de Kolmogorov-Smirnov, la normalidad si se cumple para todos los casos
menos el de técnicos y profesionales y los artesanos, trabajadores cualificados de otros sectores,
operadores y montadores. El de Saphiro-Wilk, por el contrario, dice que solo se cumple para el
caso de directores y gerentes. Por tanto decimos que la normalidad, en media, se cumple según el
estadístico de Kolmogorov-Smirnov.
Ahora, para comprobar si se cumple la homocedasticidad, vamos a fijarnos en el estadístico de
Levene, que aparecen en la siguiente tabla:
Prueba de homogeneidad de varianzas
Importe exacto de los ingresos mensuales netos del
sustentador principal
Estadístico de
Levene gl1 gl2 Sig.
2,589 3 456 ,052
De nuevo, planteamos nuestras hipótesis nula y alternativa:
Ho=Las varianzas son similares y por tanto se cumple la homocedasticidad
H1=Las varianzas no son iguales, por lo tanto no hay homocedasticidad
Para nuestro caso, vemos que sí que se cumple, ya que el p-valor es superior al nivel de
significación que hemos establecido. Por lo tanto, podemos concluir que se cumplen ambas
hipótesis, y los resultados que indica el ANOVA serán válidos.
4. Si la respuesta de la pregunta 2 es afirmativa, ¿qué niveles concretos de estudios
hacen que los ingresos, en media, varíen significativamente respecto al resto?
Para poder comprobar que niveles de estudios en concreto afectan al nivel de ingresos, nos
serviremos de las pruebas de HSD Tuckey o de Games-Howell. HSD Tuckey se utiliza cuando
asumimos varianzas iguales, y Games-Howell cuando asumimos varianzas desiguales. En nuestro
caso, se cumple la hipótesis de homocedasticidad y, por tanto, utilizaremos Tuckey. Los
resultados son los siguientes:
Comparaciones múltiples
Variable dependiente:Importe
exacto de los ingresos mensuales
netos del sustentador principal
(I) Estudios
completad
os
(reducida)
(J)
Estudios
completad
os
(reducida)
Difere
ncia de
media
s (I-J)
Error
típico Sig.
Intervalo
de
confianza
al 95%
Límite
inferior
Límite
superi
or
HSD de Tukey sin
estudios o
con
estudios de
primer
grado
educación
secundaria
, primer
ciclo
-
68,933
120,0
87
,940 -378,58 240,71
educación
secundaria
, segundo
ciclo
-
261,84
9
135,8
97
,218 -612,26 88,56
educación
superior
-
703,39
9*
124,0
95
,000 -1023,38 -
383,42
educación
secundaria
, primer
ciclo
sin
estudios o
con
estudios
de primer
grado
68,933 120,0
87
,940 -240,71 378,58
educación
secundaria
, segundo
ciclo
-
192,91
6
103,0
47
,242 -458,62 72,79
educación
superior
-
634,46
6*
86,89
2
,000 -858,52 -
410,41
educación
secundaria
, segundo
ciclo
sin
estudios o
con
estudios
de primer
grado
261,84
9
135,8
97
,218 -88,56 612,26
educación
secundaria
, primer
ciclo
192,91
6
103,0
47
,242 -72,79 458,62
educación
superior
-
441,55
0*
107,6
91
,000 -719,23 -
163,87
educación
superior
sin
estudios o
con
estudios
de primer
grado
703,39
9*
124,0
95
,000 383,42 1023,3
8
educación
secundaria
, primer
ciclo
634,46
6*
86,89
2
,000 410,41 858,52
educación
secundaria
, segundo
ciclo
441,55
0*
107,6
91
,000 163,87 719,23
*. La diferencia de medias es
significativa al nivel 0.05.
Lo que hace esta tabla es dividirnos los datos en cuatro grupos. Luego, saca un p-valor que
compara las medias entre los diferentes casos. Y entonces planteamos la hipótesis nulas o
alternativas:
Ho=Las medias son iguales, y entonces no existe diferencia en los ingresos
H1=Las medias son distintas, y entonces existen diferencias en los ingresos
De esta comparación extraemos que existen diferencias en los ingresos entre las personas que han
cursado educación superior y todas las demás.
5. ¿Hay que confirmar los resultados con pruebas alternativas? ¿Por qué? En caso
afirmativo, hágalo y explique el resultado.
No sería necesario, ya que nuestras variables cumplen las propiedades de homocedasticidad y
normalidad, y entonces podemos considerar el resultado del ANOVA válido. Sin embargo, si este
no fuera el caso, tendríamos que utilizar la prueba de Brown-Forsythe y el estadístico de Welch.
6. Desde el punto de vista técnico, ¿qué nivel de fiabilidad nos merecen los resultados
obtenidos en el estudio de la incidencia del nivel de estudios sobre el nivel de ingresos
del sustentador principal?
Como se cumplen las hipótesis del ANOVA, podemos considerar que la fiabilidad de los
resultados es alta.
7. Considerando el factor ocupación que desempeña el sustentador principal de
forma aislada, ¿tiene una incidencia significativa sobre el nivel medio de ingresos de
dicho sustentador?
De nuevo, para comprobar la incidencia de la ocupación en los ingresos percibidos, realizamos
un análisis de ANOVA. Los resultados son los siguientes:
ANOVA
Importe exacto de los ingresos mensuales netos del sustentador principal
Suma de
cuadrados gl
Media
cuadrática F Sig.
Inter-grupos 71791758,747 4 17947939,687 34,020 ,000
Intra-grupos 2,400E8 455 527570,372
Total 3,118E8 459
Nuestras hipótesis nula y alternativa son:
Ho=Las medias son similares, y por tanto no hay dependencia
H1=Las medias son distintas, y por tanto existe dependencia
Como el p-valor es inferior al nivel de significación que hemos elegido, rechazamos la hipótesis
nula y, por tanto, diremos que existe dependencia. A continuación comprobamos las propiedades
del ANOVA de Normalidad y Homocedasticidad (suponemos que existe linealidad).
8. ¿Cumple las hipótesis básicas el ANOVA de tipo de ocupación sobre el nivel de
ingresos de dicho sustentador?
Para estudiar la normalidad realizamos una prueba de Kolmogorov-Smirnov y Shapiro-Wilk. Los resultados son los siguientes:
Pruebas de normalidad
Ocupación que
desempeña
(reducida)
Kolmogorov
-Smirnova
Shapiro
-Wilk
Estadístico gl Sig.
Esta
dísti
co gl Sig.
Importe exacto de los ingresos
mensuales netos del sustentador
principal
directores y
gerentes
,125 20 ,200* ,927 20 ,133
técnicos y
profesionales
,131 101 ,000 ,920 10
1
,000
empleados de
tipo
administrativo
y trabajadores
de servicios y
comercio
,077 108 ,135 ,974 10
8
,034
artesanos,
trabajadores
cualificados de
otros sectores,
operadores y
montadores
,091 186 ,001 ,814 18
6
,000
trabajadores
en
ocupaciones
elementales
,125 45 ,074 ,905 45 ,001
a. Corrección de la significación de
Lilliefors
*. Este es un límite inferior de la
significación verdadera.
Las hipótesis nula y alternativa son:
Ho= Las medias son similares y por tanto hay normalidad
H1=Las medias son distintas y no hay normalidad
Como vemos, se cumple la hipótesis nula para todos los casos menos el de técnicos y
profesionales y artesanos, trabajadores cualificados de otros sectores, operadores y
montadores, y por tanto en media existe normalidad. Ahora, vamos a comprobar la
Homocedasticidad con el estadístico de Levene. Los resultados son los siguientes:
Prueba de homogeneidad de varianzas
Importe exacto de los ingresos mensuales netos del
sustentador principal
Estadístico de
Levene gl1 gl2 Sig.
5,153 4 455 ,000
Nuestras hipótesis nula y alternativa son:
Ho=Las varianzas son similares y por tanto se cumple la homocedasticidad
H1=Las varianzas no son iguales, por lo tanto no hay homocedasticidad
Como vemos, rechazamos la hipótesis alternativa y, por tanto, no hay homocedasticidad. Por lo
tanto no podremos validar los resultados del ANOVA, y tendremos que optar por una prueba
alternativa
9. Si la respuesta de la pregunta 7 es afirmativa, ¿qué tipos concretos de ocupaciones
hacen que los ingresos, en media, varíen significativamente respecto al resto?
Para este caso, como estamos asumiendo varianzas desiguales, nos fijaremos en el estadístico de
Games-Howel:
Comparaciones múltiples
Variable dependiente:Importe
exacto de los ingresos mensuales
netos del sustentador principal
(I)
Ocupación
que
desempeñ
a
(reducida)
(J)
Ocupación
que
desempeñ
a
(reducida)
Diferen
cia de
medias
(I-J)
Error
típico Sig.
Intervalo
de
confianza
al 95%
Límite
inferior
Límite
superi
or
Games-Howell directores y
gerentes
técnicos y
profesional
es
134,62
8
246,5
91
,981 -590,58 859,84
empleados
de tipo
administrat
ivo y
trabajador
es de
servicios y
comercio
892,64
4*
237,2
39
,009 186,18 1599,1
1
artesanos,
trabajador
es
cualificado
s de otros
sectores,
operadore
s y
montadore
s
724,81
0*
237,4
91
,043 17,87 1431,7
5
trabajador
es en
ocupacion
es
elementale
s
1458,2
94*
240,1
27
,000 746,09 2170,5
0
técnicos y
profesional
es
directores
y gerentes
-
134,62
8
246,5
91
,981 -859,84 590,58
empleados
de tipo
administrat
ivo y
trabajador
es de
servicios y
comercio
758,01
6*
101,4
19
,000 478,36 1037,6
7
artesanos,
trabajador
es
cualificado
s de otros
sectores,
operadore
s y
montadore
s
590,18
2*
102,0
08
,000 309,11 871,26
trabajador
es en
ocupacion
es
elementale
s
1323,6
66*
108,0
02
,000 1025,23 1622,1
0
empleados
de tipo
administrati
vo y
trabajadore
s de
servicios y
comercio
directores
y gerentes
-
892,64
4*
237,2
39
,009 -1599,11 -
186,18
técnicos y
profesional
es
-
758,01
6*
101,4
19
,000 -1037,67 -
478,36
artesanos,
trabajador
es
cualificado
s de otros
sectores,
operadore
s y
montadore
s
-
167,83
4
76,68
6
,187 -378,42 42,75
trabajador
es en
ocupacion
es
elementale
s
565,65
0*
84,49
6
,000 331,07 800,23
artesanos,
trabajadore
s
cualificado
s de otros
sectores,
operadores
y
montadore
s
directores
y gerentes
-
724,81
0*
237,4
91
,043 -1431,75 -17,87
técnicos y
profesional
es
-
590,18
2*
102,0
08
,000 -871,26 -
309,11
empleados
de tipo
administrat
ivo y
trabajador
es de
servicios y
comercio
167,83
4
76,68
6
,187 -42,75 378,42
trabajador
es en
ocupacion
es
elementale
s
733,48
4*
85,20
1
,000 497,32 969,64
trabajadore
s en
ocupacione
s
elementale
s
directores
y gerentes
-
1458,2
94*
240,1
27
,000 -2170,50 -
746,09
técnicos y
profesional
es
-
1323,6
66*
108,0
02
,000 -1622,10 -
1025,2
3
empleados
de tipo
administrat
ivo y
trabajador
es de
servicios y
comercio
-
565,65
0*
84,49
6
,000 -800,23 -
331,07
artesanos,
trabajador
es
cualificado
s de otros
sectores,
operadore
s y
montadore
s
-
733,48
4*
85,20
1
,000 -969,64 -
497,32
*. La diferencia de medias es
significativa al nivel 0.05.
Esta prueba nos dice que existen diferencia de ingresos entre directivos y gerentes y el resto de
ocupaciones (salvo técnicos y profesionales), entre técnicos y profesionales y el resto de
ocupaciones (salvo directores y gerentes), entre empleados de tipo administrativo y
trabajadores de servicios y comercio y el resto de ocupaciones (salvo artesanos,
trabajadores cualificados de otros sectores, operadores y montadores), entre artesanos,
trabajadores cualificados de otros sectores, operadores y montadores (salvo empleados
de tipo administrativo y trabajadores de servicios y comercio) y entre trabajadores en
ocupaciones elementales y el resto de ocupaciones.
10. ¿Hay que confirmar los resultados con pruebas alternativas? ¿Por qué? En caso
afirmativo, hágalo y explique el resultado.
Si, ya que no se cumple la hipótesis de homocedasticidad. Por ello es necesario realizar la prueba
alternativa de Welch y Brown-Forsythe:
Pruebas robustas de igualdad de las medias
Importe exacto de los ingresos mensuales netos del sustentador principal
Estadísticoa gl1 gl2 Sig.
Welch 42,990 4 101,139 ,000
Brown-Forsythe 30,567 4 91,719 ,000
a. Distribuidos en F asintóticamente.
Nuestras hipótesis nula y alternativa son:
Ho=Las medias son similares, y por tanto no hay dependencia
H1=Las medias son distintas, y por tanto existe dependencia
Como vemos, rechazamos la hipótesis nula, y entonces concluimos que si hay dependencia.
11. Desde el punto de vista técnico, ¿qué nivel de fiabilidad nos merecen los
resultados obtenidos en el estudio de la incidencia del tipo de ocupación sobre el
nivel de ingresos del sustentador principal?
Los resultados no son muy fiables ya que no se cumple la hipótesis de homocedasticidad. Sin
embargo, hemos podido realizar una prueba alternativa, con lo que la igualmente podrían
aceptarse.
12. Realice un estudio conjunto de la incidencia del nivel de estudios y tipo de
ocupación sobre el ingreso medio del sustentador principal de la unidad familiar (en
situación laboral de activo). ¿Qué capacidad de explicación de la variación del
ingreso del sustentador principal tiene el modelo así planteado, considerado
globalmente?
Para ver la capacidad de explicación del modelo en los ingresos, nos fijaremos en el estadístico
ETA cuadrado, que aparece recogido en la siguiente tabla:
Pruebas de los efectos inter-sujetos
Variable dependiente:Importe exacto de los ingresos mensuales netos del sustentador principal
Origen
Suma de
cuadrados tipo
III gl
Media
cuadrática F Sig.
Eta al cuadrado
parcial
Modelo corregido 93497932,278a 19 4920943,804 9,917 ,000 ,300
Intersección 3,203E8 1 3,203E8 645,535 ,000 ,595
ESTUDREDSP 10225550,960 3 3408516,987 6,869 ,000 ,045
OCUPARED 20180957,351 4 5045239,338 10,167 ,000 ,085
ESTUDREDSP *
OCUPARED
12580223,093 12 1048351,924 2,113 ,015 ,054
Error 2,183E8 440 496223,513
Total 1,468E9 460
Total corregida 3,118E8 459
a. R cuadrado = ,300 (R cuadrado corregida = ,270)
Según este ETA cuadrado, el modelo corregido solo sería capaz de explicar el 30% de las
variaciones que se producen en los ingresos.
13. ¿Cuál de los dos factores tiene una mayor capacidad para explicar el ingreso del
sustentador principal de la unidad familiar? ¿El nivel de estudios o el tipo de
ocupación?
De nuevo, nos fijamos en las tablas del ETA cuadrado. Ahora nos fijamos en la incidencia
individual de cada variable explicativa. Vemos que el nivel de estudios es capaz de explicar el
45% de las variaciones en los ingresos, mientras que la ocupación es capaz de explicar el 85%.
Por lo tanto, la ocupación tiene mayor capacidad de explicar las variaciones en ingresos que el
nivel de educación.
14. ¿Existe una influencia significativa de la interacción de ambos factores sobre el
ingreso del sustentador principal de la unidad familiar?
Conjuntamente, las dos alcanzan una ETA cuadrado de 54%, es decir, más de la mitad de las
variaciones en los ingresos. No es un buen resultado, pero tampoco es uno malo.
15. ¿Qué conclusiones, desde el punto de vista económico, extraería del trabajo
realizado?
Del trabajo que hemos realizado, extraemos que los ingresos sí que dependen en gran medida
de la ocupación y del nivel de educación recibida. Además, las personas con mayor nivel de
educación y en puestos que requieren más conocimientos reciben mayor salario que el resto.