la inferencia. estimaciÓn estadÍstica por intervalo de confianza + prueba normalidad k-s (prueba...

27
LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S. http:// estadis.webnode.cl

Upload: jesus-ortiz-de-zarate-fuentes

Post on 29-Jan-2016

248 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

LA INFERENCIA.

ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE

CONFIANZA

+ PRUEBA NORMALIDAD K-S

(PRUEBA DE HIPÓTESIS)

Joan Calventus S.

http://estadis.webnode.cl

Page 2: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

Supongamos una variable que a nivel poblacional se distribuye según la Ley Normal, con su correspondiente media aritmética.

De esta población extraemos al azar una muestra (representativa) de n sujetos.

Obtenemos una muestra que también se distribuye normalmente, con valores estadísticos similares a los parámetros poblacionales.

LA INFERENCIA

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA INFERENCIAL

ESTADÍSTICA INFERENCIAL

Page 3: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

Para los efectos de generalizar científicamente, debemos referir los análisis estadísticos a toda la población (con N sujetos), no sólo a los n sujetos de la muestra.

Esta muestra provino (representativamente) de una determinada población, cuyos parámetros se desconocen.

Imaginen que analizamos estadísticamente una muestra (de n sujetos) que se distribuye normalmente, con ciertos estadísticos (media, desviación típica, centiles, etc.).

LA INFERENCIA. LA ESTIMACIÓN (puntual)

ESTADÍSTICA INFERENCIAL:

La estimación puntual nos permite inferir el valor del parámetro a partir del valor del estadístico.

EL RIESGO QUE SE ASUME CUANDO SE REALIZA LA ESTIMACIÓN PUNTUAL ES ALTÍSIMO (P≈1)

Page 4: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

Para los efectos de generalizar científicamente, debemos referir los análisis estadísticos a toda la población (con N sujetos), no sólo a los n sujetos de la muestra.

Esta muestra provino (representativamente) de una determinada población, cuyos parámetros se desconocen.

Imaginen que analizamos estadísticamente una muestra (de n sujetos) que se distribuye normalmente, con ciertos estadísticos (media, desviación típica, centiles, etc.).

LA INFERENCIA. LA ESTIMACIÓN (POR INTERVALO DE CONFIANZA)

ESTADÍSTICA INFERENCIAL:

La estimación por intervalo de confianza nos permite inferir el valor del parámetro a partir del valor del estadístico, considerando una cierta probabilidad de que aquel se halle al interior de un determinado intervalo.

Page 5: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN POR INTERVALO DE CONFIANZA. LA DISTRIBUCIÓN MUESTRAL.

Supongamos una variable que a nivel poblacional se distribuye según la Ley Normal, con su correspondiente media aritmética.

De esta población extraemos al azar k muestras (muchas) representativas de la población y todas ellas de n sujetos.

ESTADÍSTICA INFERENCIAL:

Se comprueba que los promedios aritméticos de las k medias aritméticas se distribuyen según la ley normal y que dicha distribución presenta una media aritmética coincidente con la poblacional:

A la desviación típica de la distribución muestral de medias se la denomina error estándar y su valor responde al siguiente cálculo:

Page 6: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN POR INTERVALO DE CONFIANZA. LA DISTRIBUCIÓN MUESTRAL.

ESTADÍSTICA INFERENCIAL:

En definitiva, una distribución muestral de medias es como su nombre indica, una muestra de medias que se distribuyen normalmente, con parámetros como los indicados en las fórmulas anteriores:

Page 7: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN DE UNA MEDIA ARITMÉTICA POR INTERVALO DE CONFIANZA

ESTADÍSTICA INFERENCIAL:

En la estimación por intervalo de confianza de una media aritmética partimos de algunos supuestos básicos:

- Nuestra media aritmética observada en la muestra representativa servirá como punto central de la estimación.

- En la distribución muestral de medias, alguna de las medias que la constituyen coincidirá con la media aritmética poblacional que deseamos conocer.

- La estimación por intervalo se realiza sobre la distribución muestral de medias.

Page 8: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN DE UNA MEDIA ARITMÉTICA POR INTERVALO DE CONFIANZA

Page 9: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN DE UNA MEDIA ARITMÉTICA POR INTERVALO DE CONFIANZA

Page 10: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN DE UNA MEDIA ARITMÉTICA POR INTERVALO DE CONFIANZA

Page 11: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN DE UNA MEDIA ARITMÉTICA POR INTERVALO DE CONFIANZA

Page 12: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN DE UNA MEDIA ARITMÉTICA POR INTERVALO DE CONFIANZA

Ejemplo:

Estimar la media aritmética del CI en una población donde observamos, siguiendo la ley normal, una muestra (n=30) con los siguientes estadísticos: m=105 y dt=10

Page 13: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN DE UNA MEDIA O UNA PROPORCIÓN POR INTERVALO DE CONFIANZA

La argumentación lógica es la misma para

ambos parámetros

Repetiremos exactamente las mismas diapos

Pero ahora considerando una proporción en lugar

de una media…

Page 14: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN DE UNA MEDIA O UNA PROPORCIÓN POR INTERVALO DE CONFIANZA

OJOIMPORTANTE:

Cuando nos planteamos estimar una variable cuantitativa… ocupamos media

Cuando nos planteamos estimar una variable cualitativa… ocupamos proporción

RECUERDA: CUANTI – MEDIA

CUALI - PROPORCIÓN

Page 15: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN DE UNA PROPORCIÓN POR INTERVALO DE CONFIANZA

ESTADÍSTICA INFERENCIAL:

En la estimación por intervalo de confianza de una proporción partimos de algunos supuestos básicos:

- Nuestra proporción observada en la muestra representativa servirá como punto central de la estimación.

- En la distribución muestral de proporciones, alguna de las proporciones que la constituyen coincidirá con la proporción poblacional que pretendemos conocer.

- La estimación por intervalo se realiza sobre la distribución muestral de proporciones.

Page 16: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN DE UNA PROPORCIÓN POR INTERVALO DE CONFIANZA

Page 17: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN DE UNA PROPORCIÓN POR INTERVALO DE CONFIANZA

Ejemplo:

Estimar la proporción de jóvenes en una población donde observamos una muestra representativa (n=90) con 30 jóvenes.

Page 18: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

ESTIMACIÓN DE MEDIA O PROPORCIÓN POR INTERVALO DE CONFIANZA

OJOMUY IMPORTANTE:

HEMOS ESTADO ASUMIENDO QUE NUESTRAS

VARIABLES SE DISTRIBUYEN SEGÚN LA LEY

NORMAL !!!

PERO EL CUMPLIMIENTO DE LA

NORMALIDAD EN LA DISTRIBUCIÓN DE LOS

DATOS DEBE COMPROBARSE A TRAVÉS DE

LA PRUEBA DE KOLMOGOROV-SMIRNOV

Page 19: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

LA PRUEBA DE KOLMOGOROV-SMIRNOV

A menudo necesitamos corroborar si los datos de una determinada muestra o población se acomodan a la campana de Gauss (curva normal).

n= 100

m= 5

dt= 1

Distribución observada de los datos

Distribución ideal (tª) de los datos=

¿…?

PRUEBA K-S

=¿…?

Page 20: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

LA PRUEBA DE KOLMOGOROV-SMIRNOV

=¿…?

La prueba K-S calcula una valor Z que cuantifica la diferencia entre:

Distribución normal ideal Distribución observada_

Elevados valores de Z indican grandes diferencias entre ambas distribuciones…

Z muy alta Distribución observada NO normal

Z muy baja Distribución observada SÍ normal

Page 21: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

LA PRUEBA DE KOLMOGOROV-SMIRNOV

=¿…?

Distribución normal ideal Distribución observada_

Para determinar si el valor Z calculado es significativamente elevado, consultaremos su correspondiente grado de significación (P):

Z significativamente elevada P≤0,05 Distribución observada NO normal

Z no significativamente elevada P>0,05 Distribución observada SÍ normal

Valor Z de K-S =

Page 22: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

LA PRUEBA DE KOLMOGOROV-SMIRNOV

Para determinar si el valor Z (1,38) es significativamente elevado, consultaremos su correspondiente grado de significación (P):

Dado que P=0,04 < 0,05 existe una diferencia significativa de los datos con la normalidad La variable NO se distribuye según la ley normal.

Esta conclusión la asumimos considerando un nivel de confianza del 95% (0,95)

Prueba de Kolmogorov-Smirnov para una muestra

34

24,97

4,267

,237

,237

-,176

1,382

,044

N

Media

Desviación típica

Parámetros normales a,b

Absoluta

Positiva

Negativa

Diferencias másextremas

Z de Kolmogorov-Smirnov

Sig. asintót. (bilateral)

EDAD

La distribución de contraste es la Normal.a.

Se han calculado a partir de los datos.b.

Ejemplo:

Una de nuestras variables de estudio presenta el siguiente resultado en la prueba de normalidad K-S.

¿La variable se distribuye según la ley normal?

Page 23: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

La PRUEBA K-S es una PRUEBA DE HIPÓTESIS

Toda prueba de hipótesis comprueba si una determinada diferencia o un determinado valor estadístico es significativamente elevado o no.

Antes de realizar cualquier PRUEBA DE HIPÓTESIS, se consideran estas dos posibles hipótesis estadísticas:

H0 (hipótesis nula): la diferencia o valor estadístico no es elevado significativamente

H1 (hipótesis alternativa): diferencia o valor estadístico sí es significativam. elevado.

En definitiva, cualquier PRUEBA DE HIPÓTESIS, deberá concluir H0 ó H1

La decisión se tomará siempre a través del grado de significación (P):

P > 0,05 H0

P ≤ 0,05 H1

Page 24: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

La PRUEBA K-S es una PRUEBA DE HIPÓTESIS

En definitiva, cualquier PRUEBA DE HIPÓTESIS, deberá concluir H0 ó H1

La decisión se tomará siempre a través del grado de significación (P):

P > 0,05 H0

P ≤ 0,05 H1

Pero OJO IMPORTANTE:

El contraste de P con el valor 0,05 es el más común, debido a que acostumbra a asumirse para las pruebas un nivel de confianza del 95% (o lo que es igual, un riesgo

alfa α de 0,05).

Pero en algunos casos puede exigírsenos para la PRUEBA DE HIPÓTESIS un mayor

nivel de confianza (es decir, un menor riesgo α.

Veamos este último ejemplo…

Page 25: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

LA PRUEBA DE KOLMOGOROV-SMIRNOV

Para determinar si el valor Z (1,68) es significativamente elevado, consultaremos su correspondiente grado de significación (P):

Dado que P=0,038 > 0,02 no existe una diferencia significativa de los datos con la normalidad La variable SÍ se distribuye según la ley normal.

Esta conclusión la asumimos considerando un riesgo de error α del 2%.

Ejemplo:

Una de nuestras variables de estudio presenta el siguiente resultado en la prueba de normalidad K-S.

Asumiendo un riesgo de error alfa del 2% ¿podemos asumir que la variable se distribuye según la ley normal?

Prueba de Kolmogorov-Smirnov para una muestra

1200

43,02

16,752

1,077

1,077

-,068

1,675

,038

N

Media

Desviación típica

Parámetros normales a,b

Absoluta

Positiva

Negativa

Diferencias másextremas

Z de Kolmogorov-Smirnov

Sig. asintót. (bilateral)

Edad delentrevistado

La distribución de contraste es la Normal.a.

Se han calculado a partir de los datos.b.

Page 26: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

En SÍNTESIS, para una PRUEBA DE HIPÓTESIS

H0 (hipótesis nula): la diferencia o valor estadístico no es elevado significativamente

H1 (hipótesis alternativa): diferencia o valor estadístico sí es significativam. elevado.

P > α H0

P ≤ α H1

A priori se establecen dos hipótesis, de las que habrá que concluir sólo una:

Una vez obtenido el valor del estadístico (por ejemplo Z de K-S) se contrasta P:

El valor de α nos indica el riesgo de error (o su complementario, nivel de confianza)

asumidos para el contraste de las hipótesis. ES IMPORTANTE INDICAR ESTE DATO

EN LAS CONCLUSIONES DE TUS ANÁLISIS.

Page 27: LA INFERENCIA. ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA + PRUEBA NORMALIDAD K-S (PRUEBA DE HIPÓTESIS) Joan Calventus S

Joan Calventus S.

http://estadis.webnode.cl

LA INFERENCIA.

ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE

CONFIANZA

+ PRUEBA NORMALIDAD K-S

(PRUEBA DE HIPÓTESIS)