sesión 16

22
Estadística (Psicología) Sesión N°16 (07/08/2008) Prof. Ricardo Escalante

Upload: rescalante

Post on 29-Jun-2015

1.574 views

Category:

Travel


0 download

TRANSCRIPT

Page 1: SesióN 16

Estadística (Psicología)Sesión N°16

(07/08/2008)

Prof. Ricardo Escalante

Page 2: SesióN 16

Agenda

BPMM30BPMM30

2

3

4

5

Distribucíones muestralesDistribucíones muestrales

Población de la H0Población de la H0

Prueba zPrueba z

Distribución muestralDistribución muestral

1

6 Región críticaRegión crítica

Proceso de muestreoProceso de muestreo

Page 3: SesióN 16

Distribuciones muestraleso La distribución muestral de un estadístico proporciona:

1. Una lista de todos los valores que dicho estadístico puede asumir

2. La probabilidad de obtener cada valor suponiendo que éste sea producido únicamente por el azar.

o Dados los ejercicios vistos en la sesión pasada, podemos generalizar que el análisis de datos implica los siguientes pasos

1. El cálculo del estadístico apropiado, por ejemplo, el número de signos positivos y negativos para la prueba del signo

2. La evaluación del estadístico con base en su distribución muestral.

Page 4: SesióN 16

Generación de distribuciones muestraleso Hemos definido una distribución muestral como una distribución de

probabilidad de todos los valores posibles que puede asumir un estadístico suponiendo que sólo influye el azar.

o Una forma de obtener las distribuciones muestrales consiste en utilizar las consideraciones básicas de la probabilidad

o También podemos deducir las distribuciones muestrales partiendo desde un punto de vista de un muestreo empírico.

o En este caso tenemos un conjunto de datos poblacionales, real o teórico, que existe si la variable independiente no produce efecto alguno.

Page 5: SesióN 16

Generación de distribuciones muestraleso La deducción de la distribución muestral del estadístico se hace de la

siguiente manera:1. Determinamos todas las muestras posibles de tamaño N que

pueden formarse a partir de la población de datos2. Calculamos el estadístico para cada una de las pruebas3. Calculamos la probabilidad de obtener cada uno de los valores

del estadístico si sólo influye el azar.o Para ver el enfoque del muestreo, suponga que realizamos un

experimento con un tamaño de muestra N=2, y aplicamos la prueba de los signos para el análisis. Podemos imaginar un conjunto teórico de datos resultantes si el experimento se realiza sobre toda la población y la variable independiente no produce efecto alguno

o Este conjunto de datos es la población de la hipótesis nula

Page 6: SesióN 16

Población de la hipótesis nulao La Población de la hipótesis nula: es el conjunto real o teórico

de datos provenientes de una población que resultaría si el experimento se aplicara sobre toda la población y la variable independiente no tuviese efecto alguno.

o Recibe este nombre porque se utiliza para verificar la validez de H0

o En el caso de la prueba del signo, si la IV no hubiera producido efecto alguno, entonces la hipótesis nula tendría el mismo número de signos positivos y de signos negativos. (P = Q = 0,50)

Page 7: SesióN 16

Proceso de muestreoo Para facilitar los cálculos necesarios para generar la distribución muestral,

supongamos que hay solamente 6 datos en la población, tres signos positivos y tres signos negativos.

o Para deducir una distribución muestral del “número de signos positivos” con N=2 debemos determinar todas las distintas muestras de tamaño 2 que es posible formar con esta población.

o El muestreo es de un elemento a la vez, con reemplazo.

+

-

++

--

12

3

45

6

+ -3 4

+1

+1

+1

+2

+1

+3

+1

-4

+1

+1

-5

-6

+2

+2

+2

+2

+2

+2

+3

+3

+3

+3

+3

-4

-4

-4

-4

-4

+1

+2

+3

-4

-5

-6

+1

+2

+3

-4

-5

-6

+1

+2

+3

-4

-5

-6

…..

Page 8: SesióN 16

Distribución muestralo Resultan 36

muestras diferentes de tamaño 2.

o 9 muestras tienen 2 signos positivos

o 18 muestras tienen 1 signo positivo

o 9 muestras tienen 0 signos positivos

N° Muestra

N° elementos

Datos reales

N° de positivos

en el estadístico

N° Muestra

N° elementos

Datos reales

N° de positivos

en el estadístico

1 1.1 + + 2 + 19 4.1 - + 1 +

2 1.2 + + 2 + 20 4.2 - + 1 +

3 1.3 + + 2 + 21 4.3 - + 1 +

4 1.4 + - 1 + 22 4.4 - - 0 +

5 1.5 + - 1 + 23 4.5 - - 0 +

6 1.6 + - 1 + 24 4.6 - - 0 +

7 2.1 + + 2 + 25 5.1 - + 1 +

8 2.2 + + 2 + 26 5.2 - + 1 +

9 2.3 + + 2 + 27 5.3 - + 1 +

10 2.4 + - 1 + 28 5.4 - - 0 +

11 2.5 + - 1 + 29 5.5 - - 0 +

12 2.6 + - 1 + 30 5.6 - - 0 +

13 3.1 + + 2 + 31 6.1 - + 1 +

14 3.2 + + 2 + 32 6.2 - + 1 +

15 3.4 + + 2 + 33 6.3 - + 1 +

16 3.4 + - 1 + 34 6.4 - - 0 +

17 3.5 + - 1 + 35 6.5 - - 0 +

18 3.6 + - 1 + 36 6.6 - - 0 +

Page 9: SesióN 16

Distribución muestralo Si solo interviene el azaro Cada muestra es igualmente probable o Hemos obtenido la distribución muestral para N=2 del

estadístico “número de signos positivos”

p (2 signos positivos) 9/36 0.2500

p(1 signo positivo) 18/36 0.5000

p(0 signos positivos) 9/36 0.2500

Page 10: SesióN 16

Distribución muestralo En el ejemplo anterior utilizamos una población de sólo 6 datos.o Habríamos obtenido la misma distribución muestral, aunque hubiese

muchas más muestras diferentes si se hubiera empleado una población mayor, siempre que el número de signos positivos fuera igual que el de signos negativos y el tamaño de la muestra fuese N=2

o Basta con observar la distribución del caso de las 2 monedas y contrastarlo con el cuadro

Renglón N° Moneda 1 Moneda 2 N° de resultados

1 Cara Cara 1

2 Cara Sello 12

3 Sello Cara 1

4 Sello Sello 1

Total de resultados 4

p (2 signos positivos) 9/36 0.2500

p(1 signo positivo) 18/36 0.5000

p(0 signos positivos) 9/36 0.2500

Page 11: SesióN 16

Distribución muestralo Una distribución muestral proporciona todos los valores que

puede asumir un estadístico junto con la probabilidad de obtener cada valor si el muestreo es aleatorio a partir de la población de hipótesis nula

o Aparentemente hasta ahora estamos en un plano abstracto y poco práctico. Es necesario entonces ver una aplicación concreta.

o La prueba z de la desviación normalizada se utiliza cuando conocemos los parámetros de la población de la hipótesis nula

o En la prueba z la media muestral se utiliza como estadístico básico.

Page 12: SesióN 16

Prueba z de la desviación normalizadao Utilizaremos el ejemplo que R. Pagano nos propone:

o Supongamos que usted es un inspector de escuelas públicas de la ciudad donde vive. Recientemente, los ciudadanos han estado preocupados pues creen que el programa de lectura impartido en las escuelas públicas es de mala calidad. Como este asunto es grave, usted decide realizar un experimento para investigar. Establece un =0,051 cola para tomar su decisión. Para empezar compara el nivel de lectura de los estudiantes del último año del bachillerato con las normas establecidas. Estas normas están basadas en la calificación de un examen que mide la habilidad de lectura y que fue aplicado a nivel nacional a un gran número de alumnos de este sector. Las calificaciones de esta población presentan una distribución normal con =75 y =16. Para su experimento Ud. aplica el examen de lectura a 100 estudiantes elegidos al azar de su ciudad. La media muestral obtenida es de 72 pts. ¿cuál es su conclusión?

o Aunque la media muestral es menor que la media a nivel nacional ¿es significativa la diferencia?

o Si solamente interviene el azar entonces podemos considerar a los 100 datos muestrales como una muestra aleatoria de una población con =75

Page 13: SesióN 16

Prueba z de la desviación normalizadao La hipótesis nula para este experimento establece ¿cuál es la

probabilidad de obtener una media tan baja o más baja que 72, si los 100 datos provienen de una muestra aleatoria de una población con distribución normal con =75 y =16?

o Si la probabilidad resulta igual o menor que entonces rechazamos H0 y aceptamos H1. en caso contrario conservamos H0

o Es evidente que el estadístico que estamos utilizando es la media de la muestra. Para determinar la probabilidad adecuada, debemos conocer la distribución muestral de la media.

o Al aplicar la definición de la distribución muestral de un estadístico a la media aritmética se obtiene:

Page 14: SesióN 16

Distribución muestral de la mediao La distribución muestral de la media proporciona todos los valores

que puede asumir la media, junto con la probabilidad de obtener cada valor si se hace un muestreo aleatorio a partir de la población de la hipótesis nula.

o Tomando una población específica de datos en bruto que tiene una media y una desviación estándar

1. Se extraen todas las distintas muestras posibles de un tamaño fijo N

2. Se calcula la media aritmética de cada muestra3. Se calcula la probabilidad de obtener cada valor de la media si

solo interviene el azar.

Page 15: SesióN 16

Distribución muestral de la mediao Esta distribución de la media nos

proporcionará todos los valores que puede asumir la media para muestras de tamaño N, junto con la probabilidad de obtener cada valor si se realiza un muestreo aleatorio a partir de la población especificada.

o Al repetir este procedimiento variando de manera sistemática N, se puede establecer que la distribución muestral de la media tiene las siguientes características generales.

Muestra 1 de

tamaño N

Muestra 2 de

tamaño N

Muestra 3 de

tamaño N

Última muestra

de tamaño N

Page 16: SesióN 16

Distribución muestral de la mediao Características para muestras de un tamaño arbitrario N:1. Cada dato es una media muestral de N datos. Es un conjunto de datos

poblacionales, aunque los datos se basen en muestras, porque la distribución contiene a un conjunto completo de medias muestrales.

También se conoce como error estándar de la media debido a que cada media muestral se puede considerar una estimación de la media poblacional de los datos en bruto. La variabilidad en las medias muestrales se debe a los errores de estimación.

2. Tiene una media igual a la media poblacional de los datos en bruto 3. Tiene una desviación estándar igual a:4. Tiene la forma normal y depende de la forma de la población de datos en

bruto y del tamaño de la muestra.

Page 17: SesióN 16

Ejemploo Para este ejemplo supondremos que

los datos en bruto de la población son: 2, 3, 4, 5 y 6. La media =4,00 y la desviación estándar =1,41.

o El propósito del experimento es deducir la distribución muestral de la media para muestras de tamaño N=2 extraídas de esta población.

o Supondremos que el muestreo se realiza tomando un dato a la vez y con reemplazo.

N° Muestra

Datos muestrales Media N°

MuestraDatos

muestrales Media

1 2.2 2,0 14 4.5 4,5

2 2.3 2,5 15 4.6 5,0

3 2.4 3,0 16 5.2 3,5

4 2.5 3,5 17 5.3 4,0

5 2.6 4,0 18 5.4 4,5

6 3.2 2,5 19 5.5 5,0

7 3.3 3,0 20 5.6 5,5

8 3.4 3,5 21 6.2 4,0

9 3.5 4,0 22 6.3 4,5

10 3.6 4,5 23 6.4 5,0

11 4.2 3,0 24 6.5 5,5

12 4.3 3,5 25 6.6 6,0

13 4.4 4,0

Page 18: SesióN 16

Ejemploo Suponga ahora que por alguna razón

queremos determinar la probabilidad de obtener una media aritmética 5,5 como resultado de un muestreo aleatorio de dos datos. Considerando uno a la vez, con reemplazo, tomados a partir de la población de datos en bruto.

Media aritmética Probabilidad

2,0 0,04

2,5 0,08

3,0 0,12

3,5 0,16

4,0 0,20

4,5 0,16

5,0 0,12

5,5 0,08

6,0 0,04

Page 19: SesióN 16

Prueba z de la desviación normalizadao Regresamos al ejemplo:

o Supongamos que usted es un inspector de escuelas públicas de la ciudad donde vive. Recientemente, los ciudadanos han estado preocupados pues creen que el programa de lectura impartido en las escuelas públicas es de mala calidad. Como este asunto es grave, usted decide realizar un experimento para investigar. Establece un =0,051 cola para tomar su decisión. Para empezar compara el nivel de lectura de los estudiantes del último año del bachillerato con las normas establecidas. Estas normas están basadas en la calificación de un examen que mide la habilidad de lectura y que fue aplicado a nivel nacional a un gran número de alumnos de este sector. Las calificaciones de esta población presentan una distribución normal con =75 y =16. ¿Es razonable considerar a los 100 datos como una muestra aleatoria de una población normal de calificaciones de lectura con =75 y =16?

o Esta distribución:1. Tiene forma normal2. Posee 3. Tiene una desviación estándar de

Page 20: SesióN 16

Prueba z de la desviación normalizadao Hasta ahora conocemos la ecuación de puntajes z para

datos en brutoo Para el caso que nos ocupa el puntaje z queda determinado

por la fórmulao Si utilizamos esta fórmula para calcular z en este

experimentoo Utilizando la tabla de puntajes zo Dado que 0,0301 < 0,05 rechazamos H0 concluyendo que

NO es razonable suponer que los 100 datos sean una muestra aleatoria de una población con =75.

o 0,0301

Page 21: SesióN 16

Región críticao La región crítica para el rechazo de la hipótesis nula es el área debajo de la

curva que contiene a todos los valores del estadístico que permiten el rechazo de la hipótesis nula

o El valor crítico de un estadístico es aquél valor que delimita la región crítica

o En el caso que nos ocupa buscaremos el puntaje z que corresponde a =0,051 cola negativo

o 0,5000 – 0,0500 = 0,4500 o Dado que está en el centro de los puntajes z 1,64 y 1,65 corresponde -

1,645 como puntaje z críticoo El valor crítico está dado por la fórmula: o Sustituyendo:

Page 22: SesióN 16

Región críticao Queda establecido el valor crítico 72,368 como el límite de la media

muestral del experimento en cuestión para rechazar la hipótesis nula. o Cualquier media muestral por encima de este valor nos permite conservar

la H0

o Repetiremos el experimento para =0,051 cola positivoo Y para =0,052 colas que se maneja mediante =0,0251 colanegativo y =0,0251

colapositivoo Problemas de práctica págs. 280ss