anÁlisis e interpretaciÓn de resultados estadisticos dr. carlos calderón cabada lima, junio 2006

68
ANÁLISIS E INTERPRETACIÓN DE ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006 Lima, Junio 2006

Upload: emigdia-talamantes

Post on 16-Apr-2015

10 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

ANÁLISIS E INTERPRETACIÓN DE ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS RESULTADOS ESTADISTICOS

Dr. Carlos Calderón Cabada

Lima, Junio 2006Lima, Junio 2006

Page 2: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

PRUEBAS ESTADISTICAS

PARAMETRICAS

Prueba “t”

de Student

Page 3: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

¿QUE ES LA PRUEBA “t” ?

ES UNA PRUEBA ESTADISTICA PARA

EVALUAR SI DOS GRUPOS DIFIEREN ENTRE SI DE

MANERA SIGNIFICATIVA RESPECTO DE SUS MEDIAS.

Page 4: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

SIMBOLO

“ t “

Page 5: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

)1(

/

ntóndistribucitienenS

xt

SE CALCULA PARA MUESTRAS PEQUEÑAS DE DISTRIBUCION NORMAL

Page 6: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

SE CALCULA PARA MUESTRAS GRANDES DE DISTRIBUCION NORMAL

2211

21

// 22 NSNS

xxt

Page 7: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

HIPOTESIS A PROBAR

Se trata de comparar dos grupos:

La hipótesis alternativa plantea que los grupos difieren

significativamente entre si y la hipótesis nula propone que los

grupos no difieren significativamente entre si.

Page 8: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

VARIABLE INVOLUCRADA

LA COMPARACION SE REALIZA SOBRE LA VARIABLE INDEPENDIENTE, SI

EXISTEN OTRAS SE DEBE EFECTUAR VARIAS PRUEBAS “t” UNA POR CADA

VARIABLE.

EL NIVEL DE MEDICION DE LAS VARIABLES ES EL DE INTERVALO

O RAZON

Page 9: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

INTERPRETACION

PARA GRUPOS PEQUEÑOS (n < 30)

X la media del grupo. µ la media poblacional S la Desv. Estandar n = tamaño de muestra

)1(

/

ntóndistribucitienenS

xt

Page 10: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

INTERPRETACION

Para saber si el valor “t” es significativo, se aplica la formula y se calculan los grados de libertad.

La prueba “t” se basa en una distribución muestral o poblacional de diferencia de medias conocidas como la “t de Student”,

Esta distribución es identificada por los grados de libertad, los cuales constituyen el numero de maneras como los datos pueden variar libremente.

Page 11: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

RECOMENDACION

Mientras mayor sea el numero de grados de libertad la distribución “t de Student” se acerca mas a ser una distribución normal.

Si los grados de libertad exceden los 120 la Distribución Normal es utilizada como una aproximación adecuada de la “t de Student”.

Calculado “t” y los gl (grados de libertad) SE ELIGE el nivel de significancia y se compara el valor obtenido con el mostrado en la Tabla

Page 12: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Distribución t-Student

0 t1-

t(v)

)1(/

ntóndistribucitienenS

xT

Para muestras pequeñas de población normal

PRUEBA “t”

Page 13: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

CALCULO DE LOS GRADOS DE LIBERTAD

gl = (N1 + N2) – 2

N1 y N2 representan al tamaño de cada grupo comparado.

Page 14: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

EVALUACION DE RESULTADOS

Si nuestro valor calculado es igual o mayor que el de la Tabla, se acepta la hipótesis alternativa.

Pero si el valor es menor se acepta la hipótesis nula.

USO DE LA TABLA……..

Page 15: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

EJERCICIOS

Tomar la Tabla “t” y calcular: Media Muestral = Media Poblacional = α = n = gl. (t-1) =

Page 16: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

DESCANSO

Page 17: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

HIPOTESIS A CONTRASTAR

datos de la muestra

Se definen:

Las hipótesis nula y alternativa con una distribución de probabilidad conocida

Regla de decisión(nivel de significación )

Valor crítico o tabulado

Se calcula una medidaasociada a la hipótesis

que se desea docimar

Se comparan los valores calculado con tabulado

¿se rechaza Ho?

NOSIH1

Se extraen conclusiones

Page 18: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Utilizar prueba de ZSi

No

Si

Utilizar prueba de Z

No

¿Se conoce ?

¿Se conoce ?

Utilizar prueba de Z

Utilizar prueba de t

¿Se conoce?

¿Se conoce?

Si

No

Es n ≥ 30? Es n ≥ 30?

No

Si

Utilizar prueba de Z (por el teorema central del límite)

¿Se conoce?¿Se conoce?

Utilizar prueba de Z (por el teorema central del límite)

Si

¿Se sabe q la población es normal?

¿Se sabe q la población es normal?

No

Si

Es n ≥ 30?Es n ≥ 30?Utilizar una prueba no paramétrica

Page 19: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Se acepta la hipótesis nula si el estadístico de la prueba cae dentro de esta región.

Se rechaza la hipótesis nula

Se rechaza la hipótesis nula

Area A = área B y (A+B) = el nivel deseado de significancia

Valor critico

Valor teórico de la diferencia

+ Valor critico

Area A Area B

Esquema cuando se comprar la diferencia entre dos medias o proporciones muéstrales

Page 20: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Númerode

grupos

Esquema de selección de pruebas estadísticas cuando la variable dependiente es continua u ordinal

1 Grupo

2 Grupos

3 a más Grupos

Independientes

n > = 30

Prueba Z para la media

n > = 30

Distribución normal

Prueba Z para la diferencia de medias

Prueba de Mann-Whitney paracomparación de poblaciones

n > = 30

Prueba Z para la media de la diferenciaen datos apareados

Independientes

Distribuci ónnormal

Prueba T para la media de ladiferencia en datos apareados

Prueba del signo o de Wilcoxonpara datos apareados

Distribuciónnormal c/varian-zas semejantes

ANVA - Comparación de tratamientos

Prueba de Kruskal-Wallis - Comparac. de Trat.

Distribuciónnormal c/varian-zas semejantes

ANVA en Bloque - Comparac. de Tratam.

Prueba de Friedman - Comparac. de Tratam.

Distribuciónnormal

Prueba T para la media

Prueba del signo para la mediana

Varianzasiguales

Prueba T paradiferencia de medias

Prueba T con ajustede grados de libertad

Si

No

Si

No

Si

No

Si

No

Si

No

Si

No

Si

No

Si

No

Si

No

No

Si

Si

No

Page 21: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Escala demedición

para ambasvariables

Esquema de selección de pruebas estadísticas para medirrelación entre variables

Continua

Coeficiente de Correlación por rangos de Spearman

Coeficiente de correlación lineal de Pearson

Cada variabletiene dos

categorías(tablas 2x2)

- Prueba Ji-Cuadrado (Coeficiente )- Riesgo Relativo (Estudios de cohorte)- Odds Ratio (Estudios de Casos-control)- Coeficiente de concordancia Kappa (Comparación de métodos)

Prueba Ji-Cuadrado para Independenciade variables (Coeficiente de

Contingencia)

Si

No

Ordinal y/onumérica

Nominal

Page 22: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Hipótesis estadística según Hipótesis estadística según Número de grupo y tipo de variableNúmero de grupo y tipo de variable

Número de Grupos

Un grupo Dos grupos Tres o más grupos

Variablecuantitativa

Variablecategórica

Variablecuantitativa

Variablecaategórica

Variablecuantitativa

Variablecategórica

Hipótesis:= 0

Parámetro

media

Hipótesis: P=P 0

ParámetroProporción

Hipótesis:=2

Parámetrosmedias

Hipótesis:2

1=22

Parámetrosvarianzas

Hipótesis: P 1 = P 2

ParámetrosProporciones

Hipótesis:=...= kParámetros

k medias

Hipótesis:2

122=

...= 2k

Parámetrosk varianzas

Hipótesis: P 1 = P 2 =

....= P kParámetrosk Proporciones

Hipótesis:2 < 2

0

Parámetro:

varianza

Page 23: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Prueba de Correlación de Prueba de Correlación de Rango de SPEARMANRango de SPEARMAN

Page 24: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

El coeficiente de correlación por rango se define como:

Donde:N: # de observaciones, # de individuos o fenómenos

clasificados por rango.

di: Diferencia en los rangos atribuida a dos características diferentes del i-ésimo individuo o fenómeno.

)1N(N

d61r 2

2i

s

)1N(N

d61r 2

2i

s

PRUEBA DE CORRELACION DE RANGO DE SPEARMANPRUEBA DE CORRELACION DE RANGO DE SPEARMAN

La correlación por rangos de Spearman mide la relación entre dos variables que han sido clasificadas por orden de menos a mayor (o de mayor a menor)

La correlación por rangos de Spearman mide la relación entre dos variables que han sido clasificadas por orden de menos a mayor (o de mayor a menor)

Page 25: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Una empresa contrató a 7 técnicos en informática, que fueron sometidos a un examen de conocimientos básicos. Luego de un año de servicio, se calificó su rendimiento en el trabajo. A continuación, se muestran los resultados:

EJEMPLOEJEMPLO

TécnicoPuntuación en el

examenClasificación por

rendimiento

J. Manzo 82 4

M. Contreras 73 7

C. Gutarra 60 6

F. Olaechea 80 3

D. Barrientos 67 5

F. Estombelo 94 1

J. Cordova 89 2

Page 26: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Se utiliza la correlación por rangos de Spearman para determinar, si hay relación entre las calificaciones del examen y el rendimiento en el trabajo

1º Se elabora la clasificación de las puntuaciones del examen

1º Se elabora la clasificación de las puntuaciones del examen

Técnico Puntuación en el examen

Clasificación por el examen (X)

Clasificación por rendimiento (Y)

J. Manzo 82 3 4 -1 1

M. Contreras 73 5 7 -2 4

C. Gutarra 60 7 6 1 1

F. Olaechea 80 4 3 1 1

D. Barrientos 67 6 5 1 1

F. Estombelo 94 1 1 0 0

J. Cordova 89 2 2 0 0

idYX 2i

2 d)YX(

Page 27: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

2º Se calcula del coeficiente de correlación por rangos de Spearman rs:

2º Se calcula del coeficiente de correlación por rangos de Spearman rs:

857.0)17(7

861

)1N(N

d61r 22

2i

s

857.0)17(7

861

)1N(N

d61r 22

2i

s

Un coeficiente de correlación oscila entre -1 y 1; los resultados muestran una fuerte relación positiva entre las puntuaciones de examen de cada técnico y su rendimiento en le trabajo

Un coeficiente de correlación oscila entre -1 y 1; los resultados muestran una fuerte relación positiva entre las puntuaciones de examen de cada técnico y su rendimiento en le trabajo

Page 28: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Contrastando la hipotes:Contrastando la hipotes:

H0: ρs = 0, no hay relación entre las dos variables

H1: ρs ≠ 0, hay relación entre las dos variables

H0: ρs = 0, no hay relación entre las dos variables

H1: ρs ≠ 0, hay relación entre las dos variables

Tabla N, con α=0.10, n=7; los valores críticos serían: ± 0.6786

Como rs está fuera de la región de aceptación, rechazamos la H0. Se concluye, al 90% de confianza, existe relación entre las puntuaciones del examen y el orden de rendimiento en el trabajo

Como rs está fuera de la región de aceptación, rechazamos la H0. Se concluye, al 90% de confianza, existe relación entre las puntuaciones del examen y el orden de rendimiento en el trabajo

-0.6786Valor critico

+0.6786Valor critico

0.8570.857

0.050.05

Se Rechaza

Se Rechaza

Se acepta

Page 29: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Intervalo de confianza para la diferencia de medias

b) Si las varianzas 12 y 2

2 son desconocidas

Para muestras grandes

donde

212/121 )( xxSZxxL

2

22

1

21

21 ns

ns

S xx

Page 30: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Cambiar de tema

Page 31: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

ANALISISNO

PARAMETRICO

Page 32: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

CONSIDERACIONES

La mayoría no de estos análisis no requiere de presupuestos acerca de la forma de la Distribución Poblacional.

Las Variables no necesariamente deben estar medidas en un nivel de intervalo (orden y categoría cero no real) o de razón ( el cero es real) .

Pueden analizarse datos nominales (sin orden ni categoría -Sexo) u ordinales (orden de mayor a menor- primero, segundo).

En todo caso la variables deben ser categóricas.( en días, meses, años, etc.)

Page 33: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

METODOS O PRUEBAS NO PARAMETRICAS MAS

EMPLEADAS 1) LA Ji CUADRADA – CHI-CUADRADA 2) COEFICIENTES DE CORRELACION E

INDEPENDNENCIA PARA TABULACIONES CRUZADAS.

3) LOS COEFICIENTES DE CORRELACION PARA RANGOS ORDENADOS DE SPERMAN Y KENDALL

Page 34: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Ji - CUADRADA

Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables.

Se simboliza por : ²א Prueba hipotesis Correlacionales Variables involucradas : dos ( no considera

relaciones causales) Nivel de medicion de variables: Nominal y

Ordinal.

Page 35: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Ji - CUADRADA

La Chi – Cuadrada se calcula a traves de una Tabla de contingencia o Tabulacion

cruzada, que constituye una Tabla de dos dimensiones o matriz de dos x dos.

Cada dimension contiene una variable.

Cada variable se subdivide en dos o mas categorias.

Page 36: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

La Prueba Ji-CuadradoDistribución Ji-Cuadrado

n21 Z , ... , Z , ZSupóngase que se tiene una serie de variables aleatorias independientes con distribución normal estándar, , entonces la variable aleatoria , sigue una distribución Ji-Cuadrado.

2n

21 Z...ZX

Page 37: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

La Prueba Ji-Cuadrado

FUNCIÓN DE DENSIDAD MEDIA Y VARIANZA.2χ

Page 38: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Hipótesis nula:Las variables son independientes

Se construye o se obtiene una tabla de tabulación cruzada para las frecuencias reales

observadas (Oij )

Procedimientos para usar el análisis de ji cuadrada y Procedimientos para usar el análisis de ji cuadrada y probar la independencia de dos variables nominales probar la independencia de dos variables nominales

Suponiendo que las variables son independientes, se construye una tabla de

tabulación cruzada para las frecuencias teóricas ( Eij)

Se determina el nivel de significado deseado en la prueba.

Se determina el valor calculado del estadístico ji

cuadrada

r

1i

c

1j ij

2ijij2

E

EO

Page 39: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Tabla 4. Distribución de ji-cuadrado

  Probabilidad de un valor superior

Grados de libertad 0,1 0,05 0,025 0,01 0,005

1 2,71 3,84 5,02 6,63 7,88

2 4,61 5,99 7,38 9,21 10,60

3 6,25 7,81 9,35 11,34 12,84

4 7,78 9,49 11,14 13,28 14,86

5 9,24 11,07 12,83 15,09 16,75

6 10,64 12,59 14,45 16,81 18,55

7 12,02 14,07 16,01 18,48 20,28

8 13,36 15,51 17,53 20,09 21,95

9 14,68 16,92 19,02 21,67 23,59

10 15,99 18,31 20,48 23,21 25,19

USO DE LA TABLA

α]χχ[P 2n,α

2

2n,αχ

α

El área sombreada de naranja representa la probabilidad que se determinada por , donde:

es el valor critico del margen superior de la tabla, y son los grados de libertad del margen izquierdo de la tabla.

n

Page 40: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Tabla 4. Distribución de ji-cuadrado

  Probabilidad de un valor superior

Grados de libertad 0,1 0,05 0,025 0,01 0,005

1 2,71 3,84 5,02 6,63 7,88

2 4,61 5,99 7,38 9,21 10,60

3 6,25 7,81 9,35 11,34 12,84

4 7,78 9,49 11,14 13,28 14,86

5 9,24 11,07 12,83 15,09 16,75

6 10,64 12,59 14,45 16,81 18,55

7 12,02 14,07 16,01 18,48 20,28

8 13,36 15,51 17,53 20,09 21,95

9 14,68 16,92 19,02 21,67 23,59

10 15,99 18,31 20,48 23,21 25,19

Uso de la tabla Ji-Cuadrado

10.0]10n | χ99.15 [ P 2

05.0]5n | χ07.11 [ P 2

Page 41: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Martha Revilla, directora de mantenimiento de la calidad en MEGA, elige 29 bicicletas y halla una varianza en la distancia entre ejes de 32.7 pulgadas cuadradas. Si la señora Revilla tienen que garantizar que la variación no supere 27 pulgadas cuadradas ¿indica esto que se cumplen las normas de producción? (α=0.05)

EJEMPLOEJEMPLO

HipótesisHipótesisHipótesisHipótesis 27H 27H 21

20 27H 27H 2

12

0

Prueba de una cola a la derechaPrueba de una cola a la derecha

Page 42: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

277.32s

29n

2

2

91.33

277.32129s1n

2

22

91.33

277.32129s1n

2

22

0.05

41.33733.91

2

2f

Como X2=33.91<41.337 la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción

Como X2=33.91<41.337 la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción

337.41228;05.0 337.412

28;05.0

Page 43: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

¿Que pasaría, si las instrucciones de la señora Revilla fueran que la variación se mantuviera inferior a 27 pulgadas cuadradas?

27H 27H 21

20 27H 27H 2

12

0

Prueba de una cola a la izquierdaPrueba de una cola a la izquierda

33.91

2

2f

0.05

X2 =33.91, la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción

X2 =33.91, la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción

16.928

928.16228;95.0 928.162

28;95.0

Page 44: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

La señora Revilla, ahora elabora un intervalo de confianza del 90% para la varianza de la distancia entre ejes.

16.928 2

2f

0.05

Revilla puede confiar al 90% en que la varianza de la distancia entre ejes se encuentra entre 22.15 y 54.09 pulgadas cuadradas

Revilla puede confiar al 90% en que la varianza de la distancia entre ejes se encuentra entre 22.15 y 54.09 pulgadas cuadradas

0.050.90

41.3370.95

2

28;95.0

22

228;05.0

2 s1ns1n

2

28;95.0

22

228;05.0

2 s1ns1n

09.5415.22

928.167.32129

337.417.32129

2

2

09.5415.22

928.167.32129

337.417.32129

2

2

Page 45: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Prueba Ji-Cuadrado de Independencia

Y

X Categ. 1 ...... Categ. s Total

Cat. 1 O11 ...... O1s R1

......... ....... ...... ....... .....

Cat. r Or1 ...... Ors Rr

Total C1 ...... Cs n

H0: Las variables X e Y son independientes H1: Existe asociación entre X e Y

Page 46: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Prueba Ji-Cuadrado de Independencia

Estadística

0

1 0

2 0

3 0

4 0

5 0

6 0

7 0

8 0

A l t o M e d i o B a j o

S i N o

r

1i

c

1j ij

2ijij2

E

)EO(

n

CRE,donde ji

ij

21

2

.C.R

Page 47: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Ejemplo de Prueba Ji-Cuadrado de independencia

Para verificar la suposición de que la fabricación de cierto producto está asociado con enfermedades respiratorias, a 450 trabajadores de una empresa que fabrica el producto se evaluó respecto a la presencia de síntomas de alteraciones respiratorias y se los clasificó a su vez de acuerdo al nivel de exposición al producto. Los resultados se presentan en la tabla siguiente:

Presencia de Síntoma

Nivel de ExposiciónTotal

Alto Medio Bajo

Si 175 43 27 245

No 90 60 55 205

Total 265 103 82 450

Page 48: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

H1: Las alteraciones respiratorias están asociadas a la exposición al producto

H1: Las alteraciones respiratorias están asociadas a la exposición al producto

H0: Las alteraciones respiratorias son independientes de la exposición al producto.

H0: Las alteraciones respiratorias son independientes de la exposición al producto.

Frecuencias Esperadas:

n

CRE ji

ij n

CRE ji

ij

4.37

45082205

nCR

E 3223 Por ejemplo:

Presencia de Síntoma

Nivel de ExposiciónTotal

Alto Medio Bajo

Si 144.3144.3 56.156.1 44.644.6 245

No 120.7120.7 46.946.9 37.437.4 205

Total 265 103 82 450

Page 49: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Estadística

0

1 0

2 0

3 0

4 0

5 0

6 0

7 0

8 0

A l t o M e d i o B a j o

S i N o

2

1i

3

1j ij

2ijij2

E

)EO(

n

CRE,donde ji

ij

21

205.0

.C.R

Page 50: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

4.364504.37

55...

3.144175

nE

O

22

2

1i

3

1j ij

2ij2

4.364504.37

55...

3.144175

nE

O

22

2

1i

3

1j ij

2ij2

Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 2-1)*(3-1)=2 grados de libertad

Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 2-1)*(3-1)=2 grados de libertad

005.0250.000000014.36Pp 22 005.0250.000000014.36Pp 2

2

En conclusión, se rechaza la H0 (p < 0.05), es decir las alteraciones respiratorias están asociadas a la exposición al producto

En conclusión, se rechaza la H0 (p < 0.05), es decir las alteraciones respiratorias están asociadas a la exposición al producto

Page 51: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Distribución F de SnedecorSi y son variables Ji-cuadrado distribuidas en forma independiente con y grados de libertad, respectivamente, la variable

sigue la distribución F con y grados de libertad.

2X

22

11

kZkZ

F 1X

1k 2k

1k 2k

Page 52: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Tabla F de Fisher

α=0.05 con letra normal.

α=0.01 con letra negrita

Page 53: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Ejemplo de uso de la tabla F de Fisher

Page 54: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Ejemplo de Aplicación

De dos aulas de 5ª año de secundaria se tomaron muestras de tamaños 10 y 15 de las notas promedios de alumnos para probar si la dispersión de las notas es la misma para las dos aulas. Los resultados obtenidos son los siguientes:

Aula 1: 15, 16, 12, 14, 14, 15, 16, 13, 14, 15. Aula 2: 12, 14, 15, 16, 16, 17, 15, 16, 18, 14, 12, 15, 16, 14, 13.

40.14x1

87.14x2 600.1S2

1

981.2S22

10n1

15n2

Deseamos probar las hipótesis:

22

210 :H 2

2211 :H

Page 55: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Luego

Si , entonces para las cuantilas y

5367.0981.2600.1

F 05.0

)14,9(F 2/ 2/1

26.0F )14,9( 025.0 21.3F )14,9( 025.0

025.0 025.0

5367.0

Luego concluimos que la dispersión de las notas entre los alumnos para las dos aulas de 5ª año son las mismas, pues no se encuentra diferencia significativa.

26.0 21.3

Page 56: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

La compañía llantera Good Year del Perú, ha efectuado un estudio sobre los hábitos de manejo de varios grupos ocupacionales. En una muestra de 35 profesores universitarios, el número promedio de kilómetros recorridos al año fue de 14,500 con una desviación standart de 3,200 km. En una muestra de 40 dentistas, el kilometraje fue de 13,400, con una desviación standart de 1,950 km.

EJEMPLOEJEMPLO

Se tieneSe tieneSe tieneSe tiene04n ,950,1s ,450,13X

35n ,200,3s ,500,14X

222

111

Page 57: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Primero se verificará la condición siguiente: 1 2

04n 3802500,s ,950,1s ,450,13X35n 10240000,s ,200,3s ,500,14X

22122

12111

Planteamos las Hipótesis:

22

211

22

210 :H :H

22

211

22

210 :H :H

693.23802500

10240000F 693.2

380250010240000

F

Page 58: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Para α=0.05

0.515

0.0250.95

1.9

0.025

9.1F )39,34( 975.0 515.0F )39,34( 025.0

Se rechaza la H0, es decir que 1 2 Se rechaza la H0, es decir que 1 2

2.693

Page 59: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Valores críticosValores críticosValores críticosValores críticos

3.220,10

6.62296.10s*Z0

21 XX

3.220,106.62296.10

s*Z021 XX

211210 :H :H 211210 :H :H

6.62240950,1

35200,3

ns

ns

s22

2

22

1

21

XX 21

6.622

40950,1

35200,3

ns

ns

s22

2

22

1

21

XX 21

Y los valores críticos son: -1,220.3 y +1,220.3Y los valores críticos son: -1,220.3 y +1,220.3Y los valores críticos son: -1,220.3 y +1,220.3Y los valores críticos son: -1,220.3 y +1,220.3

Diferencia de lasmedias muestrales .Km050,1450,13500,14XX 21

Luego, se prueba la hipótesis:

Page 60: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

-1220.3Valor critico

+1220.3Valor critico

+1050 = diferencia observada entre las medias muestrales.

millas 6.622s

2X1X

021 XX

Z= -1.96 Z= +1.96Área =0.025Área =0.025

Se Rechaza Se Rechaza

Se acepta la hipótesis nula

Page 61: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Ejercicio

Como la diferencia entre las medias muestrales es de 1050 millas y se acepta un margen de error de 1220 millas, en consecuencia, no hay diferencias significativas entre los dos grupos

Page 62: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Freddy Lopez, operador de la cadena de restaurantes “Las Tejas””, ha hecho una encuesta entre los clientes en dos ciudades, pues desea averiguar si les gustaría que en el menú se incluyeran sandwiches de jamón y queso. De las 500 personas encuestadas en la capital, 200 contestaron afirmativamente, mientras que 150 de las 300 encuestadas en una ciudad cercana también contestaron afirmativamente. Freddy quiere saber si, en un nivel de 0.05 esos resultados son significativamente diferente.

EJEMPLOEJEMPLO

En resumenEn resumenEn resumenEn resumen030n ,50.0300/150P

500n ,40.0500/200P

22

11

Page 63: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Primero se determinará si se cumple lo siguiente: 1 ≠ 2

Se tieneSe tieneSe tieneSe tiene

Planteamos las Hipótesis:

22

211

22

210 :H :H

22

211

22

210 :H :H

576.00.000830.00048

F 576.00.000830.00048

F

00083.0

30050.050.0

s ,030n ,50.0300/150P

00048.0500

60.040.0s 500,n ,40.0500/200P

2222

2111

Page 64: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Para α=0.05

0.0250.95

0.576

0.025

228.1F )299,499( 975.0 8184.0F )299,499( 025.0

Se rechaza la H0, es decir que 1 ≠ 2 Se rechaza la H0, es decir que 1 ≠ 2

0.8184 1.228

Page 65: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Valores críticosValores críticosValores críticosValores críticos

071.000362.096.10

s*Z021 PP

071.000362.096.10

s*Z021 PP

211210 P P :H P P :H 211210 P P :H P P :H

0362.0n1

n1

P1Ps

n,n de valoreslos como asi

s de fórmula laen 0.4375 p mplazandoRe

4375.0300500

50.030040.0500nn

PnPnP

21PP

21

PP

21

2211

21

21

0362.0n1

n1

P1Ps

n,n de valoreslos como asi

s de fórmula laen 0.4375 p mplazandoRe

4375.0300500

50.030040.0500nn

PnPnP

21PP

21

PP

21

2211

21

21

Y los valores críticos son: -0.071 y +0.071Y los valores críticos son: -0.071 y +0.071Y los valores críticos son: -0.071 y +0.071Y los valores críticos son: -0.071 y +0.071

Diferencia de lasproporciones muestrales

10.050.040.0PP 21

Luego, se prueba la hipótesis:

Page 66: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Se acepta la hipótesis nula

Se rechaza Se rechaza

Z= -1.96 Z= +1.96Área =0.025Área =0.025

021 PP

0362.0s21 PP

-0.071Valor critico

+0.071Valor critico

Diferencia observada entre las proporciones muestrales = (0.40-.050) =-0.10

Page 67: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

Ejercicio

Como la diferencia entre las proporciones muestrales es de -0.10 y se acepta un margen de error de 0.0710.071, en consecuencia, si hay diferencias significativas entre los dos grupos

Page 68: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006

FIN

MUCHAS GRACIAS