“ pruebas estadísticas para una muestra” el consumo y producción del pan; distribución de...
TRANSCRIPT
“Pruebas estadísticas para una muestra”
El consumo y producción del pan; Distribución de fármacos y
placebos
Andrés Cárcamo
Camila López
Tábata Torres
Determinar si la muestra proviene de
una determinada población
Pruebas de bondad de ajuste para una muestra
Prueba Tipo de variable Objetivo
Binomial Cualitativa:
2 valores
Determinar si las diferencias entre las proporciones de cada uno de los 2 valores de la variable y unas determinadas proporciones teóricas son estadísticamente significativas.
Ji- Cuadrdo Cualitativa:
K> 2 valores
Determinar si las diferencias entre las frecuencias de cada uno de los valores de la variable y unas determinadas frecuencias teóricas son estadísticamente significativas.
Datos: Se desea
comprobar el efecto de un medicamento
Muestra de 100 pacientes
80 de ellos son fumadores
Al final solo se obtiene el resultado de 79 de ellos
X= FUMADOR (pacientes fumadores) X1: SI (codificado numéricamente como 1) X2: NO (codificado numéricamente como 2)
Ho: p=p (fumador=1) = 0,8gresarían de la siguiente manera
Utilizando el programa SPSS los datos se ingresarían de la siguiente manera:
Analizar → Pruebas no paramétricas → Binomial (en el cuadro de diálogo)
Contrastar Variables: FUMADORDefinir la dicotomía: Obtener de los datosContrastar proporción: 0,80Aceptar
Y los resultados serían los siguientes
Pacientes Fumadores
Categoría NProporción observada
Prop. De prueba
Sig. Asintot.(bilateral)
Grupo 1 SI 53 0,7 0,80 0,003
Grupo 2 NO 26 0,3
Total 79 1,00
Parámetros de la distribución Binomial:
Hay que comparar el número esperado del primer grupo con el numero observado
Np = 79 x 0,8 = 63,2
Como el p-valor asociado al estadístico de contraste es menor que 0,05 (nivel de significación) se rechazará la hipótesis nula.
Dado que la diferencia entre lo esperado y lo observado es estadísticamente significativo
En este caso no se puede aceptar la muestra, dado que no es representativa de la población objeto.
N= 79
P = pe = 0,8
Datos: Se desea comprobar el
efecto de un tratamiento Muestra de 120 pacientes
que han infarto al miocardio
Pacientes con Infarto con localización anterior o inferior son iguales y el doble de los pacientes con el infarto en localización lateral o posterior
Solo se conoce el resultado de 103 pacientes
X: Infarto (Localización del infarto) X1: Anterior (codificado numéricamente como 1) X2: Inferior (codificado numéricamente como 2) X3: Lateral (codificado numéricamente como 3) X4: Posterior (codificado numéricamente como 4) H0: p1= p (INFARTO =1) = 2/6 p2= p (INFARTO= 2) =2/6 p3= p (INFARTO= 3) = 1/6
p4= p (INFARTO= 4) = 1/6
Y los resultados serían los siguientes:
Localización del infarto de miocardio
Estadísticos de Contraste
Localización del infarto de miocardio
Chi- Cuadrado 0,252
Gl. 3
Sig. Asintot 0,969
N observado N esperado Residual
Anterior 33 34,3 -1,3
Inferior 34 34,3 -0,3
Lateral 17 17,2 -0,2
Posterior 19 17,2 1,8
Total 103
Función de Distribución normal
Función teórica
•D= máx.| Fn (x) – F0(x) |
Interesa probar que no existe diferencia
significativa entre ambas funciones
Contrastes de Normalidad
•Comprueba
•Verifica
•Hipótesis de normalidad
•Resultados fiables
KGPN
20
Parámetros normales(a,b)
Media6,1450
Desviación típica
1,79428
Diferencias más extremas Absoluta,123
Positiva,123
Negativa-,072
Z de Kolmogorov-Smirnov
,551
Sig. asintót. (bilateral),922
Pruebas no paramétricasPrueba de Kolmogorov-Smirnov para una muestra
a La distribución de contraste es la Normal.b Se han calculado a partir de los datos.
KOLMOGOROV-KOLMOGOROV-SMIRNOV-SMIRNOV-LILLIEFORSLILLIEFORS
KOLMOGOROV-SMIRNOV-LILLIEFORS
Distribución esperada es normal
Conlleva a la obtención de datos mas exactos
Tipificación de datos
Nuevas variables
N Mínimo Máximo Media Desv. típ.KGP
20 3,50 9,70 6,1450 1,79428
LIC
20 1,25 2,27 1,7742 ,29790
N válido (según lista)
20
•Estadísticos descriptivos
Valor observado
10864
Nor
mal
esp
erad
o
2
1
0
-1
-2
Gráfico Q-Q normal de KGP
Valor observado
10864
Des
v. d
e no
rmal
0,4
0,2
0,0
-0,2
-0,4
Gráfico Q-Q normal sin tendencias de KGP
Gráficos de probabilidad normal para la variable ZIC
Valor observado
210-1-2
Nor
mal
esp
erad
o
2
1
0
-1
-2
Gráfico Q-Q normal de Puntua(LIC)
Valor observado
210-1-2
Des
v. d
e no
rmal
0,3
0,2
0,1
0,0
-0,1
-0,2
-0,3
Gráfico Q-Q normal sin tendencias de Puntua(LIC)
Gráficos de probabilidad normal para la variable ZLIC
Pruebas de Rachas
•Pruebas de Autocorrelación
La prueba de rachas sirve para determinar si una muestra de observaciones es o no aleatoria.
O sea si son independientes entre si.
• Por ejemplo : Lanzamos una
moneda
Y resulta
CCCXCCXXXC
•Donde
•CCC X CC XXX C
•Equivalen a 5 rachas
•5•4•3•2•1
En este caso tomamos la producción del pan
Donde se usan las formulas:
•Con un grado de significación del 0,05.
La hipótesis nula de este problema es que la cantidad de pan comprado
posee una distribución
aleatoria de gente que compra más de 5.9 kg de pan semanalmente.
Acá trabajando con la base de datos del número de kilos comprados semanalmente
Se obtiene:
KGPValor de prueba(a)
5,90
Casos < Valor de prueba
10
Casos >= Valor de prueba
10
Casos en total
20
Número de rachas
10
Z
-,230
Sig. asintót. (bilateral)
,818
Para poder contrastar la hipótesis nula se tiene que cumplir con esta condición
α > Sig. Asintot. (bilateral)
•¡LA HIPÓTESIS NO SE PUEDE CONTRASTAR!
La autocorrelación surge cuando los términos de error del modelo no son independientes entre sí
•Por ejemplo: E(uj;ui) ≠ 0 para todo i≠j . Los errores se vincularían entre si.
En este tipo de prueba se trabaja con
Con α = 0.05
• Supóngase que en una panadería se sospecha que el número de
personas que compran pan varía en función a día de semana, por lo que según el día, el n° de kilos de
pan cocinados pueden ser deficientes o excesivos. Con el fin de elaborar un numero de kilos de
pan eficientes, se observa, a lo largo de 2 semanas, el n° de
personas que acuden a comprar el pan, para comprobar si lo que
ocurre es independiente de lo que se haya ocurrido en los días
anteriores se aplicará la prueba de autocorrelación.
• Supongamos que se dispone de una muestra de una población y que, sobre cada individuo de la
muestra, se mide una variable en escala de intervalo o de razón X.
Con una base de datos de: días en cual se compra el pan, y numero de kilos por día comprado se obtiene un grafico así:
panaderia
0
10
20
30
40
50
60
70
Lunes
Marte
s
Mierco
les
Jueves
Viernes
Sabado
Domingo
Dias de semana
Kilo
s de
pan
Primera semana Segunda Semana
Y con el programa SPSS se obtiene el siguiente resultado:
Con un total de 20 casos
Se obtiene un valor De “Auto-Corr. > α”
•¡LA HIPÓTESIS NO SE PUEDE CONTRASTAR!
•