7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 1/49
PRUEBAS CON LA BINOMIALYCUANTILES
UNIVERSIDAD DEL VALLEESCUELA DE ESTADISTICA
ESTADISTICA NO PARAMETRICA
PROFESOR GABRIEL CONDE A.
Nota: Presentación basada en notas de clase del profesor Mario César Jaramillo
de la UNAL, Medellín
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 2/49
DISTRIBUCION BERNOULLI
Definamos la variable aleatoria discreta X así:
X = 1; si se observa éxito
X = 0; si se observa fracaso
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 3/49
Si p es la probabilidad de éxito tendremos entoncesuna función de masa de probabilidad para la variable
aleatoria X tal como
Diremos que la variable aleatoria X tiene distribución
Bernoulli de parámetro p. Además su media es =E[X] = p y su varianza es Var(X) = (1 - p)p.
0xsi p;1
1xsi p;
(x)PX
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 4/49
DISTRIBUCIÓN BINOMIAL.CARACTERISTICAS
El experimento consta de n pruebas idénticas.
Cada prueba tiene dos resultados posibles: E = éxito;
F = fracaso
La probabilidad de tener éxito en una sola prueba esigual a p y es constante en todas las pruebas.
Las pruebas son independientes.
La variable aleatoria de interés es X, el número deéxitos observados en las n pruebas.
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 5/49
La función de masa de la distribución
Binomial[n, p] es
Además: E(X) = np y Var(X) = np(1 - p).
n0,1,2,x; p)(1 px
nx)f(X xnx
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 6/49
npq
0.5np bΦ
npq
0.5np bΦdye
2π
1q p
k
n npq
0.5np b
npq
0.5-npa
0.5yk nk b
ak
2
LA APROXIMACIÓN DE LA BINOMIAL MEDIANTE LA DISTRIBUCIONNORMAL[E. Parzen (1973). Capítulo 6, páginas 265 a 273 y W. Feller (1968).Capítulo VII páginas 174 a 186]
ENUNCIADO: La probabilidad de que un fenómeno aleatorio regido
por la ley de probabilidades binomial con parámetros n y p (q = 1 -p) tenga un valor observado que esté entre a y b inclusive, para
cualesquiera enteros a y b, se determina aproximadamente por:
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 7/49
PRUEBAS CON LA BINOMIAL
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 8/49
PRUEBAS CON LA BINOMIAL
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 9/49
PRUEBAS CON LA BINOMIAL
pre-establecida.
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 10/49
PRUEBAS CON LA BINOMIAL
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 11/49
PRUEBAS CON LA BINOMIAL
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 12/49
PRUEBAS CON LA BINOMIAL
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 13/49
PRUEBAS CON LA BINOMIAL
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 14/49
Ejemplo: Bajo la teoría Mendeliana, en un cruce entre plantas de
genotipos se puede esperar que se produzcan hijas, 1 / 4 de las cuales
son enanas y 3 / 4 son altas. En un experimento para evaluar si elsupuesto simple de herencia Mendeliana es razonable en una cierta
situación, un cruce produjo 3 (243) plantas enanas y 13 (682) plantas
altas, en este caso ¿será aceptable este supuesto de herencia
Mendeliana?
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 15/49
Ejemplo: Se estima que al menos la mitad de los hombres que se
someten a una operación de cáncer sufren un efecto secundario
indeseable. En un esfuerzo para reducir este efecto el HUV estudiaun nuevo método de realizar la operación. De 19 operaciones sólo 3
pacientes sufren el efecto secundario. ¿Es seguro concluir que el
nuevo método para operar es efectivo en la reducción del efecto
secundario?
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 16/49
Sea p la probabilidad de que el paciente experimente efectos
secundarios:
Ho: p 0.5 vs H1: p < 0.5
La región de rechazo es {T: T 5} con (real) = 0.0318 pero podemos
tomar = 0.05
El valor observado es T = 3 rechazamos Ho
Concluimos que el nuevo procedimiento es efectivo para reducir los
efectos secundarios.
El valor p = P(T 3) = 0.0022
que es bastante pequeña , los datos de la muestra están en fuerte
desacuerdo con Ho.
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 17/49
PRUEBA SOBRE CUANTILES
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 18/49
PRUEBA SOBRE CUANTILES
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 19/49
PRUEBA SOBRE CUANTILES
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 20/49
PRUEBA SOBRE CUANTILES
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 21/49
PRUEBA SOBRE CUANTILES
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 22/49
PRUEBA SOBRE CUANTILES
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 23/49
PRUEBA SOBRE CUANTILES
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 24/49
PRUEBA SOBRE CUANTILES
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 25/49
PRUEBA SOBRE CUANTILES
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 26/49
EJEMPLO DE CUANTILES
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 27/49
Q 3 = X75, entonces:
H0 : P(X 193) 0.75 y P(X < 193) 0.75
H1 : 193 no es el cuartil superior poblacional
Encontremos la región crítica con = 0.05
Sea Y b(15; 0.75), usando tabla de la binomial tenemos:
P(Y 7) = 0.0173 y P(Y 8) = 0.0566, luego t1 = 7
P(Y 13) = 0.9198 = 1 – 0.0802 y P(Y 14) = 0.9866 = 1 – 0.0134luego t2 = 14 1 = 0.0173 y 2 = 0.0134, 1 + 2 = 0.0307.
Rc = {(T1; T2): T1 7 ó T2 14};
Resultados: T1 = 7 y T2 = 6.
Como T1 = 7 7 se rechaza H0, es decir, hay evidencia
muestral de que el cuartil superior del puntaje de admisión no es
193, con = 0.05.
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 28/49
LA PRUEBA DE SIGNOS
Los datos consisten de n’ observaciones en una muestra aleatoria
bi-variada (X1, Y1), … , (Xn; Yn ), donde las Xs y las Ys son
dependientes, es decir, la muestra es pareada.
Para cada par (Xi, Yi) se compara Xi con Yi, si Xi < Yi el par es
clasificado con "+", si Xi > Yi el par es clasificado con “-", y si Xi = Yi
el par es clasificado con "0". De esta manera la escala de
mediciones debe ser por lo menos ordinal.
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 29/49
SUPUESTOS:
1. Las variables aleatorias bivariadas (Xi; Yi) i = 1, 2, …, n son
mutuamente independientes.
2. La escala de medida es al menos ordinal dentro de cada par.
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 30/49
El estadístico de prueba es T = # pares con ”+” (o sea con X < Y)
Distribución bajo Ho: T es binomial con p = ½ y n = # pares sinempates. O sea n = [# de “+”] + [# de “-”]
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 31/49
A. (test de 2 colas).
Ho : P(+) = P(-) vs H1: P(+) P(-)
Para n 20 usamos la tabla de la binomial con el apropiado valor de
n y p = 1/2 . Seleccionamos de la tabla el valor de /2 (lo llamamos
1), el valor de Y correspondiente lo llamamos t . La región crítica de
tamaño 21 corresponde al valor de T t ó T n – t. Rechazamos Hosi T t ó T n-t con un nivel de significancia 21. De otra manera
aceptamos Ho.
Para n > 20 usamos la aproximación normal: t = ½(n + Z/2n) [*]Nota: Si = 0.05 podemos tomar t = n/2 - n
El valor p = 2min(P(Y Tobs, Y Tobs)
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 32/49
B. (test cola inferior)
Ho: P(+) P(-) vs H1: P(+) < P(-)
Rc = {T: T t} cuando n 20.
P(Y t) con Y b(n; 1/2)
Rechazamos Ho si T t, a un nivel de significancia
Si n > 20 se usa la aproximación normal [*]
Valor P = P(Y Tobs) con Y b(n; 1/2)
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 33/49
C. (test de cola superior)
Ho: P(+) P(-) vs H1: P(+) > P(-)
Rc = {T: T n – t} cuando n 20.
t lo calculamos como en B, es decir P(Y t) con Y b(n; 1/2)
Si n > 20 se usa la aproximación normal [*]
Valor P = P(Y Tobs) con Y b(n; 1/2)
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 34/49
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 35/49
SOLUCIÓN:
El + representa el evento de que el artículo B es preferido sobre el
artículo A
Ho : P(+) P(-) vs P(+) > P(-)
el número de +'s = 8, el número de -'s = 1, el número de empates = 1.Entonces n = 8 + 1 = 9, T = 8.
De la tabla de la binomial con n = 9, p = 0.5, = 0:05, se tiene que:
valor P = P(T 8) = 1 - P(T 7) = 1 – 0.9805 = 0.0195.
Como el valor P < rechazamos Ho, es decir, hay evidencia muestral
para pensar que el consumidor prefiere el artículo B sobre el artículo
A, con = 0:05.
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 36/49
Ejemplo histórico: En lo que fue, quizás, el primer reporte de un test no
paramétrico, Arbuthnott (en 1710) examinó los archivos de nacimientos
disponibles en Londres, durante 82 años y para cada año comparó el
número de varones nacidos con el número de mujeres nacidas. Si paracada año se denota el evento “nacieron más varones que mujeres” con el
signo “+” y el contrario con el signo “–”. Consideremos la prueba:
Ho: P(+) = P(-) vs Ha: P(+) P(-)
Usamos la aproximación normal dada por [*] para calcular la región crítica
con = 0.05 correspondiente a T < t donde
t = 0.5(82 – 1.9682) = 32.1.
y el valor de T > t con n – t = 82 – 32.1 = 49.9.
De los registros Arbuthnott obtuvo 82 signos + (ningún “–” y ningún
empate). Rechazamos Ho. Ejercicio: calcular el valor p.
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 37/49
Ejercicio: El tiempo de reacción antes del almuerzo fue
comparado con el tiempo de reacción después del almuerzo con
un grupo de 28 trabajadores de oficina, de los cuales 22 tuvieron
una reacción más corta antes del almuerzo y 2 no presentarondiferencias. ¿Es el tiempo de reacción antes del almuerzo
significativamente más corto que el tiempo de reacción después
del almuerzo? use = 0.1
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 38/49
La prueba McNemar de significancia de cambios
Es un método no paramétrico que se usa para analizar
datos nominales.
Se aplica para tablas de contingencia 2x2 donde se
registra una característica dicotómica sobre sujetos
pareados (matched pairs)
Su finalidad es evaluar si las frecuencias marginales de fila
y columna son iguales
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 39/49
Los datos consisten de n’ observaciones independientes
de variables aleatorias bi-variadas (Xi; Yi), i = 1, 2, …, n’
Las parejas son independientes y las observaciones
dentro de la pareja son dependientes.
Xi representa la condición de un sujeto antes de unexperimento y Yi representa la condición del sujeto
después del experimento.
La escala de medida de Xi y Yi es nominal con 2 categorías
Los datos se presentan por medio de una tabla 2x2
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 40/49
Consideramos la diferencia de probabilidades:
P(Xi = 0; Yi = 1) - P(Xi = 1; Yi = 0)
Esta puede ser negativa, positiva o cero para todo i.
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 41/49
Estadísticos de prueba:
Si b + c > 20, el estadístico de prueba es:
Si b + c 20 se usa mejor T2 = b
T1 y T2 tienen las siguientes distribuciones:
T1 2(1) y T2 b(n = b+c, ½)
Hipótesis:
H0 : P(Xi = 0; Yi = 1) = P(Xi = 1; Yi = 0); i
H1 : P(Xi = 0; Yi = 1) P(Xi = 1; Yi = 0) para algún i.
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 42/49
Sea n = b + c. Si n 20, usamos la tabla de la distribución
binomial. Si es el nivel de significancia entrar a la tablacon n = b + c y p = ½ y encontrar la abscisa aproximada
para /2 (llamar a este valor 1) y al correspondiente valor
llamarlo t. Rechazar Ho si T2 t ó T2 n – t a un nivel de
significancia de 21, de lo contrario aceptar Ho. El valor pes 2min[P(Y Tobs, Y Tobs)], donde Y b(n = b+c, ½).
Si n > 20 usar T1 con la tabla de la distribución 2(1) ,
rechazar Ho con un nivel de significancia si T1 > 2(1)(1-).El valor p = P[T1 > Tobs] con T1 2
(1)
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 43/49
Ejercicio en clase:
1) Preguntas:
¿De que manera la prueba de McNemar se adapta a una
prueba de signos? ¿Porqué, en los estadísticos de prueba, sólo
se consideran las cantidades b y c?
¿Porqué para n > 20 se puede usar una distribución 2(1)(1-),
para definir la región de rechazo?
2) Leer y entender la presentación de la prueba de McNemar
y los ejemplos en el texto de Castillo y Ojeda (páginas 29 a 35)
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 44/49
Ejemplo
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 45/49
Consideremos las parejas (Xi, Yi) donde Xi = 0 si la i-
esima persona favorece a los demócratas antes ó Xi = 1si favorece a los republicanos antes. Yi representa la
escogencia después del debate.
Yi
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 46/49
Consideremos las parejas (Xi, Yi) donde Xi = 0 si la i-
esima persona favorece a los demócratas antes ó Xi = 1si favorece a los republicanos antes. Yi representa la
escogencia después del debate.
Yi
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 47/49
H0 : La población de votantes a favor no altera su decisión
después del debate.
H1 : Después del debate hay un mayor cambio a favor delRepublicano, que a favor del Demócrata.
H0 : P(Xi = 0; Yi = 1) = P(Xi = 1; Yi = 0) vs
H1 : P(Xi = 0; Yi = 1) > P(Xi = 1; Yi = 0)
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 48/49
Solución:
7/23/2019 Clase 2- No Parametrica - Pruebas Con La Binomial
http://slidepdf.com/reader/full/clase-2-no-parametrica-pruebas-con-la-binomial 49/49
BIBLIOGRAFIA
Jaramillo, M. C. “Estadística no Paramétrica. Notas de Clase”.
Universidad Nacional de Colombia, Medellín 2012. La mayoría de los
ejemplos y textos fueron tomados de estas notas.
Castillo A. y Ojeda M. M. “ Principios de Estadística no Paramétrica”.Universidad Veracruzana. Mexico 1994.
Conover W. J. “Practical Nonparametric Satatistics”. 3ª edición. Jhon
Wiley & Sons. N. Y. 1999.