![Page 1: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/1.jpg)
1
14. Contrastes no paramétricos
![Page 2: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/2.jpg)
Contrastes no paramétricos En la lección anterior nos hemos ocupado de contrastes paramétricos. Determinábamos la plausibilidad de ciertas hipótesis sobre los valores de parámetros poblacionales. Los contrastes no paramétricos hacen referencia a la distribución poblacional en su conjunto: (1) Cómo podemos decidir a partir de una muestra si la población sigue (“ajusta”) a una determinada distribución dada (problema de bondad de ajuste). (2) ¿Estas muestras provienen de poblaciones con la misma distribución? (problema de la homogeneidad). (3) ¿Son independientes o dependientes varias características poblacionales?
2
![Page 3: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/3.jpg)
Prueba de bondad de ajuste χ2
Supongamos una muestra aleatoria simple de tamaño n. Desconocemos que la distribución de probabilidad f de la población. Contrastaremos la hipótesis: H0: f = f0 y H1: f ≠ f0 Es decir: queremos contrastar si la distribución desconocida f de la población es f0, que conocemos completamente (por ejemplo, una distribución de Poisson determinada). Usaremos la distribución chi-cuadrado para determinar la bondad de ajuste entre las frecuencias observadas de los datos de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la de la población.
3
![Page 4: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/4.jpg)
Procedimiento: (1) Dividimos el dominio completo de la distribución teórica
f0 en k clases o intervalos disjuntos. Calculamos el número de datos esperados, según la distribución teórica a contrastar f0 , que deberían haber caído en cada clase. Para ello basta multiplicar la probabilidad que asigna f0 a cada clase por n, el tamaño muestral. Hemos de construir las clases de modo que cada una
contenga al menos 5 datos muestrales. Tenemos pues: A1, A2, ... ,Ak clases con n1
esp, n2esp, ... ,nk
esp datos muestrales en cada clase, donde todos valores tienen que ser mayores o iguales a 5.
4
![Page 5: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/5.jpg)
Ejemplo: Durante 200 días se han recogido el número de accidentes de tráfico diarios:
Número de accidentes 0 1 2 3 4 5 6 7
Número de días 22 53 58 39 20 5 2 1
(1) Creemos que el número de accidentes se distribuye como una Poisson de media 2 (hipótesis nula).
Núm. de accidentes 0 1 2 3 4 ≥5
N. esperado de días 27,06 54,14 54,14 36,08 18,04 10,54
41.2012.0200;012.0!6
2)6(6
2 =×=== −exP
Calculamos los valores esperados a través de la Poisson. Aquí la probabilidad será de 5 a infinito.
5
![Page 6: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/6.jpg)
Procedimiento: (2) Ahora construimos las mismas k clases o intervalos disjuntos para los datos muestrales. Tendremos también: A1, A2, ... ,Ak clases con n1, n2, ... ,nk datos muestrales en cada clase.
Número de accidentes 0 1 2 3 4 5 6 7
Número de días 22 53 58 39 20 5 2 1
Número de accidentes 0 1 2 3 4 ≥5
Número de días 22 53 58 39 20 8
Ajustamos al número de clases que nos determinó la distribución a contrastar.
Estos son los datos originales:
6
![Page 7: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/7.jpg)
Realizaremos el test de constraste utilizando el estadístico chi-cuadrado siguiente:
( )∑=
−=
k
i i
ii
EEn
1
22
ˆˆ
χ
que sigue una distribución chi-cuadrado con k-1 grados de libertad. En nuestro ejemplo tenemos k = 6 clases. Luego:
307.254.10
)54.108(...06.27
)06.2722(ˆ
)ˆ( 226
1
22 =
−++
−=
−=∑
=i i
ii
EEnχ
Frecuencias esperadas
Frecuencias muestrales
7
![Page 8: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/8.jpg)
307.22 =χNuestro estimador chi-cuadrado vale: El estimador se distribuye como: Supongamos que queremos:
0.05
25
216
21 χχχ == −−k
07.11205.0,5 =χ
02 07.11307.2 HrechazarpodemosNo⇒<=χ
05.0=α
07.11205.0,5 =χ
En las tablas encontramos:
8
![Page 9: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/9.jpg)
![Page 10: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/10.jpg)
![Page 11: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/11.jpg)
![Page 12: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/12.jpg)
![Page 13: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/13.jpg)
Hipótesis compuesta
Primero estimaremos por el método de máxima verosimilitud el valor del parámetro θ:
( )
∑
∏
=
=
−
−−=
∑==
n
iin
n
i
x
nin
xnLn, θ,...,xL(xLn
exf, θ,...,xL(x i
11
1
1
1
1)
1,)
θθ
θθ θ
13
![Page 14: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/14.jpg)
0ˆˆ2
ˆ
2)
1ˆ
01)
32
ˆ132
ˆ2
12
1
12
1
<−=
−=∂
∂
=⇒
=+−=∂
∂
===
=
=
∑
∑
∑
θθ
θ
θθ
θ
θθ
θθθθ
nn
xnθ
, θ,...,xL(xLn
xn
xnθ
, θ,...,xL(xLn
n
ii
n
n
ii
n
ii
n
14
![Page 15: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/15.jpg)
67.220ˆ ==∑∑
i
ii
nxn
θ
Duración 0-200 200-300 300-400 400-500 500-600
# bombillas ni 40 15 8 6 6
xi 100 250 350 450 550
El valor estimado de θ será:
15
![Page 16: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/16.jpg)
59.067.220
1)2000(ˆ
:ˆ1)(ˆ
67.220/20067.220/0
67.220/200
01
ˆ/ˆ/ˆ/
=−
==<<=
−==<<=
−−
−
−−−
∫
∫
ee
dxexPp
ejemploPor
eedxebxaPp
x
baxb
aiθθθ
θ
Duración 0-200 200-300 300-400 400-500 500-600
# bombillas ni 40 15 8 6 6
xi 100 150 350 450 550
0.59 0.15 0.09 0.06 0.04
Ahora calculamos las probabilidades esperadas:
ip̂
Aquí la probabilidad será de 500 a infinito.
16
![Page 17: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/17.jpg)
Duración 0-200 200-300 300-400 400-500 500-600
# bombillas ni 40 15 8 6 6
xi 100 150 350 450 550
0.59 0.15 0.09 0.06 0.04
44.70 11.04 7.02 4.46 2.84
Y a partir de ellas podemos calcular los valores esperados de las muestras:
ip̂
70.4459.0)6681540(ˆˆ:ˆˆ
11 =⋅++++==
=
pnE
ejemploPorpnE ii
ii pnE ˆˆ =17
![Page 18: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/18.jpg)
Como la penúltima categoría da un valor menor que 5, unimos las dos últimas:
0.59 0.15 0.09 0.06 0.04
100 150 350 450 550 xi
44.70 11.04 7.02 4.46 2.84
40 15 8 6 6 # bombillas ni
0-200 200-300 300-400 400-500 500-600 Duración
ip̂
ii pnE ˆˆ =
7.30
08.530.7
)30.712(...70.44
)70.4440(ˆ
)ˆ( 224
1
22 =
−++
−=
−=∑
=i i
ii
EEnχ
12
18
![Page 19: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/19.jpg)
08.52 =χNuestro estimador chi-cuadrado vale: El estimador se distribuye como:
0.05
22
2114
21 χχχ ν == −−−−k
99.5205.0,2 =χ
99.5205.0,2 =χ
02 99.508.5 HrechazarpodemosNo⇒<=χ
Esta es la diferencia fundamental con el caso anterior. Al número de clases k hay que restarle 1 y el número de parámetros que previamente hemos estimado. En este caso: ν = 1.
19
![Page 20: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/20.jpg)
20
![Page 21: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/21.jpg)
21
![Page 22: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/22.jpg)
Los Borg en Star Trek
Inteligencia colectiva
![Page 23: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/23.jpg)
El público presente corre los 100 metros lisos.
Habrá una mejor marca. Ahora, el promedio, ¿estará por encima o por debajo?
![Page 24: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/24.jpg)
La nota media, el salario medio, la altura media,... parece, que en general, promedio es igual a mediocridad. Sin
embargo, en la toma de decisiones o en las estimaciones, a veces, el promedio colectivo puede ser excelente.
![Page 25: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/25.jpg)
Veamos un ejemplo: “¿Quién quiere ser millonario?”
Opción de llamada Opción del público
Aciertan el 65% de las veces. Aciertan el 90% de las veces.
![Page 26: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/26.jpg)
Un experimento clásico de inteligencia de grupo
“¿Cuántos caramelos hay en el tarro?”
La media fue de 143, un error de un 6 por ciento.
En el tarro había 153 caramelos. Grupo de 53 estudiantes.
![Page 27: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/27.jpg)
Nieves Concostrina 45 años media: 50. Pancracio Celdrán 65 años media: 58. Jose Manuel Sánchez 56 años media: 52. Nieves 69 kilos estimaron 66 kilos Pancracio 69 kilos estimaron 75 kilos Jose Manuel 83 kilos estimaron 82 kilos. Hubo nueve personas que hicieron mejor estimación, en valor absoluto que la media del grupo.
Estimar el peso y la edad de tres de nuestros colaboradores solamente por su voz en antena
![Page 28: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/28.jpg)
Si sumamos los pesos de Nieves, Pancracio y el comisario, tenemos 221 kilos y la media es 223: ¡sólo 2 kilos de más! Y si sumamos las edades, el resultado es de 166, cuando el grupo estimó 160: 6 años de menos. Tomando así las cosas, nadie en particular se acercó más que la media. Y si nos inventamos los kilo-años, el total sería de 387 kilo-años y el grupo dijo 383: ¡solo 4 kilo-años menos!
Estimar el peso y la edad de tres de nuestros colaboradores solamente por su voz en antena
![Page 29: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/29.jpg)
En cierto modo, cada miembro del colectivo contribuye con información fetén
+ error, y en el promedio, los errores se compensan. De modo que, dadas las circunstancias adecuadas, los grupos
manifiestan una inteligencia notable, con frecuencia superando a sus miembros
más inteligentes o informados.
![Page 30: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/30.jpg)
¿Se está usando este conocimiento para mejorar los resultados en alguna
actividad? Todos conocemos los sondeos de intención de voto a pie de urna. A partir de esa muestra se hace una predicción del resultado de
las elecciones.
Existe una alternativa que utiliza la sabiduría colectiva: consiste en preguntar a un conjunto de personas, no qué van a votar, sino que predigan qué votará el conjunto del país. En Internet pueden encontrar los resultados de algunos experimentos. Tienen que buscar por IEM, Iowa Electronic Markets. Y comprobarán que sorprendentemente las predicciones del colectivo son mejores que las clásicas encuestas.
![Page 31: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/31.jpg)
¿Existirá algo así como creatividad artística colectiva?
Karaoke
![Page 32: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/32.jpg)
“Experto en cocina marítima” de los “No me pises que llevo chanclas”.
¿Existirá algo así como creatividad artística colectiva?
Karaoke
![Page 33: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/33.jpg)
Pablo
Sergio
Ana
Grupo
![Page 34: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/34.jpg)
A
C
B
... con Kevin McCourt (1) Cuadros colectivos (2) Relatos colectivos
![Page 35: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/35.jpg)
Prueba de homogeneidad
Supongamos que disponemos de los datos de m muestras aleatorias y deseamos saber si podemos decidir si provienen de la misma distribución poblacional.
mnnnn +++= ...21Tamaño total de todas las muestras.
Tamaño de la muestra m.
Nuevamente hemos de dividir el conjunto de observaciones en k clases: A1, A2, ... ,Ak clases determinadas por los valores esperados (en cada clase, todos valores mayores o iguales a 5). Pero ahora lo haremos m veces. 35
![Page 36: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/36.jpg)
El estadístico de contraste será ahora:
∑∑= =
−
=m
i
k
jtotalii
totalii
ij
nEE
nEEn
1 1
2
2
ˆˆ
ˆˆ
χ
Frecuencia muestral de la clase j de la muestra i
Número total de elementos de la muestra i
Suma de las frecuencias muestrales de todas las clases número i
El estadístico seguirá una distribución chi-cuadrado de (m-1)(k-1) grados de libertad. 36
![Page 37: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/37.jpg)
37
![Page 38: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/38.jpg)
Prueba de independencia Supongamos que de n elementos de una población se han observado dos características X e Y. Es decir: disponemos de los datos de una muestra aleatoria simple bidimensional:
),(),...,,(),,( 2211 nn yxyxyx
Deseamos contrastar si las características poblacionales X e Y son independientes o no. Nuevamente hemos de dividir el conjunto de observaciones en k clases: A1, A2, ... ,Ak clases determinadas por los valores esperados de X y en r clases: B1, B2, ... ,br para Y. (De nuevo en cada clase, todos valores mayores o iguales a 5) 38
![Page 39: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/39.jpg)
El estadístico de contraste será ahora:
∑∑= =
−
=k
i
r
jtotalj
totali
totalj
totali
ij
nEE
nEE
n
1 1
2
2
ˆˆ
ˆˆ
χ
Frecuencia muestral de la clase (i, j) (X,Y).
Número total de elementos de la clase j de Y con el resto de clases de X
Número total de elementos de la clase i de X con el resto de clases de Y
El estadístico seguirá una distribución chi-cuadrado de (k-1)(r-1) grados de libertad. 39
![Page 40: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/40.jpg)
40
![Page 41: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/41.jpg)
Contraste de Kolmogorov-Smirnov
El contraste K-S de bondad de ajuste es válido solo para distribuciones continuas. (1) Se ordenan los n valores muestrales:
nxxx ≤≤≤ ...21
(2) Se calcula la distribución empírica de la muestra:
≥+≤≤
<=
n
rrn
xxxxxnr
xxxF
11/
0)(
1
41
![Page 42: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/42.jpg)
Se calcula la discrepancia máxima, que será el estimador que usaremos, entre la función de distribución empírica que acabamos de calcular y la distribución teórica F0 que estamos contrastando:
|)()(| 0 xFxFmáx nn −=∆
cuya distribución es conocida y tenemos tabulada según los valores de n.
42
![Page 43: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/43.jpg)
![Page 44: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/44.jpg)
![Page 45: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/45.jpg)
![Page 46: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/46.jpg)
![Page 47: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/47.jpg)
![Page 48: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/48.jpg)
![Page 49: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/49.jpg)
![Page 50: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/50.jpg)
50
![Page 51: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/51.jpg)
51
![Page 52: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/52.jpg)
52
![Page 53: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/53.jpg)
53
![Page 54: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/54.jpg)
54
![Page 55: 14. Contrastes no paramétricos - matap.dmae.upm.es · de la muestra, frecuencias muestrales, y las frecuencias esperadas (teóricas) según la distribución que sospechamos es la](https://reader030.vdocuments.co/reader030/viewer/2022020121/5bad2eb509d3f217678c846e/html5/thumbnails/55.jpg)
55