medidas de dispersión - maestrÍa en...
Post on 11-May-2020
16 Views
Preview:
TRANSCRIPT
Revisamos la tarea de la clase pasada Distribución de Frecuencias de las distancias alcanzadas por las pelotas de golf nuevas:
Dato Frecuencia
Dato Frecuencia
Dato Frecuencia
Dato Frecuencia
223.7 1 224.4 1 226.9 1 232.3 1 232.7 1 233.5 1 237.4 1
239.9 1 243.6 1 247.2 1 248.3 1 249.2 1 252.8 1 253.6 1
256.3 1 256.5 1 258.8 1 260.4 1 264.3 1 265.1 1 267.5 1
269.6 1 271.4 1 278.7 1 294.1 1 Total 25
Moda: no hay moda
Mediana: 132
1252
1=
+=
+=
Nn 8252.Mediana =
La media es: 25
5831== ∑
Nx
x i = 251.68
Ahora vamos a agrupar estos datos para ver si nos proporcionan más información: 1° Rango 47072231294 ...R =−= 2° Número de intervalos de clase: 525 ==in (como es impar así la dejamos)
3° Ancho de los intervalos de clase: 11408145
470 ...i ≈== (como el orden de
los datos es hasta el primer decimal, así lo dejamos). 4° Con esto vamos a determinar los intervalos de clase, la primera columna de nuestra tabla de distribución de frecuencias con datos agrupados, vamos a poner de una vez, las columnas que sabemos necesitamos para construir el diagrama de pastel, el histograma polígono de frecuencias y la ojiva de frecuencias relativas acumuladas:
Tabla de Distribución de Frecuencias de las distancias alcanzadas por las pelotas de golf nuevas
Intervalos de
clase (en cm.)
Marca de clase
x
Frecuencia Alumnos
F
Frecuencias Acumuladas
Fa
Frel Frel acum
223.65 – 237.75 237.75 – 251.85 251.85 – 265.95 265.95 – 280.05 280.05 – 294.15
230.7 244.8 258.9 273.0 287.1
7 5 8 4 1
7 12 20 24 25
0.28 0.20 0.32 0.16 0.04
0.28 0.48 0.80 0.96
1 Total N = 25
Medidas de Tendencia Central Moda: 258.9 Media: 68251.x = Mediana: después aprenderemos a estimarla y a calcularla
Ojiva de frecuencias relativas acumuladas de las distancias alcanzadas por las pelotas de golf nuevas
La ojiva de frecuencias relativas acumuladas nos va a servir mucho para hacer la estimación de la mediana y medidas de dispersión. Como veremos a continuación.
MedianaMediana
Para estimar la mediana en la ojiva de frecuencias relativas acumuladas, si tenemos en el eje Y los porcentajes, localizamos el 0.5; si tenemos en el eje Y datos en porciento, localizamos el 50%. De ahí vamos hacia la curva horizontalmente y donde cruzamos la curva nos bajamos hacia el eje X y anotamos el valor correspondiente, ese es el valor estimado de la Mediana
Ojiva de frecuencias relativas acumuladas de las distancias alcanzadas por las pelotas de golf nuevas
Mediana 245 Mediana
Medidas de dispersiMedidas de dispersióónn
Ahora vamos a ver las medidas de dispersión las cuales nos dicen de cómo están diseminados nuestros datos en la distribución. Para esto estudiaremos los conceptos que a continuación vamos a definir.
RangoRango
Ya lo habíamos visto, es la diferencia entre el valor máximo y el mínimo en nuestros datos. Esta medida de dispersión aunque es la más fácil de obtener, es muy poco usada ya que no nos dice poco acerca de la mayoría de los datos.
CuartilesCuartiles y Decilesy Deciles
Estas medidas de dispersión se parecen mucho a la mediana en cuanto a que dividen a la distribución en partes iguales y se encuentra el valor que corresponde, los cuarteles la dividen en cuatro y los deciles en diez.
CuartilesCuartiles
Al dividir a la distribución en cuatro partes iguales, los cuartiles contendrán entre uno y otro al 25% del total de datos. Al primer cuartil se le denota Q1 y separa al primer 25% del total de datos; el segundo cuartil, Q2 , separa al primer 50% de los datos, (por lo que coincide con la mediana; el tercer cuartil , Q3 , separa al 75% de los datos.
el cuartil 1 (Q1) divide a
la población en 25% - 75%. el cuartil 2 (Q2) divide a
la población en 50% - 50%. Por lo que es igual a la Mediana el cuartil 3 (Q3) divide a
la población en 75% - 25%. Q 1 Q 2 Q 3
Los decilesLos deciles
Son muy similares a los cuartiles pero dividen a la distribución en diez partes iguales:
el decil 1 (D1)
el decil 2 (D2)
el decil 3 (D3)
el decil 4 (D4)
el decil 5 (D5)
el decil 6 (D6)
el decil 7 (D7)
el decil 8 (D8)
el decil 9 (D9)
D1 D2 D3 D4 D5 D6 D7D8 D9
Actividad 1 Marcar los cuartiles y los deciles en la ojiva de frecuencias relativas de las estaturas
Contestar lo siguiente:
a)¿Cuál es la mediana de esta distribución de frecuencias?
b)¿Cuál es la estatura del primer cuartil?
c)¿Cuál es la estatura del tercer cuartil?
d)¿Cuál es el porcentaje de las alumnas que miden entre 1.50 y 1.60 metros?
e)¿Cuál es la estatura máxima?
f)¿Qué porcentaje mide menos de 1.40 metros?
g)¿Qué porcentaje mide más de 1.55 metros?
Continuamos con las medidas de dispersión.Ahora vamos a ver una de las más usadas (tal vez por ser de las más útiles).
DesviaciDesviacióón media absolutan media absoluta
En datos no agrupados, se llama desviación media al promedio del valor absoluto de las diferencias entre cada dato y la media, o sea el promedio de las desviaciones de la media en valor absoluto.
N
xDM
N
ii∑
=−
= 1μ
donde: DM = desviación media N = número total de datos
ix = dato i μ = media de la distribución de la población
Actividad 2 Encontrar la desviación media de la población siguiente:
10, 12, 2, 9, 15, 6, 7, 8, 12, 9
9=
+++++++++=
109 12 8 7 615 9 212 10μ
10
9 -99-12 9-8 9-7 9-6 9-15 9-9 9- 29-12 9-10DM
10
1i∑=
+++++++++=
62.DM =
VarianzaVarianza
En datos no agrupados, la varianza es la sumatoria del cuadrado de las desviaciones respecto a la media entre el número total de datos
( )N
xN
ii∑
=
−= 1
2
2μ
σ
¿Porqué al cuadrado ?
2σ = varianza de la población
ix = dato i N = número total de datos de la población μ = media de la población
Nota: Se puede calcular la varianza de la población o de una muestra, a ésta última se denomina generalmente con la letra S.
Cabe mencionar que con lo que hemos estado trabajando es con la idea de que a pesar de que puede existir una población de un tamaño específico (generalmente grande), lo que tenemos a la mano es una parte una parte de dicha poblacide dicha poblacióónn, o sea, una muestrauna muestra.
DesviaciDesviacióón Estn Estáándarndar
Se llama desviación típica o estándar a la raíz de la varianza, tanto para datos de la población o para una muestra:
Esta medida de dispersión es de las más usadas porque permite comparar mejor la dispersión de los datos en poblaciones diferentes.
2σσ = 2ss =
Actividad 3 Encontrar la varianza de la población del ejemplo anterior:
10, 12, 2, 9, 15, 6, 7, 8, 12, 9
10
9) -(99)-12 (9)-(8 9)-7 (9)-(6 9)-(15 9)-9 (9)- 2(9)-12 (9)-(1010
1i
2222222222∑=
+++++++++=2σ
8112 .=σ
Veamos qué significan todas estas medidas tanto de tendencia central como de dispersión usando los datos de las estaturas de alumnas de secundaria. En este caso sólo graficamos cada estatura una por una.
Si graficamos el histograma con 20 intervalos y ponemos las medidas de tendencia central y dispersión ¿Cómo nos queda?.
MedianaMedia
Desviación Estándar
Moda
Varianza en datos agrupadosVarianza en datos agrupados
En datos agrupados de una muestra, la varianza es la sumatoria del cuadrado de las desviaciones respecto a la media de la muestra entre el número total de datos de la muestra menos 1.
( )1
1
2
2
−
−=∑=
n
xmcfs
t
ii
donde 2s = varianza de una muestra
t = número total de intervalos de clase f = frecuencia de la marca de clase
imc = marca de clase del intervalo i n = número total de datos de la muestra x = media de la muestra
Varianza en datos agrupados de una poblaciVarianza en datos agrupados de una poblacióónn
En datos agrupados de una población, la varianza es la sumatoria del cuadrado de las desviaciones respecto a la media de la población entre el número total de datos de la población.
( )
N
mcft
ii∑
=−
= 1
2
2μ
σ
donde 2σ = varianza de una población
t = número total de intervalos de clase
imc = dato i N = número total de datos de la población μ = media de la población
Actividad 4 Encontrar la varianza y la desviación estándar de los datos de la siguiente muestra:
Intervalo de clase
Marca de
clase
Frecuenciaaños ( )2Xmci − ( )2Xmcf i −
26.5 – 29.5 29.5 - 32.5 32.5 – 35.5 35.5 – 38.5 38.5 – 41.5 41.5 – 44.5 44.5 - 47.5
28 31 34 37 40 43 46
1 10 14 33 14 7 3
N = 82
81 36 9 0 9
36 81
81 360 126
0 126 252 243 ∑1188
37=x Varianza: 66614182
11882 .s =−
=
Desviación estándar: 83366714 ..s ==
Coeficiente de VariaciCoeficiente de Variacióónn
Se llama coeficiente de variación a la razón entre la desviación estándar y la media:
Para una población: 100×=μσCV
Para una muestra: 100×=xsCV
Actividad 5 Encontrar el coeficiente variaciActividad 5 Encontrar el coeficiente variacióón de la poblacin de la poblacióón n anterior:anterior:
10037833
×=.CV 3510.CV =
top related