ejercicios resueltos de estadÍstica descriptiva

7
EJERCICIOS RESUELTOS DE ESTADÍSTICA DESCRIPTIVA Nivel E.S.O. 2) Las estaturas de 27 jóvenes, en cm, son las siguientes: 155 178 170 165 173 168 160 166 176 169 158 170 179 161 164 156 170 171 167 151 163 158 164 174 176 164 154 a) Tabular los datos en intervalos de clase de amplitud 5. b) Incluir en la tabla las frecuencias absolutas acumuladas, las frecuencias relativas, los tantos por ciento y las frecuencias relativas acumuladas. c) Hallar la Media, la Mediana, la Moda, los Cuartiles y la Desviación Típica. d) Dibujar los datos en un gráfico adecuado. Solución: a) Tabular los datos en intervalos de clase de amplitud 5. Se trata de una variable estadística continua, por lo que tiene sentido tabular los datos en intervalos. Calculamos los valores mayor y menor de la muestra: 179 y 151. La diferencia es el rango: R = 179-151 = 28. Localizamos el múltiplo de 5 (la amplitud de los intervalos) más próximo a 28 pero mayor o igual que 28: 30. Ésta será la amplitud total de todos los intervalos de clase. Dividiendo 30/5 = 6 obtenemos el número total de intervalos de clase. Si empezamos el primero de los intervalos en 150 (por ejemplo) como la amplitud total de todos los intervalos será 30, terminaremos en 150+30 = 180. Estas elecciones son válidas, porque cubrimos desde el menor valor (151) hasta el mayor valor (179) de la muestra. Construimos la tabla con los intervalos resultantes: [150, 155); [155, 160); [160, 165); [165, 170); [170, 175); [175, 180] y haciendo un recuento de cuantos datos de la muestra caen dentro de cada uno de ellos (es decir, las frecuencias absolutas):

Upload: alpasema

Post on 02-Dec-2015

62 views

Category:

Documents


8 download

TRANSCRIPT

Page 1: EJERCICIOS RESUELTOS DE ESTADÍSTICA DESCRIPTIVA

EJERCICIOS RESUELTOS DE ESTADÍSTICA DESCRIPTIVA Nivel E.S.O.

2) Las estaturas de 27 jóvenes, en cm, son las siguientes:

155 178 170 165 173 168 160 166 176

169 158 170 179 161 164 156 170 171

167 151 163 158 164 174 176 164 154

a) Tabular los datos en intervalos de clase de amplitud 5.

b) Incluir en la tabla las frecuencias absolutas acumuladas, las frecuencias relativas, los tantos por ciento y las frecuencias relativas acumuladas.

c) Hallar la Media, la Mediana, la Moda, los Cuartiles y la Desviación Típica.

d) Dibujar los datos en un gráfico adecuado.

Solución:

a) Tabular los datos en intervalos de clase de amplitud 5.

Se trata de una variable estadística continua, por lo que tiene sentido tabular los datos en intervalos. Calculamos los valores mayor y menor de la muestra: 179 y 151. La diferencia es el rango: R = 179-151 = 28. Localizamos el múltiplo de 5 (la amplitud de los intervalos) más próximo a 28 pero mayor o igual que 28: 30. Ésta será la amplitud total de todos los intervalos de clase. Dividiendo 30/5 = 6 obtenemos el número total de intervalos de clase.

Si empezamos el primero de los intervalos en 150 (por ejemplo) como la amplitud total de todos los intervalos será 30, terminaremos en 150+30 = 180. Estas elecciones son válidas, porque cubrimos desde el menor valor (151) hasta el mayor valor (179) de la muestra.

Construimos la tabla con los intervalos resultantes: [150, 155); [155, 160); [160, 165); [165, 170); [170, 175); [175, 180] y haciendo un recuento de cuantos datos de la muestra caen dentro de cada uno de ellos (es decir, las frecuencias absolutas):

Page 2: EJERCICIOS RESUELTOS DE ESTADÍSTICA DESCRIPTIVA

xi fi

[150, 155) 2

[155, 160) 4

[160, 165) 6

[165, 170) 5

[170, 175) 6

[175, 180] 4

n = 27

La suma de la columna de las frecuencias es el número total de datos n = 27.

Añadimos una columna con las marcas de clase. Éstas son los puntos medios de cada uno de los intervalos. Hay dos formas de calcularlos: 1) Sumamos los extremos del intervalo y dividimos el resultado entre 2. Por ejemplo, para el primer intervalo, la marca de clase es (150+155)/2 = 152,5. 2) Calculamos la mitad de la amplitud de los intervalos: 5/2 = 2,5. Sumamos esta mitad al extremo inferior de cada intervalo y nos sale la marca de clase. Para el primer intervalo es: 150+2,5 = 152,5.

La tabla, con la columna de marcas de clase, es:

xi fi

[150, 155) 152,5 2

[155, 160) 157,5 4

[160, 165) 162,5 6

[165, 170) 167,5 5

[170, 175) 172,5 6

[175, 180] 177,5 4

n = 27

A partir de ahora, trabajamos la tabla como si fuera una tabla de datos sin agrupar en intervalos (es decir, ignoraremos la primera columna). Entonces, para los cálculos, supondremos que los datos son las marcas de clase, con lo que sería como si 152,5 se repitiera 2 veces (su frecuencia), 157,5 4 veces, etc.

Page 3: EJERCICIOS RESUELTOS DE ESTADÍSTICA DESCRIPTIVA

b) Incluir en la tabla las frecuencias absolutas acumuladas, las frecuencias relativas, los tantos por ciento y las frecuencias relativas acumuladas.

Las frecuencias absolutas acumuladas son la suma de las frecuencias absolutas de todas las filas que están por encima del dato actual, incluida la fila de dicho dato:

xi fi Fi

[150, 155) 152,5 2 2 El mismo valor que en fi

[155, 160) 157,5 4 6 El valor anterior de Fi (2) más el de fi de al lado (4)

[160, 165) 162,5 6 12 El valor anterior de Fi (6) más el de fi de al lado (6)

[165, 170) 167,5 5 17 12+5

[170, 175) 172,5 6 23 17+6

[175, 180] 177,5 4 27 23+4

n = 27

Las frecuencias relativas son los cocientes entre las frecuencias absolutas y n:

xi fi Fi hi

[150, 155) 152,5 2 2 2 / 27 = 0,0740

[155, 160) 157,5 4 6 4 / 27 = 0,1481

[160, 165) 162,5 6 12 6 / 27 = 0,2222

[165, 170) 167,5 5 17 5 / 27 = 0,1852

[170, 175) 172,5 6 23 6 / 27 = 0,2222

[175, 180] 177,5 4 27 4 / 27 = 0,1481

n = 27

La suma de las frecuencias relativas debe ser 1. Si las sumamos escritas en forma de fracción, en efecto resulta 1. No es así en forma decimal a causa de los redondeos (se desprecian muchos decimales).

Los tantos por ciento son las frecuencias relativas multiplicadas por 100:

xi fi Fi hi %

[150, 155) 152,5 2 2 2 / 27 = 0,0740 7,40%

[155, 160) 157,5 4 6 4 / 27 = 0,1481 14,81%

Page 4: EJERCICIOS RESUELTOS DE ESTADÍSTICA DESCRIPTIVA

[160, 165) 162,5 6 12 6 / 27 = 0,2222 22,22%

[165, 170) 167,5 5 17 5 / 27 = 0,1852 18,52%

[170, 175) 172,5 6 23 6 / 27 = 0,2222 22,22%

[175, 180] 177,5 4 27 4 / 27 = 0,1481 14,81%

n = 27

Al igual que antes, la columna debería sumar 100. Si no es así es a causa de los errores que se comenten redondeando.

Las frecuencias relativas acumuladas se calculan dividiendo las Fi entre n:

xi fi Fi hi % Hi

[150, 155) 152,5 2 2 2 / 27 = 0,0740 7,40% 2 / 27 = 0,0740

[155, 160) 157,5 4 6 4 / 27 = 0,1481 14,81% 6 / 27 = 0,2222

[160, 165) 162,5 6 12 6 / 27 = 0,2222 22,22% 12 / 27 = 0,4444

[165, 170) 167,5 5 17 5 / 27 = 0,1852 18,52% 17 / 27 = 0,6296

[170, 175) 172,5 6 23 6 / 27 = 0,2222 22,22% 23 / 27 = 0,8519

[175, 180] 177,5 4 27 4 / 27 = 0,1481 14,81% 27 / 27 = 1

n = 27

c) Hallar la Media, la Mediana, la Moda, los Cuartiles y la Desviación Típica.

La fórmula de la media aritmética es:

es decir, sumamos cada dato xi multiplicado por su frecuencia fi y dividimos el resultado total entre n. Para facilitar los cálculos, creamos una columna con los productos de cada xi por su correspondiente fi y sumaremos la columna, lo que nos dará el numerador de la fórmula:

xi fi Fi hi % Hi xifi

[150, 155)

152,5 2 2 2 / 27 =

0,0740 7,40%

2 / 27 =

0,0740 305

[155, 160)

157,5 4 6 4 / 27 =

0,1481 14,81%

6 / 27 =

0,2222 630

[160, 165)

162,5 6 12 6 / 27 =

0,2222 22,22%

12 / 27 =

0,4444 975

Page 5: EJERCICIOS RESUELTOS DE ESTADÍSTICA DESCRIPTIVA

[165, 170)

167,5 5 17 5 / 27 =

0,1852 18,52%

17 / 27 =

0,6296 837,5

[170, 175)

172,5 6 23 6 / 27 =

0,2222 22,22%

23 / 27 =

0,8519 1035

[175, 180]

177,5 4 27 4 / 27 =

0,1481 14,81% 27 / 27 = 1 710

n =

27

Por lo que:

Si hemos estudiado el ejercicio 1, que es el mismo que éste pero con los datos sin agrupar en intervalos, veremos que este resultado no coincide con el que allí se obtuvo, aunque se trata del mismo problema. La media correcta es la del ejercicio 1, porque allí empleamos los datos originales. Aquí hemos utilizado las marcas de clase, lo cual supone una aproximación. Por ejemplo, en el primer intervalo hay 2 datos, que realmente son 151 y 154. Pero nosotros hemos hecho los cálculos como si ambos fuesen 152,2.

Si hacemos los cálculos con la calculadora científica, basta introducir los datos xi y sus respectivas frecuencias fi y la calculadora nos da, no sólo la media, sino también la desviación típica y la suma de la columna xifi. En el ejercicio 1 se explicó cómo manejar la calculadora para esto. En este ejercicio, el primer dato a introducir en la calculadora será la primera marca de clase 152,5 y su frecuencia, 2; el segundo, 157,5 y su frecuencia 4; etc.

La mediana es el dato que ocupa la posición (n+1)/2, ya que n = 27 es impar. Dicha posición es 28/2 = 14. Dicho dato es 167,5 (observando la columna de frecuencias vemos que 152,2 ocupa las dos primeras posiciones; 157,5 las 4 siguientes, es decir, la 3ª, 4ª, 5ª y 6ª. 162,5 ocupa las 6 siguientes, hasta la 12ª. 167,5 ocupa las 5 siguientes, hasta la 17ª. Por tanto, ocupa la 14ª posición). Por consiguiente:

Me = 167,5

Page 6: EJERCICIOS RESUELTOS DE ESTADÍSTICA DESCRIPTIVA

Al igual que antes, al compararlo con el ejercicio 1 no da el mismo resultado. El correcto es aquel, porque aquí estamos aproximando, como explicamos antes.

La moda es el resultado que más se repite. Esta muestra es bimodal porque tiene 2 modas: 162,5 y 172,5, ya que ambos se repiten 6 veces.

El primer cuartil Q1 es el primer dato de la muestra, una vez ordenada, que deja por debajo el 25% de los datos. Como los datos son 27, resulta que el 25% de 27 = 0,25 · 27 = 6,75. El primer dato que deja por debajo a los 6,75 anteriores es el 7º (en realidad, ningún dato puede ocupar la posición 6,75º). Con el mismo razonamiento que seguimos para calcular la mediana, deducimos que:

Q1 = 162,5

El segundo cuartil coincide con la mediana, calculada anteriormente. Luego:

Q2 = 167,5

El tercer cuartil es el primer dato que deja por debajo el 75% de los datos de la muestra; esto es, 75% de 27 = 0,75 · 27 = 20,25 datos. Por tanto, será el que ocupe la posición 21º, por lo que:

Q3 = 172,5

La desviación típica lo mejor es obtenerla mediante la calculadora, tal como se explicó antes. Si no disponemos de calculadora con capacidad estadística, deberemos realizar los cálculos, tal como vamos a hacer nosotros.

Empezamos calculando la varianza que no es más que la desviación típica al cuadrado. A su resultado le calcularemos la raíz cuadrada. La fórmula de la desviación típica es:

Para obtener el numerador, añadimos dos columnas a la tabla: una con los xi

2 (los xi son las marcas de clase) y otra con los productos xi

2fi:

Page 7: EJERCICIOS RESUELTOS DE ESTADÍSTICA DESCRIPTIVA

xi fi xi2 xi

2fi

[150, 155) 152,5 2 23.256,25 46.512,5

[155, 160) 157,5 4 24.806,25 99.225

[160, 165) 162,5 6 26.406,25 158.437,5

[165, 170) 167,5 5 28.056,25 140.281,25

[170, 175) 172,5 6 29.756,25 178.537,5

[175, 180] 177,5 4 31.506,25 126.025

n = 27

Como la media la obtuvimos anteriormente:

Hemos obtenido el mismo resultado que en el problema 1; si así no hubiera sido, el correcto sería aquél, ya que aquí aproximamos los datos por las marcas de clase.

d) Dibujar los datos en un gráfico adecuado.

Como se trata de una variable continua, el gráfico más adecuado es el histograma. Aquí si empleamos los intervalos de clase, que constituirán las bases de los rectángulos, mientras que las alturas serán las frecuencias absolutas.