lección 20: medidas descriptivas de un conjunto de … · descriptivas se encuentran la moda, ......

13
Lección 20: Medidas descriptivas de un conjunto de datos Cuando se recolecta información generalmente se pretende sacar de ella algún tipo de conclusión, a través de uno o varios indicadores que permitan resumir o dar un panorama general de lo que la información aporta. Hasta ahora hemos visto cómo describir un conjunto de datos a través de tablas y de gráficas, pero muchas veces se hace a través de números o de valores de la variable que se estudia. A estas maneras de resumir la información se les llama medidas descriptivas. Entre las medidas descriptivas se encuentran la moda, que es el valor de la variable que se presenta con mayor frecuencia, y la media, que es el promedio de los datos; también se usan mucho los porcentajes para referirse a algunas informaciones estadísticas. Ahora revisaremos estas nociones. Para ver cómo se obtiene la moda, consideremos la gráfica de frecuencias de los valores correspondientes a la variables opinión, presentada en la lección 18 de este libro. Recuerde que opinión, es la opinión de cada estudiante con respecto al nivel de dificultad del examen y sus valores son 1 = fácil, 2 = regular y 3 = difícil. 212

Upload: duongkhanh

Post on 26-Sep-2018

239 views

Category:

Documents


0 download

TRANSCRIPT

Lección 20: Medidas descriptivas de un conjunto de datosCuando se recolecta información generalmente se pretende sacar de ella algún tipo de conclusión, a través de uno o variosindicadores que permitan resumir o dar un panorama general de lo que la información aporta. Hasta ahora hemos visto cómodescribir un conjunto de datos a través de tablas y de gráficas,pero muchas veces se hace a través de números o de valores de la variable que se estudia. A estas maneras de resumir la información se les llama medidas descriptivas. Entre las medidasdescriptivas se encuentran la moda, que es el valor de la variableque se presenta con mayor frecuencia, y la media, que es elpromedio de los datos; también se usan mucho los porcentajespara referirse a algunas informaciones estadísticas. Ahora revisaremos estas nociones.

Para ver cómo se obtiene la moda, consideremos la gráfica de frecuencias de los valores correspondientes a la variablesopinión, presentada en la lección 18 de este libro. Recuerde queopinión, es la opinión de cada estudiante con respecto al nivel de dificultad del examen y sus valores son 1 = fácil, 2 = regular y 3 = difícil.

212

GUÍA DE MATEMÁTICAS III

En esta gráfica vemos que elvalor de mayor frecuencia es 2 =regular, es decir, el valor que másse repite en el conjunto de datos es 2 = regular. Decimos que "regular" es la moda de este conjunto de datos.

Llamamos moda de un conjunto de datos al valor de la variable que se presenta con mayor frecuencia, el que se repitemás veces. Hay conjuntos de datos que tienen más de una moda.

Esta medida describe al conjunto de datos en la siguientemanera: al decir que la moda es "regular" estamos diciendo que laopinión que más personas atrajo, en la que más se concentraronlas apreciaciones, en la que más personas están de acuerdo, esque el examen es de una dificultad regular. ¡Cuidado! No fue lamayoría la que opinó eso, porque el total de estudiantes es 20 ysólo 9 tienen esa opinión: para que fueran mayoría se necesitaríaque fueran más de la mitad, o sea 11 ó más.

Observe que aquí no podemos hablar de promedio porquenecesitaríamos poder sumar y en la variable opinión los númerosson sólo etiquetas o códigos para no escribir completas las palabras fácil, regular y difícil. Para trabajar con la media opromedio se necesita que la medición de la característica deinterés sea numérica. Veamos ahora un ejemplo del cálculo delpromedio.

Toño se está entrenando para correr los 100 metros planos en una competencia latinoamericana; esta semana hizo los siguientes tiempos:

213

LECCIÓN 20

2

1 2 30

4

6

8

10

12Frecuencia

Opinión

Lunes: 12.5 seg, Martes: 15.3 seg, Miércoles: 10.8 seg, Jueves: 11.4 seg, y Viernes: 10.1 seg.

El tiempo promedio de esta semana en el entrenamiento deToño fue de:

12.5 + 15.3 + 10.8 + 11.4 + 10.1 = 12.02 seg5

214

GUÍA DE MATEMÁTICAS III

Ningún día de la semana hizo Toño un tiempo de 12.02 seg.en la carrera, pero el promedio es la suma del tiempo de cada díaentre el número de días y lo que nos dice es que si todos los díashubiera hecho el mismo tiempo en la carrera ese tiempo hubierasido de 12.02 seg.

La media o promedio hace una distribución pareja y se usamucho para comparar los datos individuales o por grupos con loque se tendría si la distribución fuera equitativa. Veamos másejemplos.

Los sueldos mensuales en una oficina son los siguientes: el director gana $15 000, los dos jefes de departamento $11 000, los tres analistas de cada departamento $7 000, la secretaria $2 500 y el mensajero $1 500. El sueldo promedio en esa oficina es:

15000 + 2(11000)0 + 6(7000) + 2500 + 1500 = 7545.4511

Observe que en esa oficina 2 personas ganan muy por encimadel sueldo promedio, 6 personas ganan un poco por encima delsueldo promedio y 3 personas ganan muy por debajo del sueldopromedio. Lo que nos dice el promedio es que si con el mismopresupuesto todos ganaran lo mismo, cada uno ganaría $7545.45.

Otra situación muy frecuente de uso de promedio se da cuando se quiere describir la velocidad con la que un móvil recorrió cierta distancia. Cuando decimos que José viajó aGuadalajara a un promedio de 90 Km por hora esto no significaque cada hora haya recorrido exactamente 90 Km, sino que sedivide el total de kilómetros recorridos entre el total del tiempo

215

LECCIÓN 20

en horas y se obtiene la velocidad constante a la que se tendríaque haber viajado para hacer el viaje en ese tiempo: esto permite describir globalmente la velocidad de traslado.

Al final del ciclo escolar un maestro debe concluir si un alumno tiene o no los elementos necesarios para cursar el siguiente grado; para llegar a esa conclusión cuenta con la información que fue registrando de uno u otro modo a lo largo del curso. Es decir que el resultado final de un curso es para cada alumno una síntesis de los resultados que fue teniendo a lo largo del ciclo escolar. Muchas veces el resultado final es el promedio de las calificaciones obtenidas, aunque éstas no hayan sido todas iguales.

Los porcentajes son especialmente útiles para describir unconjunto de datos. Regresemos un poco a la opinión sobre el examen de la que hablamos antes. Ya vimos que en ese conjuntode datos la moda es "regular", puesto que 9 estudiantes opinaronque la dificultad del examen era regular y ninguna otra opiniónatrajo más estudiantes que 9; pero esos 9 ¿son pocos o muchos?Eso depende del total de estudiantes; en este ejemplo tenemosque son 9 de 20 estudiantes, y lo podemos expresar como

= 0.45 = . Con estas operaciones estamos diciendo, de

varias maneras cuántos estudiantes y de un total de cuántostuvieron esa opinión. Según la primera manera lo estamos diciendo como son, o sea nueve vigésimas partes del total. Según la segunda, estamos considerando el total como unaunidad, y entonces tenemos son 45 centésimos de esa unidad.Según la tercera, estamos diciendo que si el total fueran cien, 45 de ellos tendrían esa opinión. Esta última expresión también

216

GUÍA DE MATEMÁTICAS III

9

20

45

100

se puede leer como 45 de cada 100 o como 45 por ciento, es decir45%. En todos los casos estamos diciendo que son un poco menosde la mitad.

Los porcentajes, frecuencias relativas o proporciones nos permiten describir la distribución de un conjunto de datos relativizando al total. Así, 9 de 20, o 45%, es mucho más que 9 de 200, que serían 4.5%, y que 9 de 2000, que serían 0.45%.

Veamos ahora cómo estas tres medidas descriptivas nos permiten tener una idea global de un conjunto de datos y compararlo con otro.

Dos maestros de estadística del sistema escolarizado de laUniversidad Pedagógica realizaron una encuesta en los grupos queatienden del primer curso para conocer mejor a esta población.Entre lo que les interesaba de los alumnos estaba el ambientefamiliar en relación a los estudios. Sobre esto se preguntó elnúmero de años de escolaridad de ambos padres y del hermanomayor; a partir de esta información se construyó una variable de escolaridad familiar (calculada como la media de las tresprecedentes). Se preguntó también sobre la ocupación de lospadres y el gusto por las fiestas de cada estudiante. Los datos de dos de los grupos se presentan en las tablas de las siguientespáginas.

En estas tablas se usaron los siguientes códigos:

Ocupación de la madre (y del padre):1 = Gerente o, dueña(o) de empresa2 = Empleada(o)3 = Obrera(o)

217

LECCIÓN 20

4 = Ama de casa5 = Desempleada(o)6 = Trabajador(a) por su cuenta7 = Campesina(o)8 = Finada(o)9 = Otra

Gusto por las fiestas: 1 = nada 2 = poco 3 = regular 4 = mucho

218

GUÍA DE MATEMÁTICAS III

Alumno

1 444444644224444844

1 0 0 16 5 42 3 6 6 16 9 23 2 6 6 9 7 14 2 6 9 11 9 25 3 2 6 12 7 26 6 2 2 12 5 37 6 7 6 8 7 38 9 3 3 16 7 39 9 9 17 12 13 210 6 16 14 12 14 311 8 6 10 13 10 312 5 9 9 18 12 313 9 6 9 15 10 414 1 6 0 16 7 415 9 12 15 17 15 216 9 1 2 12 5 417 2 6 4 6 5 418 7 0 1 6 2 1

Escolaridadfamiliar

Gusto porlas fiestas

Ocupación

Grupo A

Años de escolaridad

Madre Padre Madre PadreHermano

Mayor

219

LECCIÓN 20

1

Alumno

446446464424422244

3 2 1 20 8 42 3 0 2 9 4 13 6 6 6 18 10 24 9 9 9 12 10 45 2 6 6 12 8 16 2 6 9 15 10 47 6 9 12 14 12 18 3 1 9 12 7 19 3 9 10 0 6 210 8 1 9 9 6 211 6 11 17 16 15 412 8 4 10 7 7 113 2 1 4 12 6 414 9 11 9 16 12 115 9 10 1 14 8 116 7 6 6 12 8 117 2 7 0 19 9 118 2 7 0 19 9 1

419 9 6 6 17 10 2420 9 8 11 10 10 1421 9 6 6 17 10 2622 6 17 2 12 10 4223 6 9 9 9 9 1424 9 1 1 19 7 1525 9 11 9 12 11 1626 8 4 12 20 12 4

Escolaridadfamiliar

Gusto porlas fiestas

Ocupación Años de escolaridad

Madre Padre Madre PadreHermano

Mayor

Grupo B

A continuación se presentan las tablas de frecuencias y frecuencias relativas de la ocupación de la madre en ambos grupos y las respectivas gráficas de pastel.

220

GUÍA DE MATEMÁTICAS III

Ocupación FrecuenciaFrecuencia

Relativa

2 2 0.11 = 11%

4 14 0.78 = 78%

6 1 0.06 = 6%

8 1 0.06 = 6%

Total 18 1 = 100%

Ocupación FrecuenciaFrecuencia

Relativa

2 5 0.19 = 19%

4 15 0.58 = 58%

5 1 0.04 = 4%

6 5 0.19 = 19%

Total 26 1 = 100%

Ama de casa 78%

Trabaja por sucuenta 6%

Finada 6%

Empleada 11%

Ama de casa 58%

Trabaja por sucuenta 19%

Desempleada 4%

Empleada 19%

Ocupación de la madre. Grupo A.

Ocupación de la madre. Grupo B.

Es pertinente hacer varias observaciones a propósito de estastablas y gráficas.

Aunque en ambos grupos la moda de la ocupación de lamadre es ama de casa, esta ocupación la tiene en el grupo A el 78% de las madres mientras que en el grupo B la tiene el 58%.Esto significa que en el grupo A predominan más las amas de casaque en el grupo B. Observe que esto ocurre a pesar de que haymás amas de casa en el grupo B (son 15) que en el A (donde sonsólo 14): esto es porque 14 de 18 son una proporción muchomayor que 15 de 26.

221

LECCIÓN 20

En ambos grupos ocurren valores con frecuencia de 1: en elgrupo A una persona declaró que su madre trabaja por su cuentay otra persona declaró que su madre es finada, mientras que enel grupo B un estudiante declaró que su madre está desempleada(lo que significa que usualmente tiene un trabajo remunerado adicionalmente a ser ama de casa). Sin embargo, en las gráficasde pastel las "rebanadas" correspondientes a estos valores son distintas: son más grandes las "rebanadas" correspondientes a losvalores con frecuencia igual a 1 en el grupo A que en el grupo B.Esto se debe a que, como el total de los estudiantes en el grupo A es de 18 y en el grupo B es de 26, una persona en el grupo A es un 6%, mientras que en el grupo B una persona es sólo un 4%.

En las tablas se han redondeado las frecuencias relativas ados decimales por lo que en la tabla del grupo A aparece en losrenglones de las ocupaciones 6 y 8 una frecuencia relativa de 0.06 = 6%. En realidad , y 0.06 es sólo un redondeo de0.055555.....; algo análogo ocurre en los demás renglones. Así, la suma de las frecuencias relativas y los porcentajes que ahí se registran son 1.01 = 101%; si se hubiera redondeado a tres decimales se tendría 0.056 = 56% y la suma sería 1.002 = 100.2%;como estas diferencias se deben al redondeo de los decimales nose registra en la tabla una suma distinta de 1 = 100%.

a) Haga la tabla de frecuencias y frecuencias relativas de ocupación del padre para los dos grupos.

b) Haga la gráfica de barras de porcentajes de ocupacióndel padre para los dos grupos.

222

GUÍA DE MATEMÁTICAS III

1

8

Ejercicio 1

c) ¿Qué porcentaje de los padres del grupo A es campesino?d) ¿De cuántos de los padres del grupo B desconocemos la

ocupación?

Haga la gráfica de pastel de la distribución de porcentajes degusto por las fiestas de los dos grupos. Para ello, haga la tabla de frecuencias, frecuencias relativas y porcentajes y calcule elángulo para la gráfica. Anote en la gráfica cada categoría, elángulo correspondiente y el porcentaje.

223

LECCIÓN 20

Ejercicio 2

a) Encuentre la moda de años de escolaridad de la madre, del padre y del hermano mayor de los estudiantes de ambos grupos.

b) Compare las modas de años de escolaridad de la madre, del padre y del hermano mayor de los estudiantes del grupo A y ordénelas de menor a mayor.

c) Encuentre el promedio de años de escolaridad de la madre, del padre y del hermano mayor de los estudiantes de ambos grupos.

d) Compare los promedios de años de escolaridad de la madre, del padre y del hermano mayor de los estudiantes del grupo B y ordénelos de menor a mayor.

a) Encuentre la moda de las escolaridades familiares de ambos grupos y compárelas.

b) Encuentre el promedio de las escolaridades familiares de ambos grupos y compárelos.

224

GUÍA DE MATEMÁTICAS III

Ejercicio 3

Ejercicio 4