introducción - héctor palacios sifuentes | just … · web view1.3 medidas de tendencia central...

48
1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse por un número tal como una media aritmética o promedio. La ventaja de números como éstos, a los que se les llama medidas de tendencia central, es que pueden utilizarse para efectuar comparaciones cuantitativas. Un promedio es un número que se calcula para representar el centro de un conjunto de datos numéricos. El estado de Chihuahua tenía en el año 2000 aproximadamente 3 millones de habitantes, mientras que el Distrito Federal, 8.5 millones. Sin embargo, la extensión territorial de Chihuahua es de 247 087 km 2 , mientras que la del Distrito federal es de 1500 km 2 . Para tener una idea acerca de la diferencia en la densidad de la población en cada caso, se pueden comparar los promedios de habitantes por km 2 . Tabla 1.28 Densidad de población en Chihuahua y el DF en el año 2000 ENTIDAD TERRITORIO (KM 2 ) HABITANTES AÑO 2000 (MILLONES) PROMEDIO DE HABITANTES POR KM 2 Chihuahua 247 087 3 12 Distrito Federal 1 500 8.5 5 667 El promedio de habitantes por km 2 en cada una de estas entidades describe claramente la diferencia de concentración de población de ambas. Un conjunto de datos numéricos puede describirse por medio de varias cantidades que permiten comprender mejor sus

Upload: doanthuy

Post on 27-Sep-2018

219 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

1.3 Medidas de tendencia central

La población humana que se concentra en una superficie de terreno puede representarse por un número tal como una media aritmética o promedio. La ventaja de números como éstos, a los que se les llama medidas de tendencia central, es que pueden utilizarse para efectuar comparaciones cuantitativas. Un promedio es un número que se calcula para representar el centro de un conjunto de datos numéricos.

El estado de Chihuahua tenía en el año 2000 aproximadamente 3 millones de habitantes, mientras que el Distrito Federal, 8.5 millones. Sin embargo, la extensión territorial de Chihuahua es de 247 087 km2, mientras que la del Distrito federal es de 1500 km2. Para tener una idea acerca de la diferencia en la densidad de la población en cada caso, se pueden comparar los promedios de habitantes por km2.

Tabla 1.28 Densidad de población en Chihuahua y el DF en el año 2000

ENTIDAD TERRITORIO (KM2) HABITANTES AÑO 2000 (MILLONES)

PROMEDIO DE HABITANTES POR KM2

Chihuahua 247 087 3 12Distrito Federal 1 500 8.5 5 667

El promedio de habitantes por km2 en cada una de estas entidades describe claramente la diferencia de concentración de población de ambas.

Un conjunto de datos numéricos puede describirse por medio de varias cantidades que permiten comprender mejor sus características. Con ello se complementa la descripción tabular o gráfica.

1.3.1 Promedios

Si se tiene un grupo de datos numéricos ordenados o tabulados, es razonable representarlos por un número que esté en su “centro” para elaborar descripciones y obtener conclusiones generales utilizando ese número. A estos números se les llama medidas de centro o promedios. El cálculo de un promedio se hace mediante una ecuación, dependiendo de la definición que se adopte de centro. Los promedios más comunes e importantes son tres, los cuales se definen en el esquema de la figura 1.26.

Page 2: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Figura 1.26 Promedios

El promedio más ampliamente usado es la media aritmética. Posee propiedades insuperables de muestreo y por tanto para realizar inferencias. Sin embargo, no siempre es recomendable usarla, pues la mediana puede utilizarse con mayor propiedad que la media aritmética para representar datos cuando la distribución de frecuencias tiene un sesgo pronunciado. La propiedad más importante de la moda es que nos informa sobre los datos más frecuentes. La representación de un grupo de datos estadísticos por una medida de tendencia central puede hacerse por el mismo motivo por el que dos montones de naranjas se representan por su cantidad: para compararse. Veamos con mayor detalle el significado de estas medidas de tendencia central.

MEDIA ARITMÉTICA

Una razón del uso tan amplio de la media aritmética es que su cálculo es muy sencillo. Pero son sus cualidades matemáticas y estadísticas las que la convierten en el promedio más adecuado para la estimación o inferencia de parámetros a partir de una muestra.

...................................................................................................................................................La media aritmética de un conjunto de n datos de una muestra se representa por el símbolo

; se obtiene sumando los valores de la muestra, x1 + x2 + ... + xn, y dividiendo esta suma entre n, el total de observaciones en la muestra. Esto es,

Page 3: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

...................................................................................................................................................

Para los datos de una población, la media aritmética se define así:

donde N representa el número total de datos en la población.

El signo se usa para el estadístico media aritmética de las muestras; x i es una representación del valor numérico que asume el i – ésimo dato en la muestra o en la población. La letra griega (mu) se usa para el parámetro media aritmética de la población.

La media aritmética es el punto de equilibrio de los datos: su posición corresponde al punto donde la masa de datos se reparte por igual. Analiza el ejemplo 1.45.

Ejemplo 1.45

Supongamos que estudiamos el conjunto de observaciones 1, 2, 2, 2, 2, 2, 3, 3, 4, 4, 5, 24. La media aritmética es 4.5:

Si colocamos figurativamente sobre una barra numérica los valores, como se muestra en la figura 1.27, el 4,5 es el punto de equilibrio de las masas de números a sus lados. La media aritmética es una medida de posición del centro de los datos.

Page 4: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Figura 1.27 La media aritmética es un punto de equilibrio de las masas de números a sus lados

Una analogía para la media aritmética es la siguiente. Si se corta un polígono regular de cartón, su centro estará en el punto donde se intersequen las mediatrices de dos cualesquiera de sus lados. Si se coloca en ese punto un alfiler, el polígono guardará equilibrio. Ese punto corresponde a lo que se llama centro de masa del polígono, y a lo que para un conjunto de mediciones es su media aritmética.

Figura 1.28 Centro de polígonos regulares

Así, la media aritmética es el valor de la posición del centro de un conjunto de datos.

Dada esta característica de la media aritmética de un conjunto de datos como centro de todos los datos, se cumple la propiedad mostrada en el ejemplo 1.46.

Ejemplo 1.46

Se observan las edades en años de 6 voluntarios en la Cruz Roja en Poza Rica: 19, 23, 23, 25, 35, 43. La media aritmética es

¿qué sucede si se calcula la suma de cada resta posible ? Observemos.

(19 – 28) + (23 – 28) + (23 – 28) + (25 – 28) + (35 – 28) + (43 – 28) = - 9 – 5 – 5 – 3 + 7 + 15 = 0

Otra propiedad de la media aritmética es que su valor es afectado por valores extremos. Esto se muestra en el ejemplo 1.47.

Ejemplo 1.47

La media aritmética de los datos 1, 2, 3, 4, 1000, es

Page 5: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

=

Este valor está lejos de los números “parecidos” 1, 2, 3, 4, que son más, porque es “jalado” por el número 1000, muy grande respecto a los demás.

Es muy común utilizar la media de aritmética de un conjunto de datos para compararla con la media aritmética de otro conjunto de datos, cuando es posible hacer esto. Enseguida se da un ejemplo de una aplicación de este tipo.

Ejemplo 1.48

Un empresario, dueño de una gasolinera A, desea comparar las ventas diarias en litros de su gasolinera con las de un competidor B. Ambas son gasolineras muy parecidas en cantidad de operarios, capacidad y ubicación en la ciudad de Aguascalientes. Los datos correspondientes para 40 días del año 2004, tomados al azar, se muestran en las tablas 1.29ª y 1.29b.

Tabla 1.29a Ventas en cientos de litros por día en la gasolinera A28.7 42.9 39.4 35.6 37.0 37.9 37.6 29.036.6 38.5 37.5 35.4 40.8 33.7 38.7 29.233.0 35.9 25.3 32.7 31.4 34.9 29.3 31.237.6 30.6 31.1 33.1 35.8 37.2 31.1 37.739.5 33.2 32.4 35.1 33.4 32.8 33.0 35.9

Tabla 1.29b Ventas en cientos de litros por día en la gasolinera B39.7 30.6 36.5 41.5 37.7 28.5 34-6 32.839.4 44.6 37.1 31.4 43.9 38.4 40.4 37.942.4 40.0 34.0 35.8 36.1 34.8 35.2 30.528.0 48.9 47.6 43.0 44.2 40.6 41.5 52.736.0 33.0 44.4 46.3 34.1 52.1 27.7 47.9

¿Cuál gasolinera podría decirse que es la más productiva?

El cálculo de la media aritmética de cada muestra arroja los siguientes resultados:

A=

B=

La conclusión que puede obtenerse es que, dado que las gasolineras son parecidas en estructura y recursos humanos, y el promedio de ventas diarias de la gasolinera B es mayor que el promedio de las ventas diarias de la gasolinera A (38.79 contra 34.54 cientos por

Page 6: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

día), se infiere que la gasolinera B es más productiva que la gasolinera A. Toda conclusión, basada en muestras, es probable y no absoluta. Conclusiones como éstas deben hacerse con muchas reservas; observa que no se da medida alguna de la veracidad del resultado. Esas medidas se obtienen por medio de la probabilidad.

Actividades de aprendizaje

Reúnete con tres compañeros de tu grupo y contesten o resuelvan lo que se les pide. Comparen sus resultados con los de otros compañeros. Si tienen alguna duda, acudan con su maestro(a).

1 CUENTAS POR PAGAR

Una contadora hace una verificación de las cuentas por pagar vencidas cada mes del año 2004 y que generaron un pago adicional por intereses en una compañía comercializadora de cereales. Su reporte inicial lo preparó con todos los datos disponibles, como se muestra en la siguiente tabla.

Cuentas por pagar vencidas e intereses en pesos mensuales (2004)MES 1 2 3 4 5 6 7 8 9 10 11 12

Cuentas 8 7 9 8 5 6 9 10 12 7 5 8Pago de intereses (miles)

1.8 2 3.1 2.9 1.6 1.8 3.5 4 4.8 2.4 1.5 2.4

a. ¿Cuál es la pregunta de la contadora?b. ¿Cuáles son las variables que se estudian?c. ¿De qué tipo y densidad son las variables?d. ¿Los datos son los de una población? ¿Por qué?e. ¿Cuál es el rango de los datos?f. ¿Cuál es la media aritmética de cada variable?g. ¿Los datos son experimentales o tomados por observación? ¿Por qué?

2 TIEMPO DE OPERACIÓN

Alejandra trabaja en una compañía que produce pequeñas partes electrónicas para autos. Ella estuvo encargada de tomar tiempos a una operaria que realizaba una operación manual. En una serie de 10 tiempos, obtuvo el valor de la media aritmética = 37 s. Al revisar sus cálculos, vio que borró uno de ellos. Los datos que quedaron fueron: 39, 34, 41, 37, 36, 35, 37, 33, 40.

a. ¿Cuál es el dato perdido?b. ¿Cuál es el rango de los datos?

Page 7: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

c. ¿Cuál será el resultado de la suma ? [Esta suma se lee así: “la suma de las diferencias entre cada uno de los diez datos y la media aritmética de los mismos datos”.]

MEDIA ARITMÉTICA DE DATOS AGRUPADOS

Los datos agrupados en tablas no permiten conocer los valores de los datos individuales, y por tanto, para calcular la media aritmética de ellos es necesario utilizar otro recurso, el cual se señala en el siguiente ejemplo.

Ejemplo 1.49

Bárbara estudia en el Tecnológico de Aguascalientes y registra diariamente el tiempo en minutos que tarda en realizar la tarea de matemáticas. Tomó una muestra aleatoria de 30 registros y construyó la distribución de frecuencias siguiente.

Tabla 1.30 Tiempo para realizar la tarea de matemáticas

CLASE J

INTERVALOS REALES DE

CLASE (MIN): T = TIEMPO

FRECUENCIAf

FRECUENCIA RELATIVA

fr

MARCA DE CLASE

MC

1 60<T65 2 0.0667 62.52 65<T70 2 0.0667 67.53 70<T75 6 0.2000 72.54 75<T80 4 0.1333 77.55 80<T85 7 0.2333 82.56 85<T90 2 0.0667 87.57 90<T95 6 0.2000 92.58 95<T100 1 0.0333 97.5

Totales 30 1.000

¿Cuál es la media aritmética?

Frecuentemente, es necesario calcular la media aritmética a partir de los datos numéricos en una distribución de frecuencias. La media aritmética calculada a partir de datos agrupados en una distribución de frecuencias se obtiene utilizando la siguiente fórmula:

Page 8: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Donde MCj es la marca de clase de la clase j, y f j es la frecuencia de la clase j; j = 1, 2, …, k.

Así, para calcular la media aritmética de los tiempos que utiliza Bárbara para hacer la tarea de matemáticas, se tiene que

Este es el centro de los datos, tal como se explicó antes.

Actividades de aprendizaje

En compañía de un compañero de grupo calcula la media aritmética de los siguientes datos. Comparen el proceso que siguieron y el resultado obtenido con los de otros compañeros. Si tienen duda, consulten a su profesor(a).

1 BLOQUES DE MADERA

En una investigación para conocer la resistencia, R, a la compresión en la construcción de bloques elaborados con desechos de madera que se utiliza en la construcción, se obtuvo la siguiente distribución de frecuencias. Las unidades están dadas en kilogramos por centímetro cuadrado.

CLASE JINTERVALOS REALES DE

CLASE: KG/CM3

FRECUENCIAf

FRECUENCIA RELATIVA

fr

MARCA DE CLASE

MC1 0<R50 142 50<R100 683 100<R150 624 150<R200 345 200<R250 116 250<R300 77 300<R350 38 350<R400 1

Totales 200

El histograma de frecuencias se muestra a continuación.

Page 9: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

a. Completa la tabla.b. ¿Cuál es el valor de la media aritmética?c. Localicen la media aritmética sobre el eje horizontal.d. ¿Hacia qué extremo de los valores será jalada la media aritmética?e. ¿Es simétrica la distribución de frecuencias? Argumenten su respuesta.

LA MEDIANA

La mediana de un conjunto de datos es otro promedio. Sin embargo, a diferencia de la media aritmética, se utiliza para caracterizar un conjunto de datos cuando existe un sesgo considerable en ellos (observa el histograma de la actividad de aprendizaje anterior). Su propiedad principal es que aproximadamente 50% de los datos estudiados son menores que el valor de la mediana.

...................................................................................................................................................La mediana de un grupo de datos numéricos ordenados del menor al mayor (o del mayor al menor) es el valor del dato a cuya izquierda (derecha) se encuentra aproximadamente 50 por ciento de los datos....................................................................................................................................................

Page 10: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

La mediana no se calcula mediante operaciones aritméticas en las que intervengan todos los valores, como se hace con la media aritmética. Por tal motivo, su valor no es afectado por valores extremos como ocurre con la media aritmética.

Denotaremos la mediana de una muestra como x0.5. Este valor es un estadístico.

El símbolo para la mediana de una población será X0.5, Este valor es un parámetro.

Enseguida se muestran dos ejemplos numéricos del cálculo de la mediana.

Ejemplo 1.50

Número impar de datos. La mediana de los n = 7 datos maestrales 2, 3, 5, 7, 10, 20, 40 es x0.5 =7: El número de datos es impar, por lo que el valor de la mediana es el dato central (en este caso, 7).

Ejemplo 1.51

Número par de datos. La mediana de los n=4 datos maestrales 2, 4, 6, 10 es = 5:

Cuando el número de datos es par, el valor de la mediana es igual al de la media aritmética de los datos centrales. Los dos datos centrales son 4 y 6 que, siendo el número de datos n

par, ordenados del mayor al menor corresponden a los lugares y + 1.

Así, para calcular el valor de la mediana de datos ordenados de forma creciente o decreciente se utiliza la siguiente regla.

Si el número de datos es impar, el valor de la mediana es igual al del dato central de la muestra o la población.

Si el número de datos es par, el valor de la mediana es igual al promedio de los dos datos centrales.

Actividades de aprendizaje

Reúnete con tres compañeros de tu grupo y contesten lo que se les pide a continuación. Comparen sus respuestas con las de otros equipos.

1 MARCATEXTO

Los metros lineales que pueden trazarse con un marcatextos de la marca Dibujín es una variable aleatoria porque cada vez que se practica el experimento no se obtiene el mismo resultado. En la fábrica que los produce se efectuó un experimento con 40 de sus marcatextos color amarillo. Los datos obtenidos se muestran en la tabla siguiente, los cuales se han ordenado del menor al mayor.

Page 11: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Metros lineales pintados por marcatextos amarillos Dibujín7.288 11.166 13.179 15.132 16.8247.382 11.232 13.541 15.182 17.6728.230 11.597 13.809 15.239 18.0179.031 11.934 13.936 15.574 18.1989.592 12.169 13.983 15.696 18.62410.434 12.536 14.096 15.827 19.37210.565 12.723 14.634 16.507 20.05010.659 13.038 14.721 16.659 29.524

a. ¿Cuál es la variable en estudio? ¿De qué tipo y densidad es?b. ¿En qué escala se medirá la variable?c. ¿Cuál es el elemento de muestreo?d. ¿Cuántos datos puede tener la población?e. ¿Cuál es la media aritmética de los datos?f. ¿Cuál es la mediana de los datos?g. ¿Cuántos datos hay al a izquierda de la mediana? ¿Qué porcentaje representan?h. ¿Qué significado tiene la mediana?

Cálculo de la mediana a partir de datos agrupados

A continuación mediante un ejemplo se explica cómo calcular la mediana cuando los datos han sido agrupados por intervalos de clase.

Ejemplo 1.52

En la tabla 1.31 se muestra la distribución de frecuencias de los litros de leche realmente envasados por una máquina envasadora en recipientes de 2 litros, correspondiente a una muestra de tamaño 160. Se trabajó con tres cifras significativas como se observa en los intervalos reales de clase.

Tabla 1.31 Litros de leche envasados por una máquina

CLASEINTERVALOS REALES DE

CLASE

FRECUENCIAf

FRECUENCIA ACUMULADA

faINFORMACIÓN

1 1.92<L1.94 2 22 1.94<L1.96 12 143 1.96<L1.98 28 424 1.98<L2.00 39 81 Clase mediana5 2.00<L2.02 42 1236 2.02<L2.04 23 146

Page 12: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

7 2.04<L2.06 12 1588 2.06<L2.08 1 1599 2.08<L2.10 1 160

Totales 160

Como la cantidad de datos es par, la mediana de los datos ordenados es el promedio de los

datos correspondientes a los lugares = 80 y + 1 = 81. Pero al estar expuestos en

una distribución de frecuencias, sólo puede conocerse la clase donde están estos datos: la clase 4. Para aproximar el valor de la mediana de nuestros datos, se utilizará el llamado

dato mediana: = 80.

El cálculo de la mediana a partir de datos agrupados en una distribución de frecuencias se realiza como sigue. Se utiliza la ecuación

donde

LIm = 1.98 es el límite real inferior de la clase mediana (la clase mediana es la clase 4, porque en ella está el dato 80; en esa clase están los datos del 43 al 81, porque hasta la clase 3 hay acumulados 42 datos, según se ve en la columna de frecuencia acumulada);

fm es la frecuencia de la clase mediana, y

fa m-1 es la frecuencia de la clase anterior a la clase mediana.

Al sustituir los datos, se puede realizar el cálculo:

Este valor significa que aproximadamente 50% de los envases tienen menos de 1.99 litros.

LA MODA

La moda es otra medida de tendencia central de un conjunto de datos.

Page 13: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

...................................................................................................................................................Moda: Es el valor del dato numérico más frecuente en un conjunto de datos....................................................................................................................................................

Se utilizará el símbolo mo para representar la moda de los datos numéricos maestrales. Y Mo para la de datos de una población.

Ejemplo 1.53

La moda de los datos maestrales 3, 3, 3, 4, 4 es mo= 3.

Ejemplo 1.54

La moda de los datos maestrales 2, 3, 3, 4, 4, 4 es mo = 4.

Ejemplo 1.55

Los datos 3, 4, 5, 12, 24 no tienen moda, porque la frecuencia de cada observación es la misma.

Ejemplo 1.56

Los datos maestrales 1, 2, 2, 2, 3, 3, 3, 4, 4, tienen dos modas: mo1 = 2 y mo2 = 3.

Un conjunto de datos puede tener una o varias modas. Cuando existen dos modas se denomina al conjunto bimodal. Un conjunto con tres modas se denomina trimodal, y así sucesivamente.

Actividades de aprendizaje

Trabaja con un compañero de tu grupo; contesten y resuelvan lo que se les pide. Si tienen alguna duda, consulten con su maestro(a).

1 RECLAMOS DE CALIDAS

El número de clientes, por semana, que reclaman por la falta de calidad de un producto en una tienda que vende artículos electrónicos es una variable aleatoria relacionada a una frecuencia. El encargado de reclamaciones lleva una estadística, plasmada de manera incompleta en la siguiente distribución de frecuencias.

Reclamaciones por semana

CLASE INTERVALOS REALES DE

CLASE:

FRECUENCIAf

FRECUENCIA RELATIVA

fr

% PORCENTAJE ACUMULAD

O

MARCA DE CLASE

Page 14: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

RECLAMOS / SEMANA

1 4 32 5 53 6 124 7 85 8 66 9 37 10 1

Totales 34

a. ¿Cuál es la variable en estudio? ¿De qué tipo y densidad es?b. ¿Por qué los límites de clase no son intervalos?c. ¿Cuál es la media aritmética de los datos numéricos?d. ¿Cuál es la mediana de los datos?e. ¿Cuál es la moda?f. ¿Existe una clase modal? ¿Cuál es y por qué?g. ¿Tiene sesgo la distribución? ¿Cómo se percibe?h. Compara los tres promedios. ¿Cuál es el mayor, el medio y el menor? ¿A qué se

deberá esa diferencia? Coméntalo con tus compañeros.i. Construye un gráfico de espigas para los datos.j. Describe las peculiaridades del gráfico de espigas. Señala sobre el eje horizontal el

sitio de la media, la mediana y la moda.

1.3.2 Propiedades de la media, la mediana y la moda

En la tabla 1.32 se resumen algunas propiedades de las tres medidas de tendencia central estudiadas hasta este punto.

Tabla 1.32MEDIA MEDIANA MODA

Es el punto de equilibrio de los datos.

Es afectada por valores extremos que causan asimetría en la distribución de los datos.

Utiliza todos los

Parte un conjunto de datos ordenados en dos subconjuntos de datos, y aproximadamente 50% de los datos son menores que el valor de la mediana (forman uno de los

Es el valor del dato más frecuente en un conjunto de datos.

No es afectada por valores extremos.

Su cálculo no requiere de toda la información.

Page 15: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

datos numéricos para su cálculo.

Representa bien a datos distribuidos simétricamente.

La suma de todas las desviaciones xi -

es 0:

subconjuntos). No es afectada por

valores extremos. Su cálculo no

requiere de toda la información.

Representa bien el centro de datos con distribución sesgada.

Enseguida se muestran varias gráficas en las que se visualiza cuál es la relación entre la media, la mediana y la moda para diferentes tipos de distribuciones de frecuencias, representados por curva continua.

Figura 1.29 Relación entre la media, la mediana y la moda (distribución de frecuencias con sesgo derecho)

En el gráfico de la figura 1.29 se muestra una distribución de frecuencias estilizada por una curva y en relación a los porcentajes. Puede verse que la distribución tiene un sesgo (cola más larga) a la derecha. La moda, la mediana y la media de los datos de los que proviene son

Este orden se da cuando el sesgo es derecho. La moda se toma por el valor de la variable donde la curva tiene su máximo (punto más alto).

Page 16: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Figura 1.30 Relación entre la media, la mediana y la moda (distribución de frecuencias con sesgo izquierdo)

En el gráfico de la figura 1.30 se muestra una distribución de frecuencias estilizada por una curva y en relación a los porcentajes. Tiene un sesgo (cola más grande) a la izquierda. La media, la mediana y la moda de los datos de los que proviene son

Este orden se da cundo el sesgo es izquierdo.

Figura 1.31 Relación entre la media, la mediana y la moda (distribución de frecuencias simétrica, sin sesgo)

El gráfico de la figura 1.31 tiene colas iguales. No hay sesgo. Se le llama simétrico. En este caso, el valor de la media es igual al de la mediana y al de la moda:

Page 17: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Cuando se estudian datos numéricos estadísticos, es conveniente revisar lo que expresan varias medidas características, como la media aritmética, la mediana y la moda, en lugar de conformarse con una sola. Enseguida se ejemplifica esta conveniencia.

Ejemplo 1.57

Se comparan los resultados finales de los alumnos de dos grupos, D y E, que estudiaron inglés durante un año mediante dos métodos diferentes. Los chicos y chicas que iban a tomar el curso fueron distribuidos al azar en cada grupo. Los resultados son producto de aplicar una misma prueba a ambos grupos. Se estudian muestras de tamaño 30 y se pretende determinar qué método es el mejor. Los datos se muestran en las tablas 1.33 y 1.34.

Tabla 1.33GRUPO D

84.1 84.2 84.9 84.9 85.0 85.2 85.4 85.6 85.6 85.984.1 84.8 84.9 85.0 85.0 85.2 85.5 85.6 85.6 86.084.2 84.8 84.9 85.0 85.1 85.3 85.5 85.6 85.7 86.1

Tabla 1.34GRUPO E

60.8 64.8 69.0 70.6 71.9 76.6 79.4 81.4 82.7 85.363.2 66.6 69.6 71.1 73.6 77.0 79.7 81.6 84.1 88.264.5 67.3 70.2 71.3 74.2 77.0 79.9 81.8 84.8 96.6

El cálculo de la media aritmética, la mediana y la moda se muestran en la tabla 1.35.

Tabla 1.35ESTADÍSTICAS DESCRIPTIVAS

GRUPO n MEDIA MEDIANA MODAFRECUENCI

A DE LA MODA

MÍNIMO MÁXIMO

D 30 85.17 85.15 Múltiple 1 84.1 86.1E 30 75.70 75.40 Múltiple 1 60.8 96.6

Además, se prepararon los histogramas de frecuencia que se muestran en las figuras 1.32 y 1.33.

Page 18: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Figura 1.32

Figura 1.33

De acuerdo con los resultados obtenidos, algunas de las conclusiones que se pueden extraer son las siguientes.

1) La media aritmética del grupo D es mayor a la del grupo E por 85.17 – 75.50 = 9.67 puntos de 100; esto es, 12.80% mayor con respecto al valor 75.50:

2) Los resultados obtenidos por los muchachos y muchachas del grupo D están muy próximos unos de los otros; el rango es R = 86.1 – 84.1 = 2 puntos. Lo cual significa que su dispersión es muy pequeña comparada con la de los resultados obtenidos con el método con que trabajó el grupo E: R = 96.6 – 60.8 = 35.8 puntos.

Page 19: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

3) Las medianas de los grupos D y E son, respectivamente, 85.15 y 75.40. Así, aproximadamente 50% de los estudiantes del grupo D obtuvo más de 85.15 puntos, aunque menos de 86.1. Asimismo, aproximadamente 50% de los estudiantes del grupo E obtuvo más de 75.40 puntos, aunque menos de 96.1 puntos. Aquí se aprecia de nuevo la mayor dispersión de las calificaciones en este grupo.

4) La moda no existe porque ninguna calificación se repite en caso alguno. Sin embargo, los gráficos muestran que para el grupo D la mayoría de las calificaciones caen entre 84.88 y 85.29. Se puede decir que esta es la clase modal o clase con la mayor frecuencia.

5) En ambos casos, de acuerdo con los gráficos y dado que las medias aritméticas son muy parecidas a las medianas, se puede decir que las distribuciones de datos son simétricas.

6) De acuerdo con lo anterior, el método de enseñanza aplicado en el grupo D parece ser más eficiente. Esta conclusión es probable. Las medidas descubiertas sólo permiten describir la situación.

Actividades de aprendizaje

Reúnete con dos de tus compañeros de clase y realicen la siguiente actividad. Comparen sus respuestas con las obtenidas por otros compañeros. Si tienen alguna duda, consulten a su maestro(a).

1 El peso del papel blanco para fotocopiado debe tener un peso de 75 0.04 g/m2. El ingeniero de calidad de la línea de producción toma una muestra de 100 hojas de papel y las pesa; asimismo, gráfica los resultados en un histograma de frecuencias el cual se muestra a continuación.

Page 20: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Al realizar los cálculos de los promedios obtuvo las siguientes cantidades: 75.0560, 75.0916 y 75.5500.

a. Describe el contenido del histograma de frecuencias.b. ¿Cuál de las tres medidas es la media aritmética y cuál es la mediana? ¿Cómo

realizaste la deducción? Explica.

1.3.3 Regresión lineal como promedio

Mediante el siguiente ejemplo, iniciaremos el estudio de lo que es la regresión lineal.

Ejemplo 1.58

Se estudia el ingreso económico mensual de familias dependientes de obreros residentes en Nuevo León. Dicho ingreso puede compararse contra la edad del padre de familia. De este modo, se estudian dos variables que representan a su vez una variable divariada susceptible de escribirse como un par ordenado estadístico: (x, y). En la tabla 1.36 se muestran los datos correspondientes a una muestra aleatoria de 30 familias.

Tabla 1.36 Ingresos mensuales en miles de pesos de familias en Nuevo León dependientes de obreros según la edad del padreFAMILI

A1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Edad 35 35 36 38 38 38 40 41 41 43 43 45 45 45 45Ingreso 5.6 5.9 5.8 5.9 6.1 5.8 6.2 5.9 6.0 5.9 6.0 6.3 6.2 5.9 6.2FAMILI

A16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Edad 45 46 46 47 48 48 48 49 52 54 55 56 58 58 60Ingreso 6.4 6.2 6.1 6.8 7.0 6.7 6.5 6.8 6.7 7.4 7.5 7.9 8.0 8.3 8.1

De esta muestra se desprende que la variable independiente, es decir, la que explica el ingreso, es la edad. Por lo que la variable ingreso, al depender de la edad, será la variable dependiente. Se tienen así pares ordenados de la forma (edad, ingreso). Estos pares ordenados pueden representarse en un gráfico llamado de dispersión, sobre un sistema de ejes cartesiano, para describir el comportamiento de las variables, como se muestra en la figura 1.34.

Page 21: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Figura 1.34 Gráfico de dispersión de los puntos de los ingresos mensuales familiares contra la edad del padre en familias de obreros de Nuevo León

En este gráfico se observa lo siguiente:

1) A mayor edad corresponden mayores ingresos.2) Aunque la edad sea la misma, los ingresos no son iguales: hay variación.3) Se puede dibujar una línea recta entre los puntos para describir el fenómeno

mediante un modelo.

La recta que se ha ajustado a los datos se llama recta de regresión. Esa recta describe el comportamiento conjunto de las variables que se estudian. Igual que en geometría analítica, la recta puede tener pendiente positiva o negativa; es un modelo que permite calcular promedios entre la nube de puntos para diferentes valores de la edad.

Sobre el gráfico de regresión se ha notado la ecuación de la recta de regresión:

Ingreso = 1.8699 + 0.1016 x edad

El número 0.1016 es la pendiente de la recta. Significa que por cada año que aumenta la edad, el sueldo mensual se incrementa 0.1016 miles de pesos; esto es, 101.6 pesos / mes. Con esta recta es posible predecir un valor del ingreso mensual en pesos por familia. Por ejemplo, si la edad es 50 años, se sustituye en la ecuación:

Ingreso = 1.8699 + 0.1016 (50) = 6095 miles/mes

Este valor es un promedio; quiere decir que en promedio las familias de un obrero cuya edad es de 50 años tienen ingresos de 6950 pesos al mes.

Page 22: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Por consiguiente, mediante el método de la regresión lineal simple se puede construir una ecuación y la respectiva recta para describir cómo una variable dependiente es afectada o explicada por una variable independiente. Esta recta es un promedio.

APLICACIONES DE LA REGRESIÓN LINEAL

La técnica de la regresión lineal simple permite describir por medio de un modelo matemático el comportamiento y la probable relación entre dos variables, así como extraer inferencias acerca de la variable dependiente, considerando un nivel de la variable independiente. Estas inferencias dan lugar a que la regresión lineal sea útil para

explicar un fenómeno realizar una predicción, y controlar un proceso

Por ejemplo, en el caso de la edad y su relación con el ingreso familiar, los datos se comportan aproximadamente como lo hace la línea recta descrita por la ecuación Ingreso = 1.8699 + 0.1016 x edad, y por tanto este modelo lineal (la ecuación) explica la relación entre las variables; se dice que esta relación es lineal.

RECTA DE REGRESIÓN AJUSTADA

La construcción de la recta de regresión que modela un conjunto de pares ordenados estadísticos se obtiene mediante el método de mínimos cuadrados. Este método asegura que la recta ajustada posea la menor distancia a todos los puntos, tomándose la que es vertical desde cada punto a la recta.

La recta de regresión lineal simple tiene la forma

y = b0 + b1 x,

donde y es la variable dependiente, x es la variable independiente; b0 es la ordenada al origen (se llama ordenada al origen porque es la distancia del punto de intersección de la recta con el eje vertical, el de las ordenadas); si se utilizan datos de una muestra, b 0 es un estadístico; y b1 es la pendiente de la recta (representa una relación entre las variables x y y: Si x crece una unidad, y crece b1 unidades).

A los números b0 y b1 se les llaman coeficientes de regresión; b1 también es un estadístico. Para obtener los valores b0 y b1 se utilizan las siguientes ecuaciones llamadas normales.

Page 23: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Actividades de aprendizaje

Resuelve el siguiente ejercicio, y compara el resultado con el de algún compañero de tu grupo. Si tienes alguna duda, acude con tu profesor a aclararla.

1 Andrea es vendedora de casas usadas. Ella quiere saber si el precio al que se venden (y) se relaciona con la antigüedad de la casa (x). Para ello, selecciona al azar 10 casas vendidas en colonias de nivel social y área construida parecida; obtiene los datos de la siguiente tabla. Los pesos de venta se han hecho equivalentes al año 2005.

Precios por venta de casas (miles de pesos)

CASOy: PESOS /

VENTA (MILES) X: ANTIGÜEDAD xiyi xi2

1 200 8 1600 642 350 6 2100 363 250 84 380 55 450 26 230 77 420 38 360 69 440 310 210 10

SumasMedias = =

a. ¿Cuál es la población en estudio?b. Construye el gráfico de dispersión.c. Obtén la recta de regresión.d. ¿Cuál es el promedio de venta en pesos de una casa con 8 años de antigüedad? Usa

la recta de regresión para calcularlo.e. ¿Cuál es el valor del coeficiente de regresión, b1?f. ¿Qué significa el coeficiente de regresión b1?

Page 24: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Actividades generales 1.3

El siguiente conjunto de ejercicios complementarios te servirá para reafirmar tu conocimiento sobre los conceptos adquiridos hasta este punto. Las variadas situaciones que se te sugieren en diversos contextos permitirán que asocies más ampliamente las ideas que has estudiado y aplicado. Igual que antes, para obtener una solución a un ejercicio deberás aplicar una combinación de varios conceptos, los cuales se han enriquecido con los temas de esta unidad. Te sugerimos que trabajes en compañía de otros compañeros de tu grupo.

1 El conjunto de datos 1, 2, 3, 4 y 5 corresponde a una muestra aleatoria tomada de la población 0, 1, 2, 3, 4, 5, 6, 7, 8 y 9. El investigador reporta que el muestreo se hizo de la siguiente manera: Se colocaron en la copa de un sombrero 10 cartas, cada una con uno de los dígitos escrito en ella. Enseguida se tomó la primera, y fue aquella marcada con el 1. La carta no se regresó al sombrero. Se tomó la siguiente de entre las 9 restantes y salió el 2, y así sucesivamente.

a. Calcula el valor de la media aritmética.b. Calcula el valor de la mediana.c. ¿Cómo son la media aritmética y la mediana? ¿Cuál es el motivo?d. ¿Existe una moda? ¿Por qué?e. Si practicas el experimento anterior, ¿crees que la probabilidad de que ocurran las

cartas con los números 1, 2, 3, 4, 5, y en ese orden, corresponde a un evento muy frecuente? ¿Por qué?

2 Guadalupe es una nueva notaria pública en la ciudad de Durango. Ella observa el número de clientes que arriban a su despacho para solicitar un servicio. Quiere determinar si debe contratar una auxiliar de tiempo completo o de medio tiempo. Según sus observaciones, cada cliente requiere de 15 minutos de atención en promedio para recibir un buen servicio. En el lapso de cada hora de una jornada laboral de 8 horas durante tres días de una semana, contó el número de clientes que llegan a la notaría, lo cual se registra en la siguiente tabla.

DÍA 1 2 3HORA C

LIENTES

CLIENTES

CLIENTES

1 10

9 9

2 8 7 83 6 4 54 4 3 4

Page 25: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

5 3 5 36 2 3 47 3 2 28 1 4 3

TotalPromedio

a. Observa los datos con atención y describe su comportamiento.b. ¿Cuál es el promedio de clientes que acuden a solicitar un servicio notarial por hora

(media aritmética) cada día? Anótalos en la tabla.c. ¿Debe Guadalupe contratar una auxiliar de tiempo completo? ¿Por qué?

3 Fernando ha realizado un descubrimiento: La media aritmética de los datos 8, 16 y 32 es

igual a 8 .

a. ¿Es correcta esta forma de calcular la media?b. ¿Puede generalizarse este argumento?c. Calcula la media aritmética de los números 4, 12, 16 y 24 mediante este método.

4 Se mide el índice de humedad en una cámara con equipo tecnológico utilizado para construir microchips. Se espera que la temperatura promedio sea de alrededor de 70 unidades. Al tomar 5 mediciones en el lapso de una hora, se obtuvo como media aritmética 71 unidades. Escribe 5 datos que permitan obtener ese promedio si el rango de ellos fue de 1.5 unidades.

5 Cuatro datos numéricos, correspondientes al tiempo que se requiere para aprender a manejar con propiedad un torno automático, tienen como mediana 90 horas y como moda 91 horas. ¿Cuáles pueden ser los datos? Escribe un conjunto de ellos.

6 En el estado de Aguascalientes, hubo una alarma acerca de la probable presencia de la bacteria estreptococo beta hemolítico en un alto porcentaje de personas adultas (mayores de 18 años) que radican ahí. Esta bacteria se desarrolla mejor en presencia de climas fríos. Para entender el fenómeno, se tomó en el mes de enero de 2004 una muestra de 120 adultos, en diferentes pueblos y ciudades del estado. No se sabía si cada uno de ellos estaba infectado o era portador. Enseguida se muestran los datos obtenidos, los cuales corresponden a la observación de la bacteria en la muestra, tras practicar los 120 exudados faríngeos respectivos.

PERSONAS1-10 1

1-20

21-30

31-40

41-50

51-60

61-70

71-80

81-90

91-100

101-11

111-12

Page 26: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

0 0NO N

ONO

NO

NO

NO

NO

NO

SÍ NO

NO

NO NO

NO

SÍ NO

NO

NO

SÍ NO

SÍ NO

NO

SÍ NO

NO

NO

NO

SÍ NO

NO

NO

NO

NO

NO

NO SÍ NO

NO

NO

NO

NO

SÍ NO

NO

NO

NO

SÍ NO

NO

NO

NO

NO

NO

NO

NO

NO

NO

NO NO

SÍ NO

NO

NO

NO

NO

NO

SÍ SÍ NO

NO NO

NO

NO

NO

NO

NO

NO

NO

NO

NO

NO

NO NO

NO

NO

NO

NO

NO

NO

NO

SÍ NO

NO

NO NO

NO

SÍ NO

NO

NO

NO

NO

NO

SÍ NO

NO NO

NO

NO

NO

NO

NO

NO

NO

NO

NO

a. ¿Por qué se tomó una muestra aleatoria para estudiar este fenómeno? ¿Qué otra opción había?

b. ¿En qué porcentaje de las personas estudiadas estaba presente la bacteria?c. Observa cómo calculaste el porcentaje. ¿Este porcentaje es una medida aritmética?

¿Por qué?d. ¿Fue correcto haber tomado los datos en el mes de enero? ¿Sería inadecuado el

resultado si la muestra se tomara en junio? ¿Por qué?e. En el estado de Aguascalientes alrededor de 500 mil personas tienen más de 18

años. ¿Se podrá conocer exactamente la proporción de la presencia de la bacteria en todos los adultos del estado con los resultados de la muestra de 120 adultos? ¿Por qué?

f. Si se toma una muestra aleatoria de tamaño 10 000, ¿Será más confiable o representativa la información respecto a los 600 mil adultos? ¿Por qué?

g. ¿Qué significa muestra representativa?h. ¿Cómo se relacionan los conceptos de muestra aleatoria e inferencia en un caso

como éste?

7 a. ¿Cuál es la mediana aritmética de los datos 3, 3, 3, 3?b. ¿Tienen variabilidad estos datos? ¿Por qué?c. ¿Cuál es la mediana de los datos?d. ¿Cuál es la moda de los datos?e. ¿Cuál de los tres promedios anteriores representa mejor a los datos? ¿Por qué?

Page 27: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

8 En una investigación científica, ocurre la sucesión de números , 3,...

(infinita). ¿Cuál es la media aritmética de estos números? Investiga.

9 La siguiente es una población de precios de libros en pesos mexicanos que se venden por Internet:

18 libros cuyo precio individual es de 100 pesos. 14 libros cuyo precio individual es de 200 pesos. 8 libros cuyo precio individual es de 8 000 pesos.

a. ¿Cuál es el precio promedio de los libros (la media aritmética)?b. ¿Cuál es el valor de la mediana de los precios?c. ¿Cuál es el valor de la moda de los precios?d. ¿Cuál de estos tres promedios representa mejor a los datos? Explica por qué.

10 En Michoacán se producen máscaras de madera. Dos pequeños talleres artesanales en Quiroga, “Mararán” y “Cuezateo”, las fabrican de diferentes tamaños y calidades consumiendo madera de los bosques del estado y tintes de una misma empresa que adquieren en la capital. Sin embargo, según una investigación los precios de venta por tipo de máscara en pesos parecen no ser equivalentes.

Los siguientes datos corresponden a los precios por máscara de cada uno de los diferentes tipos que se producen en cada uno de los talleres.

MARARÁN6 12 18 1206 12 18 1506 12 20 1508 15 208 15 2010 17 20

CUEZATEO10 15 16 18 2010 15 16 1812 15 17 1912 15 17 2013 16 17 2015 16 17 20

a. ¿Cuál es la variable en estudio?b. ¿De qué tipo y densidad es la variable?c. ¿Cuál es el precio promedio de las máscaras de cada empresa? (Calcula la media

aritmética, la mediana y la moda, y además el rango para cada taller; escribe los resultados en la siguiente tabla).

MARARÁN CUEZATEO = =

x0.5 = x0.5 =mo = mo =R = R =

Page 28: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

d. ¿Qué empresa vende, de acuerdo con la media aritmética, a precios más altos o más bajos en promedio según sus tipos de máscara? Compara los resultados y promedios.

e. ¿Cuál promedio parece ser más representativo de los datos para cada taller? ¿Por qué?

f. Si se compran tres máscaras al azar de cada tipo en cada taller, ¿en cuál taller cabe esperar que se pagará más? ¿Por qué?

11 Cuando se supo que se sincronizarían los semáforos en las avenidas principales de la ciudad de Chihuahua, se midió una parte de la población de los tiempos en minutos que se tardaba un vehículo de transporte público en recorrer la ruta (sólo se midió el tiempo para aquella con más recorrido por esas calles), a fin de conocer posteriormente si la sincronización tendría algún efecto. Los datos en bruto que se pudieron recoger se presentan en la siguiente tabla.

Tiempo en minutos de un recorrido completo antes de la sincronización de los semáforos en Chihuahua

DATO

1-20 21-40

41-60 61-80

81-100

101-120

121-140

141-160

161-180

181-200

201-220

221-240

1 116.20 137.53 135.81 122.86 118.17 130.40 127.05 126.68 141.05 125.68 125.59 129.68

2 130.10 119.89 127.02 120.01 119.35 131.57 133.56 130.70 132.08 129.59 132.69 138.88

3 126.97 126.37 152.01 118.37 122.67 143.70 137.69 131.62 135.29 123.05 131.58 129.24

4 137.42 142.10 151.26 128.67 130.38 128.92 130.07 137.93 134.03 142.70 126.76 135.05

5 125.06 130.52 113.84 148.26 125.94 119.43 120.09 126.73 138.47 147.48 125.68 132.21

6 135.50 126.27 125.34 117.89 130.23 123.32 123.94 133.10 135.51 131.38 133.80 145.51

7 124.04 133.03 129.69 126.32 110.39 125.92 133.17 119.65 137.26 121.16 121.24 128.91

8 124.29 130.91 130.32 129.14 132.52 122.56 131.46 114.89 135.15 132.83 121.56 135.86

9 129.50 119.14 131.47 131.80 145.93 118.76 140.25 116.25 138.59 126.45 135.06 139.44

10 127.58 139.38 119.90 133.20 119.75 131.62 134.71 109.18 132.01 126.02 129.71 143.71

11 137.75 115.75 137.03 127.17 117.66 131.75 138.28 129.57 142.81 119.55 148.43 133.50

12 136.08 136.55 120.96 125.18 136.41 144.15 121.10 127.65 128.39 124.35 129.27 134.24

13 114.06 122.99 125.08 130.43 159.36 146.27 124.51 138.89 123.08 139.58 123.19 131.47

14 119.03 127.12 126.18 123.24 118.76 129.47 136.66 135.29 134.53 116.34 116.41 143.09

15 133.69 130.47 132.69 115.22 145.50 122.69 143.47 144.72 136.72 140.65 135.24 122.26

16 121.41 137.60 144.83 130.02 127.96 139.49 127.19 127.58 143.18 132.21 144.93 129.60

17 129.99 142.10 133.79 114.12 129.41 119.51 131.14 112.49 136.67 136.45 128.31 138.79

18 116.12 122.90 115.33 135.95 138.35 125.14 139.93 116.74 130.71 132.10 114.59 137.85

19 140.79 141.88 130.79 132.44 134.35 142.52 113.46 112.20 126.46 135.96 138.63 140.22

20 126.98 138.66 137.56 128.78 132.37 125.71 128.58 129.23 129.82 123.31 139.61 136.52

a. Toma una muestra aleatoria de la población de tamaño 40, utilizando números aleatorios de tu calculadora.

Page 29: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

b. Calcula las estadísticas media aritmética, mediana y moda, así como el rango de tu muestra.

Columnas x0.5 mo R

c. ¿Por qué es aleatoria la muestra tomada?d. ¿Cuál es la variable que se estudia? ¿De qué tipo y densidad es? ¿Cómo lo sabes?

Da tu argumento.e. ¿Hay una moda? ¿Por qué? Argumenta.f. Compara tus resultados con los obtenidos por otros seis compañeros. ¿A qué se

deben las diferencias o semejanzas? Explica.

RESULTADOS

x0.5 mo R

1 (el tuyo)23456

g. Construye la tabla de distribución de frecuencias para tus datos.

CLASEINTERVALOS DE

CLASEFRECUENCIA fi

FRECUENCIA RELATIVA fri

%

Totales

h. ¿Se parece tu distribución de frecuencias a las de otros compañeros? ¿En qué? Describe las similitudes.

i. ¿Dirías que hay simetría en la distribución? ¿Por qué? ¿Cómo se comportan la media, la mediana y la moda?

j. ¿Indican los resultados hallados que efectivamente los datos están esparcidos al azar en las columnas y las hileras? ¿Por qué?

12 En una tienda que vende zapatos, el dueño se dedica a observar la medida de los que vende. En la siguiente tabla se ha resumido la información de 100 días de ventas o zapatos de hombre.

Page 30: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

CLASE MEDIDA (CM) FRECUENCIA f FRECUENCIA RELATIVA fr %

1 25 42 25.5 103 26 304 26.5 505 27 2006 27.7 807 28 408 28.5 209 29 1610 29.5 811 30 2

Totales n=460

a. ¿Cuál es la variable en observación? ¿De qué tipo y densidad es?b. Completa la tabla.c. ¿Cuál de los tres promedios, media, mediana o moda, es el más importante para el

dueño del negocio? ¿Por qué?d. ¿Cuál es el promedio de pares de zapatos vendidos diariamente en la tienda?e. ¿Cuál es la moda de los datos y qué significa para el dueño?f. ¿Cuál es la mediana de los datos y qué significado tiene?

13 La siguiente distribución de frecuencias corresponde a una muestra aleatoria tomada durante un año del consumo diario de tortillas en kilogramos en el comedor de una fábrica de ropa en la ciudad de México.

CLASEINTERVALO

REAL: KG/DÍA

FRECUENCIA f

FRECUENCIA RELATIVA fr %

PORCENTAJE ACUMULAD

O

MARCA DE

CLASE1 50<K53 122 53<K56 243 56<K59 564 59<K62 135 62<K65 86 65<K68 67 68<K71 28 71<K74 1

Totales n=124

a. Calcula la media aritmética del consumo por día.b. ¿La distribución del consumo es simétrica o sesgada?c. Antes de hacer los cálculos para hallar el valor de la mediana, ¿es esta mayor o

menor que la media? ¿Por qué?d. Calcula el valor de la mediana.

Page 31: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

e. ¿Cuál es el significado del valor e la mediana?f. Si las condiciones no cambian, ¿cuántos kilogramos de tortillas deben comprarse

diariamente para que 90 por ciento de las veces no falten tortillas?

14 En un laboratorio se mide la respuesta a la temperatura en grados centígrados de las terminaciones nerviosas libres del cuerpo humano. Se seleccionan 80 voluntarios al azar y se registra bajo condiciones controladas la temperatura a la que esas terminaciones responden. En el siguiente histograma de frecuencias se muestran los resultados.

a. Calcula el promedio de la temperatura a la cual responden las terminaciones.b. Calcula la mediana de la temperatura.c. De acuerdo con los valores hallados y el gráfico, ¿aceptarías que la distribución de

temperaturas es simétrica?d. Describe la historia que muestra el histograma apoyándote en los resultados

encontrados.e. ¿Qué valor tomará la moda aproximadamente?

15 Se obtienen cuatro datos numéricos al estudiar el volumen de aire que entra a los pulmones de adultos cuando éstos respiran en condiciones normales: 486, 524, 500 y 490 cm3.

a. Calcula

b. Calcula

c. ¿Por qué el resultado en a es menor que el resultado en b?

Page 32: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

d. Expresa verbalmente el significado del símbolo .

16 Si una distribución de datos tiene un sesgo hacia la izquierda, la media aritmética es menor que la moda. ¿Cuál es la razón?

17 Una investigadora social desea conocer cómo se relacionan las horas de estudio que dedican diariamente los estudiantes de una escuela de computación con los resultados académicos finales semestrales obtenidos por ellos. Para ello, toma una muestra aleatoria de tamaño 10 de esas dos variables de una población de 200 estudiantes, la cual se presenta en la siguiente tabla.

Horas de estudio contra resultados.

ESTUDIANTERESULTADO ACADÉMICO

HORAS DE ESTUDIO DIARIAS

xiyi xi2

1 9.1 52 9.3 4.53 8.7 4.64 8 35 8 3.56 9 3.87 8.5 48 8.3 3.59 7.5 110 7 1

SumasMedias

a. Identifica la variable independiente y la variable dependiente y explica por qué las has clasificado así.

b. Construye el gráfico de dispersión de las variables.c. Calcula el coeficiente de regresión b1.d. ¿Qué significado tiene el valor de b1?e. Construye la ecuación de la recta de regresión de los datos.f. Predice el resultado académico semestral de un estudiante que dedica 2 horas diarias

a estudiar.g. La predicción hecha, ¿es un promedio? ¿Por qué?h. Si un estudiante no estudia, ¿qué predicción se puede hacer acerca de su resultado

académico? ¿Tiene sentido ese resultado?i. Si se hacen predicciones con esta recta de regresión, ¿son válidas para cualquier

escuela? ¿Por qué?

Page 33: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

18 En la ciudad de Irapuato se estudia el efecto de un insecticida en la producción de fresas. Para ello se asocian dos variables: toneladas de fresa por hectárea y toneladas de insecticida aplicado siempre a los mismos campos en observación. Los datos hallados son los que se muestran en la tabla siguiente.

OBSERVACIÓNTONELADAS DE

FRESATONELADAS DE

QUÍMICOSxiyi xi

2

1 150 122 180 83 200 64 130 145 100 206 120 14

SumasMedias

a. Identifica la variable independiente y la variable dependiente. Explica por qué las catalogaste de esa forma.

b. Construye el gráfico de dispersión de las variables.c. Calcula el coeficiente de regresión b1.d. ¿Qué significado tiene el valor de b1?e. Calcula el coeficiente b0, ¿qué significado tiene?f. Construye la ecuación de la recta de regresión de los datos.g. Predice las toneladas de fresa que se producirán en promedio si no se aplica químico

alguno.h. Predice las toneladas de fresa que se producirán aproximadamente si se utilizan 18

toneladas de químicos.i. Dibuja la recta de regresión entre los puntos. (Sugerencia: ¿Cuántos puntos se

requieren para trazar una recta?)

Resumen

En estadística, los números son elementos esenciales para describir conjuntos de mediciones numéricas y extraer conclusiones. Los promedios son algunos de los más importantes. Entre estos se encuentran la media aritmética, la mediana, y la moda.

La media aritmética es el promedio de uso más amplio por sus características de muestreo. Su valor es el del centro de todos los datos. Esto es, equilibra a todos ellos, la suma de todas las desviaciones es 0:

Page 34: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

Pero cuando la distribución de unas mediciones es muy sesgada, el promedio que mejor caracteriza y representa a los datos es la mediana.

La mediana es el valor de la medición a cuya izquierda aproximadamente 50 por ciento de todas las mediciones es menor que ella.

La moda describe el dato con mayor frecuencia. Puede haber dos o más modas en un conjunto de datos.

Si los números se obtienen de un censo, se llaman parámetros. Si se calculan con datos de una muestra, se llaman estadísticos. Estos números se pueden calcular para datos agrupados y sin agrupar mediante ecuaciones. Para la media aritmética y la mediana se tiene lo siguiente.

PROMEDIO MEDIA ARITMÉTICA MEDIANADatos de una población: parámetros.

x0.5 es el dato para el cual aproximadamente 50 por ciento de todas las mediciones es menor que él.

Datos de una muestra: estadísticos. x0.5

Datos agrupados en una tabla de frecuencias: estadísticos.

donde MCj es la marca de clase de la clase j, y fj es la frecuencia de la clase j:j = 1, 2, …, k clases.

donde

Dm es el dato mediana, se supone que los datos están agrupados en orden (del mayor al menor o viceversa).

LIm es el límite real inferior de la clase mediana.

fm es la frecuencia de la clase mediana.

fm-1 es la frecuencia de la clase anterior a la clase mediana.

Page 35: Introducción - Héctor Palacios Sifuentes | Just … · Web view1.3 Medidas de tendencia central La población humana que se concentra en una superficie de terreno puede representarse

La relación entre la media aritmética, la mediana y la moda, en cuanto a la forma de la distribución de los datos, es importante porque permite describir analíticamente el contenido de la distribución y tomar decisiones acerca del uso de un promedio. En el siguiente cuadro puede observarse esa relación.

FORMA DE LA DISTRIBUCIÓNSESGADA A LA

IZQUIERDASIMÉTRICA

SESGADA A LA DERECHA

Relación entre los promedios <x0.5<mo =x0.5=mo Mo<x0.5<

Esta relación ocurre a causa de que la media aritmética es afectada por valores extremos.

Sin embargo, es mínima. Esta propiedad de la media aritmética se utiliza

para calcular una medida de la variación (dispersión) de las mediciones alrededor de la media aritmética, llamada desviación estándar.

La regresión es una técnica estadística para crear modelos mediante los cuales se explica, se controla o se predice el comportamiento de una variable (dependiente o respuesta) en función de otras variables (independientes).

Para estudiar la relación entre las variables se construye un modelo lineal llamado recta de regresión, con el cual se explica la relación entre las variables. Esa recta, y = b0 + b1 x, sirve para calcular promedios.

b1 es el coeficiente de regresión; generalmente es el más importante ya que representa la relación entre las variables dependiente e independiente: explica cuántas unidades crece o decrece la variable dependiente por cada unidad que crece la variable independiente.

b0 es el valor de la variable dependiente cuando la variable independiente toma el valor de 0.