introducción - hpasi.files.wordpress.com · web viewel número de pasajeros por viaje en una...

61
1.2 Distribuciones de frecuencias 1.2.1 Toma de datos Los datos estadísticos generalmente son numéricos. Con ellos se realiza ele estudio de situaciones variadas en los más diversos campos de la ciencia y la tecnología. Dicho estudio se refiere a situaciones en las cuales es indispensable obtener información confiable para tomar decisiones certeras, las cuales en gran medida se producen gracias a que los datos se organizan en tablas o gráficos. Para emprender el estudio de la organización de los datos en tablas, tomemos como referencia la siguiente situación. El número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere conocer el gerente de la línea. Para ello, observó al azar 90 viajes y tomó los datos en bruto (véase la tabla 1.14). Luego los organizó por orden ascendente, como se muestra en la tabla 1.15. Con esos datos construyó una tabla de distribución de frecuencia (tabla 1.16), en la que los datos numéricos fueron organizados por clases. (Observa los elementos que se utilizaron para construir la tabla 1.16; te servirá como referencia en la sección 1.2.3, sobre clasificación de datos). Tabla 1.14 Número de pasajeros por viaje (datos en bruto) 21 26 31 28 31 25 26 28 29 22 25 25 28 30 27 31 30 30 22 31 30 32 33 31 20 30 26 23 30 24 28 25 27 24 30 26 24 24 28 29 25 30 32 26 26 24 27 26 26 25 30 30 35 24 24 28 31 29 24 30 25 33 27 24 27 27 29 28 30 25 30 22

Upload: others

Post on 10-Dec-2020

12 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

1.2Distribuciones de frecuencias

1.2.1 Toma de datos

Los datos estadísticos generalmente son numéricos. Con ellos se realiza ele estudio de situaciones variadas en los más diversos campos de la ciencia y la tecnología. Dicho estudio se refiere a situaciones en las cuales es indispensable obtener información confiable para tomar decisiones certeras, las cuales en gran medida se producen gracias a que los datos se organizan en tablas o gráficos. Para emprender el estudio de la organización de los datos en tablas, tomemos como referencia la siguiente situación.

El número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere conocer el gerente de la línea. Para ello, observó al azar 90 viajes y tomó los datos en bruto (véase la tabla 1.14). Luego los organizó por orden ascendente, como se muestra en la tabla 1.15. Con esos datos construyó una tabla de distribución de frecuencia (tabla 1.16), en la que los datos numéricos fueron organizados por clases. (Observa los elementos que se utilizaron para construir la tabla 1.16; te servirá como referencia en la sección 1.2.3, sobre clasificación de datos).

Tabla 1.14 Número de pasajeros por viaje (datos en bruto)21 26 31 28 31 25 26 28 2922 25 25 28 30 27 31 30 3022 31 30 32 33 31 20 30 2623 30 24 28 25 27 24 30 2624 24 28 29 25 30 32 26 2624 27 26 26 25 30 30 35 2424 28 31 29 24 30 25 33 2724 27 27 29 28 30 25 30 2225 25 34 23 28 26 24 25 2725 25 29 33 24 30 28 25 26

Tabla 1.15 Datos ordenados del menor al mayor en columnas sucesivas20 24 25 25 26 28 29 30 3121 24 25 25 26 28 29 30 3122 24 25 26 27 28 29 30 3122 24 25 26 27 28 30 30 3222 24 25 26 27 28 30 30 3223 24 25 26 27 28 30 30 3323 24 25 26 27 28 30 30 3324 24 25 26 27 28 30 31 3324 25 25 26 27 29 30 31 3424 25 25 26 28 29 30 31 35

Page 2: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Tabla 1.16 Distribución de frecuencias (número de pasajeros por viaje)

CLASEINTERVALO REAL

DE CLASE: PASAJEROS (P)

FRECUENCIAfi

FRECUENCIA RELATIVA

%

1 18<P20 1 0.0112 1.112 20<P22 2 0.0222 2.223 22<P24 6 0.0667 6.674 24<P26 24 2.667 26.675 26<P28 21 0.233 23.336 28<P30 16 0.1778 17.787 30<P32 13 0.1444 14.448 32<P34 6 0.0667 6.679 34<P36 1 0.0111 1.11

Total n=90 1.0000 100.00

a. ¿Cuál tabla hay que observar para saber rápidamente cuál es el dato menor y el dato mayor?

b. ¿Cuál tabla permite calcular el porcentaje de viajes con más de 30 pasajeros?c. ¿Cuál tabla te da menos información acerca del número de pasajeros por viaje? ¿Por

qué?d. ¿Cómo se puede determinar qué número de pasajeros es el más frecuente por viaje?e. ¿Puede el gerente controlar el número de pasajeros por viaje? ¿Por qué?f. ¿Los datos provienen de algún experimento?

Seguramente ahora comprendes mejor que la organización de datos numéricos es importante para descubrir patrones y relaciones ocultos en ellos. Las tablas numéricas y los gráficos son modelos que permiten la descripción cualitativa y cuantitativa de las observaciones de la variable o las variables consideradas en el fenómeno bajo estudio. Además, hacen posible la comunicación de los resultados en un marco comprensible y sugerente, constituyendo así métodos exploratorios que facilitan procesos de reflexión para crear interconexiones y significados, y por tanto conclusiones.

Revisa la siguiente situación. Te servirá para identificar los tipos de fuentes de datos estudiados.

En un laboratorio experimental psicológico se ensaya con ratones para determinar si una dieta balanceada rica en proteínas, que se les aplica desde pequeños, afecta su inteligencia. Para probar la hipótesis, los experimentadores crean laberintos que los ratones (según camadas y dieta) deben recorrer para llegar a una fuente de alimento. Dos camadas son puestas a prueba, obteniéndose los resultados que se muestran en la tabla 1.17.

Tabla 1.17RECORRIDOS

PORCENTAJE DE ÉXITOSDIETA CON PROTEÍNAS DIETA SIN PROTEÍNAS

100 94 80

a. ¿ Qué variables controlan los experimentadores?b. ¿Cuál parece ser la conclusión?

Page 3: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Los datos de un experimento o una investigación deben ser significativos para obtener respuestas correctas y adecuadas a las preguntas e hipótesis de un investigador acerca de los parámetros de una población o universo. Según se puede observar en las dos situaciones anteriores, los datos provienen de diversas fuentes (véase el esquema de la figura 1.15).

En la primera situación, los datos se obtuvieron por observación a causa de que el número de pasajeros es una fuente no controlable. En la segunda situación, los investigadores planearon un experimento y controlaron las variables camada y dieta, por lo que los resultados se obtienen mediante experimentación.

La ciencia y los negocios se apoyan en la estadística y sus métodos para recopilar, organizar e interpretar datos numéricos. En los datos se encuentra la evidencia que busca el científico, el ingeniero, el técnico, el gerente de una cadena de tiendas de mayoreo, el psicólogo, el gobernante, el biólogo, el médico, etc., para obtener un conocimiento y conclusiones que les permitan mejorar la calidad de la vida de muchas personas.

Figura 1.15 Fuentes de datos

Actividades de aprendizaje

Enseguida se presentan varias situaciones en las que se toman datos. Determina la fuente de ellos.

1. Se desea saber el tiempo al que la masa de maíz preparada debe exponerse al fuego para lograr un bolillo dorado o uno blanco.

2. Se observa el cielo para contar y encontrar asteroides que probablemente puedan impactar la Tierra.

Page 4: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

3. En un torneo de futbol, un entrenador decide jugar varios partidos con seis defensas y estudiar los resultados obtenidos.

4. Se desea conocer los resultados académicos de un grupo escolar.

5. Se mezclan varios compuestos químicos en un mismo tipo de cemento para investigar el grado de dureza alcanzado.

6. Para conocer los ingresos mensuales de los profesionistas en el estado de Veracruz, se pueden consultar encuestas.

1.2.2 Datos agrupados

Cuando se toman datos experimentales o por observación, éstos aparecen sin orden, por eso se les llama datos en bruto o crudos. Como pudimos observar en la tabla 1.14, estos datos dan escasas referencias acerca del fenómeno en estudio y difícilmente permiten extraer conclusiones. Si los datos son muchos, el desorden impide reconocer peculiaridades relevantes.

Los datos crudos pueden ordenarse o agruparse del mayor al menor o del menor al mayor. Esto al menos permite saber cuál es el dato mayor, el menor y cuáles datos están al centro. Si son pocos datos, incluso se podría apreciar cuáles datos son los que se repiten más veces, es decir, los más frecuentes.

...................................................................................................................................................Frecuencia: Es el número de veces que se repite un dato....................................................................................................................................................

Los datos en bruto pueden agruparse también en una tabla de frecuencias y frecuencias relativas, como en la tabla 1.16, si se quiere mejorar aún más la apreciación de su contenido. La agrupación en estas tablas se hace mediante la distribución de los datos numéricos en clases, según sea su frecuencia.

Actividades de aprendizaje

1 UTILIDADES DE LA PANIFICADORA “LA LUNA”

Los siguientes datos corresponden a las utilidades en pesos de la pequeña panificadora “La Luna” durante cada uno de los últimos 24 meses. Se dan tal cual se recogieron, por eso aparecen en desorden. El dueño desea traspasar la panadería y requiere conocer esos datos para tomar una decisión.

Page 5: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

8930.70 13686.85 19272.21 18030.36 21169.32 15737.4314528.90 14307.33 16400.36 16505.53 16946.47 16573.7315179.04 7814.889 13859.12 14228.12 18623.63 16573.9418702.29 20733.58 17558.97 17383.31 12109.07 17991.51

a. ¿Cuál es la pregunta del dueño de la panificadora?b. ¿Cuál es la población bajo estudio? Descríbela.c. ¿Cuál es la variable correspondiente?d. Ordena los datos anteriores en la siguiente tabla, de menor a mayor.

e. ¿Cuál es el mayor dato y cuál es el menor?f. ¿Cuál es la diferencia entre el dato mayor y el menor?g. ¿Cuáles son los dos valores en el centro de los datos?

2 EDADES DE ANCIANOS

En la siguiente tabla de frecuencias se tienen las edades agrupadas por orden progresivo de los 100 ancianos que habitan un asilo público en Ciudad del Carmen. Se quiere conocerlas para obtener un mejor juicio acerca del tipo de servicios que requieren.

54 62 66 68 69 71 72 73 74 75 76 78 79 80 82 83 85 87 93 9555 64 66 68 69 71 72 73 74 75 76 78 79 80 82 83 85 89 93 9660 64 67 68 70 71 72 73 75 75 76 78 79 80 82 84 85 90 93 9762 64 68 68 70 71 73 73 75 75 76 78 79 81 82 84 85 90 94 9762 65 68 69 70 72 73 74 75 76 77 79 80 81 82 84 86 91 95 100

a. ¿Cuál es la edad mayor y cuál es la menor?b. ¿Cuál es la edad que más se repite, o sea, la de mayor frecuencia?c. ¿Cuántos ancianos tienen menos de 70 años de edad y qué porcentaje son del total?d. ¿Cuántos tienen más de 85 años de edad y cuál es el porcentaje que representan.

3 Una pregunta difícil de contestar a partir de la tabla de la actividad 2 es la siguiente: ¿Dónde se concentran más edades, en el centro o en algún extremo? Los mismos datos pueden agruparse en una tabla de frecuencias y frecuencias relativas, como se muestra a continuación. Observa cómo se distribuyen las edades por clase. Identifica qué es lo que determina la clase.

CLASEINTERVALO: EDAD

EN AÑOS (E)FRECUENCIA

fFRECUENCIA RELATIVA fr

PORCENTAJE%

1 50<E60 2 0.02 22 60<E70 22 0.22 223 70<E80 42 0.42 424 80<E90 22 0.22 22

Page 6: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

5 90<E100 12 0.12 12Totales n=100 1.00 100

a. ¿Cuál es la frecuencia de la clase 2? ¿De dónde y cómo se obtuvo esa cantidad?b. ¿Cuál es la frecuencia de la clase 3? ¿De dónde y cómo se obtuvo esa cantidad?c. ¿Cuál clase tiene más ancianos?d. ¿Cuántos ancianos tienen entre 90 y 100 años?e. ¿Cuántos ancianos tienen más de 80 años?f. ¿Cuántos ancianos tienen menos de 70 años?g. ¿Qué porcentaje de ancianos tienen entre 50 y 80 años?h. ¿Qué porcentaje de ancianos tienen menos de 101 años?i. ¿Dónde se concentran más edades de ancianos, en el centro o en algún extremo?j. ¿Cómo se calculó cada frecuencia relativa?

1.2.3 Tablas de frecuencias: clasificación de datos

Agrupar datos y clasificarlos son tareas importantes para producir información. En biología, por ejemplo, se establecen clases para separar organismos por su similitud y diferencias; en química se clasifican y organizan los elementos químicos por algunas de sus características similares; en estadística descriptiva, las clases sirven para agrupar mediciones y contabilizar la frecuencia respectiva, lo que permite conocer la distribución de las frecuencias. Por consiguiente, la clasificación es una tarea científica de la cual se obtienen grandes frutos. Como prueba de ello, veamos el siguiente hecho.

En el siglo XIX, Dimitri Mendeleev colocó elementos químicos (entonces conocidos en clases) en una tabla que hoy se conoce como periódica, según crecían sus pesos atómicos. Esto lo condujo al hallazgo de que algunas propiedades químicas y físicas que les pertenecían se sucedían periódicamente. Al ir clasificándolos debió dejar huecos, los cuales la lógica y su intuición le decían que debían ser llenados por elementos aún no conocidos. Así, Mendeleev predijo las propiedades y características de esos elementos con base en su teoría, sugerida por la clasificación hecha, y efectivamente esos elementos fueron descubiertos después.

...................................................................................................................................................Clase: Es un intervalo o un subconjunto de una escala útil para comparar mediciones o características y determinar cuáles, por su magnitud o cualidad, le pertenecen....................................................................................................................................................

En las tablas estadísticas de distribución de frecuencias, cada clase tiene una frecuencia de la clase, que es el número de mediciones que se pueden agrupar en ella. Con las clases y sus frecuencias se construye la tabla de frecuencias, también llamada distribución de frecuencias, de la que se obtiene la frecuencia relativa de cada clase i mediante la fórmula

Page 7: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

fri=f i

n

en la que fr representa la frecuencia relativa, f la frecuencia y n el total de datos. Esta relación se lee: “la frecuencia relativa de la clase i es igual a la frecuencia de la clase i dividida entre el total de datos”. La pequeña letra i a un lado de fr se llama subíndice; representa un contador de las clases. Por ejemplo fr1 quiere decir “la frecuencia relativa de la clase 1”; fr2, “la frecuencia relativa de la clase 2”.

Ejemplo 1.37

Se observan varios artículos de lujo en una boutique, para determinar su estado. De 200 artículos inspeccionados, 40 se consideran en mal estado. Luego,

La frecuencia de la clase “en mal estado” es f= 40;

La frecuencia relativa de esos artículos es fr =

40200 = 0.20

Actividades de aprendizaje

Reúnete con tres compañeros de tu grupo y resuelvan el siguiente ejercicio. Comenten al final sus conclusiones con el resto del grupo. Si tienen alguna duda acudan con su maestro(a).

1 SALARIOS DE ESTADÍSTICOS

Se realiza un estudio en el país para conocer el salario mensual en pesos de algunos estadísticos (personas que estudiaron estadística como licenciatura, maestría, o doctorado). Se obtuvo una muestra aleatoria de 50 de ellos. Los datos en bruto se muestran en la siguiente tabla.

Salarios mensuales de 50 estadísticos en México (miles de pesos)19.50 17.38 28.25 27.56 14.66 19.07 20.04 33.56 20.15 10.5926.26 19.16 22.41 24.56 10.69 23.24 14.31 20.40 22.81 23.4819.55 23.44 19.82 22.57 19.45 19.20 12.07 18.54 14.55 25.4629.91 27.15 32.22 23.04 19.98 18.60 21.27 15.20 16.39 26.8626.70 19.20 22.78 24.36 19.98 21.89 25.00 22.26 12.09 26.33

a. Haciendo un conteo, completen la tabla de distribución de frecuencias siguiente.

Distribución de frecuencias de los salarios mensuales de 50 estadísticos mexicanos (datos en miles de pesos)

CLASEINTERVALO DE

CLASE: SALARIOS (S)

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE%

Page 8: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

1 10<S15 7 0.14 142 15<S203 20<S254 25<S305 30<S35

Totales n=50 1.00 100

b. Calculen la frecuencia relativa de cada clase.c. Con las frecuencias relativas, calculen los porcentajes de la última columna.d. ¿Por qué la suma de los porcentajes es 100?e. ¿Por qué la suma de las frecuencias relativas es 1?f. ¿Dónde se concentra la mayor cantidad de los salarios de los estadísticos? ¿En el

centro? ¿En uno de los extremos?g. ¿Qué porcentaje de los salarios supera los 25 mil pesos mensuales?h. ¿Qué porcentaje de los salarios es menor a 30 mil pesos al mes?i. Según su tipo y densidad, ¿cómo es la variable? ¿Puede considerarse continua?

1.2.4 Intervalo de clase

Como habrás notado, una distribución de frecuencias forma parte de un procedimiento para descubrir información a partir del agrupamiento de datos numéricos en clases. Una tabla de distribución de frecuencias a menudo es parte de una obra científica o técnica, o de un informe, y debe poseer características determinadas para considerarla efectiva.

Cada clase de una tabla de distribución de frecuencias se relaciona con un intervalo de clase. Este intervalo es un rango de valores que definen las posibles medidas de una clase. En consecuencia, los intervalos de clase poseen un límite superior y un límite inferior. Estos límites de clase son fronteras numéricas en cada intervalo de la distribución. Observa y analiza la tabla 1.18; tiene 5 intervalos de clase.

Tabla 1.18 Salarios mensuales clasificados de estadísticos mexicanosCLASE INTERVALO DE CLASE: SALARIOS (S)

1 10<S15: de más de 10 a 152 15<S20: de más de 15 a 203 20<S25: de más de 20 a 254 25<S30: de más de 25 a 305 30<S35: de más de 30 a 35

Debes notar que entre el límite superior de cada clase y el límite inferior de la que le sigue no existen huecos. Esto es importante. Se dice que los límites de clase corresponden a los límites reales de clase.

Los límites inferiores de los intervalos son: 10, 15, 20, 25 y 30. Los límites superiores de los intervalos son: 15, 20, 25, 30 y 35.

Page 9: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Cada clase tiene un rango, el cual se calcula restando el valor del límite inferior de la clase del límite superior de la misma:

Rango de clase = límite superior de la clase – límite inferior de la clase

Por ejemplo, el rango de la clase 1 es 15 – 10 = 5. Se supone que la variable es continua, por eso se toma el valor 10 como límite inferior.

Como regla, es preferible construir intervalos de clase con igual rango, pues eso hace más sencillo el trabajo de interpretación.

LÍMITES REALES DE CLASE

Mediante un ejemplo, se explica a continuación qué son los límites reales de clase y cómo se determinan.

Ejemplo 1.38

En una investigación acerca de la temperatura máxima en grados centígrados en la ciudad de Veracruz, en la temporada de verano, durante 4 años se obtuvieron datos al azar y se tabularon como se muestra en la tabla 1.19, aunque el encargado de construir la tabla la tiene a medio acabar.

Tabla 1.19 Temperaturas máximas durante el verano en la ciudad de Veracruz (muestra aleatoria de 4 años)

CLASE

INTERVALO DE LA CLASE:

TEMPERATURA (ºC)

INTERVALOS REALES DE

CLASE

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE%

1 28-30 27.5<T30.5 32 31-33 30.5<T33.5 103 34-36 24 37-39 285 40-42 356 43-45 24

Totales n=120

En la segunda columna de la tabla se observa que, entre cada límite superior de una clase y el límite inferior de la clase siguiente, se dejó un hueco. Así, el límite superior de la clase 1 es 30 °C y el límite inferior de la clase 2 es 31 °C. Entre estos límites hay un espacio de 31 °C – 30 °C = 1 °C. Se dice entonces que los límites de clase no son límites reales de clase o verdaderos porque, como la variable es continua, un intervalo como el primero, 28 °C – 30 °C, debe incluir las temperaturas desde 27.5 °C hasta 30.5 °C, incluido este valor. Por lo que los límites reales de las dos primeras clases son los que aparecen en la tercera columna

Page 10: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

de la tabla: la primera clase acepta datos cuyo valor sea mayor que 27.5 pero menor que o igual a 30.5.

Para encontrar los límites reales de clase, se obtiene el punto medio entre los límites superior e inferior de clases consecutivas, de la siguiente manera:

El límite real superior de la clase 1 es

30+312 =30.5

El límite real inferior de la clase 2 es el límite real superior de la clase 1.

El límite real superior de la clase 2 es

33+342 =33.5

Actividades de aprendizaje

Lee con atención los siguientes cuestionamientos y resuelve o contesta lo que se te pide.

1. Completa los límites reales de clase de la tabla de distribución de frecuencias 1.19.2. ¿Cuántas observaciones se hicieron?3. Calcula las frecuencias relativas y los porcentajes.4. ¿Cuáles son las temperaturas más frecuentes en la muestra?5. ¿En qué clase se deben incluir las siguientes temperaturas?

37.0 °C, 40.5 °C y 39.5 °C

6. ¿Cuántas cifras significativas tiene cada medición anterior? ¿Por qué?

TAMAÑO DEL INTERVALO DE CLASE

No siempre se construyen tablas de distribución de frecuencias con intervalos de igual tamaño; aunque, como ya se dijo, es mejor que los tamaños de los intervalos sean los mismos.

El tamaño correcto de cada intervalo de clase es igual a

Límite superior de una clase – límite superior de la clase anterior

También puede calcularse utilizando los límites inferiores:

Límite inferior de una clase – límite inferior de la clase anterior

Ejemplo 1.39

Page 11: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Estudiemos nuevamente los intervalos de clase de los salarios mensuales de estadísticos mexicanos, dados en la actividad de aprendizaje de la sección 1.2.3. Las unidades son miles de pesos.

Tabla 1.20 Intervalos de clase de salarios mensuales de estadísticos mexicanos

CLASEINTERVALO DE

CLASE: SALARIOS (S)

1 10<S152 15<S203 20<S254 25<S305 30<S35

Observa que el tamaño de cada intervalo de clase es 20 – 15 = 5 mil pesos. Esto equivale a 15 – 10 = 5 mil pesos. Para obtener el tamaño de una clase, pueden usarse los límites de clase o los límites reales de clase.

Actividades de aprendizaje

Contesta lo siguiente y compara tus resultados con los de algunos de tus compañeros de grupo.

¿Cuál es el tamaño de cada clase en la tabla 1.19 de temperaturas máximas en la ciudad de Veracruz? ¿Qué unidad de medida tiene el resultado?

MARCA DE CLASE

Al agrupar datos numéricos en clases o rangos en una tabla de distribución de frecuencias, los datos individuales se pierden, se diluyen con todos los demás de su clase y sólo prevalecen los límites de clase o límites reales de clase.

Cuando se quiere hacer cálculos con los datos agrupados en una tabla de frecuencias, para determinar por ejemplo la media aritmética o la desviación estándar (conceptos que se estudiarán más adelante), tiene que tomarse un solo número que represente a todos los datos numéricos contenidos en cada clase o intervalo. Ese número se llama marca de clase, la cual se define como “el valor promedio de los límites de un intervalo de clase” y se calcula así:

MC i=Límite superior de la clase i - límite inferior de la clase i

2

Page 12: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Como ya se dijo antes, la letra i, a un lado de MC, se llama subíndice; sirve para indicar la clase a la que pertenece la marca de clase calculada. Así, MC1 quiere decir “marca de clase de la clase 1”; MC2 denota la marca de clase de la clase 2, etc. El cálculo de las marcas de clase puede hacerse con los límites de clase o los límites reales de clase.

Actividades de aprendizaje

Reúnete con algunos de tus compañeros para comentar, contestar o resolver lo que se les pide en esta actividad.

1 VIDA DE UNA PIEZA METÁLICA

Una máquina para triturar piedra utiliza una pieza metálica sujeta a rotación y fricción. Esta pieza tiene lo que se llama un “tiempo de vida útil”. El productor de las máquinas realiza frecuentemente pruebas a la pieza para conocer cuántas horas de duración de la pieza debe garantizarles a los clientes. En la siguiente tabla se muestran los resultados de la distribución de frecuencias de los tiempos de vida obtenidos de 60 piezas.

Duración de la pieza en horas

CLASEINTERVALO DE CLASE:

HORAS

INTERVALOS REALES DE

CLASE

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE%

Marca de clase: MC

1 2900-3100 22 3101-3301 53 3302-3502 104 3503-3703 185 3704-3904 25

Totales 60

a. ¿Cuál es la variable en estudio?b. ¿De qué tamaño es la muestra?c. Construye los límites reales de clase.d. ¿Cuál es el tamaño de cada clase? ¿Son iguales los tamaños de clase?e. Calcula las frecuencias relativas y los porcentajes.f. Calcula las marcas de clase. Observa los resultados. ¿Puedes calcularlos de otra

manera más simple?g. ¿Cuál es la clase que tiene mayor frecuencia?h. ¿Los datos se concentran en el centro o en un extremo? Explica.

1.2.5 Construcción de una distribución de frecuencias

Page 13: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

El concepto de distribución de frecuencias es muy importante en la estadística y la probabilidad. La distribución de frecuencias se entiende como una tabla en la que los datos numéricos de una muestra o de una población han sido clasificados y se contabilizan o calculan las frecuencias y las frecuencias relativas por clase para obtener información; también se le llama así al gráfico construido con los datos de la tabla.

A partir del siguiente planteamiento, y de los pasos que se te indican, podrás construir una distribución de frecuencias. Lee, analiza y realiza lo que se te pide.

Ejemplo 1.40

En un experimento se le pidió a un alumno que midiera en minutos el tiempo que tardaba diariamente en llegar a la universidad desde su casa. Debía tomar como referencia el momento en que cerraba la puerta de su casa hasta que entraba en su salón. El alumno no viajaba en carro; tomaba el transporte urbano. En la tabla 1.21 se muestran los datos ordenados. Debes construir una distribución de frecuencias. No se dan los intervalos de clase, así que habrá que construirlos. Enseguida se indica cómo hacerlo. Puedes trabajar con un compañero.

Tabla 1.21 Tiempo en minutos17.17 21.33 24.53 25.83 27.38 28.15 29.00 29.93 30.88 33.6317.92 22.95 24.90 26.15 27.43 28.25 29.02 29.94 31.17 33.9218.18 22.95 24.90 26.35 27.52 28.26 29.39 30.35 31.47 34.2418.96 23.18 25.13 26.39 27.57 28.29 29.51 30.38 31.93 34.7019.37 23.26 25.27 26.54 27.58 28.49 29.68 30.51 32.21 35.5220.79 24.31 25.29 26.81 27.63 28.58 29.78 30.59 32.34 36.0120.90 24.44 25.55 27.03 28.03 28.58 29.82 30.77 32.66 36.0921.33 24.44 25.75 27.16 28.15 28.79 29.88 30.78 33.31 38.59

1) Se calcula el rango de los datos:

R = valor del dato mayor – valor del dato menor.

Esto es:

R = 38.59 – 17.17 = 21.42

2) Se decide cuál es el número de clases, C, para la cantidad de datos. Enseguida se sugiere qué valor tomar.

CANTIDAD DE DATOS (N) CLASES (C)20 a menos de 30 5

30 a 50 6 o 7Más de 50 a 100 7, 8 o 9Más de 100 a 300 8, 9 o 10Más de 300 a 1000 9, 10 u 11

Page 14: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Como se tienen 80 datos, se decide que sean 7 clases.

3) Se calcula el rango o amplitud (A) de cada clase mediante la fórmula

A=RC

Esto es:

A=21. 427

=3 .06

Este valor puede redondearse a 3.1 minutos.

4) Con la amplitud, se calculan los límites reales de clase, inferior (LI) y superior (LS). Partiendo desde un valor un poco menor que el dato menor para la primera clase – por ejemplo, 17.1 minutos – se le suma el valor de la amplitud: 17.1 + 3.1 = 20.2, con lo que se obtiene el límite superior de la primera clase, la cual incluye este valor: x 20.2. El límite inferior de la clase siguiente es 20.2 < x. De esta manera se asegura que las clases no se traslapen, esto es, que resulte imposible que una medición pertenezca a dos clases. Se realizan operaciones similares para calcular los demás límites. Observa los datos en la tabla 1.22 y complétala.

Tabla 1.22CLASE

LÍMITE REAL DE CLASE INFERIOR (MINUTOS)

LÍMITE REAL DE CLASE SUPERIOR (MINUTOS)

1 17.1 17.1+3.1=20.22 20.2 20.2+3.1=23.33 23.3 23.3+3.1=26.44 26.4567

5) Debe revisarse al final que los intervalos sean exhaustivos, es decir, que contengan todos los datos. Enseguida, en la tabla 1.23, escribe los resultados de los cálculos (obtén los intervalos reales de clase, las frecuencias, las frecuencias relativas, los porcentajes y las marcas de clase).

Tabla 1.23 Tiempos del trayecto casa – universidad en minutos

CLASEINTERVALOS REALES DE

CLASE

FRECUENCIAfi

FRECUENCIA RELATIVA fr

PORCENTAJE% Marca de clase

1 17.1<x20.22 20.2<x23.33

Page 15: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

4567

Totales

1.2.6 Distribución de frecuencia relativa acumulada

Con las frecuencias relativas o los porcentajes se obtienen las frecuencias relativas acumuladas o porcentajes acumulados, con los que se construirá la gráfica ojiva menor que. Estos valores son útiles para conocer de inmediato las frecuencias relativas o porcentajes de varias clases en conjunto. La idea del cálculo es simple, como se indica en seguida.

...................................................................................................................................................La frecuencia relativa acumulada de la clase i es igual a la suma de las frecuencias relativas de todas las clases anteriores a ella más la de la clase i....................................................................................................................................................

Se procede de la misma manera para obtener los porcentajes acumulados.

Para comprender los procesos que se siguen para la elaboración de la tabla de frecuencia relativa y la de frecuencia acumulada, realiza la siguiente actividad aprendizaje.

Actividades de aprendizaje

Trabaja con un compañero de tu grupo para resolver lo siguiente. Si tienen alguna duda, coméntenla con su profesor(a).

1 PRODUCCIÓN DE MAÍZ EN LA ZONA DEL YAQUI

En la siguiente tabla se observa lo que podría ser la distribución de frecuencias de las toneladas de maíz producidas por hectárea en la región del río Yaqui en Sonora en el año 2000. Se obtuvieron 200 observaciones.

Producción de maíz por hectárea en la región del Yaqui, Sonora

CLASEINTERVALOS REALES DE

CLASE (TON)

FRECUENCIAf

FRECUENCIA RELATIVA fr %

FRECUENCIA RELATIVA

ACUMULADA

PORCENTAJE ACUMULDO

1 Menos de 5.55 5 0.025 0.025 2.52 Menos de6.55 20 0.100 10.0 0.125 12.53 Menos de7.55 40 20.04 Menos de8.55 75 0.3755 Menos de9.55 50 0.250

Page 16: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

6 Menos de10.55 10 5.0 1.000 100Totales 200

Las frecuencias relativas acumuladas se obtienen como se indicó antes:

Clase 1: 0.025 Ton. Porque sólo puede acumularse esa cantidad.Clase 2: 0.025 + 0.100 = 0.125 Ton. Se acumulan las toneladas de las dos primeras clases.Clase 3: 0.125 + 0.200 = 0.325 Ton

a. Con los porcentajes se hace lo mismo. Completa la tabla haciendo los cálculos necesarios.

b. ¿Qué porcentaje de hectáreas produjo menos de 7.55 Ton por hectárea? Observa la columna de porcentajes acumulados.

c. El porcentaje de hectáreas que produjo más de 5.55 Ton, pero hasta 9.55 Ton, es 92.5%. ¿Cómo pueden calcular este dato? Hay dos maneras: usando la columna de porcentajes o la de porcentajes acumulados. Obtengan ese valor de las dos maneras.

1.2.7 Gráficos y contexto

Para que conozcamos el consumo de electricidad en nuestros hogares, la Compañía Federal de Electricidad nos envía un recibo con una gráfica de barras donde se comparan los consumos bimestrales de dos años diferentes. En la figura 1.16 se muestra un gráfico parecido, con los consumos en kilowatts por hora de un hogar durante los años 2003 y 2004.

Page 17: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Figura 1.16 Consumo en kW/h de una casa habitación

Se puede ver que el consumo en kW/h fue mayor en todos los bimestres respectivos en el año 2004 y, además, parece mostrar una tendencia a crecer a medida que pasan los bimestres. ¿A qué se debe esto?

Las herramientas gráficas en estadística son fundamentales en los procesos de comprensión de ideas, porque resumen enormes cantidades de datos numéricos que quizá no podrían ser entendidos de otra manera. Los gráficos concentran y hacen visibles los rasgos sobresalientes de los datos, de tal manera que permiten describir una situación, explorarla e interpretarla.

Howard Wainer afirma que hay diferencias entre los gráficos y propone estas categorías:

1) Un gráfico fuertemente bueno muestra todo lo que queremos conocer sólo con mirarlo.

2) Un gráfico débilmente bueno nos muestra lo que necesitamos conocer observándolo, una vez sepamos mirarlo. 1

Un gráfico es un símbolo que requiere describirse para llegar a obtener una interpretación. Una buena descripción permite transformar un gráfico no muy bueno o débilmente bueno en fuertemente bueno. Cuando alguien ve una columna de humo negro que se levanta en el horizonte, puede decir que algo se está quemando; por tanto, es signo de fuego. Esta conclusión es una interpretación. En la situación que planteamos sobre consumo de electricidad, pudo haber ocurrido que el refrigerador se averiara y consumiera más energía eléctrica en el año 2004, o que en el bimestre noviembre – diciembre se hubiesen encendido más luces. Los motivos pueden investigarse en el contexto, que es muy importante en las aplicaciones estadísticas para ofrecer una interpretación.

...................................................................................................................................................Contexto: Es un conjunto de situaciones o cosas relacionadas que determinan completa o parcialmente un significado que se dé de ellas....................................................................................................................................................

A continuación se describen algunos de los gráficos más importantes que se utilizan en estadística.

HISTOGRAMA DE FRECUENCIAS Y GRÁFICO DE ESPIGAS

Se utiliza el siguiente ejemplo para explicar qué es y como se construye un histograma de frecuencias.

1 Howard Wainer (1990), “Graphical visions from William Playfair to John Tuckey”, Statistical Science, vol. 5, núm. 3, pp. 340 . 336.

Page 18: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Ejemplo 1.41

Un vendedor de tacos decide registrar una serie de datos estadísticos de su negocio. Uno de ellos son las ventas diarias de tacos en pesos, las que tomó al azar durante un año. Su hijo Abraham, que estudia en un CETis del estado de Puebla, con los datos obtenidos construyó la distribución de frecuencias que se muestra en la tabla 1.24 y preparó el histograma de frecuencias que aparece en la figura 1.17 para explicarle el resultado a su padre. Como característica importante, se puede observar que esta gráfica guarda simetría con respecto al punto medio, que corresponde a 1250 pesos/día.

Tabla 1.24 Distribución de frecuencias de las ventas diarias en pesos

CLASEINTERVALOS

REALES DE CLASE: PESOS/DÍA (P)

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE%

1 0.00<P500 6 0.03750 3.7502 500<P1000 38 0.23750 23.7503 1000<P1500 72 0.45000 45.0004 1500<P2000 39 0.24375 24.3755 2000<P2500 5 0.03125 3.125

Totales 160 1.00000 100.000

Figura 1.17 Histograma de frecuencias de la venta diaria en pesos

500 1000 1500 2000 25000

1020304050607080

Venta de tacos por día

Variable: pesos/día

Frec

uenc

ia

En este histograma de frecuencias se muestran las ventas diarias en pesos según los intervalos reales de clase de la distribución de frecuencias en el eje horizontal.

El eje vertical representa las frecuencias; se puede observar cómo se distribuyen las ventas en los diversos días.

Page 19: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

De acuerdo con el contexto, la distribución y el histograma se contestan las siguientes preguntas.

1) ¿Cuántos días observó el padre de Abraham las ventas? 160. Este dato se observa como suma de las frecuencias.

2) ¿Cuál es la variable que se estudia? ¿Cuál es su tipo y densidad? La variable es la venta diaria en pesos. Es una variable cuantitativa y se considera continua.

3) ¿Es ésta una muestra o la población? Es una muestra tomada al azar de todos los días del año en que hubo ventas.

4) ¿Cuál es la clase con mayor frecuencia? La que cubre los ingresos de 1000 a 1500 pesos, porque la altura de esa barra en el gráfico es la mayor, con frecuencia 72.

5) ¿Cuáles son las clases con menor frecuencia? Las que se hallan en los extremos de la distribución: de 0 a 500 y de 2000 a 2500 pesos de ventas diarias.

6) ¿Es frecuente o probable un día con ventas menores de 1500 pesos? ¿Por qué? Es probable, según se puede leer tanto en la distribución de frecuencias como en el gráfico. Aproximadamente 72.5% de los días (3.75 + 23.75 + 45.00) se vendieron menos de 1500 pesos.

7) ¿Es probable un día con ventas mayores a 2600 pesos? ¿Por qué? Ese evento es muy improbable. Nunca se dio un día de ventas con más de esa cantidad.

Así, un histograma de frecuencias es un gráfico de barras o rectángulos con base sobre el eje horizontal. La base de cada rectángulo es igual al ancho del intervalo real de clase. El centro de la base de cada rectángulo es una marca de clase.

La variable en estudio se representa en el eje horizontal; sobre el eje vertical se representa a las frecuencias, las frecuencias relativas o los porcentajes. Por lo que el área de cada barra es proporcional a la frecuencia. Sobre el histograma de frecuencias se puede construir otro gráfico llamado polígono de frecuencias, el cual estudiaremos más adelante.

Cuando la variable es discreta, tomando unos pocos valores enteros, se levanta una “espiga” o línea desde cada valor entero marcado en el eje horizontal hasta la altura respectiva de la frecuencia, la frecuencia relativa o el porcentaje. El gráfico compuesto así sólo de líneas verticales se llama gráfico de espigas. Si la variable es discreta con un rango muy grande de valores, se puede optar por construir un histograma. El gráfico se construye dependiendo del tipo de variable implicada. Observa en el esquema de la figura 1.18 los tipos de gráficos que se construirán en este curso.

Page 20: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Figura 1.18 Tipos de gráficos según el tipo de variable

Para entender mejor qué es un gráfico de espigas, analiza el siguiente ejemplo.

Ejemplo 1.42

Se ha recabado información sobre la opinión que tienen los 1500 adultos que viven en un pequeño poblado acerca de la próxima instalación de la fábrica X de productos químicos en las inmediaciones, la cual, se sabe, produce desechos indeseables. Pero dará trabajo a algunos residentes. Por lo mismo, se preparó una encuesta en la que se hacía la pregunta “¿Considera que la fábrica beneficiará a la localidad?” Las respuestas posibles eran:

1) No2) Quizá3) Muy probable4) Con toda seguridad

Con los datos que se obtuvieron se construyó la tabla 1.25, de distribución de frecuencias, y el gráfico de espigas que aparece en la figura 1.19.

Tabla 1.25 Resultados de la encuesta sobre la opinión de los pobladores acerca del beneficio de la fábrica X

CLASE CATEGORÍAFRECUENCIA

fFRECUENCIA RELATIVA fr

PORCENTAJE%

1 No 1002 Quizá 700

3 Muy probablemente 400

4 Con toda seguridad 300Totales 1.00 100.00

Figura 1.19 Gráfico de espigas para las frecuencias

Page 21: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

1 2 3 40

100200300400500600700800

Gráfico de espigas

Opinión

Frec

uenc

ia

Actividades de aprendizaje

Reúnete con tres compañeros de tu grupo y resuelvan el siguiente ejercicio. Contrasten los resultados con los demás compañeros de clase. Si tienen alguna duda, consulten a su maestro(a).

1 Contesten las siguientes preguntas relativas al ejemplo 1.42 anterior.

a. ¿Cuál es la variable en estudio? ¿Cuál es su tipo y densidad?b. ¿Cuál es la población bajo estudio?c. Complete la tabla, haciendo los cálculos necesarios.d. ¿Por qué ni la tabla de distribución ni el gráfico de barras tienen en este caso

intervalos numéricos? Explica.e. ¿Cuál es el porcentaje de pobladores que cree que la planta “quizá” traerá algún

beneficio?f. ¿Qué porcentaje de personas seleccionó la opción “No” o “Quizá”?g. ¿Cuál es la suma de todas las frecuencias relativas?h. ¿Puede dar 2 la suma de todas las frecuencias relativas? ¿Por qué? Explica.

2 Una institución sin fines de lucro que se interesa en los mexicanos que emigran a los Estados Unidos de Norteamérica, realizó un estudio a una muestra de 500 de ellos, elegidos al azar en todos los estados fronterizos de EEUU con México, acerca del consumo diario en gramos de proteínas, y obtuvo los resultados que registra la tabla siguiente.

Consumo diario de proteínas de migrantes mexicanos en los EEUU

CLASEINTERVALOS

REALES DE CLASE: GRAMOS

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE%

1 30<G35 7

Page 22: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

2 35<G40 313 40<G45 954 45<G50 1985 50<G55 1406 55<G60 317 60<G65 4

Totales 500

a. ¿Cuál se la pregunta de investigación?

b. ¿Cuál es la variable que se observa?

c. ¿Cómo se puede definir la población en estudio?

d. ¿Cuál es el elemento de muestreo?

e. ¿De qué tipo y densidad es la variable en estudio?

f. Completa la tabla haciendo las operaciones necesarias.

g. ¿Cuál es la frecuencia relativa de los siguientes eventos? Un jornalero consume 55 g o menos de proteínas al día. Un jornalero consume entre 40 g y 60 g de proteínas por día.

h. Construyan el histograma de frecuencias de los tatos.

i. Construyan el histograma de frecuencias relativas de los datos.

Page 23: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

j. ¿Se parecen los gráficos? ¿Por qué?

k. ¿Cómo puede transformarse el gráfico de frecuencias relativas en el gráfico de porcentajes? Expliquen.

l. ¿Podría decirse que la distribución de gramos consumidos es simétrica con respecto a la media de gramos de proteínas consumidos diariamente, la cual fue de 48 gramos? Argumenten su respuesta tomando en cuenta que la simetría es una propiedad de una distribución de frecuencias, y tiene su analogía con la simetría de figuras geométricas.

POLÍGONO DE FRECUENCIAS

Un polígono de frecuencias se construye a partir de un histograma de frecuencias, señalando en éste las marcas de clase en la parte superior de cada barra y luego uniéndolas con un trazo recto. Para cerrar el polígono, se traza un segmento de recta desde la marca de clase de la barra extrema del histograma hacia el eje horizontal donde se encuentran los puntos que representan las marcas de clase imaginarias con frecuencia cero al lado de esas barras.

Ejemplo 1.43

En la figura 1.20 se muestra el histograma y el polígono de frecuencias del tiempo promedio en minutos que tardan 160 personas observadas al azar en el Distrito Federal en trasladarse al trabajo y regresar a su casa.

Page 24: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Figura 1.20 Histograma y polígono de frecuencias (tiempo de traslado)

El polígono de frecuencias es una figura geométrica cerrada. Representa la misma forma de la distribución del histograma. La descripción que se haga a partir de cualquiera de estos gráficos deberá coincidir. El polígono puede ser de frecuencias, frecuencias relativas o porcentajes.

OJIVA MENOR QUE

Al acumular las frecuencias relativas o porcentajes de una tabla de distribución de frecuencias, es posible calcular los porcentajes o frecuencias relativas de eventos que se definen como la adición de las frecuencias de varias clases. Con las frecuencias relativas acumuladas o con porcentajes acumulados se construye el gráfico ojiva menor que. A continuación se ejemplifica cómo se construye este gráfico.

Ejemplo 1.44

Los siguientes datos de la tabla 1.26 muestran la distribución de frecuencias de tiempos de una muestra tomada al azar de la duración en segundos de comerciales transmitidos por la televisión comercial en el horario de las 20:00 hs a las 23:00 hs, tomada en un periodo de 2 años. No se repite un comercial en la muestra.

Tabla 1.26 Tiempos de duración en segundos de comerciales en televisión comercial

CLASE

INTERVALOS REALES DE

CLASE: SEGUNDOS

(T)

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE %

FRECUENCIA RELATIVA

ACUMULADA

PORCENTAJE

ACUMULADO (%)

MARCA DE CLASE

1 5<T10 23 0.14375 14.375 0.14375 14.3750 7.52 10<T15 66 0.41250 41.250 0.55625 55.6250 12.5

Page 25: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

3 15<T20 49 0.30625 30.625 0.86250 86.2500 17.54 20<T25 16 0.10000 10.000 0.96250 96.2500 22.55 25<T30 4 0.02500 2.500 0.98750 98.7500 27.56 30<T35 2 0.01250 1.250 1.00000 100.0000 32.5

Totales 160 1.00000 100.000

1) La población puede definirse como “El tiempo en segundos que dura un comercial televisivo transmitido en México por la televisión comercial en el horario de 20:00 hs a 23:00 hs”.

2) La variable en estudio es el tiempo en segundos que dura un comercial. Es una variable continua.

3) La variable asume valores entre 5 y 35 segundos.

La figura 1.21 muestra el histograma correspondiente a esta distribución de frecuencias.

Figura 1.21 Tiempo de duración de un comercial en televisión

5 10 15 20 25 30 350

10203040506070

Histograma de frecuencias

Tiempos de comerciales en segundos (T)

Frec

uenc

ia

Ahora, para llegar a la conclusión del gráfico ojiva menor que, contesta lo siguiente con base en la columna de porcentajes acumulados.

a. ¿Cuál es el porcentaje de comerciales que duró 15 segundos o menos?b. ¿Cuál es el porcentaje de comerciales que duró 25 segundos o menos?c. ¿Qué porcentaje de comerciales duró más de 10 segundos pero menos de 30

segundos?d. ¿Qué porcentaje de comerciales duró más de 20 segundos?e. ¿Qué porcentaje de comerciales tuvo una duración mayor a 15 segundos y menor o

igual a 35 segundos?

Page 26: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Si se denota a la variable tiempo por T, los eventos enunciados anteriormente pueden escribirse como sigue.

T 15 s (el comercial dura 15 segundos o menos). T 25 s (el comercial dura 25 segundos o menos). 10 < T 30 s (el comercial dura más de 10 segundos pero menos de 30 segundos). T > 20 s (el comercial dura más de 20 segundos).

Con la columna de frecuencias relativas acumuladas o porcentajes acumulados se construye el gráfico ojiva menor que, colocando los intervalos reales de clase sobre el eje horizontal y trazando un gráfico de barras a la altura de las frecuencias relativas o porcentajes acumulados. Se construye la ojiva menor que por medio de segmentos de línea recta procediendo como sigue:

Sobre el gráfico de barras se trazan segmentos rectilíneos que unan los límites reales de clase superiores en el extremo superior de la barra respectiva, como se muestra en la figura 1.22.

Figura 1.22 Ojiva menor que

La línea gruesa representa la ojiva menor que. Con base en este gráfico se pueden contestar las siguientes preguntas.

1) ¿Qué porcentaje de los comerciales duró menos 17.5 s? La respuesta se obtiene trazando una recta paralela al eje vertical desde el punto T = 17.5 en el eje horizontal, hasta llegar a la ojiva. Desde ahí, se traza una recta paralela al eje horizontal hasta llegar al eje vertical (véase la figura 1.22). La respuesta es: aproximadamente 71%.

Page 27: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

2) ¿Qué porcentaje de los dos comerciales duró menos de 21.6 s? La respuesta es: aproximadamente 90%.

3) ¿Qué porcentaje de los comerciales duró entre 10 y 20 s? La respuesta es: aproximadamente 86% - 14% = 72%. (¿Por qué?)

4) ¿Qué porcentaje de los comerciales duró más de 12.5 s? La respuesta es: aproximadamente 100% - 38% = 62%. (¿Por qué? Explica.)

Actividades de aprendizaje

Trabaja con tres compañeros de tu grupo y resuelvan el siguiente problema. Comparen los resultados con los de sus compañeros y obtengan una conclusión acerca de la utilidad de la gráfica ojiva menor que. Si tienen alguna duda, consulten con su maestro(a).

1 TORTUGAS GIMOTEAS DEL LAGO DE CHAPALA

Enseguida se presenta la muestra de las longitudes en centímetros de tortugas gimoteas adultas halladas en el Lago de Chapala para su estudio. El objetivo es construir la distribución de frecuencias, el histograma de frecuencias y el gráfico ojiva menor que para estos datos.

Longitudes en cm de una muestra de tortugas gimoteas elegantes adultas halladas en el Lago de Chapala

Lago de Chapala18.94 23.03 24.19 25.33 26.3820.50 23.22 24.22 25.37 26.3820.60 23.37 24.23 24.45 26.4021.11 23.58 24.24 25.47 26.4521.79 23.63 24.33 25.58 26.6521.93 23.69 24.37 25.62 26.9122.38 23.70 24.50 25.65 27.0822.44 23.77 24.79 25.85 27.1922.53 23.78 25.05 25.86 27.2022.55 23.88 25.14 26.10 27.4522.78 23.89 25.14 26.15 27.8022.81 23.96 25.25 26.21 27.8722.88 23.98 25.28 26.21 28.0122.95 24.02 25.28 26.22 28.1023.01 24.12 25.33 26.31 28.49

a. Construyan la tabla de frecuencias para las longitudes. Utilicen seis clases.

CLASEINTERVALOS REALES DE

CLASE

FRECUENCIAfi

FRECUENCIA RELATIVA fr PORCENTAJE

PORCENTAJE ACUMULADO

123456

Page 28: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Totales

b. Construyan el histograma de frecuencias y el polígono de frecuencias, y describan su contenido.

c. Construyan el gráfico ojiva menor que.

2 Utilizando la ojiva menor que construida, respondan qué porcentajes (aproximadamente) de las tortugas tienen las siguientes medidas:

a. menos de 26 cmb. menos de 24 cmc. más de 24 cmd. mas de 23 cme. entre 23 y 26 cm

Page 29: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

SESGO Y SIMETRÍA

El sesgo y la simetría son cualidades importantes de una distribución de frecuencia. Los conceptos son contrarios desde el punto de vista de la geometría de una distribución. La simetría de una distribución de probabilidad se describe de la siguiente manera: Una distribución de frecuencias es simétrica si los extremos o colas de su histograma de frecuencias o espigas son aproximadamente iguales.

Una analogía del uso de estos términos en estadística la encontramos en la geometría. Observa los triángulos de la figura 1.23. El triángulo A es isósceles y el B es escaleno. Podemos observar que en el triángulo isósceles la altura es un eje de simetría: los dos triángulos formados, uno a la derecha de la altura y otro a su izquierda, son congruentes. En cambio, en el triángulo escaleno la altura no es eje de simetría: los dos triángulos formados son diferentes. Se dice que el triángulo B tiene un sesgo a la derecha.

Figura 1.23

La distribución de frecuencias y el histograma de frecuencias de la venta diaria en pesos del vendedor de tacos en Puebla, presentados en el ejemplo 1.41, son simétricos, con centro aproximadamente en 1250 pesos/día. De igual forma, puede observarse en el histograma de la figura 1.24 que sus colas izquierda y derecha son prácticamente iguales.

Figura 1.24 Distribución de frecuencias simétrica

Page 30: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

500 1000 1500 2000 25000

1020304050607080

Venta de tacos por día

Variable: pesos/día

Frec

uenc

ia

Así, el sesgo en una distribución o gráfico de frecuencias representa la ausencia de simetría. Corresponde a una tendencia marcada de las frecuencias o frecuencias relativas de algunas clases en uno de los extremos o colas de la distribución al decrecer en valor y alargarse de una manera que no es equivalente a la del otro extremo.

El gráfico de la figura 1.25 constituye un ejemplo de un sesgo. Representa los resultados de un examen de matemáticas de 1000 estudiantes que solicitaron ingresar a una universidad del centro del país. Los resultados se dan en una escala de 0 a 1.

Figura 1.25 Distribución de frecuencias asimétrica o sesgada

Se puede observar un sesgo a la izquierda, esto es, la cola de barras a la izquierda es más larga que la de la derecha.

Page 31: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

El sesgo de una distribución de frecuencias puede ser

a) derecho, ob) izquierdo

1.2.8 Regularidad estadística

En el último apartado de la sección 1.1.6 se esbozó el concepto de regularidad estadística, relacionado con el de experimento aleatorio. Ahora se puede avanzar en la comprensión de estos conceptos gracias a que tienes a la mano nuevos instrumentos.

Cuando se repite un experimento aleatorio, en el cual por su naturaleza es imposible predecir el resultado que ocurrirá en cada ensayo, lo que se observa generalmente es que las frecuencias, y por tanto las frecuencias relativas, de los diferentes resultados o eventos se estabilizan fluctuando levemente alrededor de un valor fijo cuando el número de repeticiones es grande. Por ejemplo, si se lanza un dado bien balanceado 600 veces, seguramente ocurrirá que la frecuencia relativa de cada número de puntos se aproxime a 1/6 0.1667. En la tabla 1.27 se muestran los resultados de un experimento en el cual se lanzó un dado 120 veces; se anotó el número de puntos de las caras que caían.

Tabla 1.27PUNTOS FRECUENCIA FRECUENCIA RELATIVA

1 18 0.150002 17 0.141673 22 0.183334 20 0.166675 21 0.175006 22 0.18333

...................................................................................................................................................Regularidad estadística de un evento relacionado con un fenómeno o experimento aleatorio: Es la frecuencia relativa del evento estabilizada alrededor de un valor cuando se repite el experimento al que pertenece el evento una gran cantidad de ocasiones....................................................................................................................................................

Es esta regularidad o permanencia de las frecuencias relativas con apenas pequeñas variaciones lo que permite efectuar inferencias acerca de la forma como se comportará un fenómeno aleatorio a la larga, esto es, cuando se repita de nuevo el experimento bajo condiciones similares otras muchas veces. Esas inferencias son en realidad generalizaciones que implican predicciones. La inferencia parte de algunos hechos experimentales y nos conduce a obtener conclusiones generales. Cuando se realiza un estudio científico, se utilizan sólo muestra. De esas muestras, por medio de la inferencia, el científico debe

Page 32: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

obtener alguna luz acerca de la naturaleza de la población. Sin la regularidad estadística, tal pretensión sería imposible.

Actividades de aprendizaje

Trabaja con tres compañeros de tu grupo y desarrollen los siguientes experimentos. Comparen los resultados con los de sus compañeros y obtengan una conclusión acerca de la existencia de la regularidad estadística. Si tienen alguna duda, consulten con su maestro(a).

1 En su salón de clase, registren el mes de nacimiento de cada uno de los alumnos. Utilicen la tabla siguiente para anotar la información y los resultados de sus cálculos.

MES E F M A M J J A S O N DFrecuencia Frecuencia relativa

a. ¿Cuál es la variable en estudio?b. ¿De qué tipo y densidad es la variable?c. ¿Es el experimento practicado un experimento aleatorio? ¿Por qué?d. ¿Cuál es su hipótesis acerca de la frecuencia relativa de los nacimientos que ocurren

cada mes? ¿Por qué?e. ¿Se aproximan las frecuencias relativas encontradas con la hipótesis?f. Si se registran los meses de nacimiento de otras 2000 personas, ¿qué crees que

pasaría con las frecuencias relativas? ¿A cuál número se acercarían?

2 Un experimento consiste en lanzar dos dados al aire y observar la suma de los puntos que caen. Repitan el experimento 60 veces. Antes, contesten lo que se pide enseguida.

a. ¿Cuál es la variable en estudio?b. ¿De qué tipo y densidad es la variable?c. ¿Cuáles son los resultados posibles del experimento? Escríbanlos en la tabla de

distribución de frecuencia dada más adelante.d. De acuerdo con los posibles resultados experimentales dados por ustedes antes de

practicar el experimento, ¿cuál o cuáles resultados parecen ser los que menos ocurrirían? ¿A qué creen que se deba esto? Expliquen.

e. Igualmente, ¿cuál o cuáles resultados parecen ser los que más sucederán? ¿A qué se deberá eso? Expliquen.

f. ¿Cuántos elementos tendrá la muestra que se tiene que tomar?g. Efectúen el experimento y completen la distribución de frecuencias relacionada en

la tabla que se muestra a continuación.

RESULTADOS POSIBLES (CASOS)

FRECUENCIA (CONTEO

INDIVIDUAL)

FRECUENCIAfi

FRECUENCIA RELATIVA fri

PORCENTAJE%

FRECUENCIA RELATIVA

ACUMULADA frai

Page 33: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

Totales

h. ¿Los resultados coinciden aproximadamente con sus predicciones o hipótesis?i. De acuerdo con los datos encontrados, efectúen las siguientes inferencias. Si se

repite el experimento 1 200 veces, calculen la frecuencia relativa esperada de los eventos siguientes:

Caen 7 puntos. Caen 8 o 9 puntos. Caen más de 8 puntos. Caen menos de 4 puntos. Caen 2, 5, 8 u 11 puntos.

j. ¿Creen que es real y efectiva la regularidad estadística prevista para cada resultado? ¿Cómo se podría probar esto?

Actividades generales 1.2

A continuación, se te plantea un conjunto de ejercicios complementarios para que mediante su solución apoyes el conocimiento adquirido en este tema y en el anterior. Se presentan varias situaciones estadísticas prácticas en diferentes contextos. Por consiguiente, para obtener una solución deberás aplicar los conceptos aprendidos combinándolos. Haz lo que se te pide en cada caso. Te sugerimos que trabajes en equipo con algunos de tus compañeros y, si hubiese dudas, consulta a tu maestro(a).

1 El astrónomo danés Tycho Brahe (1546 – 1601) pasó treinta años de su vida recolectando datos a simple vista (sin telescopio) acerca del movimiento de los planetas alrededor del Sol. Los datos arreglados en extensas tablas fueron estudiados por el alemán Johannes Kepler (1571 – 1639), quién determinó que la trayectoria de los planetas es elíptica y no circular como se creía.

a. ¿De qué tipo de fuente fueron tomados los datos estadísticos de Brahe? ¿Cómo lo deduces?

Page 34: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

b. ¿Qué trabajo crees que realizó Kepler con la masa de datos heredada de Brahe, para ayudarse a deducir el resultado que obtuvo?

2 Clasifica en cuatro grupos, conforme a un criterio propio, los diámetros ecuatoriales dados en kilómetros de los planetas del sistema solar, los cuales se muestran en la tabla siguiente. Da un nombre a cada grupo y calcula el porcentaje de planetas que quedan en cada clase.

PLANETA MERC VEN TIERR MART JUP SAT URAN NEP PLUDiámetro 4880 12140 12756 6787 142800 120000 52800 49500 6000

Clasificación

CLASE: NOMBRE PLANETAS CARACTERÍSTICAS PORCENTAJE1:2:3:4:

3 Las inasistencias mensuales de los niños de la escuela Magisterio Nacional en la ciudad de Aguascalientes en los últimos 5 años se anotaron en la siguiente tabla de frecuencias.

CLASE FALTAS POR MESMESES:

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE%

1 12 62 13 163 14 124 15 105 16 86 17 57 18 38 19 29 20 210 21 111 22 1

Total 66

a. ¿Los datos se obtuvieron de manera experimental o por observación? ¿Por qué?b. ¿Qué clase se registra con mayor frecuencia? ¿Qué significado tiene esa frecuencia?

Explícalo.c. Completa la tabla haciendo los cálculos que sea necesario.d. ¿Por qué la tabla no posee intervalos de clase?e. ¿Qué significa el porcentaje calculado para la clase 4?f. ¿Es simétrica o sesgada la distribución de los datos? ¿Por qué?g. ¿En qué porcentaje de meses el número de faltas fue menor que 16?

Page 35: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

4 El administrador de una tienda que vende artículos de belleza para mujeres realizó 30 observaciones al azar durante dos meses del tiempo en minutos que tardan en atender a un cliente cada una de las cuatro empleadas A, B, C y D. Los datos se muestran en la tabla siguiente.

25.3 19.0 15.7 17.0 12.2 21.319.4 16.6 21.0 15.2 16.2 19.51.3 23.6 15.1 23.8 7.5 8.513.0 13.8 13.4 17.7 17.1 13.717.2 16.1 11.3 14.8 9.8 17.9

a. Agrúpalos ordenadamente, del menor al mayor, en la tabla vacía.

b. ¿Qué porcentaje de los son menores a 15 minutos?c. Escribe cada dato que corresponde a 33% de los tiempos de atención mayores.d. ¿Cuál es la frecuencia relativa del evento “El tiempo de atención está entre 12 y 18

minutos”?e. ¿Cuál es la diferencia en minutos entre el tiempo mayor y el menor?f. ¿Cómo pudo tomar al azar los tiempos el administrador? Piensa en una forma de

hacerlo.g. ¿Parece simétrica la distribución de los datos? ¿Por qué?

5 Se realiza una investigación acerca del punto de fusión del plomo (temperatura a la cual cambia de sólido a líquido). Se trabaja en un laboratorio con temperatura controlada a 26 °C en crisoles de acero (fuentes de fuego de precisión e instrumentos de medición de calidad). Los datos de una muestra de 100 observaciones se han vaciado en la tabla de distribución de frecuencias siguiente.

CLASEINTERVALO:

TEMPERATURA DE FUSIÓN EN ºC

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE%

1 326<C326.4 82 326.4<C326.8 123 326.8<C327.2 704 327.2<C327.6 75 327.6<C328 3

Totales n=100

a. ¿Cuál es la variable en estudio?b. ¿De qué tipo y densidad es la variable?

Page 36: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

c. ¿Por qué el investigador sí calculó intervalos de clase?d. ¿Los intervalos de clase son verdaderos? ¿Cómo lo sabes?e. ¿De qué fuente provienen los datos? ¿Por qué?f. ¿Qué porcentaje de los puntos de fusión tienen un valor mayor que 326.8 °C pero

menor que o igual a 327.2 °C?g. ¿Qué porcentaje de los datos tiene un valor mayor que 326.4 °C pero menor que

328 °C?h. ¿Qué significa la enorme frecuencia relativa de la clase 3?i. ¿Es simétrica la distribución de los datos? Explica por qué.

6 En una presa del estado de Tabasco se registró en metros la altura de la cortina de agua que se formaba después de una temporada de lluvias durante los últimos 50 años. Se anotaron los datos en la tabla que se muestra a continuación.

AÑOS ALTURA EN METROS1955-1964 29.81 32.29 33.46 32.47 30.25 31.37 29.11 30.07 28.67 27.02

1965-1974 27.52 27.12 30.03 32.51 30.62 29.22 28.53 29.57 27.04 27.18

1975-1984 27.71 29.84 28.46 30.62 32.85 33.93 32.34 30.22 31.42 31.63

1985-1994 31.11 30.76 31.19 32.54 34.71 30.62 30.41 29.05 25.41 24.75

1994-2004 27.97 28.96 27.93 29.71 29.07 28.08 27.79 26.43 25.34 25.37

Un técnico creyó más conveniente ordenar los datos, según se ve en seguida.

24.75 27.02 27.71 28.46 29.07 29.81 30.25 30.76 31.63 32.5425.34 27.04 27.79 28.53 29.11 29.84 30.41 31.11 32.29 32.8525.37 27.17 27.93 28.67 29.22 30.03 30.62 31.19 32.34 33.4625.41 27.18 27.97 28.96 29.57 30.07 30.62 31.37 32.47 33.9326.43 27.52 28.08 29.05 29.71 30.22 30.62 31.42 32.51 34.71

a. ¿Cuál es el comportamiento del agua respecto a los niveles que registró por década tal como éstos se dieron?

b. ¿Qué datos dan más información? ¿Por qué? Da dos motivos respecto a algún uso particular de cada conjunto de datos.

c. Observa los datos y parte del supuesto que las condiciones de extracción de agua han sido las mismas. ¿Podría decirse que ha habido sequía alguna vez? ¿Por qué?

d. Enseguida se ha construido una distribución de frecuencias. Complétala.

CLASEINTERVALO:

ALTURA DEL AGUA EN M

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE%

1 24<C262 26<C283 28<C304 30<C32

Page 37: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

5 32<C346 34<C36

Totales n=50

e. ¿Cuál es la frecuencia relativa del evento “La altura es mayor de 30 metros”?f. ¿Cuál es la probabilidad del evento “La altura del agua será menor a 26 metros en

los próximos dos años”?g. ¿Qué indica el porcentaje de la clase 1?h. ¿Importa si la distribución de frecuencias tiene sesgo o es simétrica? ¿Por qué?

7 Un prototipo de automóvil que obtiene energía por medio de un motor híbrido de gasolina estándar combinado con un motor eléctrico, se prueba en los laboratorios de una empresa constructora de autos. Se le sometió a 40 ensayos en 2004 para medir su rendimiento. Los resultados del rendimiento se muestran en la siguiente tabla.

13.15 14.50 15.63 16.43 17.46 18.16 18.80 19.39 19.78 20.4413.36 14.94 16.02 16.46 17.52 18.24 19.10 19.47 20.11 21.1313.97 15.21 16.41 16.90 17.92 18.45 19.27 19.53 20.17 21.4714.38 15.55 16.43 16.95 18.09 18.45 19.37 19.64 20.31 22.19

Estos datos se clasifican en una distribución de frecuencias como se muestra a continuación.

CLASEINTERVALOS

DE CLASE: KM/L

INTERVALO REAL: KM/L

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE %

PORCENTAJE ACUMULADO

1 12-142 15-163 17-184 19-205 21-226 23-24

Totales n=50

a. Construye los intervalos reales de clase.b. Completa la tabla realizando los cálculos respectivos.c. ¿Cuál es la fuente de los datos?d. ¿Consideras que la dispersión de los datos es grande o pequeña? ¿En qué basas tu

respuesta?e. Calcula el rango de los datos, R = dato mayor – dato menor. ¿Es éste un parámetro

o un estadístico? ¿Por qué?f. ¿Qué tipo de medición debió realizarse para obtener los datos?g. ¿Estos datos son una muestra representativa para los carros que construirá la

empresa con motor híbrido? ¿Por qué?h. ¿Qué porcentaje de ocasiones el auto mostró un rendimiento menor que 20.5 km/L?i. ¿Qué porcentaje de los recorridos correspondió a un rendimiento mayor que 16.5

km/L?

Page 38: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

8 Una empresa dedicada al negocio de la agro biotecnología ha experimentado con un tipo de semillas de maíz S1 tratado genéticamente. La cosecha que se obtuvo con la semilla se recogió en 30 hectáreas esparcidas en un campo de 200 hectáreas. Las parcelas se distribuyeron al azar para evitar un efecto por la calidad de la tierra. Los resultados en toneladas por hectárea se muestran en el siguiente histograma de frecuencias.

a. ¿Qué deduces de este gráfico? Explica.b. Calcula las marcas de clase.c. Traza el polígono de frecuencias correspondiente sobre el histograma.d. ¿Cuál es el rango de cada clase?e. ¿Qué tipo de medición se requirió para obtener cada dato?f. ¿Puedes determinar cuál es el dato menor? ¿Por qué?g. ¿Cuál es la frecuencia relativa del evento “Se producen menos de 14 toneladas de

maíz por hectárea”?h. ¿Cuál es la frecuencia relativa del evento “Se producen entre 12.5 y 15 toneladas

por hectárea”?

9 Una agencia de viajes lleva un registro del número de viajeros por mes que contratan un viaje a Europa. En la siguiente tabla se muestran los correspondientes a los años 2001 al 2003.

MES E F M A M J J A S O N DAÑO2001 110 140 150 135 120 115 200 250 148 170 145 2202002 130 165 130 190 120 125 190 260 150 160 140 2502003 120 170 170 230 120 125 195 240 160 180 150 280

a. ¿Cuál es la variable que se observa?b. ¿De qué tipo y densidad es la variable?c. Construye un gráfico mediante el cual pueda compararse la variable para cada uno

de los meses en esos años.d. ¿Cuáles son los mejores y los peores meses en el negocio?e. En términos generales, ¿prospera el negocio? ¿Por qué?

Page 39: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

10 El monto mensual en millones de dólares de las exportaciones petroleras de un país latinoamericano, durante los años 2002 y 2003, se muestran en la tabla siguiente.

10184 11930 12479 12826 13489 13705 14395 1556310431 12134 12733 13096 13543 13857 14700 1565410586 12328 12760 13485 13669 14115 15179 15941

a. Construye la distribución de frecuencias para los datos, efectuando los cálculos (rango; clases; amplitud de clase, etc.) y las agrupaciones (frecuencias) respectivas.

CLASEINTERVALO

REAL: MILLONES DE DÓLARES/MES

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE %

PORCENTAJE ACUMULADO

Totales n=

b. ¿Cuántas cifras significativas tienen los datos?c. ¿Cuál es la clase con mayor frecuencia? ¿Qué significa esto?d. ¿Cuál es la frecuencia relativa del evento “Las ventas son menores a 14 000

millones de dólares al mes”?e. ¿A qué crees qué se deba la variación en los datos? Plantea tres causas.f. ¿Construirías un histograma o más bien un gráfico de espigas para representar los

datos? ¿Por qué?g. Construye el gráfico adecuado para representar los datos.h. ¿Parece ser simétrica o sesgada la distribución de los datos? Explica.

11 Un sociólogo en el Estado de México investiga el tiempo diario en minutos que dedican los usuarios entre 18 y 30 años residentes en Toluca a consultar sitios en Internet con contenidos sobre música. Tras 120 observaciones hechas al azar y levantando una encuesta, construyó con los datos recogidos el histograma de frecuencias y el gráfico de barras acumuladas que se presentan a continuación.

Page 40: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

a. Describe lo que representa el histograma de frecuencias.b. Construye sobre el gráfico de barras acumuladas la ojiva menor que.c. ¿Qué porcentaje de los entrevistados dijo dedicar meros de 52.7 minutos diarios a la

consulta?d. ¿Qué porcentaje aproximado de los entrevistados en el mismo caso consulta menos

de 70 minutos?e. ¿Qué porcentaje de los entrevistados consulta más de 65 minutos por día?f. ¿Qué porcentaje de los entrevistados consulta más de 55.7 minutos?

12 El administrador de un centro de servicios de modelos y edecanes lleva un registro del tiempo en minutos diarios de su trabajo. Los últimos 40 datos arrojaron las cifras siguientes.

126.1 146.7 154.6 157.4 161.8 169.3 179.1 184.7 189.8 199.5131.0 148.0 155.2 158.2 163.4 170.1 182.6 185.8 191.4 201.9133.1 154.2 156.8 159.1 167.6 171.5 183.1 186.5 193.4 204.8

Page 41: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

134.9 154.5 157.2 161.4 169.1 177.4 184.4 186.6 197.5 205.1

a. ¿De qué tipo de fuente proceden los datos?b. Construye la distribución de frecuencias.

CLASEINTERVALO

REAL: MINUTOS/DÍA

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE %

PORCENTAJE ACUMULADO

MARCAS DE CLASE

Totales n=

c. Construye el histograma y el polígono de frecuencias.d. ¿La distribución de los datos parece ser simétrica o sesgada?e. Construye la ojiva menor que.f. ¿Cuál es aproximadamente la frecuencia relativa del evento “Las contratan menos

de 180 minutos”?g. ¿Aproximadamente cuántos de los próximos 50 días se requerirá que las edecanes

trabajen menos de 170 minutos al día?h. Cada edecán recibe 5 pesos por minuto trabajado. ¿Cuántos días de los próximos

100 tendrá que pagar el administrador más de 200 pesos por los servicios de todas las edecanes?

13 Se realizó un estudio en el cual se preguntó a los 800 socios de una cadena hotelera acerca de la seguridad de su inversión. La pregunta fue: ¿La empresa ha satisfecho sus expectativas respecto al riesgo de su inversión?. Las respuestas posibles tenían que darse en una escala de 0 a 10, donde 10 era equivalente a “Sin duda”, y 0 a “Absolutamente no”. Los resultados iniciales se muestran en la siguiente tabla.

CLASEFRECUENCIA

fFRECUENCIA RELATIVA fr

PORCENTAJE%

PORCENTAJE ACUMULADO

0 01 12 43 64 205 296 1007 2408 3509 2010

n=80

a. ¿Los resultados son representativos de la opinión de los socios? ¿Por qué?

Page 42: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

b. ¿Representan parámetros o estadísticos los resultados numéricos que se obtienen? ¿Por qué?

c. ¿De qué tipo y densidad es la variable que se estudia? ¿En qué escala se mide?d. Completa la tabla de frecuencias.e. ¿De qué fuente provienen los datos?f. Construye un gráfico de espigas para los datos.g. Construye la ojiva menor que para estos datos.h. ¿Cuál es el porcentaje de los socios que marcaron más de 6 puntos? ¿Parece que se

salva la política de riesgo del hotel?i. ¿Es simétrica la distribución de las calificaciones?

14 El tiempo en minutos en que se asea completamente una habitación doble en un hotel es una variable aleatoria. El jefe del personal de limpieza investiga ese tiempo para poder planificar las tareas diarias. Obtiene algunos resultados, los cuales concentra en una distribución de frecuencias como se ve en la siguiente tabla.

CLASEINTERVALO

REAL: MINUTOS (T)

FRECUENCIAf

FRECUENCIA RELATIVA fr

PORCENTAJE %

PORCENTAJE ACUMULADO

MARCAS DE CLASE

1 11<T 8 122 <T15 103 154 17<T19 455 0.12 206 22

Totales n=100

a. Completa la tabla.b. Construye el polígono de porcentajes.c. En función de lo que observas en el polígono de porcentajes, ¿qué puedes decir

acerca del tiempo de aseo?d. Construye una ojiva menor que.e. ¿A qué crees que se deba la variación en los tiempos si todas las habitaciones son

“dobles”? Piensa en tres factores.f. ¿Cuál es la proporción de veces que se asea una de las habitaciones en menos de 18

minutos?g. ¿Cuántas de 100 veces se asea una habitación entre 12.5 y 18.5 minutos?

15 Se estudió el porcentaje de grasa corporal en 500 varones entre 25 y 40 años en una clínica del norte del país. Los resultados se resumen en el siguiente histograma de frecuencias, en el cual las frecuencias aparecen a la derecha.

Page 43: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

a. Construye una gráfica ojiva menor que.b. Si se ha determinado que quienes tienen menos de 10% o más de 20% de grasa

tienen un problema de salud, ¿aproximadamente qué porcentaje de los varones estudiados está en esa situación?

c. ¿De qué tipo es la fuente de los datos? ¿Por qué?

Resumen

Los datos numéricos o mediciones estadísticas se obtienen por medio de experimentos, en los que frecuentemente se controlan variables, o por observación, en la que no se controla ningún factor. Estos datos se obtienen desordenados y se les llama datos en bruto, pero se organizan o agrupan en tablas o gráficos para descubrir patrones y relaciones entre ellos. En una tabla de frecuencias o distribución de frecuencias de los datos, se clasifican las mediciones y se calculan las frecuencias y frecuencias relativas por clase para conocer cómo se distribuyen. Se puede determinar si los datos se acumulan más en el centro o en algún extremo.

Si los datos se acumulan en mayor cantidad en las clases centrales, y las clases de los extremos poseen frecuencias pequeñas y aproximadamente equivalentes, la distribución de los datos es simétrica. Si los datos se acumulan principalmente en las clases de un extremo y hay pocos en las del otro, desvaneciéndose y perdiéndose la simetría, la distribución es sesgada, ya sea a la derecha o a la izquierda.

Una distribución de frecuencias puede representarse por un gráfico. Para las variables continuas, el histograma de frecuencias es el gráfico más utilizado. Este gráfico se construye con los intervalos de clase y las frecuencias de cada clase de la tabla o distribución de frecuencias a partir de las cuales se determina la altura de las barras. Su ventaja sobre la tabla es que permite ver de manera inmediata las peculiaridades de la

Page 44: Introducción - hpasi.files.wordpress.com · Web viewEl número de pasajeros por viaje en una línea de camiones que va de Jalapa a Orizaba es una variable cuyo comportamiento quiere

organización de los datos a la que llamamos precisamente distribución, esto es, dónde se acumulan más o menos frecuencias, y por tanto si existe sesgo o simetría. Del histograma se deriva el polígono de frecuencias.

Cuando la variable es directa, es decir, que sólo toma valores enteros, el gráfico adecuado para describir la distribución de los datos es el gráfico de espigas, nombre que proviene de las líneas o varas que se levantan a la altura de las frecuencias relativas de cada valor que toma la variable.

Otro gráfico importante para describir datos es la gráfica ojiva menor que. Este gráfico se construye con las frecuencias relativas o los porcentajes acumulados, por lo que permite calcular las frecuencias relativas acumuladas de eventos por medio de un intervalo.