capitulo 2. descripción de datos
DESCRIPTION
Esta es parte del modulo de estadisticas básica.TRANSCRIPT
![Page 1: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/1.jpg)
2- 1
Capitulo
Dos
![Page 2: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/2.jpg)
2- 2
Capitulo Dos Descripción de datos: Distribuciones de Descripción de datos: Distribuciones de
Frecuencia y su presentación gráficaFrecuencia y su presentación gráficaMETASAl terminar este capítulo usted podrá:
UNOOrganizar la información en una distribución de frecuencia. DOS Representar una distribución de frecuencia en un histograma, un polígono de frecuencia y un polígono de frecuencia acumulada.TRESPresentar la información utilizando técnicas de gráficas de líneas, gráficas de barras y gráficas de pastel.
Metas
![Page 3: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/3.jpg)
2- 3
Distribución de Frecuencia
Una Distribución de FrecuenciaDistribución de Frecuencia es una agrupación de los datos en clases mutuamente excluyentes mostrando el número de observaciones en cada una.
![Page 4: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/4.jpg)
2- 4
Determinar la pregunta que se tratará
Construir una distribución de frecuencia requiere:
Construyendo una distr. de frecuencia
![Page 5: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/5.jpg)
2- 5
Determinar la pregunta que se tratará
Construir una distribución de frecuencia requiere:
Recolección de información en bruto
Construyendo una distr. de frecuencia
![Page 6: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/6.jpg)
2- 6
Determinar la pregunta que se tratará
Construir una distribución de frecuencia requiere:
Recolección de información en bruto
Organizar la data (distribución de frecuencia)
Construyendo una distr. de frecuencia
![Page 7: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/7.jpg)
2- 7
Determinar la pregunta que se tratará
Construir una distribución de frecuencia requiere:
Recolección de información en bruto
Organizar la data (distribución de frecuencia)
Presentación de la data (gráfica)
Construyendo una distr. de frecuencia
![Page 8: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/8.jpg)
2- 8
Determinar la pregunta que se tratará
Construir una distribución de frecuencia requiere:
Recolección de información en bruto
Organizar la data (distribución de frecuencia)
Presentación de la data (gráfica)
Conclusiones
Construyendo una distr. de frecuencia
![Page 9: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/9.jpg)
2- 9
Collecting raw data
Organizing data (frequency distribution)
Presenting data (graph)
Drawing conclusions
1.5 3.5 5.5 7.5 9.5 11.5 13.5
5
10
15
20
Construyendo una distr. de frecuencia
![Page 10: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/10.jpg)
2- 10
Clase de Punto medioClase de Punto medio:: Punto que divide la clase en dos partes iguales. Este es el promedio de las clases de limites superiores e inferiores.
Clase de Clase de FrecuenciaFrecuencia: El número de observaciones en cada clase.
Clase de IntervaloClase de Intervalo: El intervalo de clase es obtenido restando el limite más bajo de una clase del limite más bajo de la clase siguiente. Los intervalos de clase deben ser iguales.
Definiciones
![Page 11: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/11.jpg)
2- 11
EJEMPLO 1
15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.
Organice la data en una distribución de frecuencia.
Dr. Tillman es el Decano de la escuela de negocios del Socastee University. El desea preparar un reporte que muestre el número de horas por semana que dedican los estudiantes a estudiar. El selecciono una muestra al azar de 30 estudiantes y determino el número de horas que cada estudiante estudio la semana pasada.
![Page 12: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/12.jpg)
2- 12
Ejemplo 1 continua
Paso unoPaso uno:: Decidir el número de clase usando la formula
22kk > n > ndonde k=numero de clases n=numero de observaciones
o Hay 30 observaciones por tal n=30.
o Dos elevado a la quinta es 32.
o Por tal, tenemos por lo menos 5 clases, i.e., k=5.
![Page 13: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/13.jpg)
2- 13
donde H=valor más alto, L=valor más bajo
33.8 – 10.3 5
= 4.7
Paso DosPaso Dos: Determine el intervalo de clases
H – LH – L kk
i > =
Redondear a un intervalo de 5 horas.
Fijar el limite menor de la primera clase a 7.5 horas, dando un total de 6 clases.
Ejemplo 1 continua
![Page 14: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/14.jpg)
2- 14
EJEMPLO 1 continua
Horas de estudio Frecuencia, f
7.5 up to 12.5 1
12.5 up to 17.5 12
17.5 up to 22.5 10
22.5 up to 27.5 5
27.5 up to 32.5 1
32.5 up to 37.5 1
Paso TresPaso Tres: Fije los limites individuales de la clase yPaso Cuatro y Cinco:Paso Cuatro y Cinco: Marque y cuente en número de artículos en cada clase.
![Page 15: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/15.jpg)
2- 15
Clase de Punto MedioClase de Punto Medio: encuentre el punto medio para cada intervalo, usando la siguiente formula: Limite superior + limite inferior
2Horas de
estudio Punto medio f
7.5 up to 12.5 (12.5+7.5)/2 =10.0 1
12.5 up to 17.5 (17.5+12.5)/2=15.0 12
17.5 up to 22.5 (22.5+17.5)/2=20.0 10
22.5 up to 27.5 (27.5+22.5)/2=25.0 5
27.5 up to 32.5 (32.5+27.5)/2=30.0 1
32.5 up to 37.5 (37.5+32.5)/2=35.0 1
Ejemplo 1 continua
![Page 16: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/16.jpg)
2- 16
Horas f Frecuencia Relativa
7.5 up to 12.5 1 1/30=.0333
12.5 up to 17.5 12 12/30=.400
17.5 up to 22.5 10 10/30=.333
22.5 up to 27.5 5 5/30=.1667
27.5 up to 32.5 1 1/30=.0333
32.5 up to 37.5 1 1/30=.0333 TOTAL 30 30/30=1
Ejemplo 1 continua
Una Distribución de Frecuencia RelativaDistribución de Frecuencia Relativa muestra el porcentaje de observaciones en cada clase.
![Page 17: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/17.jpg)
2- 17
Presentación Gráfica de una Distribución de Frecuencia
Un Histograma es una gráfica en la que las clases se marcan en el eje horizontal y las frecuencias de clases en el eje vertical. Las frecuencias de clases se representan mediante la altura de las barras y estás últimas se dibujan una junto a otra.
Las tres formas de gráfico comunmente utilizados son Histogramas, Poligonos de Histogramas, Poligonos de FrecuenciaFrecuencia, y Frecuencia AcumuladaFrecuencia Acumulada.
![Page 18: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/18.jpg)
2- 18
Histograma de horas dedicadas a estudiar
0
2
4
6
8
10
12
14
10 15 20 25 30 35
Horas dedicadas a estudio
Fre
cuen
cia
Punto medio
![Page 19: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/19.jpg)
2- 19
Presentación Gráfica de una Distribución de Presentación Gráfica de una Distribución de FrecuenciaFrecuencia
Presentación Gráfica de una Distribución de Frecuencia
Un Poligono de FrecuenciaPoligono de Frecuencia consiste en segmentos de linea que conectan los puntos formados por las intersecciones de los puntos medios de clase y la frecuencia de clases.
![Page 20: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/20.jpg)
2- 20
Poligono de FrecuenciaPoligono de Frecuencia de de horas dedicadas a estudiarhoras dedicadas a estudiar
0
2
4
6
8
10
12
14
10 15 20 25 30 35
Hours spent studying
Fre
qu
en
cy
Poligono de Frecuencia de horas dedicadas a estudiar
![Page 21: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/21.jpg)
2- 21
Una Distribución de Distribución de Frecuencia Frecuencia AcumuladaAcumulada se utiliza para determinar cuantos o que proporción de los valores de la data se encuentran por debajo o por encima de ciertos valores.
Distribución de Frecuencia AcumuladaDistribución de Frecuencia Acumulada
Para crear un poligono de frecuencia acumulada, escale el limite superior de cada clase a lo largo del X-axis y la correspondiente frecuencia relativa a lo largo del Y-axis.
Distribución de Frecuencia Acumulada
![Page 22: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/22.jpg)
2- 22
Tabla de Frecuencia Acumulada de horas Tabla de Frecuencia Acumulada de horas dedicadas a estudiardedicadas a estudiar
Horas de Estudio
Limite Superior
f FrecuenciaAcumulada
7.5 up to 12.5 12.5 1 1
12.5 up to 17.5 17.5 12 13 (1+12)
17.5 up to 22.5 22.5 10 23 (13+10)
22.5 up to 27.5 27.5 5 28 (23+5)
27.5 up to 32.5 32.5 1 29 (28+1)
32.5 up to 37.5 37.5 1 30 (29+1)
Tabla de frecuencia acumulada
![Page 23: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/23.jpg)
2- 23
Distribución de Frecuencia Acumulada Distribución de Frecuencia Acumulada de Horas de Estudiosde Horas de Estudios
0
5
10
15
20
25
30
35
10 15 20 25 30 35
Horas dedicadas a estudio
Frecuencia
Distribución de frecuencia acumulada
![Page 24: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/24.jpg)
2- 24
Gráfico de linea tipicamente es usado para presentar cambios o tendencia de una variable a través del tiempo.
AÑOS HOMBRE MUJER1992 30.5 32.91993 30.8 33.21994 31.1 33.51995 31.4 33.81996 31.6 34.01997 31.9 34.31998 32.2 34.61999 32.5 34.92000 32.8 35.22001 33.2 35.52002 33.5 35.8 Gráfico lineal
![Page 25: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/25.jpg)
2- 25
Edad media de USA por genero
25
30
35
40
Eda
d m
edia
Males
Females
Ejemplo 3 continua
![Page 26: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/26.jpg)
2- 26
Construir un gráfico de barra del número de desempleados por 100,000 habitantes en el 2001
Ciudad Número de desempleados por 100,000 habitantes
Atlanta, GA 7300 Boston, MA 5400 Chicago, IL 6700
Los Angeles, CA 8900 New York, NY 8200
Washington, D.C. 8900
Una Gráfica de Barras Gráfica de Barras se puede utilizar para representar cualquiera de los niveles de medición (nominal, ordinal, de intervalo, o de razón).
Gráfico de Barras
![Page 27: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/27.jpg)
2- 27
Gráfico de barras para datos de desempleo
7300
5400
6700
89008200
8900
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
1 2 3 4 5 6
Ciudades
# d
esem
ple
ado
s/10
0,00
0Atlanta
Boston
Chicago
Los Angeles
New York
Washington
![Page 28: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/28.jpg)
2- 28
Gráfico P.
A una muestra de 200 corredores se les pregunto sobre sus preferencias de uso de zapatillas para correr. Dibujar un gráfico de pastel en base a la siguiente información.
Tipo de zapatillas
# de corredores
% del total
Nike 92 46.0
Adidas 49 24.5
Reebok 37 18.5
Asics 13 6.5
Other 9 4.5
Una Gráfica de PastelGráfica de Pastel es útil para ilustrar distribuciones de frecuencia relativa. Un circulo se divide proporcinalmente a su frecuencia relativa y partes del circulo distribuidos para diferentes grupos.
![Page 29: Capitulo 2. descripción de datos](https://reader035.vdocuments.co/reader035/viewer/2022081413/5490dc03b47959430c8b4747/html5/thumbnails/29.jpg)
2- 29
46%
24.50%
18.50%6.50%
4.50%
Nike
Adidas
ReebokAsics
Other
Gráfico de pastel para zapatilla de correr