Download - Capítulo 2.2
1-2008 1
Organización de datos numéricos
EstadísticaCapítulo 2.2
1-2008 22
Introducción
El aprendizaje de esta unidad se va a centrar en la organización de variables numéricas, ya sean
discretas o continuas.
1-2008 33
ARREGLO ORDENADOUna vez que los datos de la encuesta se encuentran listos, el siguiente paso es organizar la información y ordenarla.
• Por cada variable se hace un ordenamiento simple.
• El determinar cual es el dato que tiene menor valor y cual el de mayor valor es información vital para empezar a trabajar con variables cuantitativas.
1-2008 44
Suponga que decide llevar a cabo un estudio del costo de una comida en un restaurante de una gran ciudad. A 50 restaurantes citadinos se les consultó sobre el precio promedio de
sus platos y se obtuvieron los siguientes resultados.
1-2008 55
Precio del plato en 50 restaurantes citadinos
50 38 43 56 51 36 25 33 41 44
34 39 49 37 40 50 50 35 22 45
44 38 14 44 51 27 44 39 50 35
31 34 48 48 30 42 26 35 32 63
36 38 53 23 39 45 37 31 39 53
1-2008 66
Precio de plato en 50 restaurantes de la ciudad
14 22 23 25 26 27 30 31 31 32
33 34 34 35 35 35 36 36 37 37
38 38 38 39 39 39 39 40 41 42
43 44 44 44 44 45 45 48 48 49
50 50 50 50 51 51 53 53 56 63
1-2008 77
Rango
Calcular el rango es determinar la longitud numérica que existe entre el
primer dato y el último.
• Restar el dato menor del dato mayor de la muestra y se obtiene el rango.
• Rango = DatoMayor - DatoMenor
1-2008 88
La pregunta que estamos analizando ya tiene sus datos ordenados, ahora determinar a simple vista
cuales son los datos mayor y menor respectivamente:
Dato Mayor $ 63.00
Dato Menor $ 14.00
1-2008 99
RANGO
En una muestra o población el rango es la distancia entre el dato mayor y el dato menor. Se calcula restando
ambos datos.
MenorDatoMayorDatoRango
1-2008 1010
Cálculo del rango.
Muestra de restaurantes citadinos
49
1463
Rango
Rango
DatoMenorDatoMayorRango
1-2008 1111
DISTRIBUCIÓN DE FRECUENCIAS
Sin importar si los datos están o no ordenados, siempre es posible crear una distribución de frecuencias para los datos
de una variable en una muestra.
La distribución de frecuencias es una tabla de resumen en la que los datos están organizados en clases o grupos
numéricamente ordenados.
1-2008 1212
DISTRIBUCIÓN DE FRECUENCIAS
Se organiza en filas y columnas para resumir la información y poder realizar interpretaciones de manera rápida y
efectiva.
Seleccionar el número apropiado de agrupaciones oclases para la tala,
determinando una amplitud conveniente de las clases y estableciendo los límites de
cada una para evitar traslape.
1-2008 1313
Amplitud de intervalo o clase
La Amplitud de cada intervalo o clase se calcula dividiendo el rango entre el número de intervalos elegidos.Se ha convenido que todos los intervalos tienen la misma anchura.
elegidosIntervalosdeNumero
RangoAmplitud
1-2008 1414
Amplitud de unIntervalo o clase
La mayoría de las veces la amplitud de un intervalo es mejor trabajarla con una anchura que sea un número entero (aplican restricciones).
Si el resultado de la división es decimal, se redondea el resultado de la siguiente manera.• Si el resulta es menor de 0.5 se elimina la
parte decimal.• En caso contrario se pasa al próximo
entero.
1-2008 1515
Cálculo de la amplitud
Muestra de restaurantes citadinos
7
7/49
7
49
1463
Amplitud
Amplitud
Intervalos
Rango
Rango
DatoMenorDatoMayorRango
1-2008 1616
DISTRIBUCIÓN DE FRECUENCIAS
Se organiza en filas y 2 columnas:
Columna 1: El nombre de la variable que se está analizando.
Columna 2: Las veces que se repiten los datos con las mismas características de la variable y se le llama frecuencia.
VariableFrecuenci
a
1-2008 1717
DISTRIBUCIÓN DE FRECUENCIAS
Como la variable es numérica, se trata de valores y si éstos son más de 10 datos diferentes, es conveniente hacer grupos para administrarlos con eficiencia. A cada grupo de datos se le llama Intervalo.
IntervalosFrecuenci
a
1-2008 1818
DISTRIBUCIÓN DE FRECUENCIAS
Un intervalo es como un rango, tiene un dato mayor y un dato menor y el estilo de representación puede ser de varias maneras, las más generalizadas son:
DatoMenor pero menos que DatoMayor
IntervalosFrecuenci
a
1-2008 1919
Precios de plato en $ Restaurantes
14 pero menos que 21 1
21 pero menos que 28 5
28 pero menos que 35 7
35 pero menos que 42 16
42 pero menos que 49 10
49 pero menos que 56 9
56 pero menos que 63 1
63 pero menos que 70 1
Total . . . . 50
1-2008 2020
DISTRIBUCIÓN DE FRECUENCIAS
La información en cada intervalo debe ser única.
Para determinar el número de intervalos para una distribución, se calcula con la información del valor del Rango.
IntervalosFrecuenci
a
1-2008 2121
DISTRIBUCIÓN DE FRECUENCIAS
Se sugiere que una distribución de frecuencias no debe tener menos de 5 intervalos, ni más de 15.
Si no se sigue esta convención, la interpretación de los datos puede ser demasiado condensada o muy dispersa y en ambos casos los resultados aunque están bien, no son objetivos. Y puede afectar la toma de decisiones.
IntervalosFrecuen
cia
Intervalo 1 Frec. 1
Intervalo 2 Frec. 2
Intervalo 3 Frec. 3
Intervalo 4 Frec. 4
Intervalo 5 Frec. 5
Intervalo 6 Frec. 6
1-2008 2222
DISTRIBUCIÓN DE FRECUENCIAS
Los datos por ser numéricos, pueden ir de 100 a 1000, o se pueden extender a 10,000, etc.
Un intervalo es similar al rango, el cual tiene un dato mayor y un dato menor, solo que la distancia entre ellos recibe el nombre de Amplitud
IntervalosFrecuenci
a
Intervalo 1 Frec. 1
Intervalo 2 Frec. 2
Intervalo 3 Frec. 3
Intervalo 4 Frec. 4
Intervalo 5 Frec. 5
Intervalo 6 Frec. 6
1-2008 2323
DISTRIBUCIÓN DE FRECUENCIAS
Determinar el número de intervalos que sirva a una muestra se basa en la experiencia o sentido común de la persona que va a generar la distribución de frecuencias.
IntervalosFrecuenci
a
Intervalo 1 Frec. 1
Intervalo 2 Frec. 2
Intervalo 3 Frec. 3
Intervalo 4 Frec. 4
Intervalo 5 Frec. 5
Intervalo 6 Frec. 6
1-2008 2424
• Calcular el rango.• Elegir el número de intervalos• Calcular la anchura de cada intervalo• Generar los intervalos de clases (no
deben menos de 5 ni más de 15)• Determinar la frecuencia para cada
intervalo.
Procedimiento para generar una distribución de frecuencias
1-2008 2525
Calcular las frecuencias de la distribución para los 50 restaurantes citadinos
Precio de plato
14 22 23 25 26 27 30 31 31 32
33 34 34 35 35 35 36 36 37 37
38 38 38 39 39 39 39 40 41 42
43 44 44 44 44 45 45 48 48 49
50 50 50 50 51 51 53 53 56 63
1-2008 2626
78.65
34
5
34
337
3
37
Amplitud
Intervalos
Rango
Rango
DatoMenor
DatoMayor
1-2008 2727
• En este caso, se iniciará el primer intervalo con el dato menor de la muestra = 14
• A 14 se le suma la amplitud que es 7 y es = 21
• El primer intervalo será el siguiente:
14 pero menos de 21
1-2008 2828
• Para calcular el segundo intervalo, se toma como dato menor el 21 y se le suma la amplitud que es 7 = 28.
• El segundo intervalo resulta ser:De 21 a menos de 28
• Para el tercer intervalo, se toma como dato menor el 28 y se le suma 7 = 35
• El tercer intervalo será:De 28 a menos de 35
1-2008 2929
• En el cuarto intervalo, el dato menor es 35, se suma la amplitud 7 = 42.
• El cuarto intervalo resulta ser:De 35 a menos de 42
• En el quinto intervalo, al dato menor 42 se le suma 7 = 49
• El quinto intervalo es:De 42 a menos de 49
1-2008 3030
PRECIO DE PLATO Frecuencia
14 pero menos de 21
21 pero menos de 28
28 pero menos de 35
35 pero menos de 42
42 pero menos de 49
49 pero menos de 56
56 pero menos de 63
63 pero menos de 70
Intervalos o clases
1-2008 3131
Calcular la frecuencia de cada intervalo.
El primer intervalo de “14 pero menos de 21”, se cuenta el número de datos que tienen esa
característica y solo es 14. Al contar los números resulta que es 1 dato
El segundo intervalo de de “21 pero menos de 28” se cuenta 22, 23, 25, 26 y 27 que son 5
1-2008 3232
PRECIO POR PLATO Frecuencia
14 pero menos de 21 1
21 pero menos de 28 5
28 pero menos de 35
35 pero menos de 42
42 pero menos de 49
49 pero menos de 56
56 pero menos de 63
63 pero menos de 70
1-2008 3333
El tercer intervalo de “28 pero menos de 35”, se cuenta 30, 31, 31, 32, 33, 34, 34 (35 no); la frecuencia es 7.
El cuarto intervalo de “35 pero menos de 42” se cuentan 35, 35, 35, 36, 36, 37, 37, 38, 38, 38, 39, 39, 39, 39, 40, 41 y resultan 16
1-2008 3434
PRECIO POR PLATO Frecuencia
14 pero menos de 21 1
21 pero menos de 28 5
28 pero menos de 35 7
35 pero menos de 42 16
42 pero menos de 49
49 pero menos de 56
56 pero menos de 63
63 pero menos de 70
1-2008 3535
El quinto intervalo de “42 pero menos de 49”, está formado por se cuenta ; la frecuencia es 7.
El sexto intervalo de “35 pero menos de 42” se cuentan y resultan 16
1-2008 3636
1-2008 3737
1-2008 3838
Los intervalos quedan de la siguiente manera:
1-2008 3939
Fronteras de clase
• Las fronteras de clase o límites de clase, son los extremos numéricos de una clase.
• Un intervalo tiene la forma “a – b”, contiene los números que empiezan en “a” y que casi terminan de “b”
1-2008 4040
Intervalo 14 pero menos de 21
• La frontera inferior es 14
• La frontera superior se acerca a 21
Intervalo 21 pero menos de 28
• La frontera inferior es 21
• La frontera superior se acerca a 28
1-2008 4141
Frontera real de clase
• Numéricamente, “antes de A” no es un número.• Se establece un límite de acuerdo a la formulación
de los datos.• Si los datos se ministran con dos decimales, se
busca el número que está exactamente antes de la frontera superior.
Intervalo normal Fronteras reales
21 pero menos de 28
21 y 27.9
21 pero menos de 28
21 y 27.99
1-2008 4242
Calcular las fronteras reales de la siguiente distribución:
1-2008 4343
Marca de Clase
Es el punto medio de un intervalo de clase, se calcula
sumando sus fronteras y dividiendo el resultado entre dos. El intervalo es dividido a
la mitad
1-2008 4444
Marca de Clase
1-2008 4545
Calcular las marcas de clase de la siguiente distribución:
1-2008 4646
Frecuencia Relativa
La frecuencia relativa es la proporción de frecuencia que corresponde un intervalo con
relación al tamaño de la muestra.
1-2008 4747
Frecuencia Relativa
1-2008 4848
Cálculo de la frecuencia relativa
• Se suman todas las frecuencias• Se divide la frecuencia de cada
intervalo entre el total de frecuencias.• Todas las frecuencias son valores
entre 0.0 y 1.0• La suma de todas las frecuencias
relativas debe ser igual a uno (1)
1-2008 4949
CUENTAS X COBRAR
Número de
facturas Cálculo
Frecuencia Relativa
De 03 a menos de 10 7 7 / 20 = 0.35 0.35
De 10 a menos de 17 7 7 / 20 = 0.35 0.35
De 17 a menos de 24 3 3 / 20 = 0.15 0.15
De 24 a menos de 31 1 1 / 20 = 0.05 0.05
De 31 a menos de 38 2 2 / 20 = 0.10 0.10
Total . . . . . 20 1.00
Cálculo de frecuencia relativa
1-2008 5050
Frecuencia Acumulada
La frecuencia acumulada es la suma parcial para cada intervalo, permite
hacer observaciones sobre los intervalos que están por debajo de él.
1-2008 5151
Cálculo de la frecuencia acumulada
• Se suman todas las frecuencias• Se suma la frecuencia del intervalo
con todas las frecuencias anteriores.• La frecuencia acumulada de cada
intervalo nunca es menor que el valor del intervalo anterior.
• El último intervalo debe tener como resultado la suma de todas las frecuencias (tamaño de la muestra)
1-2008 5252
CUENTAS X COBRAR
Número de
facturasFrecuencias menores que la frontera inferior
Frec. Acumu-
lada
De 03 a menos de 10 7 7 7
De 10 a menos de 17 7 7 + 7 14
De 17 a menos de 24 3 7 + 7 + 3 17
De 24 a menos de 31 1 7 + 7 + 3 + 1 18
De 31 a menos de 38 2 7 + 7 + 3 + 1 + 2 20
Total . . . . . 20
1-2008 5353
Frecuencia Porcentual
La frecuencia porcentual es la misma frecuencia relativa pero en formato de % (porcentaje). El total de la muestra siempre resulta ser
100%
1-2008 5454
Frecuencia Porcentual
La frecuencia porcentual se puede calcular para las
frecuencias absolutas o las acumuladas
1-2008 5555
CUENTAS X COBRAR FacturasFrecuencia
RelativaFrecuencia porcentual
Frecuencia Porcentual Acumulada
De 03 a menos de 10 7 0.35 35% 35%
De 10 a menos de 17 7 0.35 35% 70%
De 17 a menos de 24 3 0.15 15% 85%
De 24 a menos de 31 1 0.05 5% 90%
De 31 a menos de 38 2 0.10 10% 100%
Total20
100%
1-2008 5656
Fin del capítulo 2.2
Continúa el capítulo 2.3(Investigación)