4872010-distribuciones-de-frecuencias

15

Click here to load reader

Upload: frank-rodriguez

Post on 02-Jul-2015

1.002 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

Distribución de frecuenciasDistribución de frecuencias

Una distribución de frecuencias es método de clasificación de datos en clases o intervalos, que muestra el número o porcentaje de observaciones de cada una de ellas. Esto proporciona una forma de observar un conjunto de números sin que se tenga que considerar en forma individual.La distribución de frecuencias se puede presentar en forma tabular y gráfica.

El procedimiento para elaborar una distribución de frecuencias, depende del tipo de datos particulares (esto es, continuos, discretos, nominales o jerarquizados). En primer lugar se consideraremos datos que se miden en una escala continua.

Page 2: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CONTINUOS

Los pasos principales en la elaboración de una distribución de frecuencias para observaciones de una muestra se enumeran a continuación:

1.Establecer el número de clases o intervalos (k) en que se agruparán los datos. En la práctica se eligen entre 5 y 15 intervalos. Una regla empírica es calcular la raíz cuadrada del número de observaciones (n), o bien la Regla de Sturges que se utiliza para determinar el número mínimo de intervalos que debe tener la distribución de frecuencias.

2. Determinar el rango o amplitud de las observaciones (R), el cual se obtiene como la diferencia entre el mayor y el menor valor numérico de las observaciones.

Page 3: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

Para prevenir ambigüedades en la clasificación de las observaciones, resulta conveniente considerar un rango extendido (R*) en lugar del rango original, R* se elige de modo que sea mayor que R, por ejemplo : R* = kR.

La longitud de cada intervalo se obtiene dividiendo al rango ampliado por el número de intervalos.

3. Con el fin de que la diferencia R* - R se distribuya en forma equitativa, debemos dividir esta diferencia por 2, y repartirla en ambos extremos del rango original. Con esto logramos que los límites de los intervalos tengan una mayor aproximación decimal que la que tienen las observaciones originales.

Usaremos el símbolo : (a,b] para representar a todas las observaciones que son mayores que “a” pero menores o iguales que “b”.

Page 4: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

El límite del primer intervalo se obtiene restando a la primer observación el cociente: (R* - R)/2. Los límites de los demás intervalos se obtienen sumando sucesivamente la longitud de cada intervalo.

4. El punto medio de cada intervalo, llamado marca de clase se obtiene promediando los límites inferior y superior de cada intervalo, es el valor más representativo de cada intervalo. Se le simboliza por: xj

5. Contar el número de observaciones que pertenecen a cada intervalo, a las cuales se les llama frecuencias absolutas de la clase y se les representa por: fj

6. La frecuencia relativa fr de un intervalo se obtiene dividiendo a la frecuencia de la clase por el número total de observaciones en la muestra.

Page 5: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

7. La frecuencia acumulada Fa, es la cantidad que nos indica cuántas observaciones existen, cuyo valor numérico es menor o igual al límite superior de un intervalo. Esta se puede expresar en términos de las frecuencias absolutas o de las frecuencias relativas.

Page 6: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

EJEMPLO

Considérense los siguientes datos, los cuales representan la razón de precio - ganancia de una emisión de acciones, de certificados de valores vendidos muy por arriba del precio promedio del mercado:

5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.858.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00 5.607.64 8.82 5.64 10.08 3.81 6.81 7.49 4.56 7.168.61 3.86 6.78 9.02 8.65 6.72 8.26 7.90 6.657.25 6.26 6.43 7.71 7.52 6.68 7.98 10.27 7.647.17 8.06 6.66 8.26 6.67 6.25 7.63 6.73 7.608.14 6.91 7.82 6.76 7.75 7.36 8.52 7.23 7.636.95 7.78 10.34 6.65 6.86 7.74 6.67 7.12 7.104.00

Page 7: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

Construcción de una distribución de frecuencias :

1. El número de intervalos de clase es:Usando la regla de la raíz: k = 73 = 8.54 9 intervalos.Usando la regla de Sturges:

21.7

73log3

101

k

k

nk log3

101

k 8 intervalos de clase

Page 8: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

En particular, en este ejemplo usaremos 8 intervalos de clase de longitud igual a 0.9 unidades.

El mayor valor observado es: Xmax = 10.34El menor valor observado es: Xmin = 3.81

El rango es: R = 10.34 - 3.81 = 6.53

A fin de que estas observaciones extremas queden incluidas dentro de los intervalos, usaremos un valor ligeramente mayor a R = 6.53, al que llamaremos rango extendido ( R*), de modo que este último sea un múltiplo de R.

Eligiendo a R* = 8(0.9) = 7.2

La diferencia entre R* y R es: R* - R = 7.20 - 6.53 = 0.67

Distribuyendo de manera equitativa esta diferencia, dividimos este resultado por dos, así tenemos el valor 0.335.

Page 9: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

Restando esta cantidad al menor valor observado Xmin = 3.81, obtenemos : Xmin = 3.81 - 0.335 = 3.475.

Ahora elegimos a 3.475 como el límite inferior del primer intervalo de clase. Si a este valor le sumamos la longitud del intervalo obtenemos : 3.475 + 0.9 = 4.375, el cual será el límite superior del primer intervalo. Procediendo de esta forma, obtendremos los límites de los demás intervalos.

4.375 6.175 7.975 9.775

3.475 5.275 7.075 8.875 10.675

Los 8 intervalos de clase considerados son:

(3.475,4.375], (4.375,5.275], (5.275,6.175], (6.175,7.075], (7.075,7.975], (7.975,8.875], (8.875,9.775], (9.775,10.675]

Page 10: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

La marca de clase (punto medio de un intervalo), se obtiene promediando los valores de los límites inferior y superior de cada intervalo. Así tenemos:

925.32

375.4475.3

Así, las marcas de clase xj son:

3.925, 4.825, 5.725, 6.625, 7.525, 8.425, 9.325, 10.225

En el intervalo (3.475,4.375] se encuentran incluidas las observaciones: 3.81, 4.00 y 3.86, por lo que la frecuencia absoluta fj de este intervalo es igual a 3.

Procediendo a contar las frecuencias en cada uno de los demás intervalos, obtenemos las siguientes frecuencias:

Page 11: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

2, 7,19, 22, 13, 4, y 3 respectivamente. De esta forma la Distribución de frecuencias contiene hasta este momento las siguiente información:Intervalos marca de Frecuencias

clase absolutas(3.475, 4.375] 3.925 3(4.375, 5.275] 4.825 2(5.275, 6.175] 5.725 7(6.175, 7.075] 6.625 19(7.075, 7.975] 7.525 22(7.975, 8.875] 8.425 13(8.875, 9.775] 9.325 4(9.775, 10.675] 10.225 3

Para terminar de construir la Distribución de frecuencias solo nos falta calcular las frecuencias relativas: fr y a las frecuencias acumuladas: Fa .

Page 12: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

Las frecuencias relativas se calculan dividiendo a las frecuencias absolutas de cada intervalo, por el número de observaciones en la muestra. Así, por ejemplo, la frecuencia relativa del primer intervalo es:

Repitiendo este procedimiento, obtenemos las demás frecuencias relativas.

Las frecuencias acumuladas las obtenemos sumando las frecuencias absolutas (o relativas) que se encuentren contenidas hasta el límite superior del intervalo de clase considerado.

Por ejemplo, la frecuencia acumulada absoluta hasta el límite superior del segundo intervalo es: 3 + 2 = 5.

733

Page 13: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

Toda esta información se presenta a continuación en forma de tabla:

Intervalos xj fj fr Fa(Absolutas) Fa(Relativas)

(3.475, 4.375] 3.925 3 3/73 3 3/73

(4.375, 5.275] 4.825 2 2/73 5 5/73

(5.275, 6.175] 5.725 7 7/73 12 12/73

(6.175, 7.075] 6.625 19 19/73 31 31/73

(7.075, 7.975] 7.525 22 22/73 53 53/73

(7.975, 8.875] 8.425 13 13/73 66 66/73

(8.875, 9.775] 9.325 4 4/73 70 70/73

(9.775, 10.625] 10.225 3 3/73 73 73/73

TOTAL ------ 73 -------- -------- --------

Intervalos xj fj fr Fa(Absolutas) Fa(Relativas)

(3.475, 4.375] 3.925 3 3/73 3 3/73

(4.375, 5.275] 4.825 2 2/73 5 5/73

(5.275, 6.175] 5.725 7 7/73 12 12/73

(6.175, 7.075] 6.625 19 19/73 31 31/73

(7.075, 7.975] 7.525 22 22/73 53 53/73

(7.975, 8.875] 8.425 13 13/73 66 66/73

(8.875, 9.775] 9.325 4 4/73 70 70/73

(9.775, 10.625] 10.225 3 3/73 73 73/73

TOTAL ------ 73 -------- -------- --------

Page 14: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS DISCRETOS

Al elaborar una distribución de frecuencias que utiliza datos continuos, se pierde cierta información debido a que los valores individuales pierden su identidad cuando se agrupan en clases. Esto puede o no suceder en el caso de datos discretos, dependiendo de la naturaleza.

Considérense los siguientes datos acerca de los accidentes que ocurren durante 50 días en un estacionamiento muy grande:

6 9 2 7 0 8 2 5 45 4 4 4 4 2 5 6 33 8 8 4 4 4 7 7 64 7 5 3 7 1 3 8 0

Page 15: 4872010-DISTRIBUCIONES-DE-FRECUENCIAS

5 1 2 3 6 0 5 6 62 7 5 6 3Las observaciones constan de números enteros que van de 0 a 9, utilizando a estos como clases, podemos construir una distribución de frecuencias sin que haya pérdida de los valores originales.

Clase Número de días Porcentaje deAccidentes por día

0 3 0.061 2 0.042 5 0.103 6 0-124 9 0.18

5 7 0.146 7 0.147 6 0.128 4 0.089 1 0.02

Total 50 1.00