trabajo estadística

4
tablas de frecuencia para datos agrupados Distribución de frecuencia para datos agrupados Cuando la muestra es grande es frecuente encontrar muchos valores de la variable y resulta poco práctico numerarlas todos, en estos casos resulta conveniente agrupar los valores en intervalos consecutivos llamados clases. Estos intervalos son de la forma [Li, Ls], cuyo extremo Li es el límite inferior de la clase y el extremo Ls es el límite superior de la clase. No existe alguna ley que defina cómo obtener el número de clases; pero la experiencia recomienda que sean entre 5 y 20 clases. Para construir una distribución de frecuencias en clases seguimos el siguiente procedimiento aplicado al ejemplo: los puntajes de un examen de ingreso a la universidad realizado por 40 alumnos son los siguientes:110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108, 109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108, 96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110. Paso 1. Determinamos el rango (R) de variación de los datos que se define como R = Xmax – Xmin, donde Xmax es el dato máximo y Xmin es el dato mínimo. Para el ejemplo Xmax = 140 y Xmin = 90 entonces R = 140 – 90 = 50 Paso 2. Determinamos el número de intervalos o clases k. Una forma de hacerlo es con la Regla de Sturges, donde: k = 1 + 3.3 log (n); donde n es el número de datos (se recomienda que sean más de 10). Para el ejemplo se tiene n = 40 datos, sustituyendo k = 1 + 3.3 log (40) = 1 + 3.3 (1.602) = 1 + 5.28 = 6.28, la cual se redondea al entero siguiente, en este caso k = 7. Otra alternativa es usando la raíz cuadrada del total de datos n para este ejemplo nos queda así: k = raíz (n) = raíz (40) = 6.32 que también se redondea al

Upload: andrelly-vl

Post on 18-Nov-2015

40 views

Category:

Documents


0 download

DESCRIPTION

estadistica

TRANSCRIPT

tablas de frecuencia para datos agrupados Distribucin de frecuencia para datos agrupadosCuando la muestra es grande es frecuente encontrar muchos valores de la variable y resulta poco prctico numerarlas todos, en estos casos resulta conveniente agrupar los valores en intervalos consecutivos llamados clases. Estos intervalos son de la forma [Li, Ls], cuyo extremo Li es el lmite inferior de la clase y el extremo Ls es el lmite superior de la clase.

No existe alguna ley que defina cmo obtener el nmero de clases; pero la experiencia recomienda que sean entre 5 y 20 clases.

Para construir una distribucin de frecuencias en clases seguimos el siguiente procedimiento aplicado al ejemplo: los puntajes de un examen de ingreso a la universidad realizado por 40 alumnos son los siguientes:110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108, 109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108, 96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110.

Paso 1. Determinamos el rango (R) de variacin de los datos que se define comoR = Xmax Xmin, donde Xmax es el dato mximo y Xmin es el dato mnimo.

Para el ejemplo Xmax = 140 y Xmin = 90 entoncesR = 140 90 = 50

Paso 2. Determinamos el nmero de intervalos o clases k. Una forma de hacerlo es con la Regla de Sturges, donde: k = 1 + 3.3 log (n); donde n es el nmero de datos (se recomienda que sean ms de 10).Para el ejemplo se tiene n = 40 datos, sustituyendok = 1 + 3.3 log (40) = 1 + 3.3 (1.602) = 1 + 5.28 = 6.28, la cual se redondea al entero siguiente, en este caso k = 7.Otra alternativa es usando la raz cuadrada del total de datos n para este ejemplo nos queda as:k = raz (n) =raz (40) = 6.32 que tambin se redondea al entero siguiente quedando k= 7.

Pas 3. Calculamos la amplitud de clase (A), que corresponde a la cantidad de datos que van en casa clase, dividiendo el rango R entre el nmero de clases k:sustituyendo se redondea a 8.

Pas 4. Construimos los intervalos o clases, como la variable es cuantitativa discreta los intervalos o clases son cerrados, es decir de la forma [Li, Ls].

Para formar las clases comenzaremos con los limites inferiores: En la primer clase tomamos Li1 = Xmin (el dato ms pequeo) Para las dems clases el lmite inferior se obtiene sumando la Xmin con la amplitud, es decir

Li n = Li n 1 + A. Para nuestro ejemplo Xmin = 90 y A = 8, entonces las 7 clases quedan:

Para obtener los limites superiores se toma el valor anterior al lmite inferior de la clase siguiente, y se va sumando la amplitud A = 8

Finalmente ya podemos elaborar las clases con sus respectivas frecuencias, recordando que cada clase abarca todos los valores que van desde el lmite inferior hasta el superior. Los puntajes de los 40 alumnos son:110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108, 109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108, 96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110.

Marca de clase (Mi): corresponde al punto medio del intervalo, es una caracterstica importante de cada clase ya que no cambia sin importar si la variable es discreta o contina, se calcula usando la frmula:

, se suman los lmites de clase y el resultado se divide entre dos.

Para nuestro ejemplo obtendramos las siguientes marcas de clase:

Clases para Variables Continuas

Si analizamos la tabla anterior veremos que de una clase a la siguiente hay un salto por ejemplo la primer clase acaba en 97 y la segunda comienza en 98, esto se debe a que como la variable es discreta no existen ningn dato entre estos valores, pero si la variable fuera continua y tomara valores decimales como 97.6 tendramos una prdida de informacin, para evitar esto en el caso continuo se fijan otros limites en cada clase.

Limites reales de clase: se usan cuando la variable es del tipo cuantitativa continua, se fijan tomando media unidad antes y despus de cada uno de los lmites de clase.Para nuestro ejemplo los lmites reales quedaran as:

Si observamos ya no hay saltos entre las clases, pero el valor 97.5 aparece en la primera y segunda clase, para no contarlo dos veces se toman los limites reales como semiabiertos es decir de la forma [ Li, Ls ), esto significa que el valor superior Ls 97.5, no se considera dentro de la primer clase, sino solo en la segunda. Anlogamente con los dems limites superiores.