ejemplo para datos agrupados
TRANSCRIPT
VARIABLES ESTADÍSTICAS
Una variable estadística es la característica observable de interés en un estudio estadístico. Las variables se clasifican en CUALITATIVAS y CUANTITATIVAS. Las primeras nos determinan cualidades o atributos, las segundas nos determinan cantidades.
Las variables cuantitativas se dividen en continuas y discretas; las variables continuas pueden tomar cualquier valor en un intervalo (decimales), las discretas solamente pueden tomar valores enteros.
POBLACIÓN: Es una colección completa de individuos, objetos, medidas que poseen una característica en común, es sinónimo de universo.
MUESTRA: Es un subconjunto representativo seleccionado de una población, es decir es una colección de algunos de los individuos, objetos o medidas de la población.
Adaptado por Lic. EDWIN RIVERA CANTOR 1
DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS NO AGRUPADOS
Sea X la variables que representa en número de fallas de asistencia al colegio de los 50 alumnos de un curso durante un año escolar. X genera el siguiente conjunto de los datos numéricos: 3, 2, 3, 4, 1, 2, 3, 4, 3, 3, 3, 5, 6, 6, 5, 3, 4, 1, 2, 3, 2, 5, 1, 3, 3, 3, 2, 4, 1, 2, 2, 3, 3, 5, 5, 6, 3, 4, 4, 1, 2, 4, 3, 7, 7, 3, 7, 6, 5, 3.POBLACIÓN: La totalidad de los alumnos del colegios de estudio.
MUESTRA: Los 50 alumnos del curso en estudio
TIPO DE VARIABLE: La variable X solamente toma valores enteros en el intervalo [ 1 , 7 ], razón por la cual afirmamos que x es una variable discreta.
Ordenemos los datos, representémoslos mediante una tabla de frecuencia y un gráfico de barras, calculemos sus medidas de tendencia central: moda, mediana y media aritmética.
Adaptado por Lic. EDWIN RIVERA CANTOR 2
TABLA DE DISTRIBUCIÓN DE FRECUENCIA PARA DATOS NO AGRUPADOS
XXii
Número Número de fallasde fallas
ffii
Frecuencia Frecuencia absolutaabsoluta
FFii
Frecuencia Frecuencia absoluta absoluta
acumuladaacumulada
hi Frecuencia hi Frecuencia relativa relativa
absoluta absoluta porcentual (fi/porcentual (fi/
n)*100n)*100
HiHi
Frecuencia Frecuencia relativa relativa
porcentual porcentual acumulada acumulada (Fi/n) *100(Fi/n) *100
XXii * f * fii
11 55 55 1010 1010 55
22 88 1313 1616 2626 1616
33 1717 3030 3434 6060 5151
44 77 3737 1414 7474 2828
55 66 4343 1212 8686 3030
66 44 4747 88 9494 2424
77 33 5050 66 100100 2121
TotalTotal 5050 175175
i
Adaptado por Lic. EDWIN RIVERA CANTOR 3
5
8
17
7 64 3
02468
1012141618
1 2 3 4 5 6 7
Número de alumnos
Faltas de asistencia (ausencia)
DIAGRAMA DE BARRAS
DIAGRAMA DE BARRAS CORRESPONDIENTE AL NÚMERO DE FALTAS DE ASISTENCIA DE UN GRUPO DE 50 ALUMNOS DURANTE EL AÑO ESCOLAR
Adaptado por Lic. EDWIN RIVERA CANTOR 4
MEDIDAS DE TENDENCIA CENTRAL
Moda: Número de ausencias más frecuente en el grupo.
Mediana: Número de días para el cual la mitad de los alumnos tuvo una inasistencia superior.
Media aritmética: Promedio de faltas de asistencia del grupo durante el año escolar.
LA MODA: La moda de una serie de datos estadísticos, ordenados en una tabla de frecuencias, es el valor de la variable que tiene la máxima frecuencia absoluta. En la tabla de distribución de frecuencia, la máxima frecuencia absoluta fi es f3 = 17. Por tanto, la moda es el valor de la variable x3 = 3.
Luego, moda Mo = 3 faltas indica que en un año escolar lo más frecuente el el grupo es que faltes durante tres días al colegio.
Adaptado por Lic. EDWIN RIVER CANTOR 5
LA MEDIANA: La mediana de una serie de datos estadísticos numéricos, ordenados en una tabla de frecuencias, es el valor de la variable tal que entre él y sus menores cubren la mitad (50%) de la muestra.
Para determinar la mediana en la tabla, podemos emplear uno de los siguientes procedimientos:
•Tomamos el valor de X que corresponde a la frecuencia acumulada inmediatamente superior a n/2.
Así: n/2 = 50/2 = 25. La Fi inmediatamente superior a 25 es 30, al cual corresponde el valor X3 = 3.
Luego, mediana = Me = 3 faltas significa que la mitad del grupo faltó 3 días o menos al colegio.
•En la columna de frecuencias acumuladas porcentuales, leemos aquel porcentaje que es inmediatamente superior al 50% y tomamos como mediana el valor X que le corresponde.
Así: 60% es la frecuencia acumulada porcentual inmediatamente superior a 50%; luego Me= 3 faltas.Adaptado por Lic. EDWIN RIVERA CANTOR 6
Si n/2 coincide con una frecuencia acumulada, entonces tomamos como mediana la semisuma del valor Xi correspondiente con el siguiente Xi+1.
Es decir :2
1++= iie
XXM
LA MEDIA ARITMETICA: L a media aritmética o simplemente media de una serie de datos estadísticos numéricos es un número que se obtiene sumando todos los datos y dividiendo la suma por el tamaño de la muestra.
Para calcular la media cuando los datos se encuentran ordenados en un tabla de frecuencias, procedemos de la siguiente manera:
Si los valores diferentes X1 , X2, X3, …, X k se presentan con frecuencia absolutas f1, f2, f3, …, fk, entonces la media aritmética es:
n
fxfxfxfxfxfxfxX 77665544332211 ++++++=
5.350
175 ==X
Adaptado por Lic. EDWIN RIVERA CANTOR 7
LA SIGUIENTE INFORMACIÓN ES SOLO PARA TRABAJAR CON DATOS AGRUPADOS LEAN CON ATENCIÓN Y ANTE CUAQUIER DUDA ESTARÉ ATENTO PARA SOLUCIONAR SUS POSIBLES DUDAS
Adaptado por Lic. EDWIN RIVERA CANTOR
8
REGLAS GENERALES PARA ORGANIZAR DATOS EN UNA TABLA DE FRECUENCIA
Siempre deben tenerse en cuenta las siguientes reglas generales para la organización de los datos en tablas de frecuencia.
1. Lo primero que debemos hacer es organizar los datos en forma ascendente ( de menor a mayor).
2. En caso de no conocer el nùmero de clases (m), se puede hacer un calculo aproximado con la regla de Sturges m = 1 + 3,3 Log n
3. Calcular el Rango (R) Rango = dato mayor – dato menor
4. Hallamos la amplitud del intervalo de clase (c)
c = R / m c = ( dato mayor – dato menor) / N° de intervalos
En caso de no obtener un valor entero, se aproxima o se trunca cuando el segundo decimal es mayor o igual a 5 o en el segundo caso menor de 5.
7. Una vez se han definido el número de clases a utilizar, y se conoce la amplitud de cada intervalo, se procede a tabular los datos.
Adaptado por Lic. EDWIN RIVERA CANTOR
EJEMPLO:
Supóngase que se tiene los datos de una muestra de 150 estudiantes que reflejan su cociente intelectual (CI), y se desea condensar esta información en una tabla de distribución de frecuencias.
Los puntajes obtenidos son:
88, 91, 104, 113, 125, 101, 114, 105, 101, 88, 126, 118, 100, 111, 125, 109,
119, 91, 106, 120, 129, 120, 109, 104, 112, 101, 113, 100, 106, 105, 121, 128,
93, 89, 124, 96, 105, 95, 91, 106, 93, 88, 89, 100, 115, 98, 108, 88,
99,120, 101, 108, 118, 118, 113, 114, 109, 91, 104, 109, 110, 113, 119, 119,
106,106, 97, 104, 105, 122, 112, 124, 108, 121, 96, 97, 99, 101, 116, 118,
102,127, 121, 116, 100, 95, 89, 103, 115, 113, 129, 91, 85, 108, 103, 116,
108, 98, 108, 114, 102, 96, 99, 108, 114, 121, 107, 122, 100, 116, 111, 113,
109,104, 113, 118, 110, 129, 124, 105, 93, 115, 120, 97, 112, 94, 113,122,
114,106, 105, 115, 98, 112, 103, 92, 125, 107, 115, 118, 128, 92, 85,126,
108,114, 125, 121, 122, 117
Adaptado por Lic. EDWIN RIVERA CANTOR
SOLUCIÓN:
3. Ordenamos los dato en forma ascendente.
85, 85, 88, 88, 88, 88, 89, 89, 89, 91, 91, 91, 91, 91, 92,
92, 93, 93, 93, 94, 95, 95, 96, 96, 96, 97, 97, 97, 98, 98,
98, 99, 99, 99, 100, 100, 100, 100, 100, 101, 101, 101, 101, 101, 102,
102, 103, 103, 103, 104, 104, 104, 104, 104, 105, 105, 105, 105, 105, 105,
106, 106, 106, 106, 106, 106, 107, 107, 108, 108, 108, 108, 108, 108, 108,
108, 109, 109, 109, 109, 109, 110, 110, 111, 111, 112, 112, 112, 112, 113,
113, 113, 113, 113, 113, 113, 113, 114, 114, 114, 114, 114, 114, 115, 115,
115, 115, 115, 116, 116, 116, 116, 117, 118, 118, 118, 118, 118, 118, 119,
119, 119, 120, 120, 120, 120, 121, 121, 121, 121, 121, 122, 122, 122, 122,
124, 124, 124, 125, 125, 125, 125, 126, 126, 127, 128, 128, 129, 129, 129 Adaptado por Lic. EDWIN RIVERA CANTOR
1. Calculamos el número de intervalos o clases.
m = 1 + 3,3 Log (150) = 1 + 3,3 ( 2,176091259)
m = 1 + 7.181101155
m = 8.181101155
m = 8
El número de intervalos o clases es igual a 8.
7. Calculamos el Rango.
R = 129 – 85
R = 44
10.Hallamos la amplitud del intervalo I = 44 / 8 = 5,5 = 6
En la práctica, el valor decimal se redondea al mayor valor entero.
Adaptado por Lic. EDWIN RIVERA CANTOR
1. Construimos la tabla de distribución de frecuencias.
Intervalo de claseIntervalo de clase Límites RealesLímites RealesFrecuencia Frecuencia absoluta absoluta
ffii
Frecuencia Frecuencia Relativa hRelativa hii
Frecuencia Frecuencia Acumulada Acumulada
FFii
Frecuencia Frecuencia Rela. Acum. Rela. Acum.
HHii
85 - 9085 - 90 84.5 – 90.584.5 – 90.5 99 0.060.06 99 0.060.06
91 - 9691 - 96 90.5 – 96.590.5 – 96.5 1616 0.110.11 2525 0.170.17
97 - 10297 - 102 96.5 – 102.596.5 – 102.5 2121 0.140.14 4646 0.310.31
103 - 108103 - 108 102.5 – 108.5102.5 – 108.5 3030 0.200.20 7676 0.510.51
109 – 114109 – 114 108.5 – 114.5108.5 – 114.5 2727 0.180.18 103103 0.690.69
115 – 120115 – 120 114.5 – 120.5114.5 – 120.5 2323 0.150.15 126126 0.840.84
121 – 126121 – 126 114.5 – 120.5114.5 – 120.5 1818 0.120.12 144144 0.960.96
127 – 132 127 – 132 120.5 – 126.5120.5 – 126.5 66 0.040.04 150150 1.001.00
TOTALTOTAL ------------ 150150 1.001.00 ---------- ----------Adaptado por Lic. EDWIN RIVERA CANTOR