Download - Medidas d..[1]
Instituto Guatemalteco Americano Bachillerato en Ciencias y LetrasTemarioProf. Alejandro Cruz
Medidas de Posición para Datos Simples y Agrupados
(Borrador no. 1)
Quinto Bachillerato “E”Manuel Salvador Franco
Ana Saraí de León HernándezJoselyn Dennise Barrera Rodríguez
Pablo Josué Chaclán Leiva
Guatemala, 4 de Abril del 2011
MEDIDAS DE POSICIÓN PARA DATOS SIMPLES Y AGRUPADOS
En estadística se necesita dividir los datos recopilados, para tener una mejor comprensión de lo
que se está investigando. Es por esto, que la estadística, para llegar a una conclusión más objetiva
o más formal ha creado diferentes maneras de descomposición de datos que permitan evaluar
individualmente valores. A esta descomposición de datos se calculan mediante las medidas de
posición.
Cuando se tienen algunos datos, la mejor forma de ser estudiados es agrupándolos, para que se
poder localizar cuál de los datos es más interesante que otro y merece mayor atención. Una de las
características más importantes en un conjunto de datos es su posición o localización, en
específico, su centro.
Existen medidas de posición centrales y no centrales. Ambas medidas describen conductas de la
distribución de una frecuencia, pero las medidas centrales son limitadas, por lo tanto al utilizarlas
las conclusiones son muy generales y no se puede realizar estudios muy profundos. Es por esto
que las medidas de posición no centrales ayudan al comprender el comportamiento de una
manera más específica, creando grupos de los cuales pueden encontrarse características con las
cuales las conclusiones no van a ser tan generales, sino que se van a extraer diferentes cantidades
numéricas que nos ayuden a comprender la variabilidad que existe en los datos.
En las medidas de posición no centrales se dividen en medidas cuantiles, desviación media y
desviación estándar. Las medidas cuantiles consisten en dividir los datos para encontrar una
característica en particular, esto sucede ya que las medidas cuantiles son los porcentajes que
ayudan a entender de una mejor manera las conductas de los grupos de datos (frecuencia)
Las medidas cuantiles en cuartiles deciles y percentiles, de las cuales se pueden extraer decimas
cuartas partes de la cantidad de datos en estudio. Por lo tanto el motivo de este ensayo es, explicar
las medidas de posiciones cuantiles en datos simples y agrupados y su aplicación en la vida real.
CUARTILES
Según (Triola, 2004) son valores que son iguales o menores a la mediana y que dividen los datos
en cuatro partes iguales y según (Devore, 2005), en términos generales, los cuartiles dividen el
conjunto de datos en cuatro partes iguales, donde las observaciones arriba del tercer cuartil son el
cuarto superior del conjunto de datos, el segundo cuartil es idéntico a la mediana y el primer cuartil
separa el cuarto inferior de los tres cuartos superiores. Entonces, los cuartiles dividen los datos
obtenidos en cuatro partes iguales encontrando tres cuartiles que dividan la cantidad de datos en
cuatro partes iguales, esto quiere decir que los cuartiles son el 25, 50 y 75% de los datos y son
representados como Q1, Q2 y Q3, en donde Q2 es igual a la mediana de los datos, ya que es el 50%.
Para poder calcular un cuartil para datos agrupados se utiliza la siguiente fórmula:
En donde:
- k es igual al número de cuartil
- N es la suma de las frecuencias
- Li es el inferior de la clase en donde se encuentra el cuartil
- Fi – 1 es la frecuencia anterior acumulada
- ai es la amplitud de la clase
Ejemplos:
PROBLEMA: 1
En la siguiente tabla de distribución de frecuencias de la edad de los ancianos del asilo San
Vicente de Paul de la zona 5 de la ciudad de Guatemala. Calcule los cuartiles según las
frecuencias establecidas.
SOLUCIÓN:
EDADESNúmero de Ancianos
fi (frecuencia simple)Fi (frecuencia acumulada)
[50-60) 8 8
[61-70) 10 18
[71-80) 16 34
[81-90) 14 48
[91-100) 10 58
[101-110) 5 63
[111-120) 2 65
TOTAL 65
Para encontrar los tres cuartiles se utilizará la fórmula, tomando en cuenta la jerarquía de
operaciones matemáticas para tener una mejor comprensión.
1. El primer paso es operar k*N; esto es igual a multiplicar el número cuartil que se quiere
calcular (en este caso sería Q1) por la suma total de las frecuencias (65) y esto dividirlo
entre cuatro, ya que son cuartiles.
1∗654
=16.25
2. El segundo paso es buscar en que clase o intervalo se encuentra 16.25 en la tabla se
puede observar que este dato se encuentra en la clase de [61-70), 16.5 se le resta Fi-1
(frecuencia acumulada anterior), que sería 8.
16.25−8=8.25
3. El tercer paso, sabiendo que el intervalo en donde se encuentra 16.25 es [61-70). Se divide
por fi (frecuencia simple del intervalo), que en este caso sería 10.
8.2510
=0.825
4. El cuarto paso es, que al 0.825 encontrado en el paso anterior, se multiplica por a i
(amplitud de la clase o frecuencia) del intervalo [61-70) que sería 9.
0.825∗9=7.425
5. El quinto paso es sumarle al dato encontrado en el paso anterior Li (inferior de la clase en
donde se encuentra el cuartil). Sabiendo que 16.25 se encuentra en la clase o intervalo
[61-70)
7.425+61=68.425
Entonces, se tiene que Q1 = 68.425 y para calcular Q2 y Q3 se realiza el mismo procedimiento con
la excepción que en el primer paso, siendo Q2 el que se busca k =2; siendo Q3 el que se busca k=3.
RESPUESTAS:
Las respuestas finales son:
Q1 = 68.43 años
Q2 = 79.16 años
Q3 = 91.67 años
Q2 y Q3 se calculan de la misma manera que Q1.
En asilo San Vicente de Paul el 25% de los ancianos del acilo tienen una edad aproximada a 68
años, el 50% tiene una edad aproximada de 79 años y el 75% tiene una edad aproximada a 92
años.
Para poder calcular un cuartil para datos simples se utiliza la siguiente fórmula:
1+i (n−1 )4
En donde:
- i es el número de cuartil
- n es igual a la cantidad de valores
Ejemplos:
PROBLEMA:
Según el Prensa Libre las personas en Guatemala leen de 3 a 33 libros en un año según los datos
dados determine el valor de los cuartiles de los siguientes 15 valores ordenados: 3, 5, 6, 11, 14, 18,
18, 20, 24, 25, 27, 27, 28, 31, 33. En los cuales los números representan la cantidad de libros
leídos.
SOLUCIÓN:
1. El primer paso es sustituir los datos de la fórmula. Ya que se sabe que i va a ser igual al
número de cuartil y en este ejemplo se están pidiendo todos, se va poner 1 en el lugar de i.
También, sabiendo que n va a ser igual a la cantidad de valores dados, en la fórmula se
va a colocar 15.
1+1 (15−1 )4
=4.5
2. El segundo paso es, ya sabiendo que Q1 = 4.5 entonces para determinar el valor que
corresponde a la posición 4.5 se debe sumar la cuarta posición (11), cinco décimas de la
diferencia entre el valor de la cuarta posición y de la quinta (14 - 11 = 2), es decir, 11 +
0.5(3) =12.5. Entonces el resultado aproximando seria 4 para la posición del primer decil,
y su valor, 13 libros.
Este sería el procedimiento para calcular los cuartiles en datos simples o no agrupados, sabiendo
esto, al calcular Q2 se sabe que utilizando la fórmula el resultado seria 8 y la posición 8 de los
datos es equivalente a 20. Para calcular Q3 se sabe que utilizando la fórmula el resultado seria
11.5, al restar 27 – 27 = 0; entonces si 27 + 0.5(0) = 27 años, esto quiere decir que Q3 = 27.
RESPUESTAS:
Q1 = 13
Q2 = 20
Q3 = 27
Según Prensa Libre el 25% de las personas en Guatemala leen un aproximado de 13 libros en un
año, el 50% de las personas leen 20 libros en un año y por último el 75% de las personas leen 27
libros en un año.
RANGO INTERCUARTIL
Cuando se pretende encontrar el rango que existe en una serie de datos, se entiende que es la
diferencia entre el valor más grande y el más pequeño, pero el rango se deja influir por los valores
extremos y por esto se ha creado el rango intercuartil, para eliminar la influencia de los datos
extremos.
El rango intercuartil es la diferencia que existe entre Q3 y Q1.
Rango Intercuartil Q=¿ Q3 – Q1
Ahora bien, cuando el rango intercuartil es dividido entre dos, se le conoce como rango
semiintercuartil o desviación cuartil; es la mitad del rango intercuartil y se representa como QD.
QD = Q3 – Q1
Ejemplo:
PROBLEMA:
Utilizando el mismo ejemplo de cuartiles en datos agrupados, encontrar el rango intercuartil y la
desviación cuartil.
SOLUCIÓN:
1. Mediante la fórmula del rango intercuarti sustituir los datos, sabiendo que Q3 = 91.67 y que
Q1 = 68.43. Entonces esto es igual a:
Q = 91.67 – 68.43
Q = 23.24 años
2. Ahora ya conociendo el rango intercuartil, ya se puede calcular la desviación cuartil,
mediante la fórmula, sabiendo que QD es igual al a mitad del rango intercuaril.
QD = 23.24
QD = 11.62 años
DECILES
La definición de (Goviden, 1998) para deciles dice que estos fraccionan en diez partes iguales los
datos ordenados obtenidos, en donde el primer decil es el 10% de los datos, el segundo el 20%, y
así sucesivamente entonces, los deciles dividen los datos obtenidos en diez partes iguales. Es
encontrar nueve deciles que dividan todos los datos en diez partes iguales, esto quiere decir que
los deciles son el 10, 20, 30,…, 80 y 90% de los datos y son representados como D1, D2, D3,…, D8 y
D9, en donde D5 es igual a la mediana de los datos, ya que representa el 50%.
2
2
Para calcular los deciles para datos agrupados utiliza la siguiente fórmula:
En donde:
- k es igual al número de decil
- N es la suma de las frecuencias
- Li es el inferior de la clase en donde se encuentra el decil
- Fi – 1 es la frecuencia anterior acumulada
- ai es la amplitud de la clase
Ejemplo:
PROBLEMA:
Utilizando el mismo ejemplo de los cuartiles en datos agrupados, ahora van a ser calculados los
deciles según la tabla de frecuencias dada.
SOLUCIÓN:
1. El primer paso es operar k*N; esto es igual a multiplicar el número cuartil que se quiere
calcular (en este caso sería D1) por la suma total de las frecuencias (65) y esto dividirlo
entre diez, ya que son deciles.
1∗6510
=6.5
2. El segundo paso es buscar en que clase o intervalo se encuentra 6.5 en la tabla. Teniendo
esto se puede observar que este dato se encuentra en la clase de [51-60), 16.5 se le resta
Fi-1 (frecuencia acumulada anterior), pero como no se existe una frecuencia anterior no se
le puede restar nada al 6.5.
6.5−0=6.5
3. ya sabiendo que el intervalo en donde se encuentra 6.5 es [51-60). Se divide fi (frecuencia
simple del intervalo), que en este caso sería 10.
6.510
=0.65
4. El cuarto paso es, que al 0.65 encontrado en el paso anterior se va a multiplicar por ai
(amplitud de la clase o frecuencia) del intervalo [51-60) que sería 9.
0.65∗9=5.85
5. El quinto paso es, sumarle al dato encontrado en el paso anterior Li (inferior de la clase en
donde se encuentra el cuartil). Sabiendo que 6.5 se encuentra en la clase o intervalo [51-
60)
5.85+50=55.85
Entonces, se tiene que D1 = 55.85 y para calcular D2 y D3 se realiza el mismo procedimiento con la
excepción que en el primer paso, siendo D2 el que se busca k =2; siendo D3 el que se busca k=3,
así sucesivamente hasta llegar a D9.
Para poder calcular un decil para datos simples se utiliza la siguiente fórmula:
1+i (n−1 )10
En donde:
- i es el número de decil
- n es igual a la cantidad de valores
Ejemplo:
PROBLEMA:
Utilizando el mismo ejemplo de los cuartiles en datos simples, ahora van a ser calculados los
deciles según los valores de las edades dadas.
SOLUCIÓN:
1. El primer paso es sustituir los datos de la fórmula. Ya que se sabe que i va a ser igual al
número de decil y en este ejemplo se están pidiendo todos, se va poner 1 en el lugar de i.
También, sabiendo que n va a ser igual a la cantidad de valores dados, en la fórmula se
va a colocar 15.
1+1 (15−1 )10
=2.4
2. El segundo paso es, que D1 = 2.4 entonces para determinar el valor que corresponde a la
posición 2.4 se debe sumar la segundo posición que sería 5, (cuatro décimas de la
segunda posición y seis décimas de la tercera) cuatro décimas de la diferencia entre el
valor de la cuarto posición y la tercera (6 - 5 = 1), es decir, 5 + 0.4(1) = 5.4. Entonces el
resultado aproximando seria la posición 5 la cual es 14 años. D1 =.14 libros.
El mismo procedimiento se realiza con los nueve deciles a calcular y la posición del decil va a ser
igual a la cantidad de libros leídos.
PERCENTILES
Los percentiles consisten en dividir los datos obtenidos en cien partes iguales. Es encontrar
noventa y nueve percentiles que dividan la cantidad de datos en cien partes iguales, esto quiere
decir que los percentiles son el 1, 2, 3,…, 27…98 y 99% de los datos y son representados como P1,
P2 y P3, en donde P50 es igual a la mediana de los datos, ya que es el 50%.
Para calcular los percentiles para datos agrupados utiliza la siguiente fórmula:
En donde:
- k es igual al número de percentil
- N es la suma de las frecuencias
- Li es el inferior de la clase en donde se encuentra el percentil
- Fi – 1 es la frecuencia anterior acumulada
- ai es la amplitud de la clase
Ejemplo:
PROBLEMA:
Utilizando el mismo ejemplo de los cuartiles en datos agrupados, ahora van a ser calculados los
percentiles 18, 19, 26, 45, 49, 58, 78, 93, 95 según la tabla de frecuencias dada.
SOLUCION:
1. El primer paso es operar k*N; esto es igual a multiplicar el número de percentil que se
quiere calcular (en este caso sería P1) por la suma total de las frecuencias (65) y esto
dividirlo entre cien, ya que son percentiles.
18∗65100
= 11.7
2. El segundo paso es buscar en que clase o intervalo se encuentra 11.7 en la tabla.
Teniendo esto se puede observar que este dato se encuentra en la clase de [61-70), ya
teniendo esto, se puede decir que 11.7 se le resta Fi-1 (frecuencia acumulada anterior),
entonces se le resta 8.
11.7 – 8 = 3.7
3. El tercer paso es, que el intervalo en donde se encuentra 11.7 es [61-70). Se le va a dividir
fi (frecuencia simple del intervalo), que en este caso sería 10.
3.710
=0.37
4. El cuarto paso es, que al 0.37 encontrado en el paso anterior se va a multiplicar por ai
(amplitud de la clase o frecuencia) del intervalo [61-70) que sería 9.
0.37*9 = 3.33
5. El quinto paso es, sumarle al dato encontrado en el paso anterior Li (inferior de la clase en
donde se encuentra el cuartil). Sabiendo que 11.7 se encuentra en la clase o intervalo [61-
70)
61+3.33 = 64.33
Sabiendo cómo realizar cada procedimiento ya se puede saber que los otro percentiles eran
equivalentes a:
P18= 64.33 años
P19= 64.91 años
P26= 69.01 años
P45= 77.33 años
P49= 70.79 años
P58= 83.38 años
P78= 93.43 años
P93= 105.41 años
P95= 107.75 años
Para poder calcular un percentil para datos simples se utiliza la siguiente fórmula:
1+i (n−1 )100
En donde:
- i es el número de percentil
- n es igual a la cantidad de valores
Ejemplo:
PROBLEMA
Utilizando el mismo ejemplo de los cuartiles en datos simples, ahora van a ser calculados los
percentiles 17 y 29 según los valores de las edades dadas.
SOLUCION:
1. El primer paso es sustituir los datos de la formula. Ya que se sabe que i va a ser igual al
número de percentil y en este ejemplo se están pidiendo todos, se va poner 17 en el lugar
de i. También, sabiendo que n va a ser igual a la cantidad de valores dados, en la fórmula
se va a colocar 15.
1+17 (15−1 )100
=3.38
2. El segundo paso es, ya sabiendo que P1 = 3.38 entonces para determinar el valor que
corresponde a la posición 3.38 se debe sumar la tercera posición, la cual sería 6, (treinta y
ocho centésimas de la tercera posición y a sesenta y dos centésimas de la cuarta posición)
treinta y ocho centésimas de la diferencia entre el valor de la tercera posición y de la cuarta
(11 - 6 = 5), es decir, 6 + 0.38(5) = 6.9. Entonces el resultado aproximando seria la
posición 7 la cual es 18 libros.
Realizando el mismo procedimiento ahora, al calcular P29 se sabe que es equivalente a 5.06
entonces se sabe que 18 – 14 = 4; entonces 5 + 0.06(4) = 5.24 años, esto se aproxima a 5,
entonces la posición 5 es igual a 14 libros.
Para tener una mejor compresión de los conceptos que representan los cuantiles se ha elaborado
el siguiente cuadro comparativo:
MEDIDAS CUANTILES
CUARTILES DECILES PERCENTILES
Divide los datos
ordenados en cuatro
partes iguales que son
el 25, 50 y 75%. De
los cuales se puede
calcular:
- El rango
intercuartil.
- La desviación
cuartil.
Dividen los datos
ordenados en diez
partes iguales, que
son el 10, 20, 30,…,
80, 90%.
Dividen los datos
ordenados en cien
partes iguales. Que es
aproximadamente el
1% de los valores en
cada grupo.
MEDIANA
Divide el conjunto de datos en dos partes iguales. En donde una mitad
de los datos es menor que la mediana y la otra mitad es mayor que la
mediana.
Donde Q2, D5 y P50 es igual a la mediana de los datos ya que es el 50%
Ya teniendo todos estos ejemplos y el cuadro comparativo, se puede resaltar que el Q2, D5, P50 son
equivalentes a la mediana (que pertenece a las medidas de posición centrales), por eso en el
siguiente ejemplo se va a demostrar que Q2 = D5 = P50. Este ejemplo busca de poner en práctica lo
ya explicado en un aspecto de la vida real.
Ejemplo:
PROBLEMA:
Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año
recibieron peticiones de una clínica, de reportes clínicos para realizar estudios de glucosa. Según
la tabla de frecuencias, encontrar Q2, D5 y P50.
Días Número de pacientes fi Frecuencia acumulada Fi
1 día a 9 días 5 5
10 día a 19 días 6 11
20 día a 29 días 8 19
30 día a 39 días 8 27
40 día a 49 días 4 31
50 día a 59 días 5 36
60 día a 69 días 7 43
70 día a 79 días 8 51
80 día a 89 días 4 55
90 día a 100 días 8 63
SOLUCION:
Calculando Q2:
1. Empleando la fórmula para calcular cuartiles cuando los datos son agrupados, se
empiezan a sustituir los datos, dejando K*N = 2*63 =126, este dato se divide entre 4 y el
resultado es 31.5.
2. Cuando ya se tiene este resultado buscamos este dato en la tabla de frecuencias. El dato
se encuentra en la sexta clase o en el intervalo de [50-59], sabiendo esto a 31.5 se le resta
la frecuencia anterior acumulada, 31.5 – 31 = 0.5.
3. Esta cantidad (0.5) es dividida por la frecuencia simple de la clase en donde se encuentra
31.5. Entonces 0.5 / = 0.1.
4. Después esta cantidad (0.1) se multiplica por la amplitud de la clase que es de 9 y se le
suma la cantidad menor del intervalo. 0.1*9 + 50= 50.9
RESPUESTA 1: El Q2 es igual a 50.9 días.
Calculando D5:
1. Empleando la fórmula para calcular deciles cuando los datos son agrupados, se empiezan
a sustituir los datos, dejando k*N = 5*63 = 315, este dato divide entre 10 y el resultado es
31.5.
2. Si se presta atención los datos que faltan a ingresar a la fórmula son los mismos que se
ingresaron en el procedimiento para sacar el Q2.
RESPUESTA 2: El D5 es igual a 50.9 días.
Calculando P50:
1. Empleando la fórmula para calcular percentiles cuando los datos son agrupados, se
empiezan a sustituir los datos, dejando k*N = 50*63 = 3 150, este dato se divide entre cien
y el resultado es 31.5.
2. Ocurre lo mismo que con el D5, el resultado es el mismo que en el Q2, entonces, los datos
restantes de incluir de la fórmula van a ser los mismos
RESPUESTA 3: El P50 es igual a 50.9 días
1. CONCLUSÓN:
Quedo comprobado que Q2, D5 y P50 son los mismos datos siempre y son equivalentes a la
mediana de los datos de medida de posición central.
En conclusión, las medidas de posición de datos simples y agrupados, son aquellas que nos
ayudan a la descomposición de datos, es decir, a la separación de los datos relevantes de los
irrelevantes, las medidas de posición.
Son porcentajes que se utilizan para conocer los comportamientos en una frecuencia, existen
medidas de posición centrales y no centrales, ambas describen conductas de las distribuciones de
una frecuencia las centrales son limitadas, esto nos dice que no se pueden realizar estudios muy
profundos y las no centrales nos ayudan a comprender las cosas de una manera más específicas
se dividen en: medidas cuantiles, desviación media y desviación estándar, las medidas cuantiles,
nos ayudan a dividir datos, son porcentajes que utilizamos para entender de una mejor forma las
conductas de los grupos de datos, se dividen en:
cuartiles es la división de datos en 4 partes iguales
deciles son nueve valores que dividen la serie de datos en 10 partes iguales
percentiles son series de datos estadísticos que se dividen en intervalos iguales y que
existen 99 percentiles.
Para poder explicar de una manera más sencilla como se podría aplicar esto a la vida, se decidió
tomar como ejemplo a una docente de tercer grado primaria, que desea saber en qué nivel de
aprendizaje en el que sus alumnos se encuentran, le sirve para poder mejorar su técnicas de
enseñanza es por eso que en base a las calificaciones utilizara las formas de agrupación simple
para encontrar el nivel. La clase es de veinte alumnos, entre los cuales 8 alumnos tuvieron notas
de de 60-70 pts. 5 alumnos obtuvieron una nota de 71-80 pts. 5 alumnos más sacaron una nota de
81-90 pts. Cada uno y 2 alumnos obtuvieron 91-100 puntos, en relación de los datos anteriores la
maestra la maestra se dio cuenta del nivel en que sus alumnos se encontraban.
BIBLIOGRAFÍA
Devore, J. L. (2005). Probabilidad y Estadística Para Ingeniería y Ciencias sexta edición. Col. Polanco, Mexico D.F.: THOMPSON.
Govinden, L. P. (1998). Introducción a la Estadística segunda edición. Santafé de Bogotá, Colombia: McGrawHill.
Triola, M. F. (2004). Probabilidad y Estadística novena edición. México D.F.: PEARSON EDUCACIÓN.