ejercicios resueltos de cuartiles
TRANSCRIPT
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
1
Definiciones generales
Objetivo
Brindar al participante los conceptos teóricos básicos sobre Media Aritmética para datos noagrupados y agrupados
En esta sesión
- Conceptos básicos de Media Aritmética para datos agrupados y no agrupados- Formulas- Ejemplos Resueltos- Ejercicios Propuestos
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
2
Conceptos básicos de Media Aritmética
Media Aritmética
Se trata del valor medio de todos los valores que toma la variable estadística de una serie de datos. Por lotanto, la medida posicional más utilizada en los estudios estadísticos. Por su fácil cálculo e interpretación, esla medida de posición más conocida y más utilizada en los cálculos estadísticos. La media es el valor másrepresentativo de la serie de valores, es el punto de equilibrio, es el centro de gravedad de la serie dedatos.
Esta dada por la suma de todos los datos de la población dividida entre el numero total de ellos.
Desviaciones o desvíos
Son diferencias algebraicas entre cada valor de la serie o cada punto medio y la media aritmética de dichaserie, o un valor cualquiera tomado arbitrariamente. Los desvíos o desviación se designan con la letra di.Dado una serie de valores X1, X2, X3, .......Xn , se llama desvío a la diferencia entre un valor cualquiera Xi dela serie y un valor indicado k de esa misma serie. Si el valor indicado k de la serie corresponde precisamentea la media aritmética de esos valores dados, se dice entonces que los desvíos son con respecto a la mediaaritmética. En símbolo: ).( XXd ii −=
Propiedades de la media aritmética
1. – La suma de las desviaciones con respecto a la media aritmética es igual a cero. .0=∑ id2. – La suma de las desviaciones al cuadrado de los diversos valores con respecto a la media aritmética es
menor que la suma de las desviaciones al cuadrado de los diversos valores con respecto a cualquier
punto K, que no sea la media aritmética. ( )2∑ − XX i < ( )2
∑ − KX i .
Características principales de la media aritmética
1. – El valor de la media depende de cada una de las medidas que forman la serie de datos, y se hallaafectada excesivamente por los valores extremos de la serie de datos.
2. – La media se calcula con facilidad y es única para cada caso y permite representar mediante un solovalor la posición de la serie de valores.
3. – La media es una medida de posición que se calcula con todos los datos de la serie de valores y essusceptible de operaciones algebraicas.
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
3
Definiciones generales
Objetivo
Brindar al participante los conceptos teóricos básicos sobre medidas de posición ( Cuartil , Decil yPercentil ).
En esta sesión
- Conceptos básicos de Cuartil Decil y Percentil- Formulas- Ejemplos Resueltos- Ejercicios Propuestos
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
4
Conceptos básicos de Cuartil, Decil y Percentil
Cuartiles
Medida de posición que divide en cuatro partes iguales al conjunto de los valores ordenados de una
distribución de frecuencias. Las medidas son el primer cuartil Q1, el segundo cuartil Q2 y el tercer cuartil
Q3.
♦ PRIMER CUARTIL
Distribuye a la izquierda el 25% de los datos y al lado derecho el 75 % ver figura 1
♦ SEGUNDO CUARTIL
Coincide con la mediana entonces el segundo cuartil es igual a la mediana Q2 = Md
♦ TERCER CUARTIL
Distribuye a la izquierda el 75% del numero de datos y al otro lado el 25% del numero de valores ver
figura 2
Deciles
Medida de posición que divide en 10 partes iguales al conjunto de valores ordenados de una distribución de
frecuencias . Estas medidas son : El primer decil D1, el segundo decil D2 hasta el noveno decil D9.
Q1
Q2 = Md
25%75%
25%75%
Q2 = Md
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
5
♦ El primer decil distribuye al lado izquierdo el 10% de los datos y al otro lado el 90%. Ocupa la posición
(n/ 10).
♦ El segundo decil distribuye al lado izquierdo el 20% de los datos y al otro lado el 80%. Ocupa la posición
(2n/ 10).
♦ El noveno decil distribuye al lado izquierdo el 90% de los datos y al otro lado el 10%. Ocupa la posición
(9n/ 10).
Percentiles
Medida de posición que divide en 100 partes iguales al conjunto de valores ordenados de una distribución de
frecuencias y se indican con P1, P2,...... P99 . El 50 percentil coincide con la mediana.
Formulas
D1 D2 D3 D4 D90
0 n /10 2n /10 3n /10 9n/10
0 P1 P2 P3P99
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
6
Cuartiles
Q1 = Extremo Inferior + ( n/4 - Fi - 1 ) *c
Q3 = Extremo Inferior + ( 3n/4 - Fi - 1 ) *c
Deciles
Dr = Extremo Inferior + ( r n /10 - Fi - 1 ) *c
Percentiles
Pr = Extremo Inferior + ( r n /100 - Fi - 1 ) *c
Ejemplos Resueltos
CuartilesEJERCICIO 1
Al aplicar una evaluación de Teoría política a un grupo de 138 alumnos se obtuvieron los siguientes
puntajes organizado en la siguiente distribución de frecuencias.
a) Determinar el 25% inferior y el 25% superior.
Intervalos fi Fi
40-45 4 4
45-50 8 12
50-55 15 27
55-60 24 51
60-65 31 82
65-70 19 101
70-75 16 117
f
f
f
f
f
Dr = Decil BuscadoExtremo Inferior = Extremo inferior donde se hallael decil buscador = indica el decil . Tercer decil ( r=3 ) r tomavalores de 1 hasta el 9.rn / 10 = indica la situación del decil . Intervalodonde esta el decil
Pr = Indica percentil BuscadoExtremo Inferior = Extremo inferior donde se hallael percentilr = es el rango percentil, es decir , la situacióndentro de la escala ordenada de cien elementos.rn / 100 = indica el intervalo de la distribución defrecuencia donde se halla el percentil
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
7
75-80 10 127
80-85 8 135
85-90 3 138
Determinar el 25% superior :
Calculando el cuartil Q3Para determinar el intervalo donde esta el Q3 dividimos :
3n / 4 = 3 * 138 /4 = 103.5 se halla en el sétimo intervalo empieza en 102 y termina en 117
Aplicando formula : Q3 = Extremo Inferior + ( 3n/4 - Fi - 1 ) *c
Fi - 1 = F 7 - 1 = F 6 = 101f7 = 16
Q3 = 70 + (103.5 – 101)*5
Q3 = 70+0.78
Q3 = 70.78
Q3 = 71
Todos los alumnos con puntaje superior a 71 se hallan en el 25% superior.
DecilesEJERCICIO 2
Se tiene los puntajes obtenidos por 269 alumnos en una prueba de rendimiento de Geometría.a) Determinar los puntajes de los que se hallan en el 20% inferior y cuales puntajes se ubican en el décimosuperior
Intervalos fi Fi
20-24 3 3
24-28 8 11
28-32 16 27
n = 138
24
f
16
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
8
32-36 25 52
36-40 41 93
40-44 55 148
44-48 48 196
48-52 33 229
52-56 21 250
56-60 12 262
60-64 7 269
Puntajes de los que se hallan en el 20% inferior
Calculando el segundo decil. Entonces r=2
Ubicación del segundo decil
2n / 10 = (2*269) /10 =53.8 Entonces el segundo decil esta en el quinto intervalo
Aplicando la formula :
Dr = Extremo Inferior + ( r n /10 - Fi - 1 ) *c
D2 = 36 + ( 53.8 - 52 ) *4
D2 = 36.18
Todos los alumnos que tengan puntajes desde 20 hasta 36 entero inmediato anterior a 36.18 se encuentra en el20% inferior
Puntajes se ubican en el décimo superior
Calculando el noveno decil. Entonces r=9
Ubicación del segundo decil
9n / 10 = (9*269) /10 = 242.1 Entonces el noveno decil esta en el noveno intervalo
Aplicando la formula :
Dr = Extremo Inferior + ( r n /10 - Fi - 1 ) *c
D9 = 52 + ( 242.1 - 229 ) *4
n = 269
f
41
f
21
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
9
D9 = 54.50
Todos los alumnos que tengan puntajes desde 55 se hallaran en el décimo superior
PercentilesEJERCICIO 3Con la siguiente distribución de frecuencia calcular P10 y P90
Intervalos fi Fi
30-40 4 4
40-50 6 10
50-60 8 18
60-70 12 30
70-80 9 39
80-90 7 46
90-100 4 50
Calculando P10
Empleando la formula :
Pr = Extremo Inferior + ( r n /100 - Fi - 1 ) *c
Calculando P10. Entonces r=10
Ubicación del décimo percentil
r n / 100 = (10*50) /100 = 5 Entonces el décimo percentil esta en el segundo intervalo
Aplicando la formula :
Pr = Extremo Inferior + ( r n /100 - Fi - 1 ) *c
P10 = 40 + ( 5 - 4 ) *10
P10 = 41.67 = 42 puntos
Calculando P90
n=50
f
6
f
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
10
Empleando la formula :
Pr = Extremo Inferior + ( r n /100 - Fi - 1 ) *c
Calculando P90. Entonces r=90
Ubicación de P90.
r n / 100 = (90*50) /100 = 45 Entonces el P90. esta en el sexto intervalo
Aplicando la formula :
Pr = Extremo Inferior + ( r n /100 - Fi - 1 ) *c
P90 = 80 + ( 45 - 39 ) *10
P90 = 88.57 = 89 puntos
Ejercicio Propuestos
Cuartiles Intervalos fi Fi
116-125 1 1
125-134 4 5
134-143 10 15
143-152 12 27
152-161 6 33
161-170 5 38
170-179 2 40
Respuestas :
f
7
f
n=40
Intervalos fi Fi
66-73 2 2
73-80 9 11
80-87 8 19
87-94 14 33
94-101 9 42
101-108 6 48
108-115 2 50
Respuestas :
Q1 = 81.31
n = 50
Intervalos fi Fi
11-13 1 1
13-15 5 6
15-17 9 15
17-19 14 29
19-21 12 41
Intervalos fi Fi
31-38 2 2
38-45 2 4
45-52 5 9
52-59 12 21
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
11
Q1 = 138.5 = 139
Q3 = 156.5 = 157
Deciles Y Percentiles
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
12
Definiciones generales
Objetivo
Determinar que los datos tienden a alejarse de los valores medios o tendencia central es decir losdatos presentan dispersión.
En esta sesión
- Conceptos básicos de Medida de dispersión, rango, desviación estándar o desviación típica yvarianza
- Formulas- Ejemplos Resueltos- Ejercicios Propuestos
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
13
- Conceptos básicos de Medida de dispersión, rango, desviación estándaro desviación típica y varianza
Medida de dispersión
Determinan el grado de alejamiento de los datos respecto a una medida de posición que generalmente suele ser lamedia . nos da una idea de lo agrupado que están los datos
Estas medidas de posición central no tienen ningún valor si no se conoce como se acercan o se alejan esos valores conrespecto al promedio, en otras palabras es conocer como se dispersan o varían esos valores con respecto al promediode una distribución de frecuencia.
Las Medidas de Dispersión relativa. Son relaciones entre medidas de dispersión absolutas y medidas de tendenciacentral multiplicadas por 100, por lo tanto vienen expresadas en porcentaje
Cuando la dispersión es baja indica que la serie de valores es relativamente homogénea mientras que una variabilidadalta indica una serie de valores heterogénea.
RANGO O RECORRIDO(R)
Es la primera medida de dispersión, no esta relacionada con ningún promedio en particular, ya que este se relacionacon los datos mismos, puesto que su cálculo se determina restándole al dato mayor de una serie el dato menor de lamisma
Rango(R) = Dato mayor (XM)−Dato Menor (Xm)
R = XM − Xm. El rango es la medida de dispersión más sencilla e inexacta dentro de las medidas de dispersión absoluta.
Indica la extension de los valores que puede tomar la variable cuyas medidas constituyen los datos
Rango = Valor Máximo – Valor Mínimo
Se utiliza cuando se desea una rápida apreciación de la extensión de los datos es afectado por los valores extremos notoma en cuenta las variaciones al interior de la distribución.
DESVIACIÓN MEDIA
Su uso es restringido porque existen otras medidas mas precisas . La desviación media es la media de las desviaciones
La desviación media de un conjunto de N observaciones x1, x2, x3,.............xn, es el promedio de los valores absolutos delas desviaciones (di) con respecto a la media aritmética o la mediana. Si se denomina como DM a la desviación mediaObservamos que es las desviaciones de cada valor con respecto a la media . Las desviaciones se toman en valorabsoluto . La suma obtenida se divide entre el numero de elementos.
EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo
14
DESVIACIÓN TÍPICA O ESTÁNDAR
Es la medida de dispersión más utilizada en las investigaciones por ser la más estable de todas, ya que para su calculose utilizan todos los desvíos con respecto a la media aritmética de las observaciones, y además, se toman en cuentalos signos de esos desvíos. Se le designa con la letra castellana S . La desviación típica es una forma refinada de ladesviación media”. Es la raíz cuadrada de la suma de los cuadrados de las desviaciones de cada valor con respecto a lamedia , dividida entre el numero de valores.
INTERPRETACIÓN DE LA DESVIACIÓN TÍPICA
La desviación típica como medida absoluta de dispersión, es la que mejor nos proporciona la variación de los datos conrespecto a la media aritmética, su valor se encuentra en relación directa con la dispersión de los datos, a mayordispersión de ellos, mayor desviación típica, y a menor dispersión, menor desviación típica.
Formulas
Desviación Media
Desviacion Estandar o tipica
Datos no agrupados
Ó (xi – x )2
S =
Datos Agrupados
Ó fi(xi – x )2
S =
N
d
N
XXDM
N
ii
N
ii ∑∑
== =
−
= 11
n
n