Download - medidas
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 1
1
Plan de Estudio
MEDIDAS DE RESUMEN
Tendencia
Central
Media
Aritmetica
caso:
datos
agrupados
MEDIA
Geometrica
caso:
datos
no agrupados
Mediana
caso:
datos
no agrupados
ñcaso:
datos
agrupados
Moda
caso:
datos
no agrupados
caso:
datos
agrupados
Cuantiles
caso:
datos
no agrupados
caso:
datos
no agrupados
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 2
2
Medidas descriptivas (Estadígrafo o Estadístico) variables cuantitativas Los datos organizados en una distribución de frecuencias destacan sus características mas
esenciales, como marcas de clases, centro forma de distribución (asimétrica simetría). Sin embargo
los indicadores que describen a los datos en forma más precisa debe calcularse. Estos indicadores
resumen los datos en medidas descriptivas que se refieren a la centralización (medidas de
tendencia central) o de posición, a la dispersión o variación, a la asimetría y a la curtosis de los
datos.
Medidas de tendencia central sus valores tienden a ocupar posiciones centrales o intermedios entre
el menor y mayor valor del conjunto de datos, nos da la información sobre el centro de la
distribución las más importante y muy usadas son: la media aritmética, la mediana, media
geométrica, la media armónica.
Los estadísticos de dispersión indican cuan dispersos están los datos mientras su valor sea mayor
mas dispersos se encuentran las observaciones. Las mas importantes son: desviación típica y el
coeficiente de variación.
MEDIDA DE TENDENCIA CENTRAL es un valor único que resume un conjunto de datos. Señala el
centro de los valores
Porque son importantes las medidas de tendencia central?
• Porque la mayor parte de los conjuntos de datos muestran una tendencia agruparse
alrededor de un dato central.
• En general las medidas de tendencia central se denominan promedios son puntos en una
distribución, los valores medios o centrales de esta.
• Las mas importantes son la media, la mediana y la moda
Media Aritmetica
La media aritmética es el estadígrafo de posición más importante se denomina simplemente media o
promedio.
Definición. La media aritmética, es la suma de los valores observados de la variable, dividido por el
número de observaciones.
Suponga que en una muestra de n se observan x1 , x2, ..... xn de una variable Para valores de una
variable X observados en una muestra, la media aritmética se denota por
Calculo de la media aritmética de datos no agrupados
Media aritmética de la poblacional.
La media aritmética de una población denotamos por μ . Si la población es
finita de
tamaño N con valores x 1 , x 2 , x3 . . . .x N la media es el numero :
Se reporta el promedio en el examen de admisión de todos los estudiantes que ingresaron a la
UNFV en año 2008, es 195.4 puntos; este es un ejemplo de una media poblacional porque se tienen
las puntuaciones de todos los estudiantes que e ingresaron en ese año.
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 3
3
Media Muestral La media de n valores x1 , x2, ..... xn de una variable cuantitativa X.
Observados en una muestra es el numero
Media Muestral = Suma de todos los valores de la muestra
Numero de todos los valores en la muestra
La media de una muestra o cualquier otra medida basada en datos muestrales se denomina
estadístico.
La media de una muestra y la media Poblacional se calculan de la misma manera pero la simbología es
diferente. Ejemplo:. el promedio de gasto en refrigerio de estudiantes del primer año es :
S/. 10, S/.15, S/.12, S/.20, S/.18, S/.15, S/.10, S/.21, S/.19, mensual
= 10 +10+15 +12 +20 + 18 +15 + 10 + 21 +19 = 15 soles mensual
10
promedio de gasto por los estudiantes es 15 soles
Interpretación : se espera que el gasto promedio en refrigerio por cada estudiante sea 15 soles mensual
Significa que la media es el punto de equilibrio de los datos mayores y menores.
+3
-4 + 2
-2 + 1
1 2 3 4 5 6 7 8 9 10
X
La media se puede considerarse como un punto de equilibrio de un conjunto de datos tenemos
Cinco datos 3, 5, 8, 9, 10 cuya punto equilibrio queda fijado en 7 que es la media de los cinco
números entonces las desviaciones hacia abajo de la media -6 y son iguales a las desviaciones hacia
arriba de la misma (+6)
POR LO SIGUIENTE
Propiedades de la media aritmética:
1. La media es la única medida de tendencia central donde la suma de las
desviaciones de cada valor, respecto a la media, siempre es igual a cero,
expresado de modo expresado algebraicamente
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 4
4
2. Para evaluar la media se consideran todos los valores
3. Un conjunto de datos solo tiene una media, la cual es un valor único.
4. La media es una medida muy útil para comparar dos más poblaciones.
5. Si cada uno de los n valores x i es transformado en : yi = ax i k siendo a y k constante,
entonces, la media de los n valores y i es
Como casos particulares se tiene:
a. ”La media aritmética de una constante es igual a la
misma constante”
si y i = k, entonces,
b. “La media de una variable menos o más una constante, es igual a la media de la variable menos
o más la constante ” Si y i = x i k entonces,. Esto es si a cada dato
se resta o suma una constante la media queda
disminuida o sumada por esa constante.
c. “La media del producto de una constante por una variable, es igual al producto de la constante por la
media de la variable”
Si y i = axi entonces, esto es, si a cada dato se multiplica por una constante, la media queda multiplicada
por esa constante.
Ejemplo 1: Los costos de fabricación, en soles, de diez objetos seleccionados, son los siguientes:
9.35, 9.46, 9.20, 9.80, 9.77, 9.00, 9.99, 9.36, 9.50, 9.60 soles
Si el precio de venta de cada objeto es 3 veces su costo de fabricación menos 5 soles, calcular la ganancia
promedio por objeto.
Soluc.
xi = costo del objeto _
El promedio del costo de los objetos
Xc = 9.35+9.46+9.20+9.80 +9.77+9.00+9.99+9.36+9.50+9.60 =9.503
10
Precio de venta es zi = 3xi -5 aplicando propiedad (1a)
Se tiene la media de venta es Zv = 3*Xc - 5 =3*9.503 – 5 =28.509 – 5 =23.509 soles
La media de venta es 23.509 soles la ganancia promedio es Z v – X c = 23.509 –9.503=14.006 soles
Ejemplo 2. El sueldo promedio de 200 empleados de una empresa es S/. 400. Se proponen dos alternativas de
aumento:
a) S/. 75 a cada uno,
b) 15% de su sueldo más 10 soles a cada uno.
Si la empresa dispone a lo mas de S/. 94.000 para pagar sueldos, ¿¡Cual alternativa es más conveniente?
. RP. b es la conveniente
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 5
5
*Ventajas de la media aritmética.
• Concepto familiar para muchas personas
Desventajas:
Se ve afectada por los datos extremos,, altos o bajos llamados atipicos
Si los datos están agrupados en clases con extremos abiertos, no es posible calcular la media
Nota 1: La media para datos agrupados por intervalos es aproximada por que hay una ligera perdida de
información al construir la tabla de distribución de frecuencia y al ubicar las observaciones en los intervalos
los valores pierde identidad y la marca de clase se supone que es la representación del intervalo.
-Es una medida que puede ser calculada y es única. Cada conjunto de datos tiene una y solo una media.
-La media aritmética como estadígrafo de posición de una distribución proporciona una idea de la
posición de los valores alrededor de la media.
-Para evaluar la media se consideran todos los valores
ejemplo: En la distribución de los ingresos o salarios se aprecia un predominio de ingresos menores, es decir que hay muchas
personas que ganan poco y predominio de ingresos menores, es decir que hay muchas personas que ganan poco y pocas
personas que ganan mucho.
Supongamos que los haberes de los trabajadores de una pequeña empresa es como sigue:
Cargo
Gerente general
administrador
Contador
Empleado
Obrero calificado
Obrero simicalificado
Numero de trabajadores
1
1
1
3
5
3
haberes en soles mensual
560
520
480
160
150
140
a-determinar el haber promedio mensual de la empresa
b-será representativo este haber promedio del conjunto de trabajadores
c-Cual sería un procedimiento adecuado para un análisis de los datos?
Soluc.
a)el haber promedio mensual es decir la media aritmética:
X= 1*560 +1*520 +1*480 +3*160+ 5*150+3*140 = 3210 = 229.3 soles por trabajador
1 + 1 + 1 + 3 + 5 +3 14
b-No es representativo, porque hay solo 3 personas con sueldo alto que hacen crecer el promedio
Un procedimiento adecuado podría ser estratificado previamente los datos originales en dos categorías
En este caso la media estaría influenciada por los pocos valores mayores, originando una elevación del sueldo
promedio, de este modo se distorsiona la interpretación de los sueldos de esta población.
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 6
6
NOTA: Media aritmética ponderada:
La media ponderada es un caso especial de la media común (o media aritmética). Se presenta cuando hay
valores de las observaciones que esta ponderada ( por pesos). Para explicar esto
La media aritmética de los valores x 1 , x 2 , x 3 .. . ..x m ponderada por los pesos w1 , w 2 , w 3 .... . . wm .
es el numero:
ejemplo de media ponderada
Si un alumno en el semestre anterior ha obtenido 11 en el curso A de 5 créditos, 13 en el curso B de 4
créditos, y 16 en el curso C de 3 créditos, entonces, su promedio (ponderado por los créditos) es es
_
X= 11*5+13*4+16*3 =155 =12.92puntos
5+4+3 12
NOTA: Media aritmética total. A partir de sub muestras
Si consideramos muestras de tamaños n1 ,, n2 . . . n m de una población a las cuales le corresponden media
aritméticas , respectivamente: entonces la media asociada a la muestra de
tamaños n 1 ,,, n 2 . . . n m esta dada por :
Por ejemplo; si un examen, 50 alumnos de sección A obtuvieron una media
de 12,6 ; 45 alumnos de la sección B obtuvieron un promedio de 13.48 entonces, y 40 alumnos de la sección C
obtuvieron un promedio de 13,5. Los 135 alumnos en conjunto obtuvieron el promedio:
_
XT= 50*12,6 + 45*13,48+40*13,5 = 1776,6 = 13,16 puntos
50+45+40 135
Ejemplo. .En una empresa la edad promedio de las 17 trabajadoras mujeres es de 31.2 años, y la edad
promedio de los 23 trabajadores hombres es de 38 años. ¿Cuál es la edad promedio del total de
trabajadores? _ _
Mujeres : n 1 = 17 X 1 =31.2 años Hombres: n 2 = 23 X 2 = 38 años
_
XT = 17 * 31.2 + 23 * 38 = 1404.4 =35.1 años
17 + 23 40
ejemplo 6.
En un examen de Estadística participaron tres grupos A, B, C con un total de 180 alumnos; habiendo obtenido
nota promedio general de 72 puntos. Los puntajes promedio de los grupos A y B fueron 75 y 62, y estaban
constituidos por 80 y 60 alumnos respectivamente. ¿Cuál es la nota promedio del grupo C?
_ _ _ _
nA + nB + nc = 180 alumnos YT = 72 puntos YA = 75 YB = 62 YC = ¿?
Como nA = 80 nB =60 entonces nC = 40
_
YT = 75(80) + 62(60) + YC (40) = 6000 +3720 + 40 YC = 72
_ 180 180
YC = 180(72) – 6000 – 3720 = 3240 = 81 puntos
40 40
Entonces la nota promedio del grupo C es de 81 puntos.
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 7
7
Ejercicios I
1.- Evalué la media del siguiente conjunto de valores:6,3,5,7,6
a- Demuestre algebraicamente y luego aritméticamente con los valores.
2.-El ingreso anual para una muestra de varios empleados de gerencia de nivel medio en la empresa Donofrio
es: S/.10500, S/.9500, S/. 11000, S/.15,500 S/. 12000, S/. 13500.
a) exprese la fórmula para la media muestral
b) Obtenga la media de la muestra
c) La media que obtuvo en B) es un estadístico o un parámetro? Explique porque?
d) Cual es su mejor estimación de la media poblacional?
3.- Los estudiantes de un curso de Estadística II se consideran como una Población, Sus calificaciones en el
curso son 92, 96, 61, 86, 79, y 84
a) indique la fórmula para calcular la media poblacional
b) Determine la calificación media del curso.
c) La media que obtuvo en B) es un valor estadístico o parámetro? Porque?
4- Los estudiantes del curso de Microeconomía se consideran como una población, sus calificaciones en el
curso son 12, 16, 61, 16,19 y 14
a) indique la formula para calcular la media poblacional
b) Determine la calificación media del curso e interprete
c) La media que obtuvo es un valor estadístico o un parámetro porque?
5- EL Hospital Almenara emplea 200 personas en su cuerpo de enfermeras. De ese personal, 50 son
ayudantes de enfermería, 50 son enfermeras practicantes y 100 son enfermeras generales. Las primera
reciben un sueldo de S/.8 por hora; la segundas, ganan S/. 10 por hora y las ultimas S/. 14 por hora. ¿Cuál es
el promedio del sueldo por hora.
6-Para calcular el suministro de agua que una ciudad requiere mensualmente, se escogen 15 familias de la
ciudad, resultando los siguientes consumos en metros cúbicos:
11,2 21,5 16,4 19,7 14,6
16,9 32,2 18,2 13,1 23,8
18,3 15,5 18,8 22,7 14,0
Si en la ciudad hay 5 000 familias. ¿Estime cuántos metros cúbicos de agua se requieren mensualmente si el
consumo promedio por familia permanece igual?
8- En una empresa donde el sueldo medio es de $400 se incrementa un personal igual al 25% del ya existente
con un sueldo medio igual al 60% de los antiguos. Si 3 meses más tarde se incrementan cada sueldo en 20%,
mas 30$, cual es el promedio del nuevo salario?
Ejemplo 2:
Ssupóngase que en un restaurante se venden refrescos medianos , grande y extragrandes, y sus precios son
los siguientes: 100, 1.50. 2.00 soles respectivamente. De los últimos 10 refrescos que se vendieron 3 eran
medianos, 4 grandes y 3 extragrandes. Para calcular el precio promedio de los últimos diez refrescos
vendidos se puede
_
X = 3*1.00+ 4*1.50+3*2.00 = 15/10 =1.5
10
El precio promedio de venta de los últimos diez refrescos es de 1.5 soles.
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 8
8
Ejercicio-
En junio una inversionista compro 300 acciones de Canal 5 a un precio de $20 (dólares) por acción; en agosto
compro 400 acciones más a $25 cada una, y en noviembre, 400 a $23 por acción. ¿Cuál es el precio promedio
por acción?
2) Media aritmética de datos tabulados
a) Media para datos tabulados por valores diferentes ( variable discreta)
Si n valores de una variable estadística discreta X y sus m valores x 1 , x 2 . . . . . . . . x m con sus
frecuencias absolutas respectivas f1 , f2 , f3 , f4 . . fm , entonces, su media aritmética es el numero:
Ejemplo 1 : Calcular la media aritmética de la distribución del numero de hijos por familia
Se tiene que m= 5 y
Valores diferentes
Y1 =0, y2 = 1, y3 = 2 ,y4 =3 , y5 =4
Luego calculando la media aritmética es:
Interpretación: el número de hijos que se
espera tenga cada familia es de 2.
b ) Media para datos agrupados por Intervalos
Si n valores de alguna variable X están tabulados en una distribución de frecuencias de
m intervalos, donde:
MC1 ,, MC2 , .. . . MCm son las marcas de clase y f 1 , f 2 , f 3 , . . . f m son las
frecuencias absolutas respectivas entonces, su media aritmética es el numero:
Número de hijos
Número de familias
Frecuencia absoluta fi
0
1
2
3
4
1
4
7
6
2
20
Número de hijos x i
Número de familias
fi
Productos
fi * y i 0
1
2
3
4
1
4
7
6
2
1 *0 = 0
4 * 1 = 4
7 * 2 = 14
6 * 3= 18
2 * 4 = 8
20 ∑ni * y i = 44
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 9
9
Ejemplo:
Distribución de 40 empleados de la empresa Tupac S. A. por sueldos mensuales, 2006 Sueldos
Frecuencia absoluta f i [320 – 378)
[378 – 436)
[436 – 494)
[494 – 552)
[552 – 610)
[610 – 668]
4
7
10
6
8
5
Total 40
Para calcular es necesario calcular las marcas de clase Sueldo en $ Marcas MC i N° de empleados f i Productos
f i * y i [320 – 378 >
[378 – 436 >
[436 – 494 >
[494 – 552 >
[552 – 610 >
[610 – 668]
349
407
465
523
581
639
4
7
10
6
8
5
4 *349 = 1396
7 * 407= 2849
10 * 465 =4650
6 * 523 = 3138
8 * 581 = 4648
5 * 639 = 3195
Total 40 ∑fi*MC i = 19876
Resultando
Interpretación: el sueldo que se espera sea de cada empleado es de 496.9 dólares mensuales.
Nota 1: La media para datos agrupados por intervalos es aproximada porque hay una ligera pérdida de información al
construir la tabla de distribución de frecuencia y al ubicar las observaciones en los intervalos los valores pierde
identidad y la marca de clase se supone que es la representación del intervalo.
- No se puede calcular la media aritmética para un conjunto de datos que tiene intervalos de clases
abiertos en los extremos. Por ejemplo suponga que un conjunto
-
Sueldos soles Empleados
Menos de 200
[200 – 400)
[400 – 600)
[600 – 800)
[800 – 1000]
25
35
60
40
20
180
Sueldos soles empleados
[500 – 1000)
[1000 – 1500)
[1500 – 2000)
mas de 2000
20
30
60
20
130
Sueldos Empleados
Menos de 400
[400 – 600)
[600 – 800)
[800 – 1000)
[1000 y mas
55
35
60
40
10
200
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 10
10
La mediana (Me)
Definición. La mediana es el valor Me que separa a la conjunto de datos ordenados (creciente o decreciente)
en dos partes de igual número de datos. La Me es el valor que corresponde al punto medio de los valores
después de ordenarlos de menor a mayor o de mayor a menor.
La mediana llamada algunas veces media posicionad porque queda exactamente en la mitad del conjunto de
datos después que las observaciones se han colocado en serie ordenada.
Significado
Valor de la observación que ocupa la posición central de un conjunto de datos ordenados según su magnitud.
Es el valor medio o la media aritmética de los valores medios. La mediana es un valor de la variable que deja
por debajo de él un número de casos igual al que deja por arriba.
Geométricamente la mediana es el valor de la variable que corresponde a la vertical que divide al histograma
en dos áreas iguales.
Cuando determinados valores de un conjunto de observaciones son muy grandes o pequeños con respecto
a los demás, entonces la media aritmética se puede distorsionar y perder su carácter representativo,
en esos casos es conveniente utilizar la mediana como medida de tendencia central.
Interpretación: Sea { x 1 , x 2 , x 3 .. . ..x n }
ordenados representemos en un segmento Los datos ordenados x (1 ), x (2 ), x(3 ) .. . . .. ..x(n-1 ) ,x (n) La mitad de las observaciones estará por encima de
la mediana, la otra mitad estará por debajo de ella.
El 50% de observaciones es menor o igual a Me y el
otro 50% es mayor que Me
Cálculo de la mediana (Me) de datos no Agrupados Sea el conjunto de observaciones x 1 , x 2 , x 3 .. . ..x n de la variable X
- Se ordenan los datos en forma creciente
- Luego se ubica el valor central Me . ( es decir la posición de la Me)
a. Si n es impar, la mediana es el dato ordenado del centro.
Posición de la Me = ( ( n+1 ) /2)° lugar en conjunto
b. Pero si n es par, la mediana es la semisuma de los dos valores ordenados centrales.
Posición de Mediana esta entre dos valores centrales (n/2)° lugar y ( (n/2) +1)° lugar
Ejemplo: Calcular la mediana para las siguientes serie correspondiente a cantidades vendidas de carne cuy en kg por 9
microempresarios. 120kg., 3kg, 14kg, 1kg, 99kg, 7kg, 30kg, 2,000kg, 16 kg.
ordenamos la serie de los 9 datos es n= 9 numero impar observaciones ,
1, 3, 7, 14, 16, 30, 99, 120, 2000 Posición 1° 2° 3° 4° 5° 6° 7° 8° 9°
entonces la mediana es el valor de la observación que ocupa la posición central es decir:
posición de la Me esta ((n +1)/2)° = ((9+1)/10)° = 5° lugar
el valor que esta en 5° lugar es 16 la Me = 16 kg la mediana es el quinto dato divide a la serie en dos grupos.
Interpretación: El 50 % de los microempresarios sus ventas de carne cuy es menor o igual a 16 kg y el otro 50% mayor que 16 kg.
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 11
11
Ejemplo 2: se tiene datos de producción de arroz en toneladas por 8 caseríos:
30tn, 77tn , 3tn, 300tn, 36tn, 11tn, 10000tn, 29tn
ordenamos el conjunto de observaciones n = 8 es par,
3, 11, 29, 30, 36, 77, 300, 10000 Posición 1° 2° 3° 4° 5° 6° 7° 8°
Posición de Mediana Me esta entre valor que ocupa la posición (n/2)° y ((n/2) +1)°=(8/2)° y ((8/2) + 1)°
Es decir 4° y 5° lugar
Existen dos valores centrales. La mediana será la semisuma de los dos valores centrales.
La Me esta entre 30 y 36, ya que este dividirá a los datos en dos grupos de 4 datos cada uno.
Entonces mediana la semisuma de los dos valores centrales.
Esto es, Me = (30 +36)/2 =33 toneladas Me = 33 toneladas
Interpretación:
el 50% de los caseríos de la muestra la producción de arroz es menor o igual a 33 toneladas.
Nota = la mediana no depende de la magnitud de los datos. Depende sólo del número de ellos.
Ejemplo; La edad de ingresantes del 2011 son los siguientes:
15, 16, 15, 17, y 18 años calcular la mediana y la media aritmética
Ordenando 15, 15, 16, 17, 18
n=5 impar la mediana es valor que se pocisiona en (n+1)/2 posicion 3ª
la mediana es Me = 16
interpretación
50% de los ingresantes sus edades el menor o igual a 16 años y la otra 50% es superior a 16
media aritmética 16,2
la edad que se espera tenga cada ingresante es de 16.2 años
15, 15, 16, 17, 55 me = 16 media aritmética =23.6
Características de la mediana
1. Es un promedio de posición no afectado por los valores extremos.
2. No está definida algebraicamente lo que es difícil su manejo o manipulaciones en procedimentos complejos
3. Cuando la localización del elemento central puede ser determinada y los límites de clase mediana son
conocidos, la mediana para la distribución de frecuencias puede ser calculada por interpolación, no importando
que ésta contenga intervalos abiertos, cerrados, iguales o diferentes.
4 La mediana en caso de una distribución asimétrica, no resulta desplazado del punto de tendencia central.
5. Si se desea ubicar las condiciones de un elemento en una clase, la mediana resulta se indicada, ya que por
comparación pone en evidencia si un elemento está en la mitad superior a ella o en la inferior.
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 12
12
CASO DATOS AGRUPADOS POR VALORES DIFERENTES
a- Calcular las frecuencias acumuladas
y aplicar el procedimiento anterior
EJEMPLO
Distribución de frecuencias de número de cajas de cerveza por pedido de clientes mayoristas en una
distribuidora en año 2006
El procedimiento para calcular la mediana siguiendo la técnica
anterior n es par
Nos ayudamos con la frecuencia acumuladas n =30
n/2= 30/2= 15 mitad la mediana está en la simusuma de los 2 datos
centrales ( que se posiciona en 15° y 16°)
La mediana queda entre los valores que ocupa
la posición 15° y 16°
Luego la Me = (42 + 44)/2 = 43 cajas de
cerveza por pedido Interpretación: los 30 pedidos analizados el 50 %
de los ellos fueron menor 0 igual a 43 cajas de
cerveza y la otra mitad más de 43 de cajas.
Calculo de Me Datos tabulados o agrupados por intervalos
Si las observaciones de la variable se organizan en una distribución de frecuencias por intervalos, por tanto parte de la
información ya no es identificable como resultado, no es posible determinar la mediana exacta. Sin embargo puede
estimarse localizando la clase en la que se encuentra la mediana y realizando interpolaciones dentro de esa clase para
obtener dicho valor.
La mediana se estima por interpolación lineal a partir de la distribución de frecuencia acumuladas.
Numero de cajas Pedidos ni
30
32
34
36
38
40
42
44
46
48
50
4
2
2
1
1
3
2
2
6
4
3
30
Numero de cajas Pedidos ni N
30
32
34
36
38
40
42
44
46
48
50
4
2
2
1
1
3
2
2
6
4
3
4
6
8
9
10
13
15
17
23
27
30
30
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 13
13
Para calcular la mediana el procedimiento consiste:
a- Calcular las frecuencias acumuladas
b- Ubicar la clase mediana será el intervalo de la variable cuya frecuencia acumulada es inmediatamente mayor a n/2
observaciones es decir n/2 < Fi
Ii =[ limite inferior Ii , limite superior Ii ] intervalo que contiene a
la mediana Me para la cual se determinó las frecuencias
acumuladas Fi y Fi-1
De modo que Fi-1 ≤ n/2 < Fi
Me ε [Limite inferior de Ii, Limite superior Ii] intervalo de
amplitud ai cuya frecuencia absoluta acumulada es Fi y
la frecuencia absoluta es fi = Fi - Fi-1
La mediana
Me ε [limite inferior de Ii,límite superior Ii]
luego
Luego la Me se obtiene por interpolación lineal
Graficando el intervalo de la clase mediana
por interpolación lineal
se tiene;
si en la amplitud el intervalo Ii = ai se tiene -- Fi - Fi-1 = fi observaciones
en amplitud Me - Li se tiene --- n/2 - Fi-1
luego Me = Li + ai * (n/2 - Fi-1) / f i donde:
Li = límite inferior del intervalo donde se ubica la Me
ai = amplitud del intervalo de clase mediana Ii
n = tamaño de la muestra o número de observaciones
fi = Frecuencia absoluta del intervalo de clase mediana (donde se encuentra la Me)
Fi-1 = Frecuencia acumulada anterior a la clase mediana
Ejemplo: Distribución de frecuencia de sueldos mensuales de 40
empleados de la empresa Tupac S. A. del año, 2006. Calcular la mediana e
interpretar
Sueldos $ Frecuencia
absoluta f i [320 – 378)
[378 – 436)
[436 – 494)
[494 – 552)
[552 – 610)
[610 – 668]
4
7
10
6
8
5
Total 40
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 14
14
Para el cálculo de la Me
Ubicamos la clase mediana
Calculamos las frecuencias acumuladas
Como n/2=20 entonces la menor frecuencia absoluta
acumulada que supera 20 es absoluta F 3
clase mediana ([436 –494>)intervalo que contenga la Me
Fi-1 ≤ n/2 < Fi ----- 11< 20<21
es el tercer intervalo que contiene la Me es la clase mediana
Apliquemos interpolación lineal En la amplitud 494–436 =58 se tiene 21-11= 10 empleados
Y en la amplitud b= Me-436 se tiene 40/2-11=9 empleados
(Me-436)*10 = 58 *9 ----> 10Me-4360= 522 -10Me= 522+4360
luego la mediana estimada es
Me = 488.2 $ Interpretación: el 50% de empleados de la muestra su sueldo es menor o igual a 488.2$ y la otra mitad su
sueldo es mas de 488.2$. O el 50% de los salarios de los menor o igual a 488.2$ y la otra mitad es mayor
que 488.2$
Puede aplicar directamente la formula.
Nota: caso de que n/2 = Fi en este caso la clase mediana es el intervalo Ii = [limite inferior - limite superior>
la Mediana es igual al limite Inferior del intervalo Ii
Ventajas Mediana
-La mediana solo depende del número de datos ordenados y no del valor de los datos
-La mediana puede ser calculada para distribuciones de frecuencias con intervalos de diferente amplitud,
siempre que se pueda determinar el límite inferior del intervalo de la mediana.
-La mediana puede ser calculada para variables cualitativa con valores en escala ordinal.
-La Mediana no es afectada por valores extremos
Ejemplo
Un investigador recibe las siguientes respuestas a un enunciado en una encuesta de evaluación: discrepa
fuertemente, discrepa ligeramente, discrepa un poco concuerda, concuerda fuertemente. cual es la mediana
de las 5 respuestas?
1 discrepa fuertemente
2 discrepa ligeramente
3 discrepa un poco
4 concuerda
5 concuerda fuertemente Me = 3 discrepa un poco El 50% de observaciones discrepa un poco a fuertemente
Sueldos Frecuencia
absoluta n i
Frecuencia acumulada
absoluta Fi
[320 – 378)
[378 – 436)
[436–494) [494 – 552)
[552 – 610)
[610 – 668]
4
7
10 6
8
5
4
11
21 27
35
40
Total 40
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 15
15
Defectos de la media aritmética
La media depende de todos los valores observados en consecuencia es afectada o sesgada por valores
extremos.
Por ejemplo, la media aritmética de los grupos
a) edades de ingresantes de la UNFV
15, 16, 17, 18, 19, 20 es igual X = 17,4 la Me=17,5
15, 16, 17, 18, 19, 45 es igual X = 22,4 Me=17,5
4, 16, 17, 18, 19, 20 es igual X = 15,6 Me=17,5
como se puede observar en este caso en lo dos últimos grupos la media aritmética es sesgada por valores
extremos. En este caso una mejor medida es la Mediana.
La Moda. Mo Definición. La moda de un conjunto de observaciones es el valor Mo, que se define como el dato que más se
repite.
Es decir es el valor de un conjunto de datos que ocurre más frecuentemente, se considera como el valor más
típico de una serie de datos.
La moda no siempre existe y si existe no siempre es única
La moda es una medida que se usa cuando se quiere señalar el valor mas común se una serie datos.
Para datos agrupados se define como Clase Modal el intervalo que tiene más frecuencia.
Características de la Moda.
1. Representa más elementos que cualquier otro valor
2. La moda para una distribución de frecuencias de datos agrupados no puede ser calculada exactamente, el
valor de la moda puede ser afectado por el método de agrupación de los intervalos de clase.
3. La moda no permite conocer la mayor parte de los datos
4. Algunas veces el azar interviene de manera importante y hace que un valor no representativo se repita
frecuentemente.
5. Puede usarse para datos cuantitativos como cualitativos
6. La moda como estadístico, varía mucho de una muestra a otra
8. Cuando se tienen dos o más modas es difícil su interpretación
9. Tiene la ventaja de que los datos desproporcionados con respecto al resto no la distorsionan, pero no se
presta para un tratamiento matemático.
Ejemplo: datos no agrupados
Calcular la moda para las siguientes serie correspondiente a cantidades vendidas de carne de cuy en kg. Por
9 microimpresarios, en una semana
20kg., 30kg, 14kg, 1kg, 9kg, 7kg, 30kg, 25kg, 16 kg.
La Moda es Mo =s 30 Kg y este conjunto es unimodal
Interpretamos : la cantidad mas frecuente vendida por los Microimpresarios en una semana de carne de cuy
es de 30 kg
Ejemplo 2: se tiene datos de producción de arroz en toneladas por 8 caseríos:
30tn, 77tn , 3tn, 300tn, 36tn, 11tn, 10000tn, 29tn no existe moda Mo
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 16
16
Calculo de la Moda para datos agrupados por valores diferentes: En este casi se determina fijándose en el valor de la variable que mas se repite (es decir la máxima frecuencia absoluta)
Ejemplo: sea la distribución de frecuencia de numero de hijos por familia calcular la Moda e interpretar
La frecuencia absoluta máxima es 7
Por tanto el valor que mas se repite es 2
Mo = 2 hijos
Interpretación : Las familias de la muestra el numero de hijos mas frecuente es de 2 hijos
Moda para datos tabulados por intervalos Para calcular la moda de n datos tabulados por intervalos se determina:
1- Se determina la clase modal. Esto es el intervalo que tiene la mayor frecuencia (clae modal), Luego se utiliza la
formula
Mo = Li + ai( ∆ 1 )
∆1 + ∆2
Donde
Li = es el limite inferior del intervalo o clase
∆1 = f i – fi-1 esto es ∆1 igual a la frecuencia de la clase modal menos la frecuencia de la clase modal
inmediato anterior
∆2 = f i – fi +1 esto es ∆2 es igual a la frecuencia de la clase modal menos la frecuencia de la clase modal
inmediatamente posterior.
ai = es la amplitud del intervalo modal
Esta formula de la moda solo se aplica en distribución con una sola frecuencia máxima
Ejemplo: Se tiene la siguiente distribución de sueldos por empleado de una empresa.
Calcular la moda e interprete
1ero. Se ubica la
clase modal
En este caso la frecuencia
Máxima n3 = 10 es decir Mo Є [436 - 494)
Li = 436
∆1 = f 3 – f2= 10 – 7 y ∆2 = f 3 – f4 =10 –6 a3 = 436 – 494 =58
Numero de hijos
Numero de familias
Frecuencia absoluta fi
0
1 2
3
4
1
4 7
6
2
23
Sueldos $ Frecuencia
absoluta f i [320 – 378 >
[378 – 436 >
[436–494 >
[494 – 552 >
[552 – 610 >
[610 – 668]
4
7
10 6
8
5
Total 40
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 17
17
Utilizando la formula
Mo = Li + ai( ∆ 1 )
∆1 + ∆2
Mo = 436 + 58 ( 10 - 7 ) = 436 + 58(3)/7 = 436 + 24.857 = 460.857 (10-7)+(10-6)
Mo = 460.857 $
Interpretación : En la muestra los empleados de la empresa tienen su sueldo mas frecuente es de 460.86 $
Ventajas de la Mo
-No se ve afectada por valores extremos
-La moda se puede calcular en datos tabuladas con intervalos abiertos
-Se da moda tanto para datos cualitativos como cuantitativos.
Desventaja de la Mo
- Muy ha menudo no hay un valor modal en un conjunto de observaciones.
- Cuando el conjunto de observaciones contiene dos o tres o mas modas son difíciles de interpretar .
ejercicio II
1- En una muestra por seguridad social revelo los siguientes pagos en soles 426,299,290,687,480,439 y 565
a) Cual es la mediana de los ingreso?
b) Cuantas observaciones son inferiores a la mediana? Cuantas son superiores a la mediana?
2.- El numero de paros laborales en la industria automotriz en los meses seleccionados 6,0,10,14,8 y 0
a- Cual es la mediana del numero de paros?
b- Cuantas observaciones son menores que la mediana? ¿Cuántas son mayores?
c-Cual es el valor modal de los paros en el trabajo?
3-Un estudio económico muestra que el gasto en alimentos de una familia de cuatro personas es en promedio
$218 mensuales, hallar la media del gasto diario en alimentos. Rp. $7.27$.
4- Las ventas de un distribuidor de automóviles en cierto periodo, ascendieron a la cantidad de 1,650,000
vendiendo 50 automóviles nuevos a un precio promedio de 13,000 y algunos carros usados con un precio de
5000 soles en promedio ¿Cuál es el promedio de los precios de todos los automóviles que se vendieron? Rp.
6,600soles.
5- En una empresa donde el sueldo medio es de 400 soles se incrementa un personal igual al 25% del ya
existente con un sueldo medio igual al 60% de los antiguos. Si 3 meses mas tarde se incrementan cada sueldo
en 20%, mas 30soles ¿Cuánto es el nuevo sueldo medio? Rp.471.6soles
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 18
18
Relación entre Media, mediana y Moda 1- Si la distribución de frecuencia es simétrica entonces Media , la
Mediana y la Moda tienen el mismo valor. Esto es
2- Si la distribución es asimétrica de cola a la derecha, es
decir la distribución es mas alargada para valores grandes
de la variable, entonces la Moda es menor que la Mediana
y esta a su vez es menor que la Media es decir:
3- Si la distribución es asimétrica de cola a la izquierda, es decir la
distribución es mas alargada para valores pequeños de la variable
entonces, la Media es menor que la Mediana y esta su vez es
menor que la Moda.
De (2) y ( 3) se debe concluir que cuando la población tiene sesgo, la mediana es la mejor medida de la ubicación, puesto que siempre esta entre Mo y X media aritmética.
4- Si al distribución es moderadamente asimétrica y unimodal, se cumple aproximadamente la relación:
Los tres medidas de tendencia central puede calcularse también para distribuciones de frecuencias con
intervalos de diferente longitud, siempre que pueden determinarse o las marcas de clase ( para la media
aritmética) o el limite inferior Li del intervalo (para la mediana y la moda)
Uso de la 3 medidas de tendencia central
1- La media aritmética se usa con mas frecuencia por su mejor tratamiento algebraico. Pero no
siempre es una buena medida.
2- Si la distribución de frecuencias es simétrica ( o casi simétrica) la media o la mediana o la moda es
representativo, pues en este caso los tres promedios son iguales (o casi iguales)
3- Si la distribución tiene marcada asimetría, entonces la mediana es la medida mas
representativa. debido a que está siempre entre la media y la moda. La mediana no se ve
altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se
distorsiona con la presencia de valores extremos como la media.
4- La selección de la media, la mediana o la moda, depende de la aplicación. Por ejemplo, se habla del
salario promedio (media); el precio mediano de una casa nueva puede ser una estadística más útil
para personas que se mudan a un nuevo vecindario (si hay una o dos crestas que distorsionan la
media). Y mientras que la familia promedio conste de 1,7 niños, tiene más sentido para los
diseñadores de automóviles pensar en la familia modal, con dos niños.
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 19
19
Ejercicios V 1-
Las ventas netas de una muestra de pequeñas plantas de estampado se organizaron
en la siguiente distribución de frecuencias ¿Cual es la mediana estimada de las ventas
netas? Y cual es su media aritmética y su moda e interprete
RP : 500 soles
2-Los datos siguientes corresponden a valores de una tabla de frecuencia de 7 intervalos que muestra la
distribución de las ventas semanales (en miles de soles) de la sucursal Cañete de una cadena de multitienda de
mediana importancia.
f7 =1 h5 = 0.14 F1 =3 h2 = 0.12 F4 = 39
H3 = 0.46 H6 = 0.98 Mc1 = 8.685 a = 0.16
a- Complete la tabla, bosqueje un histograma de frecuencia
b- ¿Qué proporción de semanas se tiene ventas de al menos 9,100 soles
c- ¿Cuáles son las ventas semanales media dela sucursal y su mediana
3-
4-
Ventas netas
soles
Frecuencias
Menos de 200
[200 – 400)
[400 – 600)
[600 – 800)
[800 – 1000]
25
35
60
40
20
180
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 20
20
5-
6-Calcular la media aritmética e interprete de cada una de las tabla de Distribución de frecuencias Calificaciones Porcentaje de alumnos
[0-3 > 35%
[3-5 > 16% [5-8 > 42% [8-10 ] 7%
7- En la siguiente distribución
de frecuencias de venta de carne de cerdo (redondeadas a mil
kilos) de 60 microempresas.
a) Calcular sus medidas de tendencia central e
interpretar.
b) Y el valor de ventas que esta en el cuarto superior.
8-
Edades Pacientes fi
[5- 10 >
[10 – 15 >
[15 – 25 >
[25 – 40 >
[40 – 50 >
{ 50 – 65]
30
20
45
40
30
35
Mil kilos Numero de microempresas
[5-10)
[10-15)
[15-20)
[20-25)
[25-30]
5
15
20
15
5
60
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 21
21
Las cuantiles. Se ha definido la mediana Me como aquel valor de la variable que divide a la distribución en dos partes
iguales. Siguiendo con esta idea podríamos plantearnos buscar valores de la variable que dividan la
distribución en un determinado número de partes iguales.
Se denomina cuantiles a los valores de la variable que dividen a la distribución de los datos en 2, 4, 10 o 100. .
Las cuantilas de uso más frecuente son las: cuartilas, las decilas y las centilas o percentiles.
En consonancia con la idea de cuantilas que se ha dado previamente, las definiciones concretas de cada una de
ellas serían las siguientes:
Cuartilas (Qi): son tres valores de la variable que dividen la distribución en cuatro partes iguales, es decir,
en cuatro intervalos dentro de cada cual están incluidos la cuarta parte de los valores u observaciones de la variable.
Sea el conjunto de observaciones : { x1 , x2 , ...........x n } para calcular la cuartilas ordenamos
los xi y dividimos en cuatro partes. Se tiene
gráficamente: el primer cuartil Q1 , el segundo cuartil Q2 que es igual a la mediana Me y el tercer cuartil Q3
Decilas (Di): son los nueve valores de la variable que dividen la distribución en diez partes iguales, es decir,
en diez intervalos dentro de cada cual están incluidos la décima parte de los valores u observaciones de la variable.
Sea el conjunto de observaciones : { x1 , x2 , ...........x n } para calcular la Decilas ordenamos
los xi y dividimos en diez partes.
Se tiene : gráficamente.
D1 1er decil el 10%
D2 2do decil 20%
D3 3er decil 30% D4 4to decil 40% D5 5to decil 50% D6 6to decil 60% D7 7mo decil 70% D8 8vo decil 80% D9 9no decil 90%
Centilas (Ci)o percentiles: son los noventa y nueve valores de la variable que dividen la distribución en cien
partes iguales, es decir, en cien intervalos dentro de cada cual están incluidos la centésima parte de los valores u observaciones de la variable.
Sea el conjunto de observaciones : { x1 , x2 , ...........x n } para calcular los percentiles ordenamos los xi y
dividimos en cien partes.
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 22
22
gráficamente: el primer centil P1 , el segundo centil P2 que asi sucesivamente , el noventa ochoavo centil P 98
, el noventa y nueve avo centil P 99
El centil o percentil P25 = Q1 , P 50 = Q2 y P75 = Q3
Calculo de los cuartiles Calculo para datos no agrupados
1. Se ordena los datos en forma Ascendente.
2. Se Localiza la posición de Q1,Q2,Q3.
Si la ubicación del cuartil es entero Q1 = (n+1 )°, Q2 = (2(n+1))° , Q3=(3 (n+1))° (*)
4 4 4 Entonces Q1 , Q2 , Q3 es igual a la observación particular correspondiente al punto de posición calculada de (*)
Si la ubicación del cuartil no es entero, hacemos una interpolación lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentra la fracción
Qi =Lj + (LJ+1 )* (Fracción) donde (i=1,2,3)
Ejemplo: Los siguientes datos representan tiempo en minutos de 12 estudiantes de llegar a su centro de
estudio: 9’, 10’, 12’, 8’, 8’, 7’, 15’, 10’, 9’, 11’, 13’, 11’
Determinar el 1er, y 3er Cuartil.
se tiene n = 12 ordenar los valores
Q1 Q2 Q3
7, 8, 8, 9, 9, 10, 10, 11, 11, 12, 13, 15
1° 2° 3° 4° 5° 6° 7° 8° 9° 10° 11° 12°
Ubicar la posición de Q1 = ( n +1)° = (12+1)° = 13 = 3,25°. Esto significa que el valor de Q1 es el
4 4 4
tercer dato mas 25% de la diferencia entre los valores de las observaciones 3° y 4°. Así el
valor de la 3° es 8 y el 4° es 9 entonces
Q1 = LJ + (LJ+1 – LJ) (Fracción) = $8+(9-8)0.25 Q1 = 8.25 minutos
Interpretación: el 25% de los estudiantes el tiempo en llegar a su centro de estudio es menor o igual 8.25 minutos y el
otro 75% de estudiantes el tiempo en llegar a su centro de estudio es mayor 8.25 minutos.
Calculo de Q3
Ubicación de Q3 = 3(n+1) – 3(12+1)= 9.75° Datos.
4 4
Q3 = Qi =Lj + (LJ+1 )* (Fracción) = 11+(12-11)(0.75)
Q3 = 11.75 minutos
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 23
23
Interpretación: el 75% de estudiantes de los estudiantes el tiempo en llegar a su centro de estudio es
menor o igual 11.75 minutos
PARA DATOS AGRUPADOS el procedimiento para el cálculo de los cuartiles es similar a la mediana es decir
Calcular las Frecuencias acumuladas
Localizar la clase cuartilica
Será el intervalo Frecuencia acumulada es inmediatamente mayor a Qi = (i n/4)° observaciones es decir
i*n/4 < Fi (la primera Frec.Acumulada que supere a i*n/4) y luego por interpolación lineal y se llega a la formula (aplica directamente la formula:
Formula para calcular el Primer Cuartil Q1 ,, segundo cuartil Q2 , tercer cuartil Q3
Li = Es el Limite inferior de la clase que contiene al primer cuartil.o segundo cuartil o tercer cuartil
n/4 = Localización del primer cuartil Q1, en la distribución de frecuencias
2n/4= Localización del segundo cuartil Q2 en la distribución de frecuencias
3n/4 =Localización del tercer cuartil Q3 en la distribución de frecuencias
F i-1 = Es la frecuencia acumulada anterior a la clase que contiene a Q1 o Q 2 o Q3
fi = Es la frecuencia de la clase que contiene a Q1 o Q 2 o Q3
ai =Es la amplitud de la clase en que se encuentre Q1 o Q 2 o Q3
Ejemplo 1 . Una muestra de las cantidades quincenales invertidas en el plan de participación de utilidades en
la corporación Backus por parte de los empleados, se organiza en una distribución de frecuencias para su
estudio.
Q1
Q2
Q3
¿Cual es el 1er Cuartil, 2do Cuartil, 3er Cuartil e interprete
Determinar el Q1? 1 localizar posición de Q1 = n/4 = 120/4 = 30° < F4 =43
el 1er cuartil se localiza en la cuarta clase
2. fi = 22
3. Fi-1 = 21
4. El limite inferior 45 =Li
Clase Limites
$
Frecuencia
absoluta fi
Frecuencia acumulada
absoluta F i
1ª I1 [30 – 35 > 3 3
2ª I2 [35 – 40 > 7 10
3ª I3 [40 – 45 > 11 21
4ª I4 [45 – 50 > 22 43
5ª I 5 [50 – 55 > 40 83
6ª I 6 [55 – 60 > 24 107
7ª I 7 [60 – 65 > 9 116
8ª I8 [65 – 70] 4 120
ni = n = 120
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 24
24
5to. a = 5 amplitud del intervalo cuartilico
Q1 = 45 +5 (30-21) /22 = 45 + 5*( 9/22) Q1 = 45 + 2.046 =47.045$
Interpretación.- Un cuarto (o 25%) de las aportaciones quincenales de los empleados es inferior o igual a
$ 47.045 y los tres cuartos (o 75%) de las aportaciones quincenales de los empleados de la corporación
Backus es superior a $47.045.
Calculo Q3
1ero. Localizar la posicion de Q3 = 3n = 3(120) = 90°
4 4
el tercer cuartil esta ubicada en la 6ª clase
2do. fi = 24
3ero. F i-1 = 83
4to. Limite inferior de la clase tercer cuartil $55
5to ai = 5
Q3 = 55 + 3(120)/4 –83) *5 = 55 + (90 –83) *5 =
24 24
Q 3 =55 + (7/24) *5 =55+ 1.458333
Q3 = $56.46 Interpretación.- 75% de las aportaciones quincenales de los empleados de la corporación Backus es inferior o
igual a $56.46..
Calculo de los Deciles y Centiles o Percentile : los Deciles y percentiles se determina de manera
similar a los cuartiles . Asi cuando los datos no están tabulados
1ero de ordena las observaciones
2do se localiza la posición del valor correspondiente a la i( n +1)/10 observación ordenada. Entonces Para
datos tabulados se sigue los mismo pasos Como los cuartiles
Para obtener los valores de estas medidas se procederá
Qi es el valor correspondiente a la frecuencia acumulada mayor o igual que (i n)/4, para i=1,2,3.
Di es el valor correspondiente a la frecuencia acumulada mayor o igual que (i n)/10, para i=1,2,3,...9.
Ci es el valor correspondiente a la frecuencia acumulada mayor o igual que (i n)/100, para i=1,2,3,...,98,99.
Generalizando para las cuantilas Si la distribución está agrupada o tabulada por intervalos entonces
la expresión general para determinar estas medidas, que es similar a la de la mediana, viene dada por:
:
para k=4 y r=1,2,3, tendremos las cuartilas
para k=10 y r=1,2,3,......,9, tendremos las decilas
para k=100 y r=1,2,3,...........,99 tendremos la centilas.
Li =Limite inferior Ii = limite inferior del intervalo donde se ubica el cuantil
ai = amplitud del intervalo de clase Ii
n = tamaño de la muestra
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 25
25
fi = Frecuencia absoluta del intervalo de clase cuantil (donde se encuentra el cuantil correspondiente)
Fi-1 = Frecuencia acumulada anterior a la clase cuantil
Ejemplo: 3-En el hospital Loayza 120 pacientes pagaron por su hospitalización por 3 días según tabla
de distribución de frecuencias:
a) Calcular los pagos del 25% de los pacientes
b) calcular los pagos del 25% superior de los pacientes.
c) Cual es el mínimo pago del 60% de los pacientes.
d) Calcular el pago que es superado por el 15% de los pacientes
Para calcular
1- calcular las frecuencias acumuladas que nos permita hallarla clase cuantil
Localizamos
a) ( n)/4 = 120 )/4= 30 el valor esta en [150-170>
b) (3 n)/4 = (3*120 )/4 = 90 el valor esta en [190-210>
c) (60 n)/100 = (60* 120) /100= 72 el valor esta en [170-190>
d) (85 n /100) =(85*120) / 100 =102 el valor esta en [210-230>
aplicando la formula =
Para a) P25 = 150 + 20*(30 - 20) /2 5 = 158soles
b) P75 = 190 + 20*(90 - 83) / 15 =199.3soles
c)P60 = 170 + 20*(72 – 45) /38 = 184,21 Soles
d)P85 = 210 + 20 *(102 – 98) /12 = 216.6 soles
La media Geométrica
Útil cuando la variable cambia a lo largo del tiempo, esto es, en el cálculo del promedio de tasas, razones,
proporciones geométricas y relaciones de variables. Se utiliza en Matemáticas Financieras y Finanzas para
promediar números índices, tasas de cambio, etc.
La media geométrica se representa por “G” y se puede considerar:
Es la raiz enésima del producto de los n valores de una serie. Esto es, dado los n valores
x 1 , x2 , . . . xn
Ejemplo:
Los empleados reciben un aumento de sueldo de este año de 5% y recibirá un 15% el año próximo. Calcular el
aumento porcentual promedio.
Si utilizaríamos la media aritmética (5%+15%)/2 = 10%
Lo cual no es cierto veamos calculemos la media Geométrica
Para la cual un aumento de
5% significa de cada 100 soles 5 soles es el aumento es decir se recibe 105 entonces la tasa de aumento es
1.05
15% es decir de cada 105 soles el aumento es de 15.75 soles es decir recibirá 120.75 soles es decir la tasa
de aumento es 1.15
Pagos en soles Frecuencia
[130 –150>
[150-170>
[170-190>
[190-210>
[210-230>
[230-250]
20
25
38
15
12
10
Total 120
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 26
26
-
G = \/1.05*1.15 = 1.09886 tasa promedio de aumento
Luego el aumento porcentual promedio es =0.09886=9.886% y no 10%
De lo anterior suponga que
Si el sueldo de Juan era de 2000 soles y recibió dos aumentos de 5% y 15%
Aumento 1 = 2000 * 0.05 =100
Aumento 2 = 2100 * 0.15 =315
Total = 415 soles
El aumento de sueldo es 415 soles esto equivale
2000 *0.09886 = 197.72
2197.72*0.09886 = 217.26659
414.9865 redondeando 415 soles
otro ejemplo:
Las ganancia obtenidas por la Cia Andina en cuatro proyectos recientes fueron. 3%, 2%, 4% y 6% ¿cuál es la
media geométrica de la ganancia? ______
G = \/3*2*4*6 = 3.46%
En general para simplificar la solución de la raíz n-ésima se obtiene utilizando logaritmos:
+. . . .+log xn ) Log G = 1/n (log x1 + log x 2 + log x3
G = anti log(1/n (log x1 + log x 2 + log x3 +. . . .+log xn ) )
Ejemplo: En una empresa la producción ha experimentado un crecimiento del 25% del primer año al segundo año, del 40%
del segundo al tercero
a) determine la tasa promedio de crecimiento del primer año al tercer
Soluc
Porcentaje Producción tasas de variación
1er año 100
2do año 25% 100+0.25*100=125 125/100=1.25
3er año 40% 125+ 0.40*125= 175 175/125=1.40
El Tasa promedio de aumento es _____ G = \/1.25*1.4 = 1.3225
Por tanto la el porcentaje promedio de crecimiento es será 32.25%
Ejercicio III 1-Supóngase que durante cinco años de una Economía altamente inflacionaria, los bancos pagan tasas anuales de interés de
100, 200, 250,300 y 400 por ciento. Hallar la tasa de interés promedio anual de un deposito de $100.
2- Si una producción ha experimentado un crecimiento del 30% del primero al segundo año y un incremento del 35% del
segundo al tercer año y un decrecimiento del 15% del tercer al cuarto año.
a) Calcular la tasa promedio de crecimiento de los 3 últimos años
3- El crecimiento de la población estudiantil con respecto al semestre anterior fue como sigue: aumento 10% en el
segundo, aumento 20% en el tercero y bajo 15% en el cuarto. Encuentre la promedio porcentual de crecimiento en los tres
semestres Rp. 3.91%
4- En cuatro meses consecutivos los precios de un articulo fueron $500, $550, $440 y $462 respectivamente ¿es la tasa
de variación promedio igual al –16.7% si no es así ¿cuánto es?
5-Si la producción de azúcar en 1991 bajo 20% con relación al año 1990 y si en 1992 aumento en 20% con respecto a 1991,
calcule la tasa promedio del crecimiento de la producción
Rp. G=0-9798% bajo 2%
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 27
27
Ejercicios V 1-Los ingresos netos de una muestra de grandes importadores de antigüedades se organizaron en la siguiente tabla
a) como se llama este tipo de tabla?
b) Evalué aproximadamente, la media aritmética, la
mediana, y al moda, y cual es la relación de las mediadas calculadas que
significa
c) Cual es la interpretación. De las medidas de
resumen calculadas
2-Cuando se calcula la media de un distribución de frecuencias ¿Por qué se designa como media estimada o aproximada?
3- El sueldo medio de los obreros de una fábrica es de $286
a) ¿Qué porcentaje de hombres y mujeres trabajan en la fábrica si sus sueldos medios respectivos son $300 y
$260?
b) Si el 50% de los obreros tienen menos de 30 años y percibe el 20% del total de los sueldos ¿Cuánto es el sueldo
medio de los obreros de al menos 30 años?, Rp a) 65% y 35% b) = 572$
4- Se tiene la siguiente información sobre la distribución de ventas (redondeado a miles de soles) de calzado
en 90 días de una fabrica de calzado.
Estime la media y la mediana. Indique la forma de la distribución. El
2do décil e interprete. calcular la venta mínima del 30% de los días
vendidos
5- Una firma comercial tiene fama de “pagar bien” a sus empleados, ya que un empleado afirma que paga en promedio S/.
500 mensuales. Sin embargo después se averiguó que la empresa solo tiene 10 empleados, 9 de los cuales ganan al mes 250
soles. y el jefe de ellos S/. 2750 ¿¡Paga bien la empresa?¿Porque?
6- Las ventas semanales en una muestra de tiendas de suministros electrónicos se organizaron en una distribución de
frecuencias. El valor calculado para la media de las ventas semanales fue $ 105,900, la mediana fue $ 105 000 y la moda
$104 500.
a) Represente las ventas en forma de un polígono de frecuencia alisado. Observe la ubicación de la media, la
mediana y la moda sobre el eje de las abscisas
b) La distribución es simétrica o bien asimétrica positiva o negativa’ Explique su respuesta.
7- En una evaluación 5 alumnos tiene cada uno nota 12 y un alumno tiene 18. Si se indica como nota promedio 13, ¿qué nota
promedio es??es el promedio adecuado?¿cuánto es el promedio adecuado? Rp: media, no Me = 12.
8- De las edades de cuatro personas se sabe que la media es igual a 24 años, la mediana es 23 y la moda es 22. Encuentre
las edades de las cuatro personas.
Ingreso
neto $
Numero de
importadores
[2 –6 >
[6- 10 >
[10- 14 >
[14- 18 >
[18- 22
1
4
10
3
2
Ventas
Miles se soles
Numero de días
14-36 >
[36-58 >
[58-80 >
[80-102 >
[102-124 >
[124-146]
8
12
16
20
24
10
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 28
28
9- En un informe que se supone es correcto sobre sueldos en todo el pais una empresa de estudios de mercados publica la
siguiente tabla
Clase A Clase B Clase C Clase E
% de población 10% 25% 35% 30%
Sueldos S/. 2500 S/. 1500 S/. 500 S/. 200
Y concluye diciendo que la “la media de los sueldos en todo el pais es S/. 1175”
a) ¿Que comentario le merece el informe? Si no esta de acuerdo, ¿Cuál seria la corrección?
b) ¿Es la media en este caso el promedio representativo?, si no esta de acuerdo, ¿Cuánto es el promedio adecuado?
Rp. A) la media correcta es 860 b) Mediana es 500 soles.
10- Los sueldos en una empresa varían de $300 a $800 distribuidos en forma simétrica en 5 intervalos de igual amplitud
con el 15%, 20% y 30% de casos en el primer, segundo y tercer intervalo respectivamente.
a) Calcule los diferentes indicadores de tendencia central
b) Si se aplica un impuesto a los sueldos localizados en el cuarto superior ¿a partir de que sueldo se paga el
impuesto?
Rp. a)media = Mediana = Mo= 550 b) 6505
11-Se tiene una tabla de distribución de frecuencias relativa de los sueldos en dólares de empleados de una empresa
Sueldos hi
60 – 100 0.16
100–140 0.2
140-180 0.4
180-220 0.14
220-260 0.1
a) calcule el porcentaje aproximado de empleados cuyos sueldos sea $100 a mas pero menos de $ 160 .
b)Se plantean dos alternativas de aumento: La primera consiste en un aumento general de 50$. La segunda consiste en un
aumento general del 35% del sueldo. Además una bonificación de 10$ ¿Cual de las dos propuestas conviene a los
trabajadores si el interés es subir el promedio de los sueldos? Rp. a)40% b) la segunda 216.28$
12-En una granja avícola se registra la siguiente tabla de distribución de pollos con respecto a sus pesos
Se desea agrupar los pollos en 4 categoría con relación al peso de modo que:
Los 20% menos pesados sean de la categoría D
Los 30% siguientes sean de la categoría C
Los 30% siguientes sean de la categoría B
Los 20% mas pesados sean de la categoría A
¿Cuáles son los límites de peso entre las categorías A,B,C,D
13- Una empresa decide hacer un reajuste entre sus empleados . La clasificación se lleva a cabo mediante la aplicación de
un test que arroja las siguientes puntuaciones
Puntuaciones Nº de empleados
[0-30 >
[30-50 >
[50-70 >
[70-90 >
[90-100 ]
94
140
150
98
8
La planificación optima de la empresa exige que el 65% sean administrativos, el 20% jefes de sección, el 10% jefes de
departamento y el 5% inspectores según sea la puntuación obtenida. Se pide calcular la puntuación máxima para ser
administrativo, jefe de sección y jefa de departamento.
Peso (en grs) Nº de pollos
[950-980>
[980-1000>
[1000-1020>
[1020-1040>
[1040-1060>
[1060-1080]
60
120
280
260
160
80
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 29
29
14-La distribución de frecuencias sobre notas de estudiantes de estadística presenta las frecuencias relativas h3 y h5
borrosas. Se sabe que la media es 7.9 determine aproximadamente
Notas [0.5-2.5> [2.5-4.5> [4.5-6.5> [6.5-8.5> [8.5-10.5> [10.5-12.5> [12.5-14.5> [14.5-a mas
hi 0.02 0.10 ----- 0.16 ---- 0.10 0.02 0.00
a- La nota que es excedido por el 75% de las notas de los estudiantes
b- La nota que supere a las notas de 75% de los estudiantes.
c- RP. a-5.8 b-9.85
15-El jefe de control de calidad de una empresa ha clasificado un lote de 80 artículos
con una distribución de 6 clases y con un intervalo de 5 unidades. Si las frecuencias correspondientes son: 6,12, 24, 18,
13 y 7, siendo la cuarta marca de clase igual a 35gr. Determinar la moda y la mediana de la distribución.
16-Se tiene una población dividida en dos grupos de diferentes tamaños, el primer grupo tiene un ingreso medio de 8000
soles y el segundo grupo tiene un ingreso medio de 4000 soles.
a.- Si el ingreso medio total es de 5200 soles ¿qué porcentaje de la población esta en cada grupo?
Rp 30% en el primer grupo y 70% en el segundo grupo.
17-De una muestra de tamaño 3 se sabe que:
c) La media aritmética es 7
d) La mediana es 6
e) X1 < X2 < X3
f) Determinar los valores de los datos muestrales X1, X2 , X3
18-En una sección de la asignatura de Macroeconomía la distribución de calificaciones de 50 alumnos resulto:
Calificaciones Nº de estudiantes
[0, , 4 > 2
[4, , 8 > 8
[8, , 12 > 20
[12,, 16 > 15
[16 , 20 > 5
Se desea agrupar a los estudiantes de esta sección en 3 categorías, tomando en cuenta las notas obtenidas. El 20% de los
que tienen las peores notas estarán en la categoría de Deficientes; el 60% de los siguientes estarán en la categoría de
Normales y el 20% de los que tienen las mejores notas estarán en la categoría de excelentes. ¿Cuáles son los limites de
calificaciones entre las categorías?
19-Una empresa decide hacer un reajuste entre sus empleados. La clasificación se lleva a cabo mediante la aplicación de
un test que arroja las siguientes puntuaciones
Puntuaciones Empleados
[0-30>
[30-50>
[50-70>
[70-90>
[90-100]
94
140
180
98
8
La planificación optima de la empresa exige que el 65% sean administrativos, el 20% jefes de sección, el 10% jefes de
departamento y el 5% inspectores según sea la puntuación obtenida. Se pide calcular la puntuación máxima para ser
administrativo, jefe de sección y jefe de departamento
20
-Un conjunto habitacional esta formada por 3 edificios de departamentos. Se tiene los siguientes datos respecto al
consumo mensual de electricidad de cada uno de los edificios
Edificio 1: Tiene 8 departamentos, la media es de S/. 85
Edifico 2: Tiene 9 departamentos cuyos consumos en soles son: 88, 92, 106, 110, 93, 102, 91, 94, 80
UNIVERSIDAD NACIONAL FEDERICO VILLAREAL FACULTAD DE CIENCIAS ECONOMICAS
Introducción de la Estadística - Lic. Filomena Chino Villegas 30
30
Edificio 3: Los consumos se dan en la siguiente tabla:
Consumo en soles Departamentos
50-60 1
60-70 2
70-80 4
80-90 3
a) Cual de los edificios tiene el menor consumo en promedio de electricidad?
b) Cual es el consumo promedio en todo el conjunto habitacional?
21-Se han seleccionado 1000 alumnos de la Universidad de UNA que presentan la
siguiente distribución de notas en una determinada asignatura:
Se pide:
a) ¿Supera el aprobado la nota más frecuente?
b) ¿Cuál es la nota mínima del 60% de los alumnos con mejores notas?
c) ¿Qué porcentaje de alumnos obtiene una puntuación superior a 8?
d) Si la nota media de la asignatura en otra Universidad es 6,5 con varianza 10,35 ¿cuál de las
dos Universidades tiene una nota media más representativa?
22-Se han seleccionado 1000 alumnos de la Universidad de UNA que presentan la siguiente distribución de notas en una
determinada asignatura:
Se pide:
a) ¿Supera el aprobado la nota más frecuente?
b) ¿Cuál es la nota mínima del 60% de los alumnos con mejores notas?
c) ¿Qué porcentaje de alumnos obtiene una puntuación superior a 8?
d) Si la nota media de la asignatura en otra Universidad es 6,5 con varianza 10,35 ¿cuál de las
dos Universidades tiene una nota media más representativa?