medidas de resumen
TRANSCRIPT
MEDIDAS DE RESUMENMEDIDAS DE RESUMENVariables cuantitativas. en Series simples y Agrupadas
Cálculo e interpretación de Curva normal
Las MEDIDAS DE RESUMEN sirven para describir en forma resumida un conjunto de datos que constituyen una muestra tomada de alguna población.
Podemos distinguir cuatro grupos de medidas de resumen:
MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE DISPERSION
MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL
MEDIANA
MODA
PROMEDIO O MEDIA ARITMETICA suma d las observaciones dividida entre el numero de observacionesX1+X2+…Xn / n
Es un número tal que al menos el 50% de las observaciones son menores o igual a él así como el otro 50% es mayor o igual que él. “Mn”
Es el valor de la observación que se encuentre con mayor frecuencia. “ordenados de menos a mayor o viceversa”
Pretenden indicar donde está lo que se podría considerar como el centro de la masa de datos.
TIPOS DE MEDIASTIPOS DE MEDIAS
MEDIA GEOMÉTRICA:
Es cuando se multiplica cada uno de los datos y de les saca raíz “n” (numero total de datos)
MEDIA ARMONICA
Es la inversa de la media aritmética de las observaciones.
10 11 11 12
13 14 15 16
MEDIA 12.75
MODA 11
MEDIANA 7.5
No usan toda la información disponible
Usan toda la información disponible
Rango Percentiles
Desviación media
Varianza
Percentiles
Rango entre percentiles
Rango intercuartilico
Desviación estándar
MEDIDA DE DISPERSION
DEFINICION USO
RANGO R=dato mayor –dato menor Medir la amplitud en la cual se dispersan los datos.Su valor se ve afectado por valores externos.No dice nada de la variación de los datos entre los valores extremos.No usa toda la información.
PERCENTIL D(p)= p(n) + p / 100
Partir conjuntos de datos ordenados en porcentajes p de ellos.Evita los valores extremos.No usa toda la información.
CUARTIL CUARTIL 1: Q(1)= Percentil 25%= x(25)CUARTIL 2: Q(2)= Percentil 50%= x(50)CUARTIL 3: Q(3)= Percentil 75%= x(75)
Partir conjuntos de datos en cuatro partes iguales de datos.
MEDIDA DE DISPERSION
DEFINICION USO
RANGO INTERCUARTILICO
Q(3) – Q(1) Estimar el rango en que se concentra 50% de todos los datos en el centro.
RANGO SEMIINTERCUARTILICO
QM= Q(3)-Q(1) / 2 Estimar la medida de la variación de 50% de todos los datos que está en el centro de una distribución.No usa toda la información.
DESVIACION MEDIA Medir la dispersión de los datos alrededor de la media.Determinar la simetría de una distribución.
MEDIDA DE DISPERSION
DEFINICION USO
VARIANZA Y DESVIACION ESTANDAR DE UNA MUESTRA
Medir la dispersión de los datos alrededor de la media aritméticaUtiliza toda la información.
RANGOEs la diferencia entre los valores mayor y menor
R= Valor dato mayor – Valor dato menor
PERCENTILES Es el valor x(p) para el cual “p” por ciento de las mediciones son menores que el.
D(p)= p(n) + p 100
Donde: D(p) es el dato percentiln es el total de datos y p es el percentil que se desea obtener.
EJEMPLO
R= 16-10= 6
Dato percentil 75%
D(p)= 75(8)+75= 6.5 100
10 11 11 12
13 14 15 16
CUARTILES
Son percentiles que parten un grupo de mediciones ordenadas ascendente o descendente en cuartos.
CUARTIL 1: Q(1)= Percentil 25%= x(25)CUARTIL 2: Q(2)= Percentil 50%= x(50)CUARTIL 3: Q(3)= Percentil 75%= x(75)
DATO MAYORDATO MENOR
Cuartil 1:Q(1) Cuartil 2:Q(2) Cuartil 3:Q(3)Percentil x(25) Percentil x(50) Percentil x(75)
25% de los datos es menor a
Q(1)
50% de los datos es
menor a Q(2)
75% de los datos es menor a
Q(3)
RANGO= Q(3)-Q(1)
DESVIACION MEDIADM, Es el promedio de las desviaciones absolutas (en valor absoluto) respecto de la media. Se mide en las mismas unidades que las observaciones originales.
Es la sumatoria de la diferencia de un valor numérico menos la media aritmética; todo esto entre el valor total
de datos.
10 11 11 12
13 14 15 16
DM=(10- 12.75)+ (11-12.75)….+(16-12.75) 8
DM= 1.75
Los resultados de la diferencia siempre se
deberán tomar en cuenta como positivos
La varianza es un promedio de los cuadrados de las desviaciones respecto de la media, excepto que en lugar de dividir por n (el número de observaciones), se suele dividir por n-1. Se usa el símbolo s2 o bien var para representar la varianza.
La variación es la dispersión que tienen los valores en estudio respecto a la media aritmética.
La desviación estándar de un conjunto de datos mide el grado en que los datos se dispersan alrededor de la media aritmética. A menor desviación, los datos se concentran fuertemente alrededor de la media aritmética. A mayor desviación, los datos se dispersan mas alrededor de la media.
Cuando la s es pequeña, los datos se concentran fuertemente alrededor de la media, cuando es relativamente grande, el rango es mayor y por lo tanto los datos se dispersan mas.
EjemploEjemplo
10 11 11 12
13 14 15 16
Media= Xi = 10+11+11+12+13+14+15+16= 102= 12.75 8 8
(xi) 2= (102)2 = 10404, y
xi 2 = 10 2 + 11 2 + 11 2 +122 …+ 16 2 =1332
SS 2 = nnxx 2 2 – ( – (xxii)) 2 2 = 8(1332) – 10404= 252= 4.5 n(n-1) 8(8-1) 56
S= S 2 = 4.5= 2.1213
Coeficiente de variaciónCoeficiente de variación
Es similar a la desviación estándar, pero dividido por la media. Con esto se logra que sea independiente de la unidad de medida con que se midieron las observaciones. El coeficiente de variación no tiene unidad de medida.
Cv= 2.1213 = 0.1663 12.75
VARIABLES VARIABLES CUANTITATIVASCUANTITATIVAS
VARIABLES CUANTITATIVAS DISCRETAS Y CONTINUAS
Variables cuantitativasVariables cuantitativas
CONTINUAS
Son las que pueden tomar cualquier valor de un intervalo de números reales, como el tiempo que tarda en caer una piedra en caída libre o la temperatura de un paciente con gripe, entre otras.
DISCRETAS
Son las que solo toman una cantidad finita o infinita pero contable de valores, como el numero de clientes que cobran cheques en un banco en un día o el numero de estrellas en una galaxia, entre otras.