ESTADÍSTICA DESCRPTIVAESTADÍSTICA DESCRPTIVA
Tablas de Frecuencia para Variables Continuas, Representación Gráfica y
Tabla de Contingencia
Tabla de frecuencia Variable Continua Si la variable que se esta midiendo es de tipo
continuo (puede tomar cualquier intervalo determinado por los números reales), no tiene sentido el tabularla para cada una de las observaciones dado que es muy improbable que variable bajo estudio tome el mismo valor durante el experimento.
Recorrido: Es el campo de variación de la variable.
Recorrido = X máx – X mín2
Tabla de frecuencia Variable Continua El número y tamaño de los intervalos, dependen de la cantidad
de datos de la muestra y de su recorrido.
El número de intervalos debe cumplir con dos condiciones: resumir la información y conservar el detalle de la muestra.
Los intervalos puede ser cerrado- cerrado,
cerrado- abierto
3
Tabla de frecuencia Variable Continua Definiciones:
1. Clases: Consisten en intervalos de valores ordenados en forma accedente y descendente y que cubren todos los valores disponibles. El número de clases se denota K
2. Limites de clases: Son los extremos de las clases. El valor menos se denomina limite inferior (Li) y le valor mayor limite superior (Ls). Puede ser abierto ( ) o cerrado [ ].
3. Amplitud de clase: Se obtiene hallando la diferencia entre los limites de clases. Se denota C.
4
Tabla de frecuencia Variable Continua4. Marca de clase: Es el punto medio de las clases, es
decir, la semisuma del Ls y Li.
Las clases deben tener el misma Amplitud.
Amplitud = C = (Máx. - VMín) / K
Donde K es el número de clases
En caso de no saber cuantas clases se deben tener (K) ni la amplitud de estas, se utiliza la Regla de Sturgen.
K = (1 + 3,322 Log n)
5
Ejemplo Los siguientes datos indican el número de minutos que
ocuparon sus asientos 20 clientes de una cafetería.
Construir tabla de distribución de frecuencias, utilizando intervalo cerrado – abierto. Calcular el número de intervalos utilizando la expresión [1+ 3,3log n]
¿Qué tanto por ciento de clientes ocuparon sus asientos 32 minutos o más?
¿Qué tanto por ciento de los clientes ocuparon sus asientos entre 28 y menos de 36 minutos?
6
Solución
1. 45%
2. 60%7
Representación Gráfica
1. Histograma Consiste en un conjunto de rectángulos con:
bases en el eje x, centros en las marcas de clases y longitudes iguales a los tamaños de los intervalos de clases.
Si los intervalos de clases tienen todos la misma amplitud, las alturas de los rectángulos son proporcionales a las frecuencias de clase.
8
Representación Gráfica
9
Ejemplo Dada la siguiente tabla de distribución, graficar
histograma.
10
Representación Gráfica
2. Polígono de Frecuencia Es un gráfico de trazos de la frecuencia de
clase con relación a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectángulos del histograma.
Ejemplo: Realizar el polígono de frecuencia de la tabla anterior.
11
Representación Gráfica
12
Representación Gráfica
3. Ojiva: Al igual que el histograma y el polígono de
frecuencias es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas.
En el eje horizontal se considera los limites de clase. Limites inferiores Ojiva mayor
Limites superiores Ojiva menor
13
Representación Gráfica
Ojiva Mayor
14
Ojiva Menor
Representaciones Gráficas
15
Tabla de Contingencia 2 x 2 Sirve para analizar la relación de dependencia o
independencia entre dos variables cualitativas o una cualitativa y otra cuantitativa, es necesario estudiar su distribución conjunta o tabla de contingencia.
1. Permite organizar la información contenida en un experimento cuando ésta es de carácter bidimensional, es decir, cuando está referida a dos factores.
2. A partir de la tabla de contingencia se puede además analizar si existe alguna relación de dependencia o independencia entre los niveles de las variables objeto de estudio.
16
Tabla de Contingencia 2 x 2 Para identificar relaciones de dependencia entre
variables cualitativas se utiliza un contraste estadístico basado en el estadístico X2 (Chi-cuadrado), cuyo cálculo nos permitirá afirmar con un nivel de confianza estadístico determinado si los niveles de una variable cualitativa influyen en los niveles de la otra variable nominal analizada.
17
Tabla de Contingencia 2 x 2 Considerando un grado de confianza del 95%, esto
implica un = 0,05.
Ho: El sexo de la persona no es un facto determinante en que la persona fume. Son independientes.
H1: El sexo de la persona es un facto determinante en que la persona fume. Son dependientes.
Obtención del grado de libertad para X2 (Chi-cuadrado):
Grados de libertad: (r-1)*(c-1), r: filas; c: columnas Grados de libertad: (2-1)*(2-1)=1
Valor tabla = 3,84
18
Tabla de Contingencia 2 x 2
Si el resultado es menor a 3,84 no se rechaza Ho
Si el resultado es mayor a 3,84 se rechaza Ho
19
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
Estadígrafos Básicos: Moda, Mediana, Media en Datos no Agrupados
Estadígrafos Básicos
Estadígrafo o estadístico: Es un valor que, calculado sobre la base de los datos observados, sirve para caracterizar la muestra que originó los datos.
Ejemplos: El promedio común y corriente, un tanto por ciento, el rango, el IPC, etc. Todos ellos responden a la idea general de estadígrafo.
1. Es un número real
2. Se calculan con los datos observados
3. Caracterizan la muestra en estudio
Permiten condensar ,el volumen de información, a unos pocos valores que sean indicativos de todo el conjunto.
Tipos de Estadígrafos
Tipos de Estadígrafos
1. Estadígrafos de posición: Son aquellos que describen la posición que ocupa la distribución de frecuencias respecto a un valor de variable.
Indican alrededor de cuál valor se agrupan los datos obtenidos.
2. Estadígrafos de dispersión: Cuantifican la variabilidad o dispersión de los datos.
Indican qué tan esparcidos están los datos obtenidos
Moda en datos no agrupados La moda es el valor que
tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Ejemplo: Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5
R: Mo = 4
En caso de:1. Si en un grupo hay dos o
varias variables con la misma frecuencia y
2. Esa frecuencia es la máxima
Entonces la distribución es bimodal o multimodal, es decir, tiene varias modas.
Moda en datos no agrupados Ejemplo: Hallar la moda de
la distribución: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9
R: Mo = 1, 5, 9
Cuando todos los valores de un grupo tienen la misma frecuencia, no hay moda
Ejemplo: Hallar la moda de la distribución: 2, 2, 3, 3, 6, 6, 9, 9
R: Mo = No hay moda
Ejercicios
1. Calcule la moda para n° de personas ocupantes por automóvil en un control policial fronterizo:
4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3
2. Calcule la moda para el tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos)
25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5
3. Calcule la moda para el peso de una muestra de 10 recién nacidos en un hospital público (Kg.):
3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140
Ejercicios
4. Calcule la moda de la siguiente serie de números:
5 – 4 – 6 – 5 – 4 – 5 - 6 – 5 – 4 – 5 – 4 – 2 – 4 – 2 – 5 - 4
Respuestas:
1. M0 = 4 personas
2. M0 = 25 minutos
3. M0 = La moda no existe
4. M0 = 4 y 5
Media aritmética en datos no agrupados La media aritmética o el
promedio es igual a la suma de todos los valores observados, dividida por el número de datos.
Desventaja de la media aritmética:
o Es altamente influenciable por valores extremos, por lo que la media es recomendable cuando la variable tiene una distribución de valores homogéneos.
Media aritmética en datos no agrupados Ejemplo: Calcular la media
aritmética de la edad de 5 personas: 23 – 21 – 11 – 8 – 34
R: = (23 + 21 + 11 + 8 + 34) / 5 = 19,4 años.
Ejemplo: Una persona que trabaja en forma independiente gana un mes $100.000, otro mes $300.000 y otro $200.000. ¿Cuanto gana en promedio mensual? Interprete el resultado.
R: = (100.000 + 300.000 + 200.000) / 3
= $200.000
Interpretación: La persona debe esperar ganar cada mes $200.000, por supuesto que abra meses que ganará más y otros menos.
Ejercicios
1. Calcule la media aritmética para n° de personas ocupantes por automóvil en un control policial fronterizo:
4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3
2. Calcule la media aritmética para el tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos)
25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5
3. Calcule la media aritmética para el peso de una muestra de 10 recién nacidos en un hospital público (Kg.):
3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140
Ejercicios
4. Calcule la media aritmética de la siguiente serie de números:
5 – 4 – 6 – 5 – 4 – 5 - 6 – 5 – 4 – 5 – 4 – 2 – 4 – 2 – 5 - 4
Respuestas:
= 3,3 personas
= 22,67 minutos
= 3,359 Kg
= 4,375
Mediana en datos no agrupados
La Mediana de una serie de datos, es el valor de la variable que, una vez ordenadas las observaciones de menor a mayor, divide la distribución en dos segmentos tales que:
1. A lo menos, el 50% de las observaciones son iguales o menores que la mediana
2. A lo menos, el 50% de las observaciones son iguales o mayores que la mediana.
Mediana en datos no agrupados
1. Ordenar los datos de menor a mayor (recomendado) o de mayor a menor
2. Encontrar la ubicación de la mediana
3. Determinar el valor que se encuentra en el lugar señalado.
Caso en que “n” es impar. Ejemplo: Los siguientes
son el número de menores de edad por familia:
3, 2, 0, 0, 1, 2, 0.
Calcular la mediana.
1. Ordenados:
0, 0, 0, 1, 2, 2, 3
En este caso n = 7
Mediana en datos no agrupados
2. Ubicación: = (7+1)/2
Es la 4º observación o valor.
3. La 4º observación es el valor .
La Me = 1
Caso en que “n” es par. Ejemplo: Los siguientes
son el número de menores de edad por familia:
3, 2, 0, 0, 1, 2, 0, 4
Calcular la mediana.
1. Ordenados:
0, 0, 0, 1, 2, 2, 3, 4
En este caso n = 8
Mediana en datos no agrupados
2. Ubicación: = (8+1)/2
resultado 4,5
La mediana esta entre el 4º y 5º valor.
Es decir entre: 1 y 2
3. La mediana es ( 1 + 2) / 2
Me = 1,5
Ejercicios
1. Calcule la mediana para n° de personas ocupantes por automóvil en un control policial fronterizo:
4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3
2. Calcule la mediana para el tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos)
25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5
3. Calcule la mediana para el peso de una muestra de 10 recién nacidos en un hospital público (Kg.):
3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140
Ejercicios
4. Calcule la mediana de la siguiente serie de números:
5 – 4 – 6 – 5 – 4 – 5 - 6 – 5 – 4 – 5 – 4 – 2 – 4 – 2 – 5 - 4
Respuestas:
Me = 3,5 personas
Me = 25 minutos
Me = 3,325 Kg
Me= 4,5
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
Estadígrafos Básicos: Moda, Mediana, Media en Datos Agrupados
Moda en datos agrupados La moda se obtiene por
interpolación, mediante la siguiente formula:
Ejemplo: Calcular la moda para los siguientes datos:
Li: limite inferior de la clase.
C: amplitud del intervaloNk-1: Frecuencia absoluta
del intervalo anterior al modal.
Nk+1: Frecuencia absoluta del intervalo posterior al modal.
Tiempo (horas) Marca de clase Fr. Absoluta[0 - 2) 1 6[2 - 4) 3 11[4 - 6) 5 5[6 - 8) 7 2[8 - 10] 9 3
Moda en datos agrupados Intervalo modal: [2 – 4), posee la
mayor frecuencia absoluta. Li: Limite inferior del intervalo =
2 C: amplitud del intervalo modal
=2 Nk-1: Frecuencia absoluta del
intervalo anterior = 6 Nk+1: Frecuencia absoluta del
intervalo posterior = 5
Formula:
M0 = 2,9 Horas
Ejercicios
1. Calcule la moda para los siguientes datos, los cuales reflejan el gasto mensual, de combustible para calefacción, expresado en miles de pesos.
2. Interprete la moda obtenida en el ejercicio anterior
Ejercicios Intervalo modal: [6 – 8), posee la mayor frecuencia absoluta.
Li: Limite inferior del intervalo = 6 C: amplitud del intervalo modal =2 Nk-1: Frecuencia absoluta del
intervalo anterior = 17 Nk+1: Frecuencia absoluta del
intervalo posterior = 14
Formula: M0= 6 + 2 ( 14 / (14 + 17))
M0 = 6,9 $ Miles
Interpretación: Lo más frecuente es que haya un gasto de $6.900 pesos mensualmente en combustible para la calefacción.
Media aritmética en datos agrupados La media aritmética
se obtiene de la siguiente formula:
Ejemplo: Calcular la media aritmética de:
Xmi: El valor de la variable o la marca de clase.
Fi: Frecuencia de absoluta.
Xi
Media aritmética en datos agrupados
Luego la media aritmética es:
= ( 1.068 / 30) = 35,6
Xi Xi
Ejercicios
1. Calcule la media aritmética de los datos que representan las horas que transcurren hasta que un trabajador sufre un accidente.
2. Interprete la media aritmética obtenida en el ejercicio anterior
Ejercicios
Interpretación: En promedio cada 3,9 horas un trabajador sufre un accidente.
Mediana en datos agrupados La mediana se obtiene por
interpolación, mediante la siguiente formula:
Ejemplo: Calcular la mediana para los siguientes datos:
Li: limite inferior de la clase medial.
C: amplitud del intervalo medial
Nk-1: Frecuencia absoluta acumulada del intervalo anterior al medial.
nk: Frecuencia absoluta del intervalo medial
Tiempo (horas) Marca de clase Fr. Absoluta[0 - 2) 1 6[2 - 4) 3 11[4 - 6) 5 5[6 - 8) 7 2[8 - 10] 9 3
Mediana en datos agrupados Condición a considera :
El intervalo medial es [2 – 4)
Ejercicios
1. Calcule la mediana para los siguientes datos, los cuales reflejan el gasto mensual, de combustible para calefacción, expresado en miles de pesos.
2. Interprete la moda obtenida en el ejercicio anterior
Ejercicios
Interpretación: El 50% de los casos de consumo mensual destinado a calefacción se encuentra antes de 7,65 $miles y el 50% restante de los consumos mensuales esta sobre los 7,65 $miles.
Nk > n/2 Nk-1 n/2 Nk > 77/2 = 38,5 Nk-1
77/2= 38,5
El intervalo medial es: [6 – 8)
Me = 6 + 2 x (38,5 – 17) / 26 Me = 7,65
Media aritmética ponderada en datos agrupados La media aritmética
ponderada, se obtiene de la siguiente formula:
Ejemplo: Calcular la media aritmética ponderada de:
Wi: La ponderación de la variable xi
:
ii
iii
nw
nwxwX
Media aritmética ponderada en datos agrupados
Luego la media aritmética PONDERADA es:
= ( 42 / 6) = 7
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
Estadígrafos de Localización: Cuartil, Decir y Percentil
Cuartiles Los cuartiles son puntos o
medidas que dividen a la muestra ordenada en cuatro grupos de igual tamaño.
Se denota Qi el cuartil i- ésimo con 3,2,1=i
Ejemplo: Calcular el cuartil 1, 2 y 3 de la siguiente tabla de horas asociadas hasta que ocurre un trabajo
Cuartiles Calculo del 1º cuartil.
1. Se construye la tabla de distribución de frecuencias acumuladas.
2. Se identifica la clase que contiene a Q1 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de n/4
Con n= 27 n/4 = 27/4 = 6,75
La frecuencia absoluta acumulada que supera a 6,75 pertenece al 2º intervalo [2-4)
Cuartiles Calculo del 1º cuartil.
3. Se utiliza la siguiente formula de interpolación:
Li: limite inferior de la clase del cuartil
C: amplitud del intervalo del cuartil
Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del cuartil
nk: Frecuencia absoluta del intervalo del cuartil.
Cuartiles Interpretación: El 25% de los accidentes ocurren antes
que el trabajador cumpla 2,14 horas de trabajo y el 75% restante de los accidentes ocurren sobre las 2,14 horas de trabajo.
Calculo del 2º cuartil. El 2º cuartil el cual comprende el
50% de los datos es equivalente a la mediana.
Q2 = Me
Cuartiles Calculo del 3º cuartil.
1. Se construye la tabla de distribución de frecuencias acumuladas.
2. Se identifica la clase que contiene a Q3 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de 3n/4
Con n= 27 3n/4 = (3 x 27)/4 = 20,25
La frecuencia absoluta acumulada que supera a 20,25 pertenece al 3º intervalo [4-6)
Cuartiles Calculo del 3º cuartil.
3. Se utiliza la siguiente formula de interpolación:
Li: limite inferior de la clase del cuartil.
C: amplitud del intervalo del cuartil.
Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del cuartil.
nk: Frecuencia absoluta del intervalo del cuartil.
Cuartiles
Interpretación:
El 75% de los accidentes ocurren antes que el trabajador cumpla 5,3 horas de trabajo y el 25% restante de los accidentes ocurren sobre las 5,3 horas de trabajo.
Ejercicio Propuesto La siguiente información corresponde al consumo mensual
en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno:
Calcule cada uno de los cuartiles e interprete su significado, en relación a la tabla de distribución
Diagrama de Caja Es una representación
semigráfica de una distribución constante.
Se utiliza cuando la muestra no es muy grande.
Construcción de una diagrama de caja:
1. Se ordenan los datos de la muestra, identificando el valor mínimo y el máximo, luego se obtiene el recorrido y los tres cuartiles.
2. Se dibuja un rectángulo cuyos extremos son Q1 y Q3 e indicar la posición de la mediana, mediante un segmento de recta vertical.
Así, dentro de la caja queda representado el 50% central de la información contenida en los datos.
Diagrama de Caja La tabla de distribución de
frecuencias adjunta indica el número de años de experiencia de una muestra de expertos en el área de administración de empresas.
Con esta información construya un diagrama de cajas
Diagrama de Caja SOLUCIÓN:
Xmin = 0 años.
Xmáx = 15 años.
Q1 = 3,7 años
Q2 = Me = 5,4 años
Q3 = 7,9 años.
Ejercicio Observe el siguiente diagrama de caja, el cual
representa la Deuda morosa de 5.400 clientes de la empresa CONAFE residentes en la comuna de Viña del Mar (Miles de $)
Realice 5 afirmaciones
Ejercicio1. El 25% de los deudores, deben
entre 10 y 20 mil pesos.
2. De los deudores, el 50% adeuda, cuando más, $35.000.
3. El 75% de los deudores, deben más de 20 mil pesos.
4. El 25% de los deudores, deben a lo menos $40 mil a CONAFE.
5. El 50% de los deudores, deben entre 20 y 40 mil pesos.
Deciles Los deciles son puntos o
medidas que dividen a la muestra ordenada en diez grupos de igual tamaño.
Se denota Di el decil i- ésimo con i = 1,2,3,...,9
Ejemplo: Calcular el decil 3 y 7 de la siguiente tabla de horas asociadas hasta que ocurre un trabajo
Deciles Calculo del 3º decil.
1. Se construye la tabla de distribución de frecuencias acumuladas.
2. Se identifica la clase que contiene a D3 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de
(3n)/10
Con n= 27 3n/10 = 3x27/10 = 8,1
La frecuencia absoluta acumulada que supera a 8,1 pertenece al 2º intervalo [2-4)
Deciles Calculo del 3º decil.
3. Se utiliza la siguiente formula de interpolación:
Li: limite inferior de la clase del decil
C: amplitud del intervalo del decil.
Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del decil.
nk: Frecuencia absoluta del intervalo del decil.
Di: Número del decil.
Deciles
Interpretación:
El 30% de los accidentes ocurren antes que el trabajador cumpla 2,38 horas de trabajo y el 70% restante de los accidentes ocurren sobre las 2,38 horas de trabajo.
Deciles Calculo del 7º decil.
Con n= 27 7n/10 = 7x27/10 = 18,9
El intervalo del 7º decil es [4 – 6)
Reemplazando:
D7 = 4 + 2 x [ (18,9 – 17)/5 ]
D7 = 4,76 Horas
Interpretación: El 70% de los accidentes ocurren antes que el trabajador cumpla 4,76 horas de trabajo y el 30% restante de los accidentes ocurren sobre las 4,76 horas de trabajo.
Ejercicio Propuesto La siguiente información corresponde al consumo mensual
en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno:
Calcule el 4º decil e interprete
Percentiles Los percentiles son
puntos o medidas que dividen a la muestra ordenada en cien grupos de igual tamaño.
Se denota Pi el perceptili- ésimo con i = 1,2,3,...,99
Ejemplo: Calcular el percentil 10 y 95 de la siguiente tabla de horas asociadas hasta que ocurre un trabajo
Percentiles Calculo del 10º percentil.
1. Se construye la tabla de distribución de frecuencias acumuladas.
2. Se identifica la clase que contiene a P10 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de
(10n)/100
Con n= 27 10n/100 = 10x27/100 = 2,7
La frecuencia absoluta acumulada que supera a 2,7 pertenece al 1º intervalo [0-2)
Percentiles Calculo del 10º percentil.
3. Se utiliza la siguiente formula de interpolación:
Li: limite inferior de la clase del percentil.
C: amplitud del intervalo del percentil.
Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del percentil.
nk: Frecuencia absoluta del intervalo del percentil.
Pi: Número del percentil.
Percentiles
Interpretación:
El 10% de los accidentes ocurren antes que el trabajador cumpla 0,9 horas de trabajo y el 90% restante de los accidentes ocurren sobre las 0,9 horas de trabajo.
Percentiles Calculo del percentil 95
Con n= 27 95n/100 = 95x27/100 = 25,65
El intervalo del percentil 95 es [8 – 10]
Reemplazando: P95 = 8 + 3 x [ (25,65 – 24)/3 ] P95 = 9,65 Horas
Interpretación: El 95% de los accidentes ocurren antes que el trabajador cumpla 9,65 horas de trabajo y el 5% restante de los accidentes ocurren sobre las 9,65 horas de trabajo.
Ejercicio Propuesto La siguiente información corresponde al consumo mensual
en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno:
Calcule el percentil 75 e interprete
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
Estadígrafos de Dispersión: Varianza, desviación Estándar
y Coeficiente de Variación
Estadígrafos de dispersión
Por si solas las Medidas de Posición no permiten caracterizar de cómo es una distribución.
Las Medidas de Dispersión, indican como se distribuyen las observaciones, generalmente con respecto a la media.
La dispersión se relaciona con la mayor o menor concentración de datos en torno a un valor central generalmente el promedio o media.
Varianza y Desviación Estándar Ambos estadígrafos están
relacionados.
La varianza se define, en datos no agrupados, como:
También se le define como:
La varianza se define, en datos agrupados, como:
n: Números de elementos de lamuestra.
: Media aritmética o promedio.
Xi: Valor de la variable.
ni: Frecuencia absoluta de la variable.
Varianza y Desviación Estándar
La Desviación Estándar o Desviación Típica es la raíz cuadrada de la varianza.
Para los datos no agrupados.
Para los datos agrupados.
Ejercicio Se dispone de la siguiente información sobre el consumo de
un producto envasado en latas.
Se encuestó a un grupo de 20 familias y se interrogó: ¿cuántas unidades de este producto, mensualmente consume su grupo familiar?
Calcule: Media Aritmética, Varianza y Desviación Estándar
Ejercicio RESULTADO: Media Aritmética: 2,3 unidades. Varianza: 2,61 unidades Desviación Estándar: 1,62 unidades.
Se clasifican los ingresos mensuales de los trabajadores, de una empresa (en miles de pesos), obteniéndose los siguientes resultados.
Calcule: Varianza y Desviación Estándar
Ejercicio
RESULTADO:
Media Aritmética: 675,93 pesos.
Varianza: 7150,62 pesos
Desviación Estándar: 84,30 pesos
Coeficiente de Variación
El coeficiente de variación permite comparar la dispersión entre dos poblaciones distintas e incluso, comparar la variación producto de dos variables diferentes (que pueden provenir de una misma población).
Formula:
Ejercicio La siguiente tabla muestra las horas de trabajo
transcurridas hasta que un trabajador sufre un accidente de trabajo, investigación realizada a una muestra de 27 accidentes de trabajo.
Calcule el coeficiente de variación e interprete.
Ejercicio
La media aritmética y la desviación estándar es:
El cálculo de coeficiente de variación:
Esto significa que existe una dispersión de un 62,98% en relación a la media.
Ejercicio
Se conoce la información respecto de los ingresos de los trabajadores de dos secciones de una empresa, A y B.
El ingreso promedio de los trabajadores de la sección A es de $950.000 con una desviación típica de $98.000.
Los trabajadores de la sección B tienen un ingreso promedio de $1.2000.000 con una desviación típica de $180.000
¿En cual de las dos secciones existe una dispersión relativa mayor? Justifique su respuesta.
Ejercicio
Dispersión relativa mayor en la sección B.
Asimetría Esta medida nos permite identificar si los datos se
distribuyen de forma uniforme alrededor del punto central (Media aritmética).
La asimetría presenta tres estados diferentes Se dice que la asimetría es positiva cuando la
mayoría de los datos se encuentran por encima del valor de la media aritmética,
La curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la curva.
Asimetría
La asimetría negativa es cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.
Asimetría
(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5).
(g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media.
Asimetría
(g1 < 0): La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la parte derecha de la media.
Entre mayor sea el número (Positivo o Negativo), mayor será la distancia que separa la aglomeración de los valores con respecto a la media.
Curtosis Esta medida determina el grado de concentración que
presentan los valores en la región central de la distribución.
Por medio del Coeficiente de Curtosis, se puede identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).
Curtosis (g2 = 0): la distribución es Mesocúrtica: Al igual
que en la asimetría es bastante difícil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (± 0.5 aprox.).
(g2 > 0): la distribución es Leptocúrtica
(g2 < 0): la distribución es Platicúrtica
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA