Download - 3ra med veter medidas de tendencia central
“Los tumores de estadio II fueron los más frecuentes (55,5%)”Estudio epidemiológico sobre el cáncer de mama. 2004
“…pero otras como leptospirosis y la rinotraqueitis infecciosa (VHB-1) están presentes constituyendo un riesgo sanitario, por lo que se recomienda maximizar las medidas de bioseguridad,…”
Dr. Mayhuasca Salgado RonaldDocente
Medidas de
tendencia central
ESTADÍSTICA2016-I
FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE MEDICINA VETERINARIA
Objetivos
•Conocer las principales medidas de resumen (síntesis de datos)
•Obtener la media, mediana y moda de las fuentes recolectadas
¿Cómo se comporta la variable?
ESTADÍSTICA DESCRIPTIVA
en cuanto
TENDENCIA CENTRAL VARIABILIDAD
Estadística Descriptiva• Organización de datos• Representación de datos: Tablas y Gráficos• Medidas de resumen
• Medición de datos numéricos1. Medidas de tendencia central2. Medidas de posición3. Medidas de dispersión4. Medidas de forma
• Medición de datos nominales1. Proporción2. Razón3. Medición epidemiológica
Medidas de tendencia central
ESTADÍSTICA DESCRIPTIVA
Nos informan de los valores centrales hacia los que se dirige la distribución: media, mediana y moda
Medidas de posición
Nos localizan un dato determinado dentro de la serie, informándonos acerca de la propia distribución: mediana y percentiles
Medidas de dispersión o variabilidad
Nos informan de los valores centrales hacia los que se dirige la distribución: rango, desviación media, desviación típica, varianza y coeficiente de variación de Pearson
Mald
on
ado
M. M
edicin
a Preven
tiva. Bio
estadística y e
pid
emio
logia.
Españ
a: Cu
rso in
tensivo
MIR
Astu
rias; 20
11
Las medidas de tendencia central y de dispersión se
usan juntos para establecer el comportamiento global
de una serie de datos…
Mald
on
ado
M. M
edicin
a Preven
tiva. Bio
estadística y e
pid
emio
logia.
Españ
a: Cu
rso in
tensivo
MIR
Astu
rias; 20
11…para saber a qué valor tienden a
agruparse y cuánto se separan de él…
Es la medida de tendencia central más simple y usada. Es el promedio
matemático de todos los valores que adquiere la variable.
Su determinación dependerá de:
1ro. Datos no agrupados en tablas de frecuencia
2do. Datos agrupados en tablas de frecuencia
MEDIA ARITMÉTICA
N= Número de elementos en la población
n= Número de elementos en la muestra
xi: valor individual o punto medio el intervalo
1ro. Datos no agrupados en tablas de frecuencia
𝜇 = 𝑖=1𝑁 𝑥𝑖 /𝑁Media poblacional: 𝝁
Media muestral: 𝒙 𝒙 = 𝑖=1𝑛 𝑥𝑖 /𝑛
Cálculo de la media aritmética
4995; 4993; 4994; 4996; 4998; 4992
Determine el volumen promedio.
Supóngase que con una pipeta de 5000 ul se toman muestras
de suero, después de pipetear en seis ocasiones generó las
siguientes medidas:
1ro. Datos no agrupados en tablas de frecuencia
Rpta 49947
Ejemplo de media aritmética
Ejemplo de media aritmética
xi= marca de clase
m= número de intervalos de clase
fi= frecuencia absoluta
2do. Datos agrupados en tablas de frecuencia
Cuando los datos están agrupados en tablas de frecuencia, la
media aritmética se calcula mediante la siguiente fórmula.
𝒙 = 𝑖=1𝑚 (𝑥𝑖. 𝑓𝑖 /𝑛)
Ejemplo de media aritmética
De la siguiente tablas de frecuencias calcular la media aritmética:
2do. Datos agrupados en tablas de frecuencia
Pto ebullic Xi fi Fi hi (%) Hi(%)
136-144 2 6,7
144-152 6 20
152-160 13 43,3
160-168 22 73,3
168-176 27 90
176-184 30Rpta 161,333°C
Características de la media aritmética
Su cálculo únicamente es posible en variables cuantitativas
(discretas o continuas), o sea no válidas para variables nominales
(grupos sanguíneos) ni ordinales (intensidad de dolor)
No recomendable en distribuciones muy asimétricas (valores muy
altos y muy bajos), pues la media aritmética es “arrastrada” por la
cola de los valores extremos,
Ejemplo: 1,2,3,4 y 140. La media es 30, y no es muy representativa de la distribución
Media ponderada
Media geométrica
Media armónica
Media cuadrática
Inverso de la media aritmética de los inversos de los valores de la variable
Raíz enésima del producto de los N valores de la variable. Es mejor estimador en datos de crecimiento exponencial
Empleada para dar distintos pesos a diferentes valores
Raíz cuadrada de la media aritmética de los cuadrados de los valores de la variable
MEDIA PONDERADA (𝑿𝑾)
Si cada observación Xi, tiene un peso o ponderación Wi, o sea cuando las observaciones no
tienen la misma importancia dentro de una muestra, entonces tenemos la media ponderada
que se calcula de la siguiente manera:
Rpta 10,4
Ejemplo: Las notas de un alumno de estadística en el semestre 2015-II fueron:
Determine el promedio ponderado del estudiante.
Curso Nota Crédito
Estadística 11 4
Anatomia 09 5
Anatomía de CC 12 3
MEDIANA
Es el valor de la variable que deja el mismo número de
observaciones por debajo y por encima de su valor..
La mediana representa el valor
central de una distribución de datos
ordenados en forma creciente o
decreciente…50% de los valores son
menores o iguales que él, y el otro
50% son mayores o iguales que él.
MEDIANA
Del ejemplo anterior: (1,2,3,4, 140): su mediana es 3 (deja 1 y 2 a un
lado, y 4 y 40 al otro)
No se influye por los valores extremos de una distribución muy
asimétrica, siendo en estos casos mejor medida de tendencia central
que la media.
En las distribuciones simétricas unimodales (distribución normal), la
media, mediana y la moda coinciden
Cálculo de la mediana
A. Datos NO agrupados en tablas de frecuencia
1ro: Se ordenan los datos en forma creciente o decreciente, y se
toma en cuenta lo siguiente:
Si, n es impar….la mediana es el valor central
Ejemplo: Los siguientes datos corresponden al contenido de flúor en el agua en partes por millón(ppm): 4520 4570 4520 4490 4500 4520 4590 4540 4500
Me = 𝑋𝑛+1
2
Cálculo de la mediana
A. Datos NO agrupados en tablas de frecuencia
1ro: Se ordenan los datos en forma creciente o decreciente, y se
toma en cuenta lo siguiente:
Si, n es par….la mediana es igual al promedio de
los 2 valores centrales
Me =𝑋𝑛
2+ 𝑋𝑛+1
2
2
4995; 4993; 4994; 4996; 4998; 4992
Determine la mediana
Supóngase que con una pipeta de 5000 ul se toman muestras
de suero, después de pipetear en seis ocasiones generó las
siguientes medidas:
Cálculo de la mediana
En este caso la mediana se calcula mediante la siguiente fórmula:
• X`me-1: límite inferior de la clase mediana
• Cme: tamaño del intervalo de la clase mediana
• Fme-1: frecuencia absoluta acumulada anterior a la
clase mediana
• fme: frecuencia absoluta de la clase mediana
Clase mediana: es aquel intervalo que contiene al
valor que ocupa la posición media, es decir contiene a
la mediana
Me = X`me-1 + Cme [
𝑛
2− Fme−1
fme
]
B. Datos agrupados en tablas de frecuencia
B. Datos agrupados en tablas de frecuencia
Ejemplo De la tabla de frecuencia anterior, calcule la mediana:
Pto ebullic Xi fi hi (%) Fi Hi(%)
136-144 140 2 6,7 2 6,7
144-152 148 4 13,3 6 20
152-160 156 7 23,3 13 43,3
160-168 164 9 30 22 73,3
168-176 172 5 16,7 27 90
176-184 180 3 10,0 30 100
• X`me-1: 160
• Cme: 8
• Fme-1: 13
• fme: 9
Rpta.
Me: 161,7778°C
Cálculo de la mediana
Características de la mediana
La mediana coincide con el percentil 50 (P50), siendo a la vez una
medida de tendencia central y de posición.
Se puede calcular en variables cuantitativas (continuas o discretas) y
en variables ordinales. No en variables nominales
Características de la mediana
Físicamente divide en dos partes iguales el área de un histograma
(50% a cada lado)
Media Mediana
Cuantitativas (continuas y
discretas)
Cuantitativas (continuas y discretas) y
cualitativas ordinales
No válida si valores muy extremos 8altos
o bajos)
Válida aún con valores extremos
Representa el valor que más se repite en un conjunto de
observaciones (el de mayor fi).
En una distribución puede haber uno o más valores que se repitan
con mayor frecuencia en tal caso se tienen dos o más modas.
Entonces:
- Si la distribución de frecuencias tiene un solo valor que más se
repite: UNIMODAL
- Si la distribución presenta dos o más valores que se repitan:
POLIMODAL
- Si no hay ningún valor que se repita con más frecuencia:
DISTRIBUCIÓN UNIFORME
MODA
MODA
Se puede determinar para cualquier tipo de variable: cualitativa o
cuantitativa
No se debe usar en series con pocos datos (fluctúa excesivamente al
azar) y pierde representatividad si es una distribución muy dispersa
Aporta escasa información en variables cuantitativas y prácticamente
no se usa en inferencia estadística. Más útil en variables cualitativas
Cálculo de la moda
A. Datos NO agrupados en tablas de frecuencia
1ro: Observar el dato que más se repite
Ejemplo:
Calcule la moda en cada caso:
• 4,5,6,7,4,5,4,6,5,5,4,5,5: Mo =5 (Unimodal)
• 7,7,6,8,8,6,8,7,7,9,12,11,10,8 Mo= 7 y 8 (bimodal)
Cálculo de la moda
B. Datos agrupados en tablas de frecuencia
En este caso la moda se calcula mediante la siguiente fórmula:
• X`mo-1: límite inferior de la clase modal
• Cmo: tamaño del intervalo de la clase modal
• d1: diferencia entre la frecuencia absoluta de la clase modal
menos la frecuencia absoluta anterior
• d2: diferencia entre la frecuencia absoluta de la frecuencia
modal menos la siguiente
Clase modal: es aquel intervalo con la
mayor frecuencia absoluta
Mo = X`mo-1 + Cmo [d1 / (d1 + d2 )]
Cálculo de la moda
B. Datos agrupados en tablas de frecuencia
Ejemplo
De la tabla de frecuencia anterior, calcule la moda:
Pto ebullic Xi fi hi (%) Fi Hi(%)
136-144 140 2 6,7 2 6,7
144-152 148 4 13,3 6 20
152-160 156 7 23,3 13 43,3
160-168 164 9 30 22 73,3
168-176 172 5 16,7 27 90
176-184 180 3 10,0 30 100
• X`mo-1: 160
• Cmo: 8
• d1: 9’-7 = 2
• d2: 9- 5 = 4
Rpta.
Mo: 162, 6667°C
En resumen….
Medidas de tendencia central: Valor central hacia el que tiende la distribución
Media aritmética: medida más simple y usada que promedia todos los valores de una distribución cuantitativa (continua o discreta). No recomendable en distribuciones muy asimétricas
Mediana: Deja la mitad de las distribuciones a cada lado, (coincide con el percentil 50). De elección en distribuciones asimétricas.
Moda: Valor más frecuente. Poco usada.
Relación entre la media aritmética, mediana y moda
Nótese que del cuadro anterior , para datos agrupados en tablas: la media
aritmética, la mediana y la moda poseen valores muy cercanos entre sí.
Mo: 162, 6667°C
Me: 161,7778°C
Pto ebullic Xi fi hi (%) Fi Hi(%)
136-144 140 2 6,7 2 6,7
144-152 148 4 13,3 6 20
152-160 156 7 23,3 13 43,3
160-168 164 9 30 22 73,3
168-176 172 5 16,7 27 90
176-184 180 3 10,0 30 100
𝑋 = 161,333°C
¿Cuál es el indicador más estable de la tendencia central, la mediana o la media?
La mediana es un indicador más estable de la
tendencia central. Por ejemplo, 10 estudiantes de
estadística consiguieron los siguientes
resultados en un examen de estadística: 41, 42,
42, 43, 44, 46, 48, 48, 50 y 98.
La mediana aquí es 45, y representa un valor
típico (aunque no un valor real) en esta muestra.
La media, por otro lado, es 50,2, una puntuación
superior al 90% de la muestra
Conclusiones
• La media, mediana y moda son medidas de tendencia central
• La media es, sencillamente , el promedio aritmético de los valores observados
• La mediana divide la distribución en dos grupos iguales
• La moda es el valor observado con mayor frecuencia en la distribución
• Puede haber más de una moda en un conjunto de datos
• La media resulta más afectada por los valores extremos que la mediana
No
rdn
essR
. Epid
emio
logía y estad
ística. Secretos. M
adrid
: Elsevier; 2
01
0.
Los siguientes datos corresponden a los ingresos netos de 20 individuos
subempleados (en soles):
415 460 510 475 430 410 425 490 500 470
450 425 485 470 450 455 460 480 475 465
Sin agrupar los datos en tablas de frecuencia calcule: la media
aritmética, mediana, moda e interprete.
RESUELVA
Repasemos lo aprendido
1. La media aritmética de las cifras de TAD de los 200 sujetos
es de 100mmHg
2. La mitad de los sujetos de la muestra tienen cifras iguales o
inferiores a 100mmHg
3. Todos los sujetos de la muestra tienen cifras de TAD
iguales o superiores a 100mmHg
4. La cifra de TAD que se ha observado en un mayor número
de sujetos es de 100mmHg
5. El 95% de los sujetos de la muestra tienen cifras de TAD
superiores a 100mmHg
1. MIR 97: En un estudio sobre una muestra de 200 sujetos hipertensos, se
informa que la tensión arterial diastólica (TAD) mediana observada es de
100mmHg. ¿Cuál es el significado correcto de esta afirmación?
Mald
on
ado
M. M
edicin
a Preven
tiva. Bio
estadística y e
pid
emio
logia.
Españ
a: Cu
rso in
tensivo
MIR
Astu
rias; 20
11
1. La media
2. La mediana
3. El sesgo
4. La moda
5. La proporción
2. MIR 92: ¿Cuál de las siguientes medidas definiría mejor la localización
(tendencia central) de los siguientes datos: 1,3,22, 4, 2?
Peso de truchas
1. No hay ningún paciente que sobreviva menos de 6 años
2. La mitad de los pacientes sobreviven aproximadamente 6
años
3. El valor esperado del tiempo de supervivencia es 6 años
4. No hay ningún paciente que sobreviva más de 6 años
5. La mitad de los pacientes sobreviven más de 6 años
3. MIR 10: Un estudio informa que la mediana de supervivencia de los
pacientes después del diagnóstico de cierto tipo de cáncer es de 6 años.
¿Esto qué quiere decir?