medidas de tendencia central y dispercion
TRANSCRIPT
Caracterización de variables cuantitativas
José David Ojeda
Datos no agrupados
Medidas de tendencia central
Medidas de tendencia central
1. El diagrama de dispersiónEs la representación de los datos en la recta numérica mediante puntos.Ejemplo: A continuación se relacionan las cantidades de artículos vendidos en una tienda de computadores durante 15 días.25, 32, 20, 21, 29, 26, 30, 25, 19, 22, 17, 28, 30, 21, 40.
1. El diagrama de dispersión• Elaborar un diagrama de dispersión y
analizarlo.
En la gráfica se puede observar que la mayoría de los datos, exceptuando el dato 40, se encuentran cercanos entre si. Es decir que el numero de artículos vendidos fue muy parecido en 14 de los 15 días.
17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Medidas de tendencia central
2. La Media:La media aritmética o promedio se representa por y se interpreta como el individuo típico de la población:
1 2 31,
n
ini
XX X X X
Xn n
X
2. La Media:• Ejemplo: El jefe de recursos humanos de
una empresa esta interesado en determinar el numero medio de cigarrillo que consumen los trabajadores en un día. Para ello pregunto a 16 empleados por la cantidad de cigarrillos que fumaron ese día, los resultados fueron:
• 3 1 4 7 6 7 0 4 6 2 3 1 0 2 2 0Calcular el numero promedio de cigarrillos que consume un trabajador.
2. La Media:• Solución: Calculamos la media aritmética
El numero medio de cigarrillos que consume un trabajador en un día es de tres. Se espera que al escoger al azar un empleado de la empresa, fume alrededor de 3 cigarrillos
3 1 4 7 6 7 0 4 6 2 3 1 0 2 2 016
X
483
16X
Medidas de tendencia central
3. La Mediana:Es el dato que divide un grupo de datos en dos partes iguales. Se simboliza .Para calcular la mediana es necesario ordenar los datos de menor a mayor, una vez ordenados se ubica el valor que esta en el centro de ellos.
3. La Mediana:• En el calculo de la mediana se pueden
presentar dos casos:• Caso 1: Numero de datos impar: En
este caso se suma 1 a la cantidad de datos y se divide entre 2. La mediana será el dato que esta en esa posición.Por ejemplo si se tienen 11 datos, la mediana estará en la posiciónluego de ordenar los datos.11 1
62
3. La Mediana:
• Ejemplo: Un biólogo desea probar que el diámetro del tronco de un árbol influye en la producción de oxigeno para ello hace la medición del diámetro de 7 arboles en centímetros:110, 79, 128, 161, 158, 175, 50.Calcular la mediana de los diámetros de tronco.
3. La Mediana:
• Solución:Ordenamos los datos de menor a mayor50, 79, 110, 128, 158, 161, 175
Se concluye que el 50% de los diámetros de tronco son iguales o superior a 128.
47 12
128x x
3. La Mediana:• Caso 2: Numero de datos par: Se
divide el total de datos entre 2. Se toma el dato que esta en esa posición y el dato siguiente, la mediana será el promedio de estos dos datos.
3. La Mediana:• Ejemplo 2: En un simulacro se midió el
tiempo de reacción de seis patrullas de policías luego de recibir una llamada de emergencia. Los resultados en minutos fueron:
6,0 5,99 5,41 5,44 5,21 5,48Calcular la mediana de los tiempos de reacción.
• Solución: Ordenamos los datos de menor a mayor.
3. La Mediana:
5,21 5,41 5,44 5,48 5,99 6,0
Se puede concluir que el 50% de las patrullas llegaron en 5,46 minutos o menos.
6 61
2 2 3 4 5,44 5,485,46
2 2 2
x xx x
Medidas de Dispersión
Medidas de Dispersión
Medidas de Dispersión
Medidas de Dispersión
2
2 1
( )
1
n
ii
x XS
n
Medidas de Dispersión• Ejemplo: El entrenador de un equipo
de futbol pregunto a los jugadores sobre el tiempo en horas que dedican al entrenamiento por semana. Los resultados fueron:
5, 5, 6, 8, 7, 7, 9, 5, 6, 8, 4, 11, 6, 10, 8.
Solución: Hallamos la media de los datos
5 5 6 8 7 7 9 5 6 8 4 11 6 10 815
X
10515
7X
Medidas de Dispersión• Hallamos la desviación de cada uno de
los datos con respecto a la media y su cuadrado.
• Teniendo en cuenta la tabla anterior, la varianza es:
2 4 4 1 1 0 0 4 4 1 1 9 16 1 9 115 1
S
2 25614
4 HorasS
Medidas de Dispersión
3. Desviación EstándarSe nota como S, y es la raíz cuadrada de la varianza
La desviación estándar se utiliza para interpretar el comportamiento de los datos y la representatividad del promedio
2
2 1
( )
1
n
ii
x XS S
n
Medidas de Dispersión
• La varianza al ser sumada y restada dos veces a la media, proporciona un intervalo en el cual se encuentra el 95% de los datos, este intervalo se denomina intervalo de extremos :
• Si este intervalo es muy grande, se dice que el promedio no representa bien a los datos. En el caso contrario se dirá que el promedio es un buen representante de los datos.
2 , 2X s X s
Medidas de Dispersión• Para el ejemplo del equipo de futbol
la desviación estándar sería:
• Construimos el intervalo de extremos:
Se observa que los datos están muy alejados entre si, ya que el 95% de los futbolistas entrena entre 3 y 11 horas semanales.
2 2 2 Horas4 HorasSS
7 2(2) 2 , 2 3, 7 2(2) , 11X s X s
Medidas de Dispersión
• Ejemplo: A continuación se muestran las edades de 20 pacientes del pabellón de adultos del Hospital General55, 78, 50, 41, 55, 35, 41, 42, 51, 54, 41, 54, 72, 76, 75, 47, 62, 59, 75, 46.
• Caracterizar la variable utilizando la media, el rango, la varianza y la desviación estándar y el intervalo de extremos.
Medidas de Dispersión
1). Hallamos la media
2). Hallamos el rango
55 78 50 41 55 35 41 42 51 54 41 54 72 76 75 47 62 59 75 4620
X
110920
55,45X
78 35
43
Mayor MenorRango D D
Rango
Rango
Medidas de Dispersión
3). Hallamos la VarianzaEn la siguiente tabla hallamos la desviación de cada dato y el cuadrado de estaDato 55 78 50 41 55 35 41 42 51 54
Desviación
-0,45 22,55 -5,45-
14,45-0,45
-20,45
-14,45
-13,45
-4,45 -1,45
Cuad. Des.
0,203
508,5
29,7208,
80,20
3418,
2208,
8180,
919,8
2,103
Dato 41 54 72 76 75 47 62 59 75 46
Desviación
-14,45
-1,45 16,55 20,55 19,55 -8,45 6,55 3,55 19,55 -9,45
Cuad. Des.
208,8
2,103
273,9
422,3
382,2
71,4 42,9 12,6382,
289,3
Medidas de Dispersión
• Utilizando los resultados de la tabla anterior, hallamos la varianza:
4). Hallamos la Desviación Estándar:
2 20,203 508,5 29,7 ... 89,3
20 1182,36 añosS
2 2182,36 añ 13,5 os añosS S
Medidas de Dispersión5). Hallamos el intervalo de extremos
Dentro de este intervalo se encuentra el 95% de los datos, como el intervalo es muy grande, aproximadamente de 28 a 83 años, la variabilidad es muy alta.Las edades de los pacientes son entonces muy heterogéneas, la media no representa bien los datos
55,45 2(13,5) 55,45 2(13,5)
2 , 2 ,
28, , 45 82,45
X s X s