curso de estadística básica - uteq curso mars/sesiones...estadística básica cuartiles son los...
TRANSCRIPT
Estadística Básica
Curso de Estadística Básica
MCC. Manuel Uribe Saldaña
MCC. José Gonzalo Lugo Pérez
SESION 4
MEDIA Y DESVIACIÓN ESTÁNDAR DE
DISTRIBUCIONES DE FRECUENCIA,
MEDIDAS DE POSICIÓN
Estadística Básica
Objetivo
Calcular la media y desviación estándar de
diagramas de frecuencia. Conocer las medidas de
posición y su interpretación.
Estadística Básica
Agenda Sesión 4
• Revisión del examen de la sesión 1 y 2
• Media y desviación estándar en diagramas de frecuencia
• Medidas de Posición
– Cuartil
– Percentil
– Puntaje estándar
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
• Calcular la media, varianza
y desviación estándar para
el siguiente conjunto de
datos:
3 1 3 1 3 2 4
3 2 4 2 4 4 3
2 3 2 3 2 2 2
1 4 1 4 1 3 2
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
• Para calcular la media y la
varianza de la muestra, es
necesaria la suma de los 28
valores x y la suma de los
28 valores de x al cuadrado,
así:
• Del ejemplo anterior se
obtiene una distribución de
frecuencias:
x f
1 5
2 9
3 8
4 6
Suma 28
x =
Estadística Básica
Σx = 1 + 1 +…+ 1 + 2 + 2 +…+ 2 + 3 + 3 +…+ 3 + 4 + 4 +…+ 4
Media y Desviación estándar de
distribuciones de frecuencia
5 sumandos 9 sumandos 8 sumandos 6 sumandos
Σx = (5)(1) + (9)(2) + (8)(3) + (6)(4)
Σx = 5 + 18 + 24 + 24 = 71
Σx2 = 12 +…+ 12 + 22 +…+ 22 + 32 +…+ 32 + 42 +…+ 42
5 sumandos 9 sumandos 8 sumandos 6 sumandos
Σx2 = (5)(1) + (9)(4) + (8)(9) + (6)(16)
Σx2 = 5 + 36 + 72 + 96 = 209
Estadística Básica
Se utilizará la distribución de frecuencias para determinar las
sumatorias, obteniendo una tabla de extensiones:
Media y Desviación estándar de
distribuciones de frecuencia
x f xf x2f
1 5 5 5
2 9 18 36
3 8 24 72
4 6 24 96
Suma 28 71 209
Número de
datos
Suma de x, Σxf,
usando las
frecuencias.
Suma de x2, Σx2f,
usando las
frecuencias.
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
• Para encontrar la media
de una distribución de
frecuencias se tiene:
x barra =suma de x, usando frecuencias
número
x =ΣxfΣf En la fórmula para la media se utiliza n,
x =ΣxfΣf
= 771
282.536
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Media y Desviación estandar de
distribuciones de frecuencia
• Para encontrar la varianza de
la distribución de frecuencias
se tiene:
s cuadrada =(suma de x2, usando frecuencias) – (suma de x, usando frecuencias)2
número - 1
número
073.127
964.28
128
28
71209
1
22
2
2
f
f
xffx
s
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
• Para encontrar la
Desviación estándar de la
distribución de
frecuencias se tiene:
036.1073.12 ss
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Ejercicios
1. Encontrar la media, la varianza y la desviación
estándar de la muestra de 50 puntajes de examen,
usando la distribución de frecuencias agrupadas:
Numero de clases Marca de clase, x f
1 40 2
2 50 2
3 60 7
4 70 13
5 80 11
6 90 11
7 100 4
Media: 75.6
Varianza: 221.1
Desviación Estándar: 14.9
Estadística Básica
Ejercicios
2. Una empresa productora de láminas metálicas utiliza varios reparadores de
problemas para hacer composturas de emergencia en los hornos. Por lo común, este
personal realiza varios viajes cortos. Para efectos de estimar los gastos por viajes
del año próximo, la empresa tomó una muestra de 20 cupones de gastos de viaje
relacionados con la reparación de dichos problemas. Se obtuvo la siguiente
información:
Calcule la media y la desviación estándar de estas cantidades de gastos por viaje en
dólares.
Media: 21.00
Desviación Estándar: 9.95
Cantidad de dólares en cupones Número de cupones
$0.00 - 10.00 2
$10.00 - 20.00 8
$20.00 - 30.00 7
$30.00 - 40.00 2
$40.00 - 50.00 1
Total de la muestra 20
Estadística Básica
Estadística descriptiva
Medidas de
tendencia
central
Medidas de
dispersión
Medidas de
posición
Tipos de
distribución
Estadística Básica
Cuartiles
Son los valores de la variable que dividen en cuartos a los datos
ordenados; cada conjunto de datos posee tres cuartiles. El primer cuartil,
Q1,es el número tal que cuando mucho el 25% de los datos es menor en
valor que Q1 y cuando mucho el 75% de los datos es mayor que Q1. El
segundo cuartil es la media. El tercer cuartil, Q3 , es un número tal que
cuando mucho el 75% de los datos es menor en valor que Q3 y cuando
mucho el 25% de los datos es mayor que Q3
25% 25% 25% 25%
Mín MáxQ1 Q2 Q3
Datos clasificados en orden creciente
Estadística Básica
Percentiles
Son los valores de la variable que dividen a un conjunto de datos
ordenados en 100 subconjuntos iguales; cada conjunto de datos tiene 99
percentiles. El k-ésimo percentil, Pk, es un valor tal que cuando mucho k%
de los datos son más pequeños en valor que Pk y cuando mucho (100-k)%
de los datos es mayor.
1% 1% 1% 1%
Mín P5P1 P2 P3
1% 1% 1% 1%
MáxP97 P98 P99
Datos clasificados en orden creciente
A lo más k A lo más (100 – k)%
Mín MáxPk
Estadística Básica
Percentiles
Notas:
1. El primer cuartil y el 25avo percentil son iguales; es decir, Q1 = P25.
También, Q3 = P75.
2. La mediana, el segundo cuartil, y el 50avo percentil son iguales.
De esta forma, cuando se pida encontrar P50 o Q2, se puede aplicar el
procedimiento para encontrar la mediana.
502~ PQx
Estadística Básica
Procedimiento para determinar el valor de
cualquier k-ésimo percentil o cuartil
Ordenar los datos, del más chico al
más grande
5.)( APd k
Se obtiene un entero A
Pk está a la mitad entre
el valor del dato en la
A-ésima posición y el
valor del siguiente dato.
100
nkCalcular
Se obtiene un número
con una fracción
BPd k )(
Pk, es el valor del dato
en la B-ésima posición
Paso 1
Paso 2
Paso 3
Paso 4
Estadística Básica
Ejemplo
• Con la muestra de 50 puntajes del examen final del
curso de estadística elemental que se observa en la
tabla, determinar el primer cuartil, Q1, el 58avo percentil,
P58, y el tercer cuartil, Q3.
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 68 97 70 64 70 70
58 78 89 44 55 85 82 83 72 77
72 86 50 94 92 80 91 75 76 78
Estadística Básica
Ejemplo
• Paso 1
– Ordenar los datos
39 64 72 78 89
44 66 72 80 90
47 67 74 82 90
50 68 74 82 91
55 68 75 83 92
58 70 76 85 94
58 70 77 86 95
60 70 77 86 95
63 72 77 88 97
64 72 78 88 98
Datos ordenados: puntajes del examen de estadística
Estadística Básica
Ejemplo
Paso 2Encontrar
n = 50 y k = 25, ya que Q1 = P25
Paso 3Encontrar la profundidad de Q1; d(Q1)=13 (Debido a que 12.5contiene una fracción, B está más próximo al siguiente enteromás grande, 13)
Paso 4Encontrar Q1: Q1 es el 13avo valor contando a partir delMínimo. Q1 = 67
5.12100
)25)(50(
100
nk
Estadística Básica
P58
Paso 2Encontrar
n = 50 y k = 58, debido a P58
Paso 3Encontrar la profundidad de P58; d(P58) = 29.5 (Como A = 29(un entero), se suma .5 y se usa 29.5)
Paso 4Encontrar P58: P58 es el valor que está a la mitad entre losvalores de las porciones de datos 29ava y 30ava, contando apartir del Mínimo.
P58 = (77 + 78)/2 = 77.5
29100
)58)(50(
100
nk
Estadística Básica
Q3
Estadística Básica
Puntaje estándar (puntaje z)
• Posición que tiene un
valor particular de x con
respecto a la media,
medida en desviaciones
estándar. El puntaje z se
calcula con la fórmula:
s
xxz
Estadística Básica
Ejemplo
• Encontrar los puntajes estándar para a) 92 y b) 72 con respecto a una
muestra de puntajes de un examen que tiene como media de 74.9 y una
desviación estándar de 14.19
20.019.14
9.7472,.19.14;9.74,72
20.119.14
9.7492,.19.14;9.74,92
s
xxzAsísxx
s
xxzAsísxx
Lo anterior significa que el puntaje 92 está a 1.2 desviaciones estándar
por arriba de la media, mientras que el puntaje 72 está a 0.2
desviaciones estándar por debajo de la media.
Estadística Básica
Notas
1. Normalmente, el valor calculado de z se redondea
al centésimo más próximo
2. El intervalo de variación aproximado del valor de
los puntajes z suele ir de -3.00 a +3.00
Estadística Básica
Ejercicios
1. Una muestra tiene una media de 50 y una
desviación estándar de 4. Encuentre el puntaje z
para cada valor de x.
• X=54
• X=50
• X=59
• X=45
Estadística Básica
Ejercicios
2. Un examen que se administró a nivel nacional tuvo
una media de 500 y una desviación estándar de
100. Si el puntaje z normal de un estudiante en
este examen fue de 1.8, ¿cuál es su calificación en
el examen?
Estadística Básica
Ejercicios
3. ¿Qué valor x tiene el mayor valor con respecto al
conjunto de datos del que proviene?
• X=85, donde la media = 72 y la desviación
estándar = 8
• X=93, donde la media = 87 y la desviación
estándar = 5
Estadística Básica
Ejercicios
4. Considere el siguiente conjunto de tiempos de
ignición que fueron registrados para una tela
sintética
Encuentre: a) La mediana, b) El rango medio, c) El
cuartil medio, c) Q2
30,1 30,1 30,2 30,5 31,0 31,1 31,2 31,3 31,4
31,5 31,6 31,6 32,0 32,4 32,5 33,0 33,0 33,5
34,0 34,5 34,5 35,0 35,0 35,6 36,5 36,9 37,0
37,5 37,5 37,6 38,0 39,5
Estadística Básica
Ejercicios
5. ¿Qué valor x tiene la menor posición relativa con
respecto al conjunto de datos del que proviene?
• X=28, donde la media = 25.7 y la desviación
estándar = 1.8
• X=39.2, donde la media = 34.1 y la desviación
estándar = 4.3
Estadística Básica
Teorema de Chebyshev
La proporción de cualquier distribución que esté a
menos de k desviaciones estándar de la media es
por lo menos
Donde k es cualquier número positivo mayor que 1.
Este teorema es válido para todas las distribuciones
de datos.
2
11
k
Estadística Básica
Teorema de Chebyshev
Este teorema establece que a menos de dos
desviaciones estándar de la media (k = 2) siempre
se encontrará por lo menos el 75% (o más) de los
datos.
s
xX-2s X+2s
Por lo menos el 75%