curso de estadística básica - uteq.edu.mx curso mars/sesiones/pdf... · se considera una muestra...
TRANSCRIPT
Estadística Básica
Curso de Estadística Básica
MCC. Manuel Uribe Saldaña
MCC. José Gonzalo Lugo Pérez
SESION 2
PRESENTACIÓN GRÁFICA DE DATOS
Estadística Básica
Objetivo
Aprender cómo presentar y describir conjuntos de
datos
Estadística Básica
Agenda Sesión 2
• Presentación gráfica
de datos
– Diagramas de pastel
y gráficas de barras
– Diagrama de Pareto
– Gráfica de Puntos
– Distribución de
frecuencia
– Histogramas
Estadística Básica
Resultados del examen de
matemáticas…
Calificación: 78
E: ¿Cuál fue la calificación promedio del examen?
I: el promedio del salón fue de 68
E: ¿cuán próxima del máximo está mi calificación?
I: las calificaciones variaron de 42 a 87 puntos.
42 68 78 87
Estadística Básica
Resultados del examen de
matemáticas…
Calificación: 78
E: ¿Cómo están distribuidas las calificaciones?
I: la mitad del grupo obtuvo calificaciones entre 65 y 75.
Conclusión del estudiante: su calificación es buena
Estadística Básica
Reflexión…
• Conjunto de datos: Calificaciones del examen
• Estadísticas descriptivas: calificación promedio y calificaciones máxima y mínima
• Con esta información los estudiantes pueden obtener conclusiones sobre su éxito relativo
Estadística Básica
Estadística descriptiva
Medidas de
tendencia
central
Medidas de
dispersión
Medidas de
posición
Tipos de
distribución
Estadística Básica
Gráficas
• Una vez recolectado los datos de la muestra, es necesario“familiarizarse” con ellos.
• Aplicar una técnica inicial exploratoria de análisis de datos queproduzca una representación visual.
• Las representaciones visuales revelan patrones de comportamientode la variable de estudio.
• Existen muchas formas gráficas (visuales) para describir los datos.
• El método que se aplique es determinado por el tipo de datos y elconcepto a representar.
NOTA: Cuando se elabora una representación gráfica no existe solamente unarespuesta correcta. El juicio del analista y las circunstancias que rodean alproblema desempeñan un papel primordial en el desarrollo de la gráfica.
Estadística Básica
Diagramas de pastel
• Gráficas que se utilizan
para resumir datos de
atributo (cualitativos).
Los diagramas de pastel
muestran la cantidad de
datos que pertenecen a
cada categoría como
una parte proporcional
de un círculo.
Estadística Básica
Ejemplo
Tipo de operación Número de casos
Torácica 20
Huesos y articulaciones 45
Ojos, oídos, nariz y garganta 58
General 98
Abdominal 115
Urológicas 74
Proctológicas 65
Neurocirugía 23
Total 498
En la tabla se muestra el número de casos de cada tipo
de operación realizada en el Hospital General, el año
pasado
Estadística Básica
EjemploEstos datos se muestran en un diagrama de pastel, donde cada tipo de operación
está representado por una proporción relativa del círculo identificada con un
porcentaje.
Estadística Básica
Diagramas de barras
• Gráficas que se utilizan
para resumir datos de
atributo (cualitativos).
Las gráficas de barras
muestran la cantidad de
datos que pertenecen a
cada categoría como
áreas rectangulares de
tamaño proporcional.
Estadística Básica
EjemploEn la figura se presentan los mismos datos sobre el “tipo de operación” en forma de
gráfica de barras
Estadística Básica
Pregunta
• En su opinión, con qué
gráfica, diagrama de
pastel o gráfica de
barras, se obtiene una
mejor representación de
la información?
Estadística Básica
Respuesta
• La gráfica de círculo
facilita la comparación
visual de los tamaños
relativos de las partes
entre sí y el tamaño de
cada parte con respecto
al todo.
Estadística Básica
Diagrama de Pareto
Gráfica de barras con éstas dispuestas de la categoría más numerosa a la
menos numerosa. Incluye una gráfica hecha a base de rectas que muestra
los porcentajes acumulados y la cantidad de datos representada por cada
barra. Es una representación gráfica de los datos obtenidos sobre un
problema, que ayuda a identificar cuáles son los problemas prioritarios que
hay que tratar
Estadística Básica
Ejemplo
Estadísticas de delitos por animadversión cometidos en 1993
0
500
1000
1500
2000
2500
3000
3500
4000
4500
Can
tid
ad
0,00%
20,00%
40,00%
60,00%
80,00%
100,00%
120,00%
Po
rcen
taje
Cantidad 4168 1189 806 583
Porcentaje acumulado 61,78% 79,41% 91,36% 100,00%
Racial Religioso Sexual Étnico
Estadística Básica
Consejos para elaborar y usar los
diagramas de Pareto
• No es conveniente que la categoría de “otros”represente un porcentaje de los más altos. De ser así,se debe utilizar un método diferente de clasificación.
• Es preferible representar los datos (si es posible) envalores monetarios.
• Si un factor se puede solucionar fácilmente debeafrontarse de inmediato aunque sea de pocaimportancia.
• Es imprescindible realizar un diagrama de causas si sequieren realizar mejoras
Estadística Básica
Ejercicio
1. Se tienen los datos de una
inspección final de defectos para la
línea de ensamble A12
organizados en la siguiente tabla:
2. Representar los datos en un
diagrama de pareto
Defecto Cantidad
Manchado 56
Rayado 45
Astillado 23
Doblado 12
Abollado 8
Otros 6
Estadística Básica
Pareto de la línea de ensamble A12
Defectos del producto
0
10
20
30
40
50
60
Can
tid
ad
0,0%
20,0%
40,0%
60,0%
80,0%
100,0%
120,0%
Po
rcen
taje
Cantidad 56 45 23 12 8 6
Porcentaje acumulado 37,3% 67,3% 82,7% 90,7% 96,0% 100,0%
Manchado Rayado Astillado Doblado Abollado Otros
Estadística Básica
Ejercicio propuesto
Utilizando como herramienta el diagrama de Pareto, analice las pérdidas
por rechazos en una fábrica de papel, teniendo en cuenta que se han
detectado los conceptos que se muestran en la tabla siguiente, en la que
también se indican los costes asociados a cada concepto.
Estadística Básica
Gráficas para datos cuantitativos
• Una razón fundamental para elaborar una gráfica de datos cuantitativos esmostrar la distribución de éstos.
Distribución
• Patrón de variabilidad mostrado por los datos de una variable. Ladistribución muestra la frecuencia de cada valor de la variable.
Estadística Básica
Gráfica de puntos
• Presenta los datos de una muestra mediante la representación de cada porción de
datos con un punto ubicado a lo largo de una escala. Esta escala puede ser vertical u
horizontal. La frecuencia de los valores está representada a lo largo de la otra
escala.
19 Calificaciones del examen
0
0,5
1
1,5
2
2,5
3
3,5
0 20 40 60 80 100 120
Calificación
Fre
cu
en
cia
Estadística Básica
Gráfica de puntos
• La gráfica de puntos es una técnica que conviene utilizar alinicio del análisis de los datos. Esta representación da porresultado una imagen y una clasificación de los datos en ordennumérico. (Clasificar datos es ordenarlos según el valornumérico)
Estadística Básica
Ejercicio
Se eligió una muestra aleatoria de 50 estudiantes universitarios. Sus pesos
fueron obtenidos de sus registros médicos. En la siguiente tabla se
muestran los datos resultantes: obtener el diagrama de puntos y una
conclusión
Estudiante 1 2 3 4 5 6 7 8 9 10
Sexo: Masculino (M)
Femenino (F) F M F M M F F M M F
Peso 98 150 108 158 162 112 118 167 170 120
Estudiante 11 12 13 14 15 16 17 18 19 20
Sexo: Masculino (M)
Femenino (F) M M M F F M F M M F
Peso 177 186 191 128 135 195 137 205 190 120
Estudiante 21 22 23 24 25 26 27 28 29 30
Sexo: Masculino (M)
Femenino (F) M M F M F F M M M M
Peso 188 176 118 168 115 115 162 157 154 148
Estudiante 31 32 33 34 35 36 37 38 39 40
Sexo: Masculino (M)
Femenino (F) F M M F M F M F M M
Peso 101 143 145 108 155 110 154 116 161 165
Estudiante 41 42 43 44 45 46 47 48 49 50
Sexo: Masculino (M)
Femenino (F) F M F M M F F M M M
Peso 142 184 120 170 195 132 129 215 176 183
Estadística Básica
Distribuciones de frecuencia
Los listados de grandes conjuntos de datos no presentan una imagen
valiosa. A veces se desea condensar los datos en una forma más
manejable. Esto puede lograrse con ayuda de una distribución de
frecuencia.
Distribución de frecuencias
Listado, a menudo expresado en forma de diagrama, que asocia cada valor
de una variable con su frecuencia.
Estadística Básica
Ejemplo
3 2 2 3 2
4 4 1 2 2
4 3 2 0 2
2 1 3 3 1
Si x representa una variable, puede usarse una distribución de frecuencias para
representar este conjunto de datos enumerando los valores x con sus
frecuencias. Por ejemplo, el valor 1 se presenta tres veces en la muestra; por
tanto, la frecuencia de x = 1 es 3.
Se tiene el siguiente conjunto de datos:
x f
0 1
1 3
2 8
3 5
4 3
Estadística Básica
Frecuencia
La frecuencia f es el número de veces que aparece el valor x en la muestra.
La tabla anterior es una distribución de frecuencias no agrupadas,
porque cada valor de x en la distribución permanece solo. Cuando un gran
conjunto de datos tiene muchos valores x distintos, es posible agrupar los
valores en un conjunto de clases y elaborar una distribución de
frecuencias agrupadas.
Estadística Básica
Ejercicio
Forme una distribución de frecuencias no agrupadas de
los datos resultantes: 1, 2, 1, 0, 4, 2, 1, 1, 0, 1, 2, 4
Estadística Básica
Distribución de frecuencias Agrupadas
y No Agrupadas
Calificaciones Frecuencia
52 1
62 1
66 1
68 1
72 1
74 2
76 3
78 2
82 2
84 1
86 1
88 1
92 1
96 1
Total 19
De un grupo grande se extrajo aleatoriamente una muestra de 19 calificaciones
de un examen: 76 74 82 96 66 76 78 72 52 68
86 84 62 76 78 92 82 74 88
Distribución de frecuencias no agrupadas
Distribución de frecuencias agrupadas
Clase Frecuencia
50 ≤ x < 60 1
60 ≤ x < 70 3
70 ≤ x < 80 8
80 ≤ x < 90 5
90 ≤ x < 100 2
Total 19
50 o más hasta menos que 60
60 o más hasta menos que 70
70 o más hasta menos que 80
80 o más hasta menos que 90
90 o más hasta menos que 100
Estadística Básica
19 Calificaciones del examen
0
0,5
1
1,5
2
2,5
3
3,5
0 20 40 60 80 100 120
Calificación
Fre
cu
en
cia
19 Calificaciones del examen
0
1
2
3
4
5
6
7
8
9
0 20 40 60 80 100 120
Calificacion
Fre
cuen
cia
Distribución de frecuencias no agrupadas
Distribución de frecuencias agrupadas
Distribución de frecuencias Agrupadas
y No Agrupadas
Estadística Básica
Procedimiento para elaborar una
distribución de frecuencias agrupadas
1. Cada clase debe ser del mismo ancho
2. Las clases deben estar dispuestas de modo que no se superpongan y que cada porción de información pertenezca exactamente a una clase
3. La raíz cuadrada de n es un lineamiento razonable para el número de clases con muestras de menos de 150 datos.
4. Utilizar un sistema que aproveche un patrón numérico, para garantizar precisión
5. Cuando sea conveniente, un ancho de clase par suele ser ventajoso
Estadística Básica
Ejemplo
Se considera una muestra de 50 puntajes del examen
final del curso de estadística básica. A continuación se
muestran los puntajes:
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 68 97 70 64 70 70
58 78 89 44 55 85 82 83 72 77
72 86 50 94 92 80 91 75 76 78
Estadística Básica
Procedimiento
1. Identifique los puntajes máximo y mínimo y determine el rango.
Máx = 98, Mín = 39.
Rango = Máx – Mín = 98 – 39 = 59
2. Elija un número de clases m y un ancho de clase c de modo que elproducto mc sea ligeramente mayor que el rango
m = raíz cuadrada de n = 50
m = 7
c = 10
mc = 70 Es mayor que el rango = 59
Estadística Básica
Procedimiento
3. Elija un punto inicial, que debe ser algo menor que el puntaje másbajo (min). Posteriormente se cuenta a partir de ahí enincrementos del ancho de clase. Cada número obtenido sedenomina límites de clase.
35 ≤ x < 45
45 ≤ x < 55
55 ≤ x < 65
65 ≤ x < 75
75 ≤ x < 85
85 ≤ x < 95
95 ≤ x < 105
Estadística Básica
Procedimiento
4. Una vez establecidas las clases, es necesario clasificar los datosen dichas clases. El método utilizado para realizar la clasificacióndepende del formato actual de los datos: si los datos estánordenados, es posible contar las frecuencias; si los datos no estánordenados, se efectúa un conteo de éstos para determinar losnúmeros de frecuencia. Cuando se efectúa la clasificación de losdatos, es de utilidad usar un diagrama estándar.
Número de clases Límites Frecuencia
1 35 ≤ x < 45 2
2 45 ≤ x < 55 2
3 55 ≤ x < 65 7
4 65 ≤ x < 75 13
5 75 ≤ x < 85 11
6 85 ≤ x < 95 11
7 95 ≤ x < 105 4
50
Estadística Básica
Notas
1. Si se han ordenado los datos (en forma de lista, gráficade puntos o representación de tallo y hojas) el conteoes innecesario; simplemente se cuentan los datos quepertenecen a cada clase.
2. Si los datos no están ordenados, debe tenerse cuidadoal efectuar el conteo.
3. La frecuencia f para cada clase es el número de datosque pertenecen a esa clase.
4. La suma de frecuencias debe ser exactamente igual alnúmero de datos n (n = Σf). Esta sumatoria es unaverificación aceptable.
Estadística Básica
Notas
5. Cada clase requiere un solo valor numérico para representar todos
los valores de datos que caen en esa clase. La marca de clase
(algunas veces denominada punto medio de clase) es el valor
numérico que está exactamente a la mitad de ésta y se encuentra
al sumar los límites de clase y dividirlo entre 2.
Número de clases Límites Frecuencia Marca de clase
1 35 ≤ x < 45 2 40
2 45 ≤ x < 55 2 50
3 55 ≤ x < 65 7 60
4 65 ≤ x < 75 13 70
5 75 ≤ x < 85 11 80
6 85 ≤ x < 95 11 90
7 95 ≤ x < 105 4 100
50
Estadística Básica
Histograma
Gráfica de barras que representa una distribución
de frecuencias de una variable cuantitativa. Un
histograma está integrado por los siguientes
componentes:
1. Un título, que identifica la población o la muestra de interés
2. Una escala vertical, que identifica las frecuencias que hay
en las diversas clases
3. Una escala horizontal, que identifica la variable x. Los
valores de los límites de una clase de las marcas de clase
deben identificarse a lo largo del eje x. El empleo de
cualquier método para identificar el eje presenta mejor a la
variable.
Estadística Básica
Ejemplo
50 puntajes del examen final de estadística básica
0
2
4
6
8
10
12
14
40 50 60 70 80 90 100
Puntaje
Fre
cu
en
cia
Estadística Básica
Forma de los histogramas
Simétrico, normal o triangular Uniforme o rectangular Sesgado a la derecha
Sesgado a la izquierda En forma de J Bimodal