presentación de datos ing. iliana rosero estadistica i
Post on 25-Jan-2016
244 Views
Preview:
TRANSCRIPT
Presentación de datos
Ing. Iliana Rosero
Estadistica I
TABLAS
Características importantes de los datos
Centro Variación Distribución Valores Extremos Tiempo
Distribuciones de Frecuencia
Concepto: Lista valores de datos junto con su frecuencia.
Ej: Edad
ActricesFrecuencia
[20-30) 28
[30-40) 30
[40-50) 12
[50-60) 2
[60-70) 2
[70-80) 2
Distribuciones de frecuencia
Limites de clase Inferior :Cifras más pequeñas que pueden pertenecer a las clases.
Limites de clase Superior :Cifras más grande que pueden pertenecer a las clases.
Ancho de clase: Diferencia entre dos límites de clases inferiores consecutivos.
Marca de Clase: Punto medio de la clase (Lim Inf + Lim sup)/2
Procedimiento para construir una distribución de frecuencias
Decidir el número de clases K=1+3,32 log(n) (entre 5 y 20)
Calcular el ancho de clase=(Valor máximo-Valor mínimo)/número de clases.
Establecer el punto de partida como límite inferior de la primera clase y sumar el ancho de clase para encontrar el límite superior.
Completar todos las clases
Tabular los datos que se encuentren en cada clase.
Ejemplo: Cierto fabricante selecciona aleatoriamente 20
días de invierno y toma la temperatura °C con los siguientes resultados :
24, 35, 17, 21, 24, 37, 26, 46, 58, 30,
32, 13, 12, 38, 41, 43, 44, 27, 53, 27 Realice la tabla de distribución de frecuencia
Distribución de frecuencias relativas
Se obtiene dividiendo cada frecuencia de clase en el total de frecuencias. Las frecuencias relativas en ocasiones se expresan como porcentaje.Frecuencia relativa= frecuencia de clase
suma de todas las frecuenciasFrecuencia relativa= frecuencia de clase suma de todas las frecuencias
Edad Actrices Frec. Relativa
[20-30) 37%
[30-40) 39%
[40-50) 16%
[50-60) 3%
[60-70) 3%
[70-80) 3%
Distribución de frecuencias acumuladas
La frecuencia acumulada de una clase es la frecuencia de esa clase y de todas las anteriores.
Edad Actrices Frec. Acumulada
[20-30) 28
[30-40) 58
[40-50) 70
[50-60) 72
[60-70) 74
[70-80) 76
Exploración de datos
Distribución Normal Gráfica de campana Al inicio las frecuencias son bajas, después se
incrementan hasta un punto máximo y luego disminuyen.
Distribución aproximadamente simétrica y las frecuencias tienden a distribuirse de manera uniforme a ambos lados
Ej. Las frecuencias:1,5,6,10,7,4,1 son aprox normal
1,5,50,25,20,15,10,5,3,2 no se aprox normal.
Ejemplo Se seleccionaron a 1000 mujeres al azar y se
midieron sus estaturas. Tienen una distribución normal?
Estaturas (pulg) Frecuencia
[56-58) 10
[58-60) 64
[60-62) 178
[62-64) 324
[64-66) 251
[66-68) 135
[68-70) 32
[70-72) 6
Ejercicios de aplicación
La siguiente tabla corresponde a la frecuencia de los pesos (gramos) de monedas de un centavo elegidas al azar. ¿Cuáles son sus conclusiones?
Pesos (gramos) Frecuencia
[2,4-2,5) 18
[2,5-2,6) 19
[2,6-2,7) 0
[2,7-2,8) 0
[2,8-2,9) 2
[3,0-3,1) 25
[3,1-3,1) 8
Ejercicios de aplicación
Remítase a siguiente tabla de distribución. ¿Cuáles son sus conclusiones?
Estatura hombres (pulg)
Frecuencia
[60-65) 4
[65-70) 25
[70-75) 9
[75-80) 0
[80-85) 0
[85-90) 0
[90-95) 0
[95-100) 0
[100-105) 1
Una persona taladró un hoyo en un dado, lo rellenó de plomo y lo lanzó 180 veces. Los resultados se presentan en la distribución de frecuencias siguiente. Construya la distribución de frecuencias relativas para los resultados que esperaría de un dado perfectamente legal ¿Existen diferencias en los resultados de los dos dados?
Resultado Frecuencia
1 24
2 28
3 39
4 37
5 25
6 27
GRÁFICOS
Histograma
Es una gráfica de barra donde la escala horizontal representa clases de valores ( marca de clase y la escala vertical representa frecuencias. Las barras se dibujan sin espacios entre sí.
Ejemplo:
Realice el histograma a partir de la siguiente tabla:
Estaturas (pulg) Frecuencia
[56-58) 10
[58-60) 64
[60-62) 178
[62-64) 324
[64-66) 251
[66-68) 135
[68-70) 32
[70-72) 6
A partir del siguiente histograma que muestra las calificaciones de un examen de Estadística responda :
¿Cuántos estudiantes hicieron el examen?,
¿Cuál es la mínima calificación posible?
¿Cuál es la calificación más frecuente?
¿Cuál es el ancho de clase? Y el número de clases?
Polígono de frecuencia
Concepto: Gráfico que utiliza segmentos lineales conectados a puntos que se localizan directamente por encima de los valores de la marca de clase.
Las alturas de los puntos corresponden a la frecuencia de clase.
Ojiva Gráfica lineal que representa frecuencias acumuladas.
En el eje horizontal se muestran el límite superior de cada clase.
Temperatura FrecFrec
Acum%
Acum
[0 - 10) 0 0 0%
[10 - 20) 3 3 15%
[20 - 30) 6 9 45%
[30 – 40) 5 14 70%
[40-50) 4 18 90%
[50 – 60) 2 20 100%
Ojiva: Temperatura diaria
0
2
4
6
8
10
12
14
16
18
20
10 20 30 40 50 60
Límite de Clase
Fre
c. A
cum
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
% A
cum
.
a) ¿Cuántos dias se investigaron?
a) El 60% de los dias registraron temperaturas inferiores a ….
a) ¿Cuantos días se registraron temperaturas menores a 45° ?
A 40 estudiantes en la cafetería se les pidió que estimaran el número de horas que habían dedicado a estudiar en la semana anterior. El registro de respuestas aparece en la tabla. Construya la ojiva
Tiempo de estudio semanal en horas Frecuencia
10 y menos que 20 6
20 y menos que 30 11
30 y menos que 40 9
40 y menos que 50 7
50 y menos que 60 4
60 y menos que 70 2
70 y menos que 80 1
Diagrama tallo hojas Permite ver cómo se distribuyen y donde están
las concentraciones de datos. Se organiza los datos en grupos (llamados
tallos), para que los valores dentro de cada grupo (las hojas) ramifiquen hacia la derecha de cada fila.
Ej: 12,13,25,28,47, 48,49,49,65,66,1101 2 3
2 5 8
4 7 8 9 9
6 5 6
11 0
Efectúe el diagrama de tallo hoja para los siguientes conjuntos de datos 21, 24, 24, 26, 27, 27, 30, 32, 38, 41
613, 632, 658, 717,722, 750, 776, 827,841, 859, 863, 891,894, 906, 928, 933,955, 982, 1034, 1047,1056, 1140, 1169, 1224
Diagramas de dispersión
Gráficas de datos pareados (x,y). El patrón de puntos puede indicarnos que existe
alguna relación entre las variables
0
50
100
150
200
250
300
350
0 50 100 150Variable A
Var
iabl
e B
0
20
40
60
80
100
120
140
160
0 50 100 150Variable A
Var
iabl
e B
Relación creciente o positiva
Relación decreciente o negativa
No existe relación entre x y
Ejemplo
Ejercicio
Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la tabla se describen el nº de errores que corresponden a los intentos realizados. Realice el diagrama de dispersión.
Número de
intentos
Número de errores
1 15
2 12
3 10
4 8
5 7
6 5
7 5
8 2
Ejercicio
Gráficas de serie de tiempo
Se usa para estudiar patrones de las variables a través del tiempo .
Errores comunes
Muestra autoseleccionada: Los propios sujetos deciden ser incluidos. Encuestas por Internet, por correo o telefónicas.
Gráficas engañosas
Errores comunes
Pictogramas:
Preguntas predispuestas: Ej: ¿Debería el presidente utilizar su poder de veto para
eliminar los desperdicios? …………………… 97% si ¿Debería utilizar el presidente su poder de veto? 57% si
Orden de preguntas:◦ Ej: ¿Cree usted que el tránsito vehicular contribuye
a la contaminación mas o menos que la industria? 47% tránsito
◦ ¿Cree usted que la industria contribuye a la contaminación mas o menos que el tránsito vehicular ? 24% tránsito
Correlación y causalidad: Correlación indica que dos variables están relacionadas. Sin embargo correlación no implica causalidad.
Estudios para el propio beneficio.
Imágenes parciales :Ej. “El 90% de todos nuestros automóviles vendidos en este país en los últimos 10 años continua circulando”
Números precisos: Ej. En la actualidad existen 103´215.027 hogares
estadounidenses.
Muestras pequeñas
TALLER DE EJERCICIOS
top related