Download - EstadíStica Descriptiva
ESTADESTADÍÍSTICA STICA DESCRIPTIVADESCRIPTIVAJose Gonzales VillanuevaJose Gonzales VillanuevaProfesor de MatemProfesor de Matemááticatica
[email protected][email protected]
www.matewww.mate--clavero.blogspot.comclavero.blogspot.com
LICEO NAVAL CAPITLICEO NAVAL CAPITÁÁN DE CORBETA N DE CORBETA MANUEL CLAVEROMANUEL CLAVERO
¿¿Por quPor quéé hay que conocer la hay que conocer la EstadEstadíística y quistica y quiéénes la utilizan?nes la utilizan?
• Está presente en todas las áreas del saber humano. Lo utilizan médicos, banqueros, deportistas, amas de casa.
• Es una herramienta fundamental en la investigación.
• Permite realizar una buena toma de decisiones.
DefiniciDefinicióónn• La Estadística es una ciencia con base
matemática que utiliza instrumentos para recoger datos, presentarlos, ordenarlos y analizarlos para obtener información útil que permita inferir conclusiones y garantice una buena toma de decisiones.
SubdivisiSubdivisióón de la Estadn de la Estadíísticastica
ESTADÍSTICA
ESTADÍSTICADESCRIPTIVA
ESTADÍSTICAINFERENCIA
TEORÍA DEDECISIONES
TTéérminos usados en rminos usados en EstadEstadíísticastica
OrganizaciOrganizacióón y Presentacin y Presentacióón n de datosde datos
• Cuando se realiza la recopilación , se obtiene una gran cantidad de datos.
DATOS
•Clasificados
•Ordenados
•Presentados
deben
ser
•Comprensión
•Descripción
•Análisis
Tablas
y
Gráficos
para
facilitar
en
PresentaciPresentacióón de datos n de datos no agrupadosno agrupados
• Ejemplo 1: Los sueldos mensuales de 60 empleados de la empresa Metro de Ventanilla, son los siguientes
450580634364470660471501530450
382645507625480518380462500574
340
430
650
560
460
537
376
587
607
600
560
400
492
428
526
393
67
432
500
466
512382560558440
591550409618570
528321470407453
565424613335440
Datos no agrupados
32h
35G
31F
30E
36D
32C
34B
30A
Nº de alumnos
Sección
• Ejemplo 2: Número de alumnos de tercer grado de secundaria matriculados el presente año 2008 en cada sección
Datos agrupados en una tabla sin intervalos
PresentaciPresentacióón de datos n de datos agrupadosagrupados
15[1,90 - 2,00>
14[1,80 - 1,90>
15[1,70 - 1,80>
15[1,60 - 1,70>
16[1,50 - 1,60>
18[1,40 - 1,50>
14[1,30 - 1,40>
15[1,20 - 1,30>
15[1,10 - 1,20>
13[1,00 - 1,10>
FrecuenciaEstatura (cm.)
• Ejemplo 3: Distribución de 150 habitantes de la unidad vecinal Santa Rosa según estatura
Datos agrupados en una tabla con intervalos
PresentaciPresentacióón de datos n de datos agrupadosagrupados
ConstrucciConstruccióón de una n de una distribucidistribucióón de frecuenciasn de frecuencias
1. Nos fijamos en el número de datos (n)
2. Buscamos el dato mínimo y máximo y calculamos el rango (r)
r = máx. - mín.
3. Determinamos el número de intervalos (m) m = 1 + 3,3 log(n)
4. Verificamos la amplitud del intervalo (c)c = r/m
• Ejemplo 4: La siguiente tabla muestra los gastos semanales de 80 trabajadores de una compañía agrupados en intervalos
ConstrucciConstruccióón de una n de una distribucidistribucióón de frecuenciasn de frecuencias
100180Total
1006.2510.0625805650[700 - 800>
93.7522.50.93750.2257518550[500 - 600>
71.2521.250.71250.21255717450[400 - 500>
50350.50.354028350[300 - 400>
158.750.150.0875127250[200 - 300>
6.256.250.06250.062555150[100 -200>
Hi x 100%hi x 100%HihiFifixi[Li - Ls>
Frecuencia relativa
acumulada porcentual
Frecuencia relativa
porcentual
Frecuencia relativa
acumulada
Frecuencia relativa
Frecuencia absoluta
acumulada
Frecuencia absoluta
Marca de clase Intervalos
GrGrááficos Estadficos EstadíísticossticosHistograma Polígono
Pastel Barras
ReducciReduccióón de Datosn de DatosMedidas deMedidas deResumenResumen
De Posición o
Tendencia Central
De Dispersión o
Variabilidad
De Deformacióno
Asimetría
Rango
Varianza
Desviación Estándar
De Apuntamientoo
Kurtosis
Media
Mediana
Moda
Simetría
Asimetría Positiva
Asimetría Negativa
Platikúrtica
Mesokúrtica
Leptokúrtica
¡¡¡¡¡¡ Ganaste un viaje !!!Ganaste un viaje !!!
Playa BávaroPunta Cana
República Dominicana
Playa Tambor Punta ArenasCosta Rica
GrGrááfico de temperaturas fico de temperaturas registradas el aregistradas el añño 2008o 2008
152230333535302530222420Playa Bavaro
101525203538323025202015Playa Tambor
DicNovOctSepAgoJulJunMayAbrMarFebEne
0
5
10
15
20
25
30
35
40
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
Tem
pera
tura
(ºC
)
Playa Tambor Playa Bavaro
Surge la preguntaSurge la pregunta
¿Qué playa es más calurosa?
NNºº de personas que visitan mensualmente de personas que visitan mensualmente el Parque de las Leyendasel Parque de las Leyendas
142510Noviembre154757Mayo
254611Setiembre102435Marzo
245615Agosto187234Febrero
132534Diciembre243518Junio
182568Octubre123543Abril
325415Julio154250Enero
Nº de personas
MesNº de personas
Mes
Medidas de PosiciMedidas de Posicióón o n o Tendencia CentralTendencia Central
• Son valores numéricos en torno a los cuales se agrupan los valores de una variable estadística.
La Media (X)La Media (X)
el valor de la variable que indicael promedio de todos los datos
trabajados
PARA DATOS NO AGRUPADOS
PARA DATOSAGRUPADOS
nXXX
n
XX n21
n
1ii +++==
∑= ...
es
Se calcula
nf Xf Xf X
n
f XX nn2211
n
1iii +++==
∑= ...
Donde:n : es el número de datos trabajadosX1,X2,…: En los Datos No Agrupados son los valores de la variable y en los
Datos Agrupados son la marca de clase del intervalo 1, intervalo 2, …f : es la frecuencia absoluta.
Ejemplo 1Ejemplo 1Para Datos No AgrupadosPara Datos No Agrupados
Sean los puntajes obtenidos en 5 exámenes de Aritmética:
15 ; 12 ; 13 ; 15 ; 20Determinar la nota media
155
752015131215 ==++++=5
X
Ejemplo 2Ejemplo 2Para Datos AgrupadosPara Datos Agrupados
Dada la siguiente tabla de distribución de frecuencias, calcular la media aritmética
134625
37057478-70
26446670-62
17435862-54
15035054-46
25264246-38
13643438-30
xi x fifixiLs>-[Li
84,5325
1346 ==X
Donde:Li : es el límite inferior del intervalo medianon : es el número de datos trabajadosF : es la frecuencia absoluta acumulada del intervalo anterior al intervalo
medianof : es la frecuencia absoluta del intervalo medianoC : es el tamaño de la amplitud del intervalo
La Mediana (Me)La Mediana (Me)
el valor de la variable que divideal total de observaciones en dos
partes de igual tamaño
PARA DATOS NO AGRUPADOS
PARA DATOSAGRUPADOS
Ordenando de menor a mayor y eligiendo el central. Si no hubiese un dato central, entonces será igual a la media de los dos
valores centralesC
f
F 2
n
L Me i ×
−+=
es
Se calcula
Ejemplo 1Ejemplo 1Para Datos No AgrupadosPara Datos No Agrupados
Sean los puntajes obtenidos en 5 exámenes de Aritmética:
15 ; 12 ; 13 ; 15 ; 20Determinar la mediana
Ordenar datos:
12 ; 13 ; 15 ; 15 ; 20
Me = 15 25
2557478-70
2046670-62
1635862-54
1335054-46
1064246-38
443438-30
FifixiLs>-[Li
Ejemplo 2Ejemplo 2Para Datos AgrupadosPara Datos Agrupados
Dada la siguiente tabla de distribución de frecuencias, calcular la mediana
10
46
12.5
F =
Li =
n / 2 =
52.67Me =
8C =
3f =
Datos
Donde:Li : es el límite inferior del intervalo modald1 : es la diferencia de la frecuencia (fi) del intervalo modal y la frecuencia (fi)
del intervalo inmediato anterior.d2 : es la diferencia de la frecuencia (fi) del intervalo modal y la frecuencia (fi)
del intervalo inmediato posterior.C : es el tamaño de la amplitud del intervalo
La Moda (La Moda (MoMo))
el dato que más se repite o la mayor frecuencia de un
conjunto de datos
PARA DATOS NO AGRUPADOS
PARA DATOSAGRUPADOS
Se toma el dato que más se repiteSi fuesen dos valores diferentes,se habla de bimodal, de ser tres,
sería trimodal
C d d
d L Mo
21
1i ×
++=
es
Se calcula
Ejemplo 1Ejemplo 1Para Datos No AgrupadosPara Datos No Agrupados
Sean los puntajes obtenidos en 5 exámenes de Aritmética:
15 ; 12 ; 13 ; 15 ; 20Determinar la moda
Conteo:
12 � 1 vez13 � 1 vez15 � 2 veces20 � 1 vez
Mo = 15
25
57478-70
46670-62
35862-54
35054-46
64246-38
43438-30
fixiLs>-[Li
Ejemplo 2Ejemplo 2Para Datos AgrupadosPara Datos Agrupados
Dada la siguiente tabla de distribución de frecuencias, calcular la mediana
3d2 =3fi+1 =
8
4
6
C =
fi-1 =
fMo =
41.20Mo =
2d1 =
38Li =
Datos
COMPARACICOMPARACIÓÓN DE MEDIA, N DE MEDIA, MEDIANA Y MODAMEDIANA Y MODA
Pueden haber muchas modas o ninguna
Requiere de un ordenamiento previo de datos que sería difícil sin un ordenador
Se ve influenciada por los valores extremos
Desventajas
Es la que más fácilmente se determina, puesto que la podemos obtener por inspección
Cuando la distribución es casi simétrica se puede utilizar:Moda = 3Me- 2X
No toma en cuenta los valores extremos
Es útil cuando la tabla de frecuencias no presenta los valores del extremo inferior del 1er intervalo y del extremo superior del ultimo intervalo
Toma en cuenta todos los valores de la variable
Es fácil de interpretarVentajas
ModaMedianaMedia
Ejemplo Demostrativo 1Ejemplo Demostrativo 1Usando la hoja de calculo de Excel halle las tres MTC estudiadas para los siguientes datos:
12, 141, 11, 14, 12, 10, 10, 12, 11, 14
121224,7ModaMedianaMedia
Vemos que:La media se ve afectada por el valor extremo 141.
Ejemplo Demostrativo 2Ejemplo Demostrativo 2Usando la hoja de calculo de Excel halle las tres MTC estudiadas para los siguientes datos:
12, 15, 11, 14, 13, 10, 20, 17
amodal13,514ModaMedianaMedia
Vemos que:Al no haber ningún valor que se repita, no hay moda , por lo tanto el sistema es amodal
Posiciones relativas de la Posiciones relativas de la Media, la Mediana y la Moda. Media, la Mediana y la Moda.
En casos en que la distribución de frecuencias es poco asimétrica se cumple la siguiente relación empírica
Media – Moda = 3(media- mediana)
De acuerdo a la simetría o asimetría de la distribución de frecuencias se cumple lo siguiente
EjemploEjemplo
Ejemplo demostrativo 1Ejemplo demostrativo 1En un estudio sobre comprensión de lectura en inglés hecho a 100 personas la menor nota fue de 40 puntos y la mayor, de 180. Para la distribución de frecuencias se usaron siete intervalos de igual longitud y las frecuencias de los intervalos fueron respectivamente: 19, 20, 25, 15, 10, 6 y 5.
1.Construye la distribución de frecuencias con sus intervalos, marcas de clase y frecuencias.2.Calcula la media, la mediana y la moda de las notas3.Dibuja el HISTOGRAMA y ubica en él la media, la mediana y la moda
1. Distribuci1. Distribucióón de frecuenciasn de frecuencias
8910.000.890.108910130140-1205
7915.000.790.157915110120-1004
6425.000.640.25642590100-803
100.001.00100
1005.001.000.051005170180-1607
956.000.950.06956150160-1406
3920.000.390.2039207080-602
1919.000.190.1919195060-401
Hi x 100%hi x 100%HihiFifixiLs>-[LiNº
Frecuencia relativa
acumulada porcentual
Frecuencia relativa
porcentual
Frecuencia relativa
acumulada
Frecuencia relativa
Frecuencia absoluta
acumulada
Frecuencia absoluta
Marca de clase Intervalos 7
2. Medidas de tendencia central2. Medidas de tendencia central
9300
850
900
1300
1650
2250
1400
950
xi x fi
20C =
25f =
39F =
80Li =
50n / 2 =
Datos
20C =
80Li =
10d2 =
5d1 =
15fi+1 =
20fi-1 =
25fMo =
Datos
93S / n =
Media (x)
88.80Me =
Mediana (Me)
86.67Mo =
Moda (Mo)
3. Histograma3. Histograma
Ahora tuAhora tuLos gastos semanales de 65 amas de casa oscilan entre 60 y 300 soles. Agrupando los datos en 8 intervalos de igual amplitud se tienen las siguientes frecuencias: 2, 3, 5, 7, 12, 15, 13, 8
1.Construye la distribución de frecuencias con sus intervalos, marcas de clase y frecuencias.2.Calcula la media, la mediana y la moda de las notas3.Dibuja el HISTOGRAMA y ubica en él la media, la mediana y la moda
FFáábula bula El El ááguila y guila y las gallinaslas gallinas