Download - ESTADISTICA parte 3[1]
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 1/41
Unidad VIII
Estadística Descriptiva
Semestre 2011-1
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 2/41
MEDIDAS DE TENDENCIAMEDIDAS DE TENDENCIACENTRALCENTRALMEDIDAS DE TENDENCIAMEDIDAS DE TENDENCIACENTRALCENTRAL
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 3/41
INTRODUCCIÓN INTRODUCCIÓN
�Los salarios de las superestrellas de los deportesprof esionales reciben mucha atención de losmedios de comunicación. Cada año que pasa uncontrato millonario se está convirtiendo en unhecho común y corriente para este grupo de
élite. Aun así, son pocos los años que una de lasasociaciones deportivas no negocien con losdueños de equipos nuevas condiciones salarialesy benef icios marginales para todos los jugadores
de un deporte en particular.
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 4/41
� Según los dueños d e equipos de básquet, el
salario promedio de un jugador es de$ 275 000. Los representantes de los
jugadores alegan que el salario promedio
está cerca de $310 000. Ambos grupos
cuentan con los mismos datos. ¿Cómo
pueden llegar a conclusiones tan dispares?
¿Quién dice la verdad?
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 5/41
506/07/2011
Estadígrafos o estadísticos� Estadígrafos: llamaremos estadígrafo o estadístico, anúmeros resúmenes, que nos permiten establecerconclusiones a cerca de la estructura de una
muestra.� Una manera de representar características de un
conjunto de datos en estadística es a través de tresmedidas numéricas: media, mediana y moda. Cadauna de ellas representa un tipo de promedio, el cualindica la tendencia central del conjunto de datos. Enesta parte del curso veremos como calcularlos y queinformación nos brindan.
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 6/41
MEDIAMEDIA
� Se representa por:
� La media es el promedio aritmético de los
valores de la variable. Obviamente, al serpromedio, tiene sentido en variables de
tipo cuantitativo
X
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 7/41
Para datos no agrupados
� En ocasiones puede conducirnos ainterpretaciones incorrectas.
Simbólicamente la media en el caso de
una muestra se representa por , y en elcaso de población por Q .
� Se calcula sumando todos los datos y
dividiendo dicha suma por el número de
datos.
x
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 8/41
n
x.......xxmedia
n21 !
Sea x1, x2, .... ,xn los valores que toma una variable
cuantitativa X, entonces la media aritmética se
determina mediante:
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 9/41
� Ejemplo: Si las notas en el curso de
introducción a la computación de 10alumnos son : 14, 18, 12, 16, 14, 15, 16, 18,
10, 12
� Respuesta: La nota promedio es 14,5
1012101816151416121814x !
5,14x !
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 10/41
10
Ejemplo 2
� Un estadístico es una medida característica de una
muestra.
� Ejemplo 2: Una muestra de cinco ejecutivos recibió
los siguientes bonos el último año ($000):
14.0, 15.0, 17.0, 16.0, 15.0
4.155
77
5
0.15...0.14!!
!
7
!n
X X
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 11/41
� La media aritmética de los valores x1, x2, x3,
.........., xk ponderada por los pesos
w1, w
2, w
3, ........ w
kes el número.
Media aritmética ponderadaMedia aritmética ponderada
k 21
k k 2211
w..........ww
xw.........xwxw
x
!
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 12/41
Ejemplo: Si un alumno el semestre pasado obtuvo 11 en Física 2 y su peso es cinco, 13 en el curso
Lengua de peso cuatro y 16 en cálculo 2 de peso 3,
¿ cuál f ue su promedio ?
92,12x
345
)3(16)4(13)5(11x
!
!
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 13/41
Media aritmética para datos agrupados
� Si los n valores de una variable estadística
discreta X se clasif ican en k valores distintos
x1, x2, x3, .........., xk con f recuenciasabsolutas respectivas n1, n2, n3, ......, nk,
entonces su media aritmética es el número:
k
k k
nnn
xn xn xn x
!
..........
.........
21
2211
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 14/41
� Ejemplo: En un estudio de edades de estudiantes
de Electrotecnia Industrial del 1º semestre se
obtuvo la siguiente tabla de distribución:
� Edades Frecuencia
� 16 5
� 17 10
� 18 6
� 19 4
� 20 2� Total 26
� Determina la edad promedio.
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 15/41
Solución
246105
)20(2)19(4)18(6)17(10)16(5 _
! x
= 18,23 años
_ x
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 16/41
Media aritmética para datos agrupadosen clases
� Si los n valores de una variable estadística continua X
se clasif ican en k intervalos con marcas de clases x1,
x2, x3, .........., xk con f recuencias absolutas
respectivas n1, n2, n3, ......, nk, entonces su mediaaritmética es el número:
� Dondenese l total de datos
n
n x
x
nnn
xn xn xn
x
k
i
ii
k
k k
§!
!
!
1
21
2211
..........
.........
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 17/41
� Media aritmética para datos agrupados:
Cuando se cuenta con datos agrupados en una
distribución de f recuencia, todos los valores
que caen dentro de un intervalo de clase dado
se consideran igual a la marca de clase, o
punto medio del intervalo.
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 18/41
Ejemplo: La siguiente tabla muestra la inversión anual de 44 empresas.
Intervalo Marca de clase
xi ni Ni hi
? 4, 10?
?10, 16?
?16, 22?
?22, 28?
?28, 34?
?34, 40?
?40, 46A
1
3
6
12
11
5
2
40
Tí tulo: ³Inversión anual de empresas´
Unidades: miles de dólares.
ii n x
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 19/41
Solución
� La media aritmética es:
251112631
)2(43)5(37)11(31)12(25)6(19)3(13)1(7
x
!
8,26x
40
1072x
!
!
La inversión promedio es de 26 800 dólares
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 20/41
20
Propiedades de la media aritmética
� Para evaluar la media se consideran todos los valores.
� Un conjunto de datos sólo tiene una media la cual es un valorúnico.
� La media es af ectada por valores inusualmente grandes o pequeños.
� La media aritmética es la única medida de tendencia centraldonde la suma de las desviaciones de cada valor, respecto dela media, siempre es igual a cero.
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 21/41
Propiedades de la media aritmética
1. Si a cada valor de las observaciones x2, x3, .........., xn se le sumao se le resta una constante, la media aritmética del nuevo
conjunto transformado
, es la media aritmética del conjunto original mas o menos la
constante.
2. De la misma forma si se multiplica por una constante a cada
valor, la media aritmética del conjunto original multiplicado
por la constante
nib x y ii ,....2,1, !s!
b x M y M y s!! )()(
)()( xb y y !!
nibx y ii ,....2,1, !!
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 22/41
3. Media de medias: supongamos que de una
población (o de dos poblaciones dif erentes) se
obtienen dos muestras de n1 y n2 respectivamente.
Sean las medias aritméticas de las muestras,entonces la media asociada a las n1 y n2
observaciones esta dada por:
21 x y x
21
2211
nn xn xn x
!
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 23/41
23
La mediana
� La mediana es el valor que corresponde al punto medio de los valores después de ordenarlos demenor a mayor.
� Cincuenta por ciento de las observaciones sonmayores que la mediana, y 50% son menores queella.
� Para un conjunto par de valores, la mediana será el
promedio aritmético de los dos valores centrales.
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 24/41
24
Para datos no clasif icados� Las edades de una muestra de 5 estudiantes del colegio son:
21, 25, 19, 20, 22
Ordenando los datos en forma ascendente, tenemos:
19, 20, 21, 22, 25. Entonces la mediana es 21.Las estaturas de 4 jugadores de basquetbol, en pulgadas, son:
76, 73, 80, 75
Entonces la mediana es 75.5
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 25/41
25
Propiedades de la mediana� Es única; esto es, a semejanza de la media, sólo existe una
mediana para un conjunto de datos.
� No se ve af ectada por valores extremadamente grandes o muy pequeños, y por tanto es una medida valiosa de
tendencia central cuando se presenta esta clase de valores.� Puede calcularse para una distribución de f recuencias con unaclase de extremo abierto, si la mediana no se encuentra en talclase.
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 26/41
¹¹¹¹
º
¸
©©©©
ª
¨ !
m
m
mm
n
N n
W L1
2Xm
Lm =Es el límite inferior del intervalo de la mediana
n = Número de datos observados
Nm-1= Frecuencia acumulada absoluta del intervalo
inmediatamente anterior al intervalo de la mediana
nm = Frecuencia absoluta del intervalo de la mediana
W = Amplitud del intervalo de la mediana
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 27/41
Ejemplo: La siguiente tabla muestra la inversión anual de 44 empresas.
Intervalo Marca de clase
xi
Frecuencias Frecuencias acumuladas
ni hi Ni Hi
? 4, 10?
?10, 16?
?16, 22??22, 28?
?28, 34?
?34, 40?
?40, 46A
7
13
1925
31
37
43
1
3
612
11
5
2
40
Tí tulo: ³Inversión anual de empresas´
Unidades: miles de dólares.
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 28/41
� El intervalo donde se encuentra n/2 es el
número cuatro, luego:
� Lm= 22; n = 40; Nm-1 =10; ni =12; W= 6
� Por tanto
27Me
612
102
40
22Me
!
!
E l 50% de las empresas invierten menos de 27 000 dólares
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 29/41
MODAMODA
�La moda es el dato que más se repite (el de más alta f recuencia).Por ejemplo: ¿cuántas veces se repite la letra e en la palabra
representatividad? se repite 3 veces y te f ijarás que es la que
más se repite, por lo tanto se dice que la letra e es la moda de
este conjunto de letras.
� Podremos determinar la moda en muestras de variables tanto
cualitativas como cuantativas (datos agrupados o no).
� La moda es muy f ácil de calcularla y útil, pero tiene sus
limitaciones, a veces no encontraremos moda (cuando todos o
más de dos tienen la misma f recuencia) o muestras bimodales(con dos modas). Por lo tanto veremos otras opciones.
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 30/41
� La moda se def ine como el valor o clase
que tiene la mayor f recuencia, en un
conjunto de observaciones.
� La moda resulta sumamente útil para
expresar la tendencia central de
observaciones correspondientes a
características cualitativas tales como color,estado civil, ocupación, lugar de
nacimiento, etc.
Para datos no agrupados
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 31/41
Para datos agrupados
� Para calcular la moda de n datos tabulados porintervalos, primero se determina el intervalo quecontiene a la moda, esto es, el intervalo que tienela mayor f recuencia (intervalo modal). Luego seutiliza la f órmula:
� donde:
� Li es el límite inf erior del intervalo modal.
� d1= ni - ni-1
� d2= ni - ni+1
� w= amplitud del intervalo modal
¹¹ º
¸©©ª
¨
!
21
1
d d
d W L M iio
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 32/41
Ejemplo: La siguiente tabla muestra la inversión anual de 40 empresas.
Intervalo Marca de clase
xi
Frecuencias Frecuencias acumuladas
n.
i
hi Ni Hi
? 4, 10?
?10, 16?
?16, 22??22, 28?
?28, 34?
?34, 40?
?40, 46A
7
13
1925
31
37
43
1
3
612
11
5
2
0,025
0,075
0,1500,300
0,275
0,125
0,050
1
4
1022
33
38
40
0.025
0.100
0.2500.550
0.825
0.950
1.000
40 1,000
Tí tulo: ³Inversión anual de empresas´
Unidades: miles de dólares.
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 33/41
� El intervalo donde se encuentra la mayorf recuencia es el cuarto intervalo
� Entonces: Li = 22
� d1= ni - ni-1 = 12 6 = 6
� d2= ni - ni+1 = 12 11= 1� W = 6
� de donde: Mo= 22 + = 27,85
� Esto significa la mayoría de las empresasinvierten 27 850 dólares
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 34/41
LOS CUANTILESLOS CUANTILES
Son valores que dividen a la distribución en partes iguales,Son valores que dividen a la distribución en partes iguales,
es decir, en intervalos que comprenden el mismo númeroes decir, en intervalos que comprenden el mismo númerode observaciones. Los que más se utilizan son: losde observaciones. Los que más se utilizan son: los
CUARTILES, DECILES Y PERCENTILES.CUARTILES, DECILES Y PERCENTILES.
LosLos CUARTILESCUARTILES son 3 valores que dividen a la distribución en 4son 3 valores que dividen a la distribución en 4
partes iguales, cada una de las cuales contienen el 25% de laspartes iguales, cada una de las cuales contienen el 25% de lasobservaciones.observaciones.
LosLos DECILES (PERCENTILES)DECILES (PERCENTILES) son 9 (99) valores que dividen a lason 9 (99) valores que dividen a la
distribución en 10 (100) partes iguales, cada una de las cualesdistribución en 10 (100) partes iguales, cada una de las cuales
contiene el 10% (1%) de las observaciones.contiene el 10% (1%) de las observaciones.
MEDIDAS DE POSICIÓN
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 35/41
LOS CUARTILES
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 36/41
Ejemplo 1
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 37/41
Ejemplo 2
� Hallar el intervalo intercuartilico:
El Intervalo Intercuartí lico de X, se def ine como: [ Q 1 , Q 3 ]
� Es el intervalo en el cual está comprendido el 50% de los
datos centrales.
El rango Intercuartí lico de X, se def ine como:
� Rango intercuartílico=Q3-Q2, es la dif erencia entre el tercer y
el primer cuartil: . Nos da una f ranja en la que se encuentra el
50% de la población.
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 38/41
LosLos DECILESDECILES (PERCENTILES)(PERCENTILES) sonson 99 ((9999)) valoresvalores queque dividendividen aa lala
distribucióndistribución enen 1010 ((100100)) partespartes iguales,iguales, cadacada unauna dede laslas cualescuales
contienecontiene elel 1010%% ((11%%)) dede laslas observacionesobservaciones..
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 39/41
EJEMPLO 1: Se presenta la distribución de f recuencias de los puntajes
obtenidos por 250 alumnos en una prueba de rendimiento de Física.
Determinar que puntajes deben tener los que se hallen en el 20% inf erior ycuales puntajes los que se encuentren en el decimo superior.
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 40/41
EJEMPLO 2
� Determinar el intervalo interdecílico. Precisar
el signif icado del resultado obtenido
� INTERVALO INTERDECIL : : [ D1 , D9 ] aquí esta
comprendido el 80% de los datos centrales.
� RANGO INTERDECILICO: se obtiene de la dif erencia
entre el decil 9 y el decil 1, evitando así los puntos
extremos. RANGO INTERDECILICO= D9 -D1
5/7/2018 ESTADISTICA parte 3[1] - slidepdf.com
http://slidepdf.com/reader/full/estadistica-parte-31 41/41
100
110
120
150
140
130
1er cuartil1er cuartil
3er cuartil3er cuartil
MedianaMediana