estadistica i 05
DESCRIPTION
Mediadas de VariabilidadTRANSCRIPT
1
UCV/FACES/EACEstadísticas I
Medidas de Dispersión y Variabilidad Prof. Leonardo Simmons
Prof. Leonardo Simmons Estadísticas I -05
2
PENSAMIENTO ESTADISTICO Y VARIABILIDAD
Según vimos anteriormente el pensamiento estadístico es la filosofía de aprender y emprender acciones basada en los siguientes principios:
Todo ocurre en un sistema de procesos interconectados
La variación existe en todos los procesos
Entender y reducir la variabilidad es la clave del éxito
Conclusión:
Estudiar, medir, entender y reducir la variabilidad de los procesos de negocio de las empresas es vital para la salud éstas y por lo tanto se constituye en la razón de ser de todo aquel que este a cargo de tales procesos.
Prof. Leonardo Simmons Estadísticas I -05
3
MEDIDAS DE VARIABILIDAD
Una medida de tendencia central (media, mediana, modo) representa a la correspondiente distribución de datos de una variable y nos informa acerca de la tendencia de la misma, sin embargo, estas medidas no nos informan nada respecto a la variabilidad o dispersión existente entre los distintos valores de la variable y la medida de tendencia.
Por ejemplo, las siguientes series de salarios en Bs. tiene igual media aritmética:
Serie A: 2500, 2800, 3000, 3300, 3500 – Media = Bs. 3020
Serie B: 1000, 1500, 1600,4000, 7000 – Media = Bs. 3020
Sin embargo son bien distintas.
¿Cuan representativa es una media de tendencia central?
¿Cuál de dos o mas distribuciones de datos de una misma variable es mas o menos dispersa respecto a una medida de tendencia central?
Prof. Leonardo Simmons Estadísticas I -05
4
MEDIDAS DE VARIABILIDAD
Las medidas de variabilidad tienen por objeto medir la magnitud de los desvíos de los valores de la variable con respecto al valor central de la distribución, o sea, las medidas de variabilidad definen cuan semejante o cuan distinto son cada uno de los valores, de la variable con respecto al valor central.
Las medidas de variabilidad son también medidas del grado de representatividad de las medidas de tendencia central.
La variabilidad es la característica mas importante de la distribución, ya que se constituye en un eficaz test de validación referido al nivel de significación de las medidas de centralización
Las distintas medidas de variabilidad que estudiaremos serán:
• Rango Intercuartilico (Q) • Coeficiente de Variación (CV)
• Rango o Recorrido (R)
• Desviación Media (D)• Desviación Típica o Estándar (S , )• Varianza (S2 , 2)
Prof. Leonardo Simmons Estadísticas I -05
5
MEDIDAS DE VARIABILIDAD – RANGO O RECORRIDO
Definición:
El recorrido o Rango de una variable es la diferencia entre sus valores extremos:
Características del rango o recorrido:
• Solo suministra información de los extremos de la variable
• Informa sobre la distancia entre el mínimo y el máximo valor observado
• Se limita su uso a una información inicial
minmax XXRx
Xmin Xma
x
Rx
Prof. Leonardo Simmons Estadísticas I -05
6
MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
Definición:
Es la media aritmética de los valores absolutos de las desviaciones entre los valores de la variable y una medida de tendencia central. Entonces, identificamos tres (3) posibles desviaciones medias:
• Desviación Media respecto a la Media:
• Desviación Media respecto a la Mediana:
• Desviación Media respecto al Modo:
n
fxxD
k
iii
x
1
n
fMxD
k
iiei
M e
1
n
fMxD
k
iioi
M o
1
Prof. Leonardo Simmons Estadísticas I -05
7
x1
xx 1
xk
xxk
x
MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
La Desviación Media da cuenta de la distancia promedio que existe
entre los valores de la variable (x1, x2, …..xk) y la medida de
tendencia central, por ejemplo la media aritmética x
Prof. Leonardo Simmons Estadísticas I -05
8
Por ejemplo: Dada la siguiente distribución de frecuencia del precio de un producto de consumo masivo (no regulado).
BsMeBsx 00,6y 93,5
MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
Precio (Bs) No.Ofertas
2 4 15,72 16,00
4 6 11,58 12,00
6 10 0,70 0,00
8 7 14,49 14,00
10 3 12,21 12,00
30 54,70 54,00
ii fXx iei fMx
Bsn
fxxD
k
iii
x 82,130
70,541
Bs
n
fMxD
k
iiei
M e 80,1
30
00,541
En promedio los precios distan en 1,82 Bs del precio promedio
Prof. Leonardo Simmons Estadísticas I -05
9
Otro ejemplo: Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al alumno más idóneo para representar al colegio en un torneo a nivel nacional.El número de preguntas buenas por materia se muestra a continuación:
MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
Materia Carlos Pedro Juan1 2 7 52 9 2 63 10 2 54 2 6 55 3 6 56 1 3 57 9 6 48 9 7 59 1 6 6
10 4 5 4
SOLUCIÓNLo primero que analizaremos es la media de los puntajes para cada uno de los alumnos, con el fin de determinar el alumno con mayor promedio de preguntas buenas.
Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5 preguntas correctas por prueba. ¿Cuál sería entonces el indicador diferenciador entre los alumnos?.
Complementemos el análisis anterior calculando la desviación media:
Carlos muestra una desviación media de 3,9 indicando que los datos se alejan en promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variación (2,9), siendo Juan el que menos variación presenta con 0,9 preguntas tanto por arriba como por debajo de la media aritmética. Se recomienda al colegio elegir como ganador en este caso a Juan, presenta resultados más constantes que los otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una variación muy baja (rondando entre 4 y 6).
Prof. Leonardo Simmons Estadísticas I -05
10
MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA
Definición:
La desviación típica o desviación estándar mide la dispersión de los valores de una variable respecto a su media aritmética y se basa en la propiedad de ésta que dice que:
- La suma de los cuadrados de los desvíos respecto de la media aritmética es un mínimo, es decir:
Tomando esta propiedad en consideración calcularemos la desviación típica o estándar de la población de una variable, a la cual denotaremos con la letra (sigma), con la siguiente expresión:
xCfCxfxxk
iii
k
iii
)()(1
2
1
2
lpoblaciona típicadesviación )(
1
2
N
fxk
iixi
x
Prof. Leonardo Simmons Estadísticas I -05
11
MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA
Cuando estamos analizando una muestra a la desviación típica o estándar la denotamos con la letra S y se determina con la siguiente expresión:
La desviación estándar es una medida del grado de dispersión de los datos respecto al promedio. Dicho de otra manera, la desviación estándar es simplemente el "promedio" o variación esperada con respecto de la media aritmética.
Si Sx 0 indica que los valores están cerca de la media (poca dispersión)
Si Sx +∞ indica que los valores están lejos de la media (mucha dispersión)
La desviación típica, al igual que la media y la varianza, es un índice muy sensible a los valores extremos.
Nota: El término desviación estándar fue incorporado a la estadística por Karl Pearson en 1894.
muestral típicadesviación 1
)(1
2
n
fxxS
k
iii
x
Prof. Leonardo Simmons Estadísticas I -05
12
MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA
Se demuestra que:
para la población
Y para la muestra:
21
2
x
k
iii
x N
fx
1)1(
21
2
n
x
nn
fxS
k
iii
x
Prof. Leonardo Simmons Estadísticas I -05
13
MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA
Ejemplo: La siguiente tabla corresponde a la distribución de frecuencias de una muestra de los espesores en pulgadas, de recipientes de acero producidos por cierto proceso:
pulg 005,049
96,15
150
)319,0(
1
)(1
2
1
2
k
iii
k
iii
x
fx
n
fxxS
Espesores en pulg No.Piezas x xf (x-Media)2f
0.306 - 0.310 3 0,308 0,924 0,0004
0.310 - 0.314 5 0,312 1,560 0,0003
0.314 - 0.318 5 0,316 1,580 0,0001
0.318 - 0.322 22 0,320 7,040 0,0000
0.322 - 0.326 14 0,324 4,536 0,0003
0.326 - 0.330 1 0,328 0,328 0,000150 15,968 0,0011
El proceso produce una pieza de espesor promedio 0,319 pulgadas con una variación de 0,005 pulgadas
Prof. Leonardo Simmons Estadísticas I -05
14
MEDIDAS DE VARIABILIDAD – VARIANZA
Definición:
Definimos varianza a la media de los cuadrados de las desviaciones respecto a la media, es decir, la varianza es el cuadrado de la desviación típica, por lo tanto:
En el ejemplo anterior:
S2x = (0,005 pulg)2 = 0,000025 pulg2
Muestral) (Varianza 1
)()(
l)Poblaciona (Varianza )(
)(
1
2
2
1
2
2
n
fxxSxVar
N
fxxVar
k
iii
x
k
iixi
x
Prof. Leonardo Simmons Estadísticas I -05
15
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
1. La desviación típica y la varianza de una variable son estadísticos positivos, es decir, Sx > 0 y Var(x) = S2
x > 0
2. la varianza de una constante por una variable es igual al cuadrado de la constante por la varianza de la variable, es decir:
Var(cX) = c2Var(X) = c2S2x
En consecuencia la desviación típica de una constante por una variable será:
Scx = \c\Sx
3. La varianza de la suma de una variable más una constante es igual a la varianza de la variable, es decir:
Var(X + c) = Var(X) = S2x
En consecuencia: Sx+c= Sx
Nota: La varianza de una constante es igual a cero; Var(C) = 0
Prof. Leonardo Simmons Estadísticas I -05
16
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
4. Si x ʌ y son variables estadísticamente independientes entonces:
4. Var (x ± y) = Var (x) + Var (y) = S2x + S2
y , por lo tanto
5.
6. Var (ax + by+ c) = a2Var(x)+b2Var(y)= a2S2x + b2S2
y , por lo tanto:
5. Si x ʌ y son variables que no son estadísticamente independientes entonces:
Var(x±y) = Var(x) + Var(y) ± 2Cov(x,y), donde Cov(x,y) es la Covarianza (*) entre x ʌ y mide la magnitud de la asociación entre las dos variables y se determina por:
yxyx SSS 22
yxcbyax SbSaS 2222
Prof. Leonardo Simmons Estadísticas I -05
17
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
muestral) a(Covarianz 1
))((),(
l)Poblaciona a(Covarianz ))((
),(
1
1
n
yyxxSyxCov
N
yxyxCov
k
ixy
k
iyx
xy
Nota (*): El concepto de covarianza se ampliará cuando abordemos el tema de las medidas de asociación entre dos variables
5. Si y S12, S2
2,…Sr2 representan las medias aritméticas y las
varianzas de r muestras de tamaño n1, n2, …nr de la misma variable entonces la varianza de la unión de las r-muestras será la media de las varianzas más la varianza de las medias, es decir:
rXXX ,...., 21
r
ii
r
iii
r
ii
nnn
XXn
n
SnS
i
1
1
2
1
2
2 donde )(
Prof. Leonardo Simmons Estadísticas I -05
18
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
Si las r-muestras fuesen del mismo tamaño entonces:
)(
1
2
1
2
2
r
XX
r
SS
r
i
i
r
i
i
Si las r-muestras fuesen del mismo tamaño y tuviesen la misma media entonces:
r
SS
r
i
i 1
2
2
Prof. Leonardo Simmons Estadísticas I -05
19
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
Ejemplo (1): Hallar la media del número de establecimientos hoteleros que hay en las distintas Comunidades Autónomas de España. Después, con ayuda de la desviación típica, comenta si esta media es representativa de todas las comunidades autónomas.
CC.AA. Nº establecimientoshoteleros
Andalucía 2.266Aragón 712Asturas (Principado de) 620Baleares (Islas) 1.483Canarias 532Cantabria 496Castilla y León 1.452Castilla-La Mancha 842Cataluña 2.713Comunidad Valenciana 1.019Extremadura 418Galicia 1.526Madrid (Comunidad de) 1.242Murcia (Región de) 209Navarra (C. Foral de) 150País Vasco 396Rioja (La) 117Ceuta y Melilla 36
ientosEstablecim 14,731N
)x-(x
ientosEstablecim 902
18
1i
2i
x
18
1
N
xi
i
x
Se trata de la población de establecimientos en España distribuido en las 18 Comunidades Autónomas de ese país, luego:
Como la desviación típica es muy alta, esto me indica que los datos reales se diferencian mucho de la media, luego el dato de la media no es representativo.
Prof. Leonardo Simmons Estadísticas I -05
20
TEOREMA DE CHEBYSHEV
Teorema de Chebyshev (Desigualdad de Chebyshev):
Para cualquier distribución estadística de datos de una variable (muestra o población), la proporción () mínima de los valores que se encuentran dentro de k desviaciones estándares desde la media es al menos 1 – 1/k2, donde k es una constante mayor que 1.
X kx kx x
≤ 1-1/k2
K>1
P.ej: La distribución de contribuciones al SSO tiene media Bs. 51.54 y desviación estándar Bs. 7.51; ¿Qué porcentaje de contribuyentes como mínimo aportan entre la media más o menos 3.5 veces la desviación:
1-1/k2 = 1 – 1/(3.5)2=0.92 o sea 92%
Prof. Leonardo Simmons Estadísticas I -05
21
REGLA EMPIRICA
Regla Empírica o Regla Normal:
Para distribuciones simétricas o en forma de “campana” (Normales), se cumple que:
X x xx
68% de los datos
X 2x 2xx
95% de los datosX 3x 3xx
99,7% de los datos
Prof. Leonardo Simmons Estadísticas I -05
22
MEDIDAS DE VARIABILIDAD – RANGO INTERCUARTIL
Definición:
El rango intercuartil es una medida de variabilidad adecuada cuando la medida de posición central empleada ha sido la mediana y él se define como la diferencia entre el Tercer Cuartil (Q3) y el Primer Cuartil (Q1), es decir: RQ = Q3 - Q1
A la mitad del rango intercuartil se le conoce como Desviación Cuartil (DQ):
DQ = RQ /2= (Q3 - Q1)/2
Q1
25% 25%
Q2 Q3
50%
Prof. Leonardo Simmons Estadísticas I -05
23
DIAGRAMA DE CAJA
El Rango Intercuartil se usa para construir los Diagramas de Caja que sirven para visualizar la variabilidad de una variable y comparar distribuciones de la misma variable; además de ubicar valores extremos:
Xmax
Xmin
Q3
Q1
Q2
Q3+1.5 RQ
Q1 -1.5 RQ
x
Dist. A Dist. B Dist. C
Prof. Leonardo Simmons Estadísticas I -05
24
DIAGRAMA DE CAJA
Distribución simétrica o en forma de “campana” (Normal), se cumple que:
|Xmin-Q1| =|Xmax-Q3|
|Q2-Q1| =|Q2-Q3|
Q2 = X
Distribución asimétrica negativa se cumple que:
X < Q2=Me< Mo
Distribución asimétrica positiva se cumple que:
X > Q2=Me> Mo
Prof. Leonardo Simmons Estadísticas I -05
25
COEFICIENTE DE DE VARIACION
Definición:
El coeficiente de variación permite comparar la dispersión entre dos poblaciones distintas e incluso, comparar la variación producto de dos variables diferentes (que pueden provenir de una misma población).
Estas variables podrían tener unidades diferentes, por ejemplo, podremos determinar si los datos tomados al medir el volumen de llenado de un envase de cierto líquido varían más que los datos tomados al medir la temperatura de el liquido contenido en el envase al salir al consumidor. El volumen los mediremos en centímetros cúbicos y la temperatura en grados centígrados.
El coeficiente de variación elimina la dimensionalidad de las variables y tiene en cuenta la proporción existente entre una medida de tendencia y la desviación típica o estándar.
Prof. Leonardo Simmons Estadísticas I -05
26
COEFICIENTE DE VARIACION
Coeficiente de variación (Cv): Equivale a la razón entre la media aritmética y la desviación típica o estándar.
Si envés de la media aritmética se emplea la mediana, obtendremos el coeficiente de variación mediana:
P.ej: se han tomado los pesos y las estaturas de los alumnos de una sección hallándose que:X = 68 Kg , Sx = 8 Kg; y = 1,70 mts, Sy = 0,61 mts¿en cuál de los dos aspectos los estudiantes son más homogéneos?
CVx = 8/68*100=11,7% mientras que CVy = 0,61/1,70*100 = 39,5%
Hay mayor homogeneidad (menor variación) en los pesos
100X
SCV x
x
100e
xx M
SCV
eM
Prof. Leonardo Simmons Estadísticas I -05
27
TIPIFICACION DE VARIABLES
Sea X la variable que toma los valores X1, X2, …..Xk, de media X y desviación estándar Sx entonces si tomamos cualquier valor de X, digamos Xi, la diferencia de dicho valor con la media (Xi - X ) mide la distancia entre estos dos valores y si dividimos tal diferencia entre la desviación típica, obtendremos las cantidad de desviación típicas que dista Xi de la media. Si definimos la variable Z como:
Se demuestra que Z = 0 y Sz = 1 independientemente de los estadísticos de la variable X. A la variable Z la llámanos variable estandarizada o tipificada y se cumple que Z no tiene unidades y siempre Z = 0 y Sz = 1 y Z pertenece a (- , + )
....kiS
XXZ
x
i 1;
Z= (X-X)/SxX, X, SxZ, Z=0,
Sz=1
Tipificación
Prof. Leonardo Simmons Estadísticas I -05
TIPIFICACION DE VARIABLES
X1 X2 XkX
Z1=(X1-X)/Sx
Z2=(X2-X)/Sx
Z1 Z2 Z=0
Z=(X - X)/Sx=0
Zk=(Xk-X)/Sx
X
z
Prof. Leonardo Simmons Estadísticas I -05
29
TIPIFICACION DE VARIABLES
La interpretación de Z es como sigue:
• Si Z1= 1,2 indicaría que X1 es 1,2 desviaciones típicas mayor que la media de X; es decir si Xi > X entonces Zi > 0
• Si Z1= -0.5 indicaría que X1 esta a 0,5 o ½ desviaciones típicas a la izquierda de la media de X; es decir si Xi < X entonces Zi < 0
• El valor tipificado o estandarizado de la media de la variable siempre será o cero:
0
x
x S
XXZ
Prof. Leonardo Simmons Estadísticas I -05
30
TIPIFICACION DE VARIABLES
Uso de la Tipificación o Estandarización:
P.ej.: Dos estudiantes uno de Contaduría (A) y el otro de Administración (B) obtienen las siguientes notas: A: 12 ptos en AuditoriaB: 14 Ptos en Investigación de OperacionesLos estadísticos para las clases respectivas fueron:Clase de A: Nota promedio de Auditoría XA = 13 ptos con SA = 6 ptosClase de B: Nota promedio de IO XB = 15 ptos con SB = 5 ptos
Evidentemente no se pueden comparar directamente las notas de los dos estudiantes porque el rendimiento de sus respectivas clases es diferente. La comparación habrá de hacerse a través de la variable tipificada:Para A: ZA = (12 - 13)/6 = 1/6Para B: ZB = (14 – 15)/5 = -1/5
Se aprecia que la calificación del alumno A es mejor en relación a su clase, que la del alumno B en relación a la suya
0-1-2-3 321
ZA=1/5
ZB=-1/6
z
Prof. Leonardo Simmons Estadísticas I -05
31
TIPIFICACION DE VARIABLES
P.ej.: Una empresa que posee una fabrica en el país A y otra en B ha realizado una encuesta relativa al porcentaje que de su sueldo gastan sus empleados por concepto de alimentación, obteniéndose los siguientes datos:
El porcentaje reportado por los gerentes de producción de ambos países fueron:Gte. Producción A: 32%Gte. Producción B: 42%
Respecto a la realidad económica de cada país, cual de ellos se podría decir que gasta menos en alimentación?
Tratándose de realidades distintas, la comparación habrá de hacerse a través de la variable tipificada:Para país A: Z = (42 - 30)/12 = 1Para país B: Z = (32 – 20)/6 = 2
País Media Desv. Típica
A 20% 6%
B 30% 12%
Prof. Leonardo Simmons Estadísticas I -05
32
TIPIFICACION DE VARIABLES
Se aprecia que el gerente del país A, no obstante las apariencias numéricas, en proporción gasta menos en alimentación respecto a la realidad económica de su país que lo que gasta el gerente del país B respecto a la suya
0-1-2-3 321
GTE. País A
Z=2
GTE. País B
Z=1
Realidad
Económica
Media
z
Prof. Leonardo Simmons Estadísticas I -05
33
DETECCION DE VALORES ATIPICOS CON Z
SI UNA DISTRIBUCIÓN ES APROXIMADAMENTE “Normal” entonces según la regla empírica aproximadamente el 99.7% de los datos están comprendidos en el intervalo x±3x por lo tanto en la escala estandarizada (Z) ese intervalo se convierte en [-3, 3]. Luego todo valor de X cuyo valor estandarizado este fuera del anterior intervalo se puede considerar atipico.
0-1-2-3 321 z
Atípicos
Atípicos
Prof. Leonardo Simmons Estadísticas I -05
34
MEDIDAS DE ASIMETRIA
Definición:
Además de la posición (tendencia) y la dispersión de un conjunto de datos, es común usar medidas de forma en la descripción. Una de estas medidas es una estadística que busca expresar la simetría ( o falta de ella ) que manifiestan los datos, denominada coeficiente de asimetría.
Para saber si una distribución de frecuencias es simétrica, hay que precisar con respecto a qué. Un buen candidato es la mediana ya que divide a la distribución de frecuencias en dos partes de igual área (50-50). Podemos basarnos en ella para, de forma natural, decir que una distribución de frecuencias es simétrica si el lado derecho de la gráfica (histograma o polígono de frecuencias (a partir de la mediana) es la imagen por un espejo del lado izquierdo
Prof. Leonardo Simmons Estadísticas I -05
35
MEDIDAS DE ASIMETRIA
Coeficiente de Asimetría basado en los tres cuartiles (Yule-Bowley) :Si una distribución es simétrica, es claro que deben haber tantas observaciones entre la que deja por debajo de sí las tres cuartas partes de la distribución y la mediana, como entre la mediana y la que deja por debajo de sí un quarto de todas las observaciones. De forma abreviada esto es,
Q3 – Q2 = Q2 – Q1
Una pista para saber si una distribución de frecuencias es asimétrica positiva es cuando:
Q3 – Q2 > Q2 – Q1
Prof. Leonardo Simmons Estadísticas I -05
36
MEDIDAS DE ASIMETRIA
Por analogía, si es asimétrica negativa, se tendrá:
Q3 – Q2 < Q2 – Q1
Para quitar dimensionalidad al problema, utilizamos como índice de asimetría la cantidad:
Coeficiente de Asimetría basado en el momento central de tercer orden: Si la distribución fuese asimétrica positiva, las cantidades , con p impar positivas estarían muy aumentadas al elevarse a p. Esta propiedad nos indica que un índice de asimetría posible consiste en tomar p=3 y definir:
11
22 123
13
123
Q
A
R
QQQ
QQQA
)( pi XX
Prof. Leonardo Simmons Estadísticas I -05
37
MEDIDAS DE ASIMETRIA
Apoyándonos en este índice, diremos que hay asimetría positiva si A3>0, y que la asimetría es negativa si A3<0.
Otros Coeficientes de Asimetría:Basándonos en que si una distribución de frecuencias es simétrica y unimodal, entonces la media, la mediana y la moda coinciden, podemos definir otras medidas de asimetría, como: ó
Diremos que hay asimetría positiva si A>0 y negativa si A<0
11 ,
)(
33
1
3
3
ASn
XX
Ax
k
ii
x
o
S
MXA
)(3
x
e
S
MXA
Prof. Leonardo Simmons Estadísticas I -05
38
MEDIDAS DE ASIMETRIA
P.ej: Los días-calle de la población de cuentas x cobrar de una firma se distribuyen de la siguiente forma:
Días No.Cuentas x F7 -- 9 4 8 4
9 -- 11 18 10 2211 -- 12 14 11,5 3612 -- 13 27 12,5 6313 -- 14 42 13,5 10514 -- 15 31 14,5 13615 -- 17 20 16 15617 -- 19 1 18 157
157
x = 13,15 días
x= 1,94 díasMe = Q2=13,4 díasQ1= 12,1 díasQ3 =14,4 días
Lo que nos dice que aproximadamente en un rango de (Q3-Q11) = 14,4-12,1 = 2,3 días se encuentra el 50% central del total de observaciones. Además:AQ = -0,09Este resultado nos indica que existe una ligera asimetría a la izquierda (negativa). Un resultado similar se obtiene si observamos que la distribución de frecuencias es unimodal, siendo Mo = 13,6 días y
0,21
x
ox MA
Prof. Leonardo Simmons Estadísticas I -05
39
MEDIDAS DE FORMA – KURTOSIS (CURTOSIS)
Definición:
En estadística, la Kurtosis (Curtosis) es una medida de lo "picudo"(concentrada en torno a la media) de la distribución de frecuencia de una variable cuantitativa. Una mayor curtosis implica que la mayor parte de la varianza (variación) es debida a desviaciones infrecuentes en los extremos, que se oponen a desviaciones comunes de medidas menos pronunciadas.
La curtosis se determinará a partir del momento central de cuarto orden, esto es :
Se cumple que:Si K < 0, la distribución es menos apuntada de lo “normal” –PlaticúrticaSi K = 0, la distribución tiene un apuntamiento “normal” – MesocúrticaSi k > 0, la distribución es más apuntada de lo “normal” - Leptocúrtica
4)( XX i
3)(
41
4
x
k
iii
nS
fXXk
Prof. Leonardo Simmons Estadísticas I -05
40
MEDIDAS DE FORMA – KURTOSIS (CURTOSIS)
Curtosis Negativa Curtosis nula Curtosis Positiva
Platicúrtica
Mesocúrtica
Leptocúrtica
En el ejemplo de los días-calle de la población de cuentas x cobrar de una firma, el calculo de la curtosis resulta igual a:
K = +0,094 lo que implica que dicha distribución tiene un apuntamiento casi normal.
Prof. Leonardo Simmons Estadísticas I -05
41
TAREA No.5
1. Tómese unos minutos de su tiempo y lea detenidamente el siguiente articulo: VARIACIÓN, GERENCIA, Y EL DR. W. EDWARDS DEMINGPor: Brian L. Joiner y Marie A. Gaudard.JOINER ASSOCIATES INC.Quality Progress, Diciembre de 1990.Compilación, desarrollo y traducción libre: por Rogelio Carrillo Penso
http://sev.cuao.edu.co/mipymes/Documentos/Calidad/VariacionGerenciayDeming.pdf
2. Ingrese a la página de la Fundación Polar y lea los fascículos 20 y 21 de la serie El Mundo de Las Matemáticas, que trata de la variabilidad estadística:
http://www.fundacionempresaspolar.org/matematica2/index.html
3. Resolver del libro Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 3, los ejercicios del 15 al 26 (pag. 88 al 89); 31 al 37 (pag. 94 al 95); 42 al 46 (pag.98 al 99)