¡error! marcador no definido.descripciÓn univariante · este es un término estadístico...
TRANSCRIPT
ESTADÍSTICA I
Tema II 15
TEMA II: ¡Error! Marcador no definido.DESCRIPCIÓN UNIVARIANTE
II.1.- Notación y tabulación.
II.2.- Descripción gráfica.
II.3.- Descripción numérica.
II.3.1.- Momentos estadísticos.
II.3.1.1. Momentos con respecto al origen.
II.3.1.2.- Momentos con respecto a la media
II.3.2.- Medidas de posición.
II.3.2.1.- Medidas de posición central. Media
aritmética, geométrica, armónica y mediana.
II.3.2.2.- Medidas de posición no central. Moda y
cuantiles.
II.3.3.- Medidas de dispersión. Recorrido, varianza,
desviación típica y coeficiente de variación.
II.3.4.- Variable tipificada.
II.3.5.- Medidas de forma.
II.3.5.1.- Coeficiente de asimetría de Fisher.
II.3.5.2.- Coeficiente de curtosis.
II.3.6.- Medidas de concentración.
II.3.6.1.- Índice de Gini
II.3.6.2.- Curva de Lorenz.
Descripción Univariante
Tema II 16
II.1.- Notación y tabulación
La información es el punto de partida para el análisis
estadístico, y el primer paso que hay que realizar con esta
información es su tabulación, entendiendo como tal el
ordenamiento de la información de tal forma que se simplifique
la aplicación de las técnicas estadísticas.
Sin embargo, nuestro objetivo no es tabular una información
concreta o específica, sino que lo que se pretende es
establecer el marco general con el que poder tabular cualquier
tipo de información y, en consecuencia, tenemos que fijar una
notación que nos permita expresarnos en términos generales. Con
este objetivo estableceremos la siguiente notación.
Denotaremos por X, Y, Z (con letras mayúsculas) a los
caracteres que queremos estudiar. Así, por ejemplo, cuando
hablamos del carácter X podemos estar hablando del nivel de
renta de los individuos de Las Palmas de Gran Canaria, o los
beneficios de las empresas españolas, etc…
Denotaremos por xi, yi, zi a cada una de las modalidades de X, Y
o Z respectivamente, en donde i toma los valores 1,2,3,..., k,
en donde k es el número máximo de modalidades del carácter X.
De esta manera, si la variable que estamos estudiando, que
podemos denotar por X, es el número de hijos de las familias de
Las Palmas, xi puede tomar los valores 0,1,2,3,…, lo que indica
que x1 = 0, x2 = 1, x3 = 2, etc…
Un caso particular lo forman las variables continuas. En este
caso, el número de modalidades es infinito, es decir k es
infinito. Para este tipo de modalidades, la tabulación se suele
realizar mediante la definición de clases. Una clase no es más
que un intervalo que contiene un número infinito de posibles
valores de la variable. Estas clases deben de ser de tal manera
que, por una parte, entre sí sean excluyentes y, por otra
parte, contengan a todos los posibles valores de la variable.
Es decir, cada individuo debe de pertenecer a una única clase y
ESTADÍSTICA I
Tema II 17
no debe existir ningún individuo que no este en alguna clase.
Como ejemplo podemos usar la información procedente de las
mediciones de las temperaturas. Esta variable puede tomar
infinitos valores, pero sabemos que las mismas se encuentran
siempre entre los –100 grados centígrados y los 100 grados
centígrados. Esta es una variable continua, y su información la
podemos agrupar en distintas clases. Así, para su tratamiento
estadístico los valores de la misma los podemos agrupar en, por
ejemplo, 6 clases, definidas como:
Clase 1: temperaturas entre los –100º y los –20º(sin incluir el –20)
Clase 2: Temperaturas entre los –20º y los 0º (sin incluir los 0º)
Clase 3: Temperaturas entre los 0º y los 10º (sin incluir los 10º)
Clase 4: Temperaturas entre los 10º y los 20º (sin incluir los 20º)
Clase 5: Temperaturas entre los 20º y los 30º (sin incluir los 30º)
Clase 6: Temperaturas entre los 30º y los 60º.
En este caso, en términos genéricos hablamos de clase 1, clase
2, etc… Además, cada una de las clases tiene unos extremos de
clase, que son el valor inferior y el valor superior de cada
una de las clases, unas marcas de clase, que son los puntos
intermedios de cada clase y unas amplitudes de clase, que son
los tamaños de cada una de las clases.
Para las variables continuas la notación que seguiremos es la
siguiente:
La letra i representa a la clase i-ésima. Esta clase tiene unos
extremos de clase que representaremos por e de tal forma que la
clase i-ésima vendrá representada genéricamente de la forma
[ei-1, ei]
La amplitud de clase la representaremos por la letra a, y ai se
corresponderá con la amplitud de la clase i. Es evidente que la
amplitud de la clase i la podemos obtener mediante los valores
de los extremos de esa clase. Es inmediato deducir que la
amplitud de la clase i se puede calcular como
Descripción Univariante
Tema II 18
ai = ei – ei-1
La marca de clase la denotaremos por ci, y como hemos dicho no
es más que el punto intermedio de la clase i. Su cálculo
también se obtiene a partir del conocimiento de los extremos de
clase
ci = (ei-1 + ei)/2
Una vez que hemos establecido la forma de representar a las
variables estadísticas y a los atributos, el primer concepto
que debemos analizar es el concepto de frecuencia. Este es un
término estadístico ampliamente usado en la vida real. Desde el
punto de vista estadístico nos podemos encontrar con varias
formas de medir la frecuencia:
La frecuencia absoluta. Es el número de veces que aparece una
determinado valor o clase de un carácter. La denotaremos por n,
siendo ni el número de veces que aparece la modalidad xi de la
variable X, o la clase i de dicha variable. Denotaremos por N
al número total de individuos estudiados. Es evidente que N la
podemos calcular como suma de las distintas frecuencias
absolutas.
N = n1 + n2 + n3 + … + nk
En donde k es el número de modalidades de X o el número de
clases de la misma.
La frecuencia relativa. Es la proporción de individuos que
presentan una determinada modalidad. La denotaremos por fi y su
forma de cálculo viene dada por
fi = ni / N
En muchos casos se usa la frecuencia relativa multiplicada por
100, indicando en este caso el porcentaje de individuos que
presentan una determinada modalidad.
ESTADÍSTICA I
Tema II 19
Es inmediato demostrar que la suma de las frecuencias relativas
es igual a 1.
∑=
=k
1ii 1f
Frecuencia Absoluta Acumulada. Nos informa del número de
individuos que presentan una modalidad igual o inferior a la
considerada. Lo denotaremos por Ni y se calcula como:
Frecuencia Relativa Acumulada. Nos informa de la proporción de
individuos que presentan una modalidad igual o inferior a la
considerada. La vamos a denotar por Fi y es el resultado de
dividir cada frecuencia absoluta acumulada por el número total
de datos. Es decir,
Algunos resultados inmediatos son los siguientes.
(1) La suma de todas las frecuencias relativas debe ser igual a
la unidad:
(2) La última frecuencia relativa acumulada es la unidad. Es
decir,
n=N r
i
1=ri ∑
NN=F i
i
1=NN=
N+...+
N+
N=
nnnf
n21
i
n
1=i∑
Descripción Univariante
Tema II 20
Llamaremos distribución de frecuencias a los pares (xi,ni) ó
(xi,Fi) ó (xi,fi) ó (xi,Ni).
Observen que en función del tipo de dato con el que estemos
trabajando alguna de las medidas definidas hasta ahora ya no
tienen sentido. Por ejemplo, supóngase que estamos interesados
en estudiar la profesión de los residentes en una determinada
zona geográfica. Los resultados que obtenemos son:
¡Error!
Marcador no
definido.PR
OFESION
FRECUENCIA
ABSOLUTA
FRECUENCIA
RELATIVA
FRECUENCIA
RELATIVA %
FRECUENC.
ABSOLUTA
ACUMULADA
Agricultor 2000 0.444 44.4% 2000
Peón
Industrial
500 0.111 11.1% 2500
Ganadero 1700 0.377 37.7% 4200
Empresario
industrial
50 0.011 1.1% 4250
Comerciante 250 0.055 5.5% 4500
Como se puede deducir fácilmente no tiene sentido en este caso
calcular la frecuencia acumulada. Es decir, no tienen sentido
decir que existan 4200 personas que tienen una modalidad igual
o inferior a ganadero puesto que el orden en el que se han
colocado las profesiones es arbitrario. Si tiene pleno sentido
el análisis de las frecuencias no acumuladas. Esto es, estamos
en una zona geográfica fundamentalmente dedicada a la
agricultura y ganadería, un 82% de la población, quedando el
resto dedicado a la industria y comercio.
En conclusión, la frecuencia acumulada no tiene sentido para
1=NN
=N
n+...+n+n=NN=F
n21nn
ESTADÍSTICA I
Tema II 21
datos que provengan de una medición nominal.
El proceso de tabulación no es más que la colocación en una
tabla de los datos que definen la distribución de frecuencias.
En términos genéricos la tabulación en el caso unidimensional
viene dada por (ejemplo aplicable a un atributo o a una
variable discreta
X n f N F
x1 n1 f1 N1 F1
x2 n2 f2 N2 F2
xk nk fk Nk Fk
II.2.- Descripción gráfica
A la hora de introducirnos en el estudio de las
representaciones gráficas, debemos distinguir entre los dos
tipos de caracteres existentes: Cuantitativos y Cualitativos.
Representaciones gráficas de los caracteres cualitativos
(atributos):
Entre las diferentes formas posibles de representar un carácter
cualitativo distinguimos los siguientes:
-Diagrama de sectores.
-Diagrama de barras.
-Pictograma.
*DIAGRAMA DE SECTORES:
Consiste en repartir los 360o de una circunferencia de forma
proporcional a las frecuencias absolutas.
Descripción Univariante
Tema II 22
Ejemplo:
Calificaciones ni ���������������������������� Suspenso � 30 Aprobado � 40 Notable � 20 Sobresaliente� 10 ���������� N=100
Y haciendo un reparto proporcional de los 360o grados entre las
ni:
100---- 360o
30---- X X= Suspensos = 108o
100---- 360o
40---- Y Y= Aprobados = 144o
100---- 360o
20---- Z Z= Notables = 72o
100---- 360o
10---- W W= Sobresalientes = 36o
ESTADÍSTICA I
Tema II 23
* DIAGRAMA DE BARRAS:
Representación gráfica que consiste en colocar en unos ejes
cartesianos, las modalidades en el eje de abcisas, el valor de
la frecuencia absoluta en el eje de ordenadas y levantar barras
de igual base cuya altura sea la de dicha frecuencia.
Vamos a realizar un diagrama de barras con el mismo ejemplo que
utilizamos para el caso del diagrama de sectores:
CALIFICACION � ni �������������������������������� Suspenso � 30 Aprobado � 40 Notable � 20 Sobresaliente � 10 ����������� � N=100
Descripción Univariante
Tema II 24
* PICTOGRAMA:
Representación gráfica consistente en asignar un valor a una
determinada figura, representando la distribución de
frecuencias en función de esta asignación.
Ejemplo: CALIFICACION � ni ������������������������������� Suspenso � 30 Aprobado � 40 Notable � 20 Sobresaliente � 10 ������������ � N=100
Asignamos el valor de 10 alumnos a la siguiente figura
Por tanto,
alumnos. 10 = ⊕
SUSPENSO= ⊕⊕⊕
ESTADÍSTICA I
Tema II 25
Representaciones gráficas de los caracteres cuantitativos:
Hemos visto que existen dos tipos de caracteres cuantitativos:
Discretos y Continuos. Teniendo en cuenta este hecho,
distinguiremos entre las representaciones gráficas de los
caracteres cuantitativos discretos y las respectivas
representaciones de los continuos.
Caracteres Cuantitativos Discretos:
Entre los diferentes tipos de representaciones distinguimos:
-Diagrama de barras.
-Diagrama de escalera o curva de acumulación.
*DIAGRAMA DE BARRAS.
Consideremos la distribución de frecuencias dada de la forma
(xi,ni) ó (xi,fi), donde xi = (x1,...,xk); ni=(n1,..., nk);
fi=(f1,..., fk).
LLamaremos "Diagrama de Barras" de un carácter discreto a la
parte vertical de la representación cartesiana de los puntos
(xi,fi) ó (xi,ni).
APROBADO = ⊕⊕⊕⊕
NOTABLE = ⊕⊕ 4
ENTE SOBRESALI= ⊕
Descripción Univariante
Tema II 26
Analíticamente, la función cuya representación gráfica es el
diagrama de barras viene dada por:
a f(x) la denominaremos función cuantía.
* DIAGRAMA DE ESCALERA O CURVA DE ACUMULACION.
Es la gráfica que se obtiene al graficar la función F(x)
definida de la siguiente manera:
≠
→ℜ∈
ℜ→ℜ
x=x si ; f xx si ; 0
=f(x) x
:f
ii
i
∈∀
ℜ→ℜ
N=F(x) F=NN=F(x) _ )x ,x[ x
: F
iii
1+ii
ESTADÍSTICA I
Tema II 27
La función F(x) se denomina función de distribución, cuya
gráfica será la curva de acumulación o diagrama de escalera.
Esta segunda denominación es evidente después del análisis de
esta función.
Por tanto,
Obsérvese que tanto el diagrama de barras como la curva de
acumulación se han definido en función de la frecuencia
absoluta (ni el diagrama de barras, Ni la curva de acumulación)
y en función de la frecuencia relativa (fi el diagrama de
barras, Fi la curva de acumulación). Es recomendable, sobre
todo si se desea utilizar la representación gráfica para
comparar varias situaciones utilizar, tanto para el diagrama de
barras como para la curva de acumulación, las frecuencias
1=F(x)]x ,x[ x Si . . .
NN=F(x))x ,x[ x Si
NN=F(x))x ,x[ x Si
0=F(x))x ,[- x Si
k1-k
232
121
1
→∈
→∈
→∈
→∞∈
Descripción Univariante
Tema II 28
relativas.
Pongamos un ejemplo, supongamos que estamos estudiando como
están formadas las familias, en cuanto al número de miembros de
las mismas, en la Comunidad de Madrid y de Canarias. La
diferencia en población de estas dos comunidades es muy grande.
Supongamos en consecuencia que en Canarias hay 500.000 familias
y en Madrid 1.500.000 con la siguiente distribución.
¡Error! Marcador no definido.
CANARIAS
MADRID
N� MIEMBROS FRECUENCIA N� MIEMBROS FRECUENCIA
1 50000 1 150000
2 100000 2 300000
3 150000 3 450000
4 150000 4 450000
5 25000 5 75000
6 15000 6 45000
7 10000 7 30000
Si queremos comparar Canarias con Madrid en cuanto a tamaño del
número de familias, es evidente que lo podemos hacer usando
únicamente los valores totales, esto es, 500.000 familias en
Canarias y 1.500.000 familias en Madrid.
Si queremos estudiar gráficamente estas dos distribuciones la
forma correcta consistiría en realizar la representación sobre
el mismo gráfico. Si para ello usamos la frecuencia absoluta el
gráfico que obtendríamos sería de la forma:
ESTADÍSTICA I
Tema II 29
Como se puede observar, la diferencia de escala entre una y
otra comunidad dificulta claramente el estudio de la variable
de interés. Sin embargo, si en vez de utilizar la frecuencia
absoluta utilizamos la frecuencia relativa la conclusión sería
mucho más evidente. Esto es, la distribución relativa del
tamaño de las familias es la misma en las dos comunidades como
aparece en el siguiente gráfico:
Por último, podemos decir que la función de distribución de un
carácter cuantitativo discreto no es más que la expresión
analítica de la curva de acumulación de dicho carácter.
* Caracteres Cuantitativos Continuos:
Antes de introducirnos en el estudio de las representaciones
gráficas de los caracteres continuos recordemos que este tipo
de variables tienen algunos elementos que le son propios.
- Clase: Llamamos clase a cada uno de los intervalos en que se
ha dividido el rango posible de valores de la variable.
Hablaremos, por tanto, de clase 1, 2, 3, ..., k.
- Extremo de clase: Llamaremos extremo de clase y lo denotamos
por ei a los extremos de las clases. Por notación diremos que
la clase i viene dada como [ei-1, ei). Esto es el número de la
Descripción Univariante
Tema II 30
clase lo define el subíndice superior, siendo la clase cerrada
por la izquierda y abierta por la derecha.
- Marca de clase: Se define como el punto medio de una clase.
Por ejemplo, la marca de la clase i será:
- Amplitud de clase: No es más que el tamaño de la clase. Lo
denotamos por ai:
- Recorrido: Es la diferencia entre el mayor y menor valor de
la variable y lo vamos a denotar por Re. Es decir,
Re= Max (x) - Min (x)= ek - e0
- Frecuencia relativa absoluta por unidad de clase: es el
resultado que se obtiene al dividir la frecuencia relativa o
absoluta por el tamaño de cada clase (ai). Es decir, es una
medida, en términos relativos o absolutos, de la densidad de
individuos en cada una de las clases.
Una vez vistos estos conceptos básicos pasamos al estudio de
las representaciones gráficas continuas, entre las cuales
destacamos:
- Histograma de frecuencias.
- Curva de acumulación o Polígono acumulativo de frecuencias.
* HISTOGRAMA DE FRECUENCIAS:
Representación gráfica que se construye levantando sobre cada
clase un rectángulo de área proporcional a la frecuencia
relativa (o frecuencia absoluta) por unidad de clase
correspondiente a dicha modalidad.
2e+e=c 1-ii
i
i. clasela de amplitud ,e-e=a 1-iii
ESTADÍSTICA I
Tema II 31
Supongamos que tenemos una distribución de frecuencias
(xi,fi):
� ni � fi � ai � fi/ai � � � � � � e0 ���������������������������������������� � n1 � f1 � a1 � f1/a1 � e1 ���������������������������������������� � n2 � f2 � a2 � f2/a2 � e2 ���������������������������������������� � n3 � f3 � a3 � f3/a3 � e3 ���������������������������������������� . � . � . � . � . � . � . � . � . � . � . � . � . � . � . � � � � � �
ni/ai nos da el número de individuos por unidad de tamaño de
cada clase mientras que fi/ai nos da la proporción de
individuos por unidad de tamaño de cada clase.
Llamaremos "Histograma de Frecuencias" a la siguiente
representación gráfica:
Descripción Univariante
Tema II 32
La representación que resulta de unir mediante rectas los
puntos medios de las bases superiores de los rectángulos del
histograma de frecuencias se conoce como polígono de
frecuencias.
En la representación gráfica del histograma de frecuencias
debemos de tener en cuenta:
- Si los intervalos son de amplitud constante, las alturas de
los rectángulos serán proporcionales a las frecuencias
relativas (o absolutas) respectivamente.
- Si los intervalos son de amplitud variables, las alturas de
los rectángulos se calculan como fi/ai ó ni/ai.
Aunque a la hora de construir el histograma de frecuencias se
pueden utilizar tanto (xi, fi/ai) como (xi, ni/ai), es mejor
utilizar el primer tipo de distribución ya que si tenemos k
clases y sumamos las áreas debajo del histograma:
- Con (xi, fi/ai):
- Con (xi, ni/ai):
Por tanto, la ventaja de utilizar la representación con
(xi,fi/ai) estriba en el hecho de que sea cual sea el número de
individuos, el área debajo del histograma es siempre igual a la
unidad y por ello, nos servirá para realizar comparaciones
entre dos distribuciones de frecuencias. La representación con
(xi,ni/ai) no permite comparar dos distribuciones que no tengan
1== fa
fa=
a
fa+...+
a
fa+
a
fa i
k
1=ii
ii
k
1=ik
kk
2
22
1
11 ∑∑
N== na
na=
an
a+...+an
a+an
a i
k
1=ii
i
i
k
1=ik
kk
2
22
1
11 ∑∑
ESTADÍSTICA I
Tema II 33
el mismo número de individuos o de datos (N).
Denominaremos función de densidad a la expresión analítica cuya
representación gráfica es el histograma de frecuencias. Esta
función viene dada por:
según se consideren relativas o absolutas.
* POLIGONO ACUMULATIVO DE FRECUENCIAS:
Llamaremos "Polígono Acumulativo de Frecuencias" o "Curva de
Acumulación" a la función poligonal que se obtiene uniendo,
mediante rectas, cada par consecutivo de los siguientes
valores:
Es decir,
an=f(x) ó
af=f(x), )e ,e[ x Si
: f
i
i
i
ii1-i∈
ℜ→ℜ
)N,e( ... )N,e( ... )N,e( )N,e( ,0)e( kkii22110
... )F,e( )F,e( ,0)e( bien 22110
Descripción Univariante
Tema II 34
Para conocer la expresión analítica de la curva de acumulación,
es decir, la función cuya representación gráfica es la curva de
acumulación, tomamos sólo el segmento (ei-1,ei):
La expresión analítica de la recta que contiene al segmento
viene dada por:
donde,
(I) )eF(-)eF(
)eF(-F(x)=
e-ee-x
1-ii
1-i
1-ii
1-i
ESTADÍSTICA I
Tema II 35
Sustituyendo en (I):
Por tanto,
Y podremos decir que la curva de acumulación viene dada como la
representación gráfica de dicha función, que denominaremos
función de distribución.
Propiedades de la función de distribución:
f=Nn=)eF(-)eF(
N
n+...+n+n=N
N=)eF(
N
n+...+n+n=NN=)eF(
e-e=a
ii
1-ii
1-i211-i1-i
i21ii
1-iii
n.acumulació decurva
la deanalítica Expresión)_eF(+)e-(xaf= F(x)
f
)eF(-F(x)=ae-x
1-i1-ii
i
i
1-i
i
1-i
)eF(+)e-(xa
f=]_F(x)e,e[ x
:F
1-i1-ii
ii1-i∈
ℜ→ℜ
Descripción Univariante
Tema II 36
Como se puede ver de lo dicho hasta ahora hemos aprovechado el
estudio de las representaciones gráficas para introducir el
concepto de función de cuantía, de densidad y de distribución.
Estos conceptos se estudiarán con detalle en la parte
correspondiente a la teoría de la probabilidad y más
específicamente al abordar el estudio de las variables
aleatorias. Su introducción en esta parte del temario permitirá
al alumno tener una idea más clara sobre el contenido y la
aplicación de estas funciones puesto que en este tema se
definen en términos de frecuencias cuya comprensión no supone
ninguna dificultad para el alumno, mientras que el nivel de
abstracción en el que se desarrollará este concepto en el
ámbito de la probabilidad es considerable.
II.3.- Descripción numérica.
II.3.1.- Momentos estadísticos
Los momentos estadísticos son el resultado de llevar a cabo
unas determinadas operaciones con la información suministrada
por la distribución de frecuencia. Su importancia radica en que
la mayoría de medidas que usaremos para describir y sintetizar
la información se pueden expresar en términos de momentos.
Sea (xi,fi) la distribución de frecuencias de una variable
discreta o atributo X, que presenta k modalidades. Sea b un
número perteneciente al conjunto de os números reales, y sea r
un número perteneciente al conjunto de los números naturales.
Llamaremos momento de orden r con respecto al punto b, y lo
1F(x)0 anterior, lo deia consecuenc como
0=F(x) (3)
1=F(x) (2)
creciente nfunci una es (1)F
x
x
≤≤
∞→
∞→
lim
lim
ESTADÍSTICA I
Tema II 37
denotaremos por :r,b, al resultado de realizar la operación rk
1iiib,r )bx(*f∑
=−=µ
Como se puede observar, según le vamos dando valores a r y b
vamos obteniendo distintos momentos. Así, por ejemplo, el
momento de orden 2 con respecto al punto 4 se calcularía
mediante la expresión
2k
1iii4,2 )4x(*f∑
=−=µ
aplicada a cualquier distribución de frecuencias.
Si en vez de trabajar con una atributo o una variable discreta,
trabajamos con una variable X que es continua, la expresión de
los momentos solo difiere en que en vez de aparecer xi se
utiliza ci, la marca de clase. Su expresión, por tanto, sería
rk
1iiib,r )bc(*f∑
=−=µ
II.3.1.1.- Momentos con respecto al origen.
Llamaremos momento de orden r con respecto al origen o momento
no centrado, y lo denotaremos por "r, al momento de orden r con
respecto al punto cero.
∑∑==
=−=µ=αk
1iii
ri
k
1ii0,rr x*f)0x(*f
Por ejemplo, el momento no centrado de orden cero es 1 sea cual
sea la distribución de frecuencias de X.
II.3.1.2.- Momentos con respecto a la media. Llamaremos momento de orden r con respecto a la media o momento
centrado de orden r, y lo denotaremos por :r, al momento de
Descripción Univariante
Tema II 38
orden r con respecto al momento no centrado de orden 1.
r1i
k
1ii,rr )x(*f1 α−=µ=µ ∑
=α
Por ejemplo, el momento centrado de orden cero es 1 sea cual
sea la distribución de frecuencias de X.
II.3.2.- Medidas de posición.
Las medidas de posición no son más que promedios cuyo objetivo
es obtener una medida que nos informe de cómo se sitúan los
individuos dentro de la distribución. Dentro de ellos,
encontramos dos grandes grupos: Medidas de Posición Central,
nos suministran un valor central de la distribución (media
aritmética, media geométrica, media armónica, mediana); Medidas
de Posición No Central: la moda y los cuantiles.
II.3.2.1.-Medidas de Posición Central. Media aritmética, geométrica, armónica y mediana.
Dentro de las medidas de posición central vamos a distinguir
las siguientes:
- Media Aritmética.
- Media Geométrica.
- Media Armónica.
- Mediana.
**MEDIA ARITMETICA:
Si tenemos una distribución de frecuencias dada por (xi,fi),
llamamos Media Aritmética de la variable X a la suma de todos
los valores de la distribución dividida por el número total de
datos. La representamos por:
ESTADÍSTICA I
Tema II 39
A la hora de estudiar la media aritmética debemos identificar
el tipo de variable con el que trabajamos: variable estadística
discreta o variable estadística continua.
- Variables estadísticas discretas:
La expresión de la media aritmética diferirá dependiendo del
tipo de datos con los que trabajemos: agrupados o no agrupados.
Lo que nos va a proporcionar la media aritmética es el valor
central de la distribución que coincide con su centro de
gravedad.
- Variables estadísticas continuas:
Al trabajar con variables continuas, no tenemos valores de Xi
sino extremos de clase, ei, y por tanto, utilizaremos las
marcas de clase Ci. Obsérvese que ahora el caso de datos no
agrupados no tendría sentido. Se tiene:
*Propiedades de la media aritmética:
1) La suma algebraica de las desviaciones de los valores de la
X. deMedia =X
Nx =
Nx+...+x+x=X :AGRUPADOS NO DATOS
fx=Nnx=
Nnx+...+nx+nx=X :AGRUPADOS DATOS
ik
1=i
k21
ii
k
1=i
iik
1=i
kk2211
∑
∑∑
fC = nCN1
=X :AGRUPADOS DATOS ii
n
1=iii
n
1=i∑∑
Descripción Univariante
Tema II 40
variable con respecto a la media aritmética ponderada por su
frecuencia relativa o absoluta es igual a cero.
Demostración:
2) La media de los cuadrados de las desviaciones de los valores
observados respecto a cualquier número Q resulta mínima cuando
ese número K es igual a la media aritmética.
Esto se expresa diciendo que:
se hace mínima si, y solamente si:
Demostración:
De donde,
0 = X - X = X - X = X =)X-( ff-xfxf i
n
1=ii
n
1=iii
n
1=iii
n
1=i∑∑∑∑
f)Q-x( =S i2
i
k
1=i∑
X=Q
Q)]-X)(X-2(++[
Q-(
xQ)-X()X-x(f=
=Q)]-X(+)X-x[(f)xf=S
i2
i2
i
k
1=i
i
2i
k
1=i
2ii
k
1=i
∑
∑∑
ESTADÍSTICA I
Tema II 41
En donde el valor de Q que hace mínimo S es la media
aritmética, es decir:
3) Si tenemos una variable estadística X y le sumamos un valor
constante è a todos los valores de la variable, la media se ve
incrementada en esa constante. Es decir,
Demostración:
4) Si todos los valores de una variable estadística los
multiplicamos por una constante , su media aritmética también
queda multiplicada por la misma constante. Es decir,
Q)-X(+)X-x(ffQ)-X(+)X-x(f
xfQ)-X2(+Q)-X(f+)X-x(f=S
2
i
2i
k
1=ii
k
1=i
2
i
2i
k
1=i
ii
n
1=I
2i
k
1=ii
2i
k
1=I
==
=)X-(
∑∑∑
∑∑∑
X=Q cuandovalor menor toma su queya
N
=N
=
=+N
)X-(Q
n)X-x(
nQ)-x(
)X-(Qn
Q)-x( = S
2
i
i2
k
1=i
i
i2
k
1=iQ
2i
i2
k
1=iQQ
∑∑
∑
min
minmin
θ
θθ
+ X = Z
i + X = Z + X = Si Z ii ∀→
θθ
θθ
+ X = + xf
f + xfxf= zf = Z
ii
n
1=i
i
n
1=iii
n
1=iii
n
1=iii
n
1=i
= Z
= ) + (
∑
∑∑∑∑
Descripción Univariante
Tema II 42
Demostración:
* Ventajas e Inconvenientes de la media aritmética:
Ventajas:
- Utiliza todos los valores de la distribución.
- Es fácil de calcular.
- Es única y existe siempre.
- Es el centro de gravedad de la distribución.
Inconvenientes:
- Pierde representatividad cuando la variable toma valores muy
extremos. Este inconveniente no lo presenta la mediana.
**MEDIA GEOMETRICA:
Sea una distribución de frecuencias (xi, ni). La media
geométrica, que representaremos por G, se define como la raíz
N-ésima del producto de los N valores de la distribución
elevados a su correspondiente frecuencia absoluta. Es decir,
θ
θθ
* X = Z
i *X = Z * X = Si Z ii ∀→
X * = fx * = Z
* fx = f) * x( = fz = Z
fx = X
ii
k
1=i
ii
k
1=iii
k
1=iii
k
1=i
ii
k
1=i
θθ
θθ
∑
∑∑∑
∑
ESTADÍSTICA I
Tema II 43
Para el cálculo práctico de la media geométrica se suelen
aplicar logaritmos neperianos o logaritmos en base diez.
Aplicando logaritmos neperianos la expresión de la media
geométrica quedará como sigue:
* Ventajas e Inconvenientes de la media geométrica:
Ventajas:
- Utiliza todos los valores de la distribución.
- Es menos sensible que la media aritmética a los valores
extremos, por su carácter de producto.
Inconvenientes:
- Es de significado estadístico menos intuitivo que la media
aritmética.
- Su cómputo es más difícil.
- En ocasiones no queda determinada. Cuando la variable toma al
menos un xi=0, entonces G se anula y además, si la variable
toma valores negativos, se puede presentar una gama de casos en
los que tampoco la G queda determinada.
continuas. ablespara varai c(=c...cc= G
discretas. blespara varia x(=x...xx= G
)
)
ini
k
1=i
N1
nn
2nN
1n
in
k
1=i
N1
Nn
n2
n1
n
k21
ik21
∏
∏
e xn =G ,donde De
xnN1
=)xn + ... + xn + xn(N1
=G
)x...xxx N1
= x( =G
ii
k
1=i
N1
ii
k
1=ikk2211
kn
2n
1n
in
k
1=iin
k
1=i
N1
k21ik ( N1 = )
ln
lnlnlnlnln
lnlnln ln
∑
∑
∏∏
Descripción Univariante
Tema II 44
Ejemplo:
Sea la distribución de salarios de los empleados de la empresa
de autobuses "Suárez S.A" que viene dada por la siguiente
tabla:
¡Error!
Marcador
no
definido.
xi
ni
250000 425
320000 834
412000 421
528000 265
630000 384
870000 128
Calcúlese la media geométrica de dicha distribución.
Solución:
¡Error!
Marcador
no
definido.
ni ln(xi) ni*ln(xi)
ESTADÍSTICA I
Tema II 45
xi
250000 425 12,4292162 5282,416885
320000 834 12,6760762 10571,847550
412000 421 12,9287786 5443,015791
528000 265 13,1768515 3491,865648
630000 384 13,3534751 5127,734438
870000 128 13,6762484 1750,559795
N=2457 '= 31667,44011
Por tanto,
La media geométrica es utilizada principalmente para promediar
porcentajes, tasas, índices,... es decir, aquellos casos en los
que la variable representa variaciones acumulativas.
**MEDIA ARMONICA:
La media armónica se define como:
395798,693 = e = e =G 112,888661011)(31667,440
24571
Descripción Univariante
Tema II 46
Se suele utilizar para promediar velocidades, tiempos
promedios. Es decir, se utiliza para promediar datos que vienen
en términos relativos.
Ejemplo:
Vamos a calcular la producción media de 4 fincas que han
producido: 100, 120, 150 y 200 Tms. de plátanos con unos
rendimientos de 10, 15, 20 y 18 Tms. por hectárea
respectivamente.
Llamando xi al rendimiento y ni a la producción tenemos:
¡Error!
Marcador
no
definido.
xi
ni ni /
xi
xini
10 100 10 1000
12 120 12 1440
15 150 10 2550
18 200 11.11 3600
570 39.4 8590
cn
N = A
:bien o
xn
N = A
i
ik
1=i
i
ik
1=i
∑
∑
ESTADÍSTICA I
Tema II 47
La media armónica es: A = 570 / 43.1 = 13.22 Tms./hectárea.
La media aritmética para este caso es : 8590/570 = 15.07
Tms./hectárea.
* Ventajas e Inconvenientes de la media armónica:
Ventajas:
- Utiliza todos los valores.
- Si se realiza el cambio oportuno, se puede pasar de una media
armónica a una media aritmética.
- Hay casos en que es más representativo que la media
aritmética.
Inconvenientes:
- Cuando los valores de la variable están muy próximos a cero,
la media armónica pierde significación, es poco representativa.
- Si existe algún valor de la variable igual a cero (algún
xi = 0), la media armónica no se puede determinar.
**FORMULA DE FOSTER DE LOS PROMEDIOS:
La fórmula de Foster de los promedios nos va a permitir
obtener todas las medidas de posición central estudiadas hasta
ahora. Se define como:
Y dando diferentes valores a m, obtenemos las diferentes
medidas de posición central:
)nxN1
( nxN1
= M(m) iim
k
1=i
m1
m iim
k
1=i∑∑
Descripción Univariante
Tema II 48
Además es posible demostrar que la relación entre las tres
medias estudiadas anteriormente es siempre:
**MEDIANA:
La mediana es aquel valor de la distribución que deja a su
izquierda y a su derecha el mismo número de frecuencias,
partiendo de la base de que la distribución ha sido ordenada de
menor a mayor.
De forma analítica, la mediana vendrá dada por la siguiente
expresión:
en donde Me indica la mediana y F(x) la función de distribución
de la variable X.
Hay que distinguir dos casos a la hora de hablar de la mediana
en función del tipo de variable con la que trabajamos. Es
X = M(1) 1 = m Si
G = M(0) 0 = m Si
A =
xn
N= nx
N1
= M(-1) 1- = mSi
i
in
1=i
1- ii1-
n
1=i
→
→
→
∑∑
x G A ≤≤
21
= F(x) que tal x = Me ,
ESTADÍSTICA I
Tema II 49
decir, Variables Estadísticas Discretas y Variables
Estadísticas Continuas.
A) Variables Estadísticas Discretas:
Dentro de este tipo de variables distinguimos dos casos:
Vamos a ver entonces, la expresión que tendría la mediana en el
caso (A-1):
Gráficamente:
21
= )XF( / XExisteNo 2)-A
21
= )XF( / X Existe 1)-A
ii
ii
_
X = Me
caso tal en
21
= )XF( / X
i
ii∃
Descripción Univariante
Tema II 50
Ejemplo caso (A-1):
Sea la distribución de frecuencias dada por la tabla siguiente:
¡Error!
Marcado
r no
definid
o. xi
ni
6 3
12 7
18 5
24 3
30 2
Calcúlese la mediana.
Solución:
ESTADÍSTICA I
Tema II 51
¡Erro
r!
Marca
dor
no
defin
ido.
xi
ni fi Ni Fi
6 3 0,15 3 0,15
12 7 0,35 10 0,50
18 5 0,25 15 0,75
24 3 0,15 18 0,90
30 2 0,10 20 1,00
N=20 '=1,00
Por tanto,
Y la expresión de la mediana en el caso (A-2) será la
siguiente:
12 = Medonde, De
21 = 12)=X F(_
21 = )X F( ii
h)+XF(<21
<h)-XF(
0;h 0,>h X = Me
21
= )XF( / X ExisteNo
ii
i
ii
→_
_
Descripción Univariante
Tema II 52
Gráficamente:
Ejemplo caso (A-2):
Sea la distribución de frecuencias dada por la tabla:
¡Erro
r!
Marca
dor
no
defin
ido.
xi
ni
6 3
12 6
ESTADÍSTICA I
Tema II 53
18 5
24 4
30 2
Calcúlese la mediana.
Solución:
¡Erro
r!
Marca
dor
no
defin
ido.
xi
ni fi Ni Fi
6 3 0,15 3 0,15
12 6 0,30 9 0,45
18 5 0,25 14 0,70
24 4 0,20 18 0,90
30 2 0,10 20 1,00
'=1,00
Por tanto,
B) Variables Estadísticas Continuas:
Supongamos que conocemos la función de distribución de la
variable X: F(X) y que sabemos que:
0h 0,>h h);+F(18<21
<h)-F(18 18 = Me
21
= )XF( / XExisteNo ii
→_
_
Descripción Univariante
Tema II 54
por tanto, la mediana pertenece a la clase [ei-1, ei).
Gráficamente:
Y analíticamente,
(I) )eF(-)eF(
1))-eF(-21
)(e-e( = e-Me
)eF(-)eF(
)eF(-21
= e-ee-Me
Y-YY-Y
= X-XX-X
-1ii
i-1ii
-1i
-1ii
-1i
-1ii
-1i
12
1
12
1 _
21
)eF(y 21
1)-eF( ii ≥≤
ESTADÍSTICA I
Tema II 55
Ejemplo del caso continuo:
Calcular la mediana de la siguiente distribución de
salarios:
¡Error!
Marcado
r no
definid
o.
Clase
Salario Anual N� obreros
1 30000 a 35000 100
2 35000 a 40000 150
e-e = a
f = )eF(-)eF( :Donde
1-iii
i1-ii
e + )N-2N(
na = Me
N
N = )e F(;Nn = f como, lado otro Por
e + ))eF(-21
(fa = Me
f
))eF(-21
(a = e-Me
1-i1-ii
i
1-i1-i
ii
1-i1-ii
i
i
1-ii
1-i
Descripción Univariante
Tema II 56
3 40000 a 45000 200
4 45000 a 50000 180
5 50000 a 55000 41
N=671
Solución:
¡Error
!
Marcad
or no
defini
do.
Clase
Ci ni Ni Fi
1 32500 100 100 0,14903
2 37500 150 250 0,37257
3 42500 200 450 0,67064
4 47500 180 630 0,93889
5 52500 41 671 1,00000
N=671
Por tanto,
ESTADÍSTICA I
Tema II 57
* Propiedades de la Mediana:
La mediana hace mínima la suma de todas las desviaciones
absolutas. Es decir, si representamos la mediana por Me,
tenemos que,
cuando la constante con respecto a la cual se toman las
desviaciones, Q, es igual a la mediana Me.
II.3.2.2.-Medidas de Posición No Central
**MODA:
La moda es el valor de la variable que se presenta más
frecuentemente, y por tanto, en la distribución de frecuencias
será el valor de la variable que tenga la máxima frecuencia.
Distinguimos dos casos: A) Variables Estadísticas Discretas. B)
Variables Estadísticas Continuas.
A) Variables Estadísticas Discretas:
42137,5 = Me
40000 + 25(85,5) = Me
40000 + 250]-[335,52005000
= Me
e + N-2N
na = Me
0,5 = (x) F 45000) [40000, Me
1-i1-ii
i
∈ _
n|Me-x| = n|Q-x| ii
k
1=iii
k
1=iQ ∑∑min
Descripción Univariante
Tema II 58
La moda, Mo, viene dada por aquel valor que puede tomar la
variable que verifique que tiene la mayor frecuencia absoluta
(o relativa). Gráficamente, la moda será el valor máximo que
puede tomar el diagrama de barras.
De forma analítica:
Ejemplo:
Calcular la moda de la siguiente distribución de frecuencias:
¡Error!
Marcado
r no
definid
o. xi
ni
1 2
4 3
7 5
10 10
12 8
15 6
Solución:
i f>fi n>n / x = Mo irirr ∀∀
ESTADÍSTICA I
Tema II 59
¡Erro
r!
Marca
dor
no
defin
ido.
xi
ni fi
1 2 0,0588235
4 3 0,0882352
7 5 0,1470588
10 10 0,2941176
12 8 0,2352941
15 6 0,1764705
34 1
Por lo tanto, Mo = 10 puesto que la mayor frecuencia absoluta ó
relativa: n4 = 10 > ni úi ó f4 = 0,2941176 > fi
B) Variables Estadísticas Continuas:
La clase modal en las variables estadísticas continuas será
aquella que contiene la mayor densidad de frecuencia (fi/ai).
Supongamos que sabemos que la moda pertenece a la clase [ei-
1,ei). Dentro de ese intervalo modal, la moda se encuentra en
un punto en el que las distancias a los extremos inferior y
superior del intervalo son directamente proporcionales a las
diferencias entre la densidad de frecuencia del intervalo modal
y la de los intervalos contiguos a dichos extremos.
Gráficamente:
Descripción Univariante
Tema II 60
De forma analítica, la moda vendrá dada por la siguiente
ecuación:
Por semejanza entre los triángulos que quedan definidos a
izquierda y derecha de Mo (que notaremos por A y B), podemos
deducir la expresión de m (recuérdese que dos triángulos
semejantes verifican que el cociente entre altura y base de
cada uno es el mismo). Así pues, m vendrá dado por la siguiente
expresión:
Y sustituyendo m en la expresión de la moda, ésta quedará como
sigue:
m + e = Mo 1-i
a *)
a
f-
a
f(+)
a
f-
a
f(
a
f-
a
f
= m
a
f-
a
f
m - a =
a
f-
a
f
m
i
1+i
1+i
i
i
1-i
1-i
i
i
1-i
1-i
i
i
1+i
1+i
i
i
i
1-i
1-i
i
i
ESTADÍSTICA I
Tema II 61
Ejemplo:
Calcúlese la moda de la siguiente distribución de frecuencias:
¡Error!
Marcador
no
definido
. [ei-
1,ei)
ni
0-2 12
2-4 14
4-6 26
6-8 22
8-10 16
10-12 10
Solución:
¡Erro
r!
Marca
dor
no
defin
ni fi fi/ai
a
f-
a
f = Z
a
f-
a
f = Z : siendo
Z+Z
Za + e = Mo
1+i
1+i
i
i2
1-i
1-i
i
i1
21
1i1-i
Descripción Univariante
Tema II 62
ido.
Ci
1 12 0,12 0,06
3 14 0,14 0,07
5 26 0,26 0,13
7 22 0,22 0,11
9 16 0,16 0,08
11 10 0,10 0,05
'=1,00
La moda pertenece al intervalo [4, 6), el que contiene la mayor
densidad de frecuencia (fi/ai), y por tanto, vendrá dada por la
siguiente expresión:
**CUANTILES
Los cuantiles son aquellos valores de la distribución que la
dividen en partes iguales, es decir, en intervalos que
contienen la misma proporción de individuos.
Si tenemos una distribución de frecuencias (xi, ni) y sean r y
k dos números naturales, tal que r<k, llamaremos "Cuantil",
Cr/k, de orden r/k a la raíz de la ecuación F(X)=r/k. Es decir,
será aquel valor de la variable X que verifique la F(X)=r/k.
Los cuantiles tendrán denominaciones específicas según cual sea
el número de intervalos en que se divide la distribución. Entre
ellos distinguimos:
5,5 = 2 * 0,11)-(0,13+0,07)-(0,13
0,07-0,13 + 4 = Mo
m + e = Mo 1-i
ESTADÍSTICA I
Tema II 63
*Cuartiles:
Son aquellos valores de la distribución que la dividen en
cuatro partes iguales, en cada una de las cuales ha de estar el
25% de los individuos. Los denotaremos por Q1/4, Q2/4 y Q3/4.
Se presentan dos casos: A) Distribuciones discretas, B)
distribuciones continuas.
A) Distribución Discreta.
Si estamos estudiando una variable discreta llamaremos cuartil
primero y lo denotaremos por Q1 o Q1/4 a aquel valor de la
variable X que verifica:
donde: h > 0 Y h --> 0
De igual forma podríamos definir el cuartil segundo (Q2 o Q 2/4)
y el tercero (Q3 o Q3/4). Esto es xj es el cuartil de orden dos
si verifica:
Y x3 es el cuartil de orden tres si verifica:
Vemos un ejemplo.
¡Error
!
Marcad
or no
ni Ni Fi
0.50 )XF( )Q = XF( )XF( 0.25 h+i1ih-i ≥≤≤≤
0.50 )xF( )Q=xF( )xF( 0.50 h+j2jh-j ≥≤≤≤
0.75 )xF( )Q=xF( )xF( 0.75 h+s3sh-s ≥≤≤≤
Descripción Univariante
Tema II 64
defini
do.
xi
16 5 5 0.05
19 5 10 0.1
21 10 20 0.2
23 20 40 0.4
24 20 60 0.6
25 30 90 0.9
30 5 95 0.95
32 5 100 1.00
B) Distribución Continua:
En este caso el primer paso a dar consiste en determinar cual
es la clase que contiene al cuartil. Este paso es inmediato. La
clase i contiene a Q1 si verifica que:
De igual forma diremos que la clase j contiene al segundo
cuartil si se verifica:
Y la clase s contiene al tercer cartil si se cumple:
25 = Q
24 = Q
23 = Q
43
42
41
)eF( 0.25 < )eF( i1-i ≤
)eF( 0.50 < )eF( j1-j ≤
ESTADÍSTICA I
Tema II 65
Una vez determinada la clase el cálculo del cuartil es
inmediato mediante la expresión:
en donde el subíndice i nos indica la clase que contiene a Qr/k
y que se ha determinado en un paso previo. Esta expresión se
deduce de forma similar a como se hizo con la fórmula de la
mediana.
Ejemplo:
Calcúlense los cuartiles de la siguiente distribución:
[ei-1,ei) ni
50-55 20
55-60 80
60-65 175
65-70 100
70-75 75
75-80 50
Solución:
)eF( 0.75 < )eF( s1-s ≤
4=k siendo ,n
N-Nkr
*a + e = Qi
1-i
i1-ikr
Descripción Univariante
Tema II 66
[ei-1,ei) ni Ni Fi
50-55 20 20 0,04
55-60 80 100 0,20
60-65 175 275 0,55
65-70 100 375 0,75
70-75 75 450 0,90
75-80 50 500 1,00
'=500
Por tanto,
*Quintiles:
Serán aquellos valores de la distribución que la dividen en
cinco partes iguales. También distinguimos dos casos:
160,7142857 = 175
100-*50041
*5 + 60 = Q
65) [60, Q
41
41 ∈
8664,2857142 = 175
100-*50042
*5 + 60 = Q
65) [60, Q
42
42∈
70 = 100
275-*50043
*5 + 65 = Q
70) [65, Q
43
43 ∈
ESTADÍSTICA I
Tema II 67
distribución discreta y distribución continua; en ambos casos
los planteamientos son similares a los ya desarrollados para
los cuartiles y por tanto se presentarán ahora con un ejemplo.
A) Distribución Discreta.
Veámoslo con un ejemplo.
xi ni Ni fi Fi
1000 20 20(1) 0.2 0.2
2000 10 30 0.1 0.3
3000 15 45(2) 0.15 0.45
4000 25 70(3) 0.25 0.70
5500 10 80(4) 0.10 0.80
6000 15 95 0.15 0.95
6500 5 100 0.05 1.00
100 1.00
Descripción Univariante
Tema II 68
B) Distribución Continua.
Los quintiles se obtienen a través de la siguiente expresión:
Ejemplo:
Calcular los quintiles de la siguiente distribución:
[ei-1,ei) ni Ni Fi
50-55 40 40 0.04
55-60 160 200 0.2
60-65 350 550 0.55
65-70 200 750 0.75
70-75 150 900 0.9
75-80 100 1000 1.00
Solución:
5500 = Qi 80=5
1004x (4)
4000 = Qi 60=5
1003x (3)
3000 = Qi 40=5
1002x (2)
1000 = Qi 20=5
1001x (1)
54
53
52
51
_
_
_
_
5=k siendo ,a * n
N-Nkr
+ e = Qi ii
1-i
1-ikr
ESTADÍSTICA I
Tema II 69
* Deciles:
Son aquellos valores de la distribución que la dividen en diez
intervalos iguales.
* Percentiles:
Dividen a la distribución en cien partes iguales, cada una de
las cuales contiene al 1% de la población.
II.3.3.- MEDIDAS DE DISPERSION.
Con las medidas de dispersión tratamos de estudiar hasta qué
punto, para una determinada distribución de frecuencias, las
medidas de posición central estudiadas son representativas como
síntesis de toda la información.
Para medir la representatividad de estas medidas tendremos que
cuantificar la separación entre los valores de la distribución
y estas medidas. A esta cuantificación, es decir, a la mayor o
menor separación de los valores respecto a otro que se pretende
771,6666666 = 5 * 150
750-100054
+ 70 = Qi
66,25 = 5 * 200
550-100053
+ 65 = Qi
662,8571428 = 5 * 350
200-100052
+ 60 = Qi
60 = 5 * 160
40-100051
+ 55 = Qi
54
53
52
51
Descripción Univariante
Tema II 70
que sea su síntesis, se le llama Dispersión o Variabilidad.
Podemos distinguir dos tipos de medidas de dispersión: Medidas
de Dispersión Absolutas: Aquellas que no permiten establecer
comparaciones entre distribuciones heterogéneas.
Medidas de Dispersión Relativas: Aquellas que sí permiten
establecer estas comparaciones. Habitualmente son
adimencionales.
MEDIDAS DE DISPERSION ABSOLUTAS:
Entre ellas distinguimos las siguientes:
-Recorrido o Rango.
-Recorrido Intercuartílico.
-Media de las Desviaciones a un Promedio.
-Varianza.
-Desviación Típica o Standard.
-Cuasivarianza.
Veamos cada una de ellas:
*Recorrido o Rango:
Es la diferencia entre el mayor y el menor valor posible de la
distribución de una variable. Distinguimos dos casos:
-Variable Discreta: El recorrido vendrá dado por la siguiente
expresión:
-Variable Continua: El recorrido se obtiene a través de la
siguiente expresión:
Esta medida tiene el inconveniente de que viene determinada
sólo por dos valores de la variable, siendo por ello, muy
sensible a la fluctuación de estos valores extremos.
X-X = Re 1k
e-e = Re 0k
ESTADÍSTICA I
Tema II 71
Ejemplo:
��������������������������������������� � Xi � 5 7 9 20 25 30 � ��������������������������������������� � ni � 1 1 1 1 1 1 � ���������������������������������������
* Recorrido Intercuartílico:
Se define como la diferencia entre el tercer y el primer
cuartil. Es decir,
Como se puede observar esta medida nos indica la dispersión que
presenta el 50% de los individuos centrales de la distribución.
* Media de las Desviaciones a un Promedio:
Analíticamente,
Si analizamos esta expresión, vemos que al realizar el
sumatorio tendremos desviaciones positivas y negativas que se
compensarán y ello hará que la medida así definida tienda a
cero. Por lo tanto, no estaríamos cuantificando la dispersión.
Para solucionar este problema, podemos considerar los valores
absolutos de las desviaciones o elevarlas al cuadrado.
Dentro de esta primera solución (valores absolutos),
tenemos:
25 = 5-30 = Re
Q-Q =Ri 1/43/4
.cualquiera promedio un p siendo ,fp)-x( = D ii
k
1=i∑
Descripción Univariante
Tema II 72
A) Desviación media respecto a la media aritmética:
Una desviación grande indica una gran dispersión en la
distribución.
B) Desviación media respecto a la mediana:
En el caso de obtener un DMe grande, la mediana no será
representativa.
* Varianza:
Es junto a la desviación típica la medida de dispersión más
utilizada. Es una medida que entra dentro de la segunda
solución (elevarla al cuadrado). Se define como la media de los
cuadrados de las desviaciones de los valores de la variable a
la media aritmética.
En general, cuanto más dispersas sean las observaciones,
mayores serán las desviaciones respecto a la media, y mayor por
tanto, el valor numérico de la varianza.
Propiedades de la Varianza:
1.-La varianza nunca puede ser negativa.
f|X-x| = D ii
k
1=iX ∑
f|Me-x| = D ii
k
1=iMe ∑
f)X-X( = S
m = S
i2
i
k
1=i
2x
22x
∑
ESTADÍSTICA I
Tema II 73
2.-Si sumamos a todos los valores de la variable una constante
è, la varianza no varía.
Demostración:
3.-Al multiplicar los valores de una distribución de
frecuencias por una constante è, la varianza queda multiplicada
por el cuadrado de la constante.
Demostración:
0 S 2x ≥
S = S tanto,Por
S = f)X-x( =
=f)] + X(-) + x[( = f)X-x( = )S(
+ X = X + X = X si que Sabemos
2x
2x
2xii
2k
1=i
ii2
k
1=iii
2k
1=i
2x
′
′′′
′′
∑
∑∑ θθ
θθ _
S* = )X-x(f =
= )*X-*x(f = )X-x(f = )S(
*X = X X* = X ahora Sea
f)X-x( = S ; fx = X
2x
2i
2i
k
1=i
2
i
2i
k
1=ii
2i
k
1=ix
2
ii2
k
1=i
2xii
k
1=i
θθ
θθ
θθ
∑
∑∑
∑∑
′′′
′′ _
Descripción Univariante
Tema II 74
* Desviación Típica o Standard:
Se define como la raíz cuadrada, con signo positivo, de la
varianza. Es decir,
Al ser la raíz cuadrada de la varianza, vendrá expresada en las
mismas unidades de medida que la distribución de la variable.
Ello nos permitirá realizar una interpretación más clara de la
dispersión.
Es una medida de dispersión absoluta que no nos permite
comparar dos distribuciones salvo en el caso de que las medias
de ambas y las unidades en que vienen expresadas sean iguales.
* Cuasivarianza:
Se define como:
Es fácil obtener una relación entre la cuasivarianza y la
varianza. Para ello basta multiplicar y dividir por N:
f)X-x(+ = S+ = S ii2
n
1=i
2xx ∑
1-N
* n)X-x( = S
i
i2
n
1=i
2*x ∑
ESTADÍSTICA I
Tema II 75
Por tanto,
Esta medida se interpreta de forma similar a la varianza.
Realmente cuando N tiende a infinito la cuasivarianza tiende a
la varianza. Sin embargo cuando N es pequeña estas dos medidas
son distintas, jugando en este caso la cuasivarianza un papel
importante en la estadística inferencial.
MEDIDAS DE DISPERSION RELATIVAS:
El objetivo de este tipo de medidas es permitirnos comparar la
dispersión de distribuciones distintas, posibilitando así,
resolver el inconveniente que presentan las medidas de
dispersión absoluta. Dentro de ellas nos vamos a centrar en el
estudio del coeficiente de variación de Pearson.
* Coeficiente de Variación de Pearson:
Se define como la relación por cociente entre la desviación
típica y la media aritmética. Es decir,
Ventajas e Inconvenientes en el uso del coeficiente de
S1-N
N = )x-x(f
1-NN
=
= )X-x(NN
1-Nn = S
2xi
2i
k
1=i
i
2ik
1=i
2*x
∑
∑
1-N
NS = S 2
x2*
x
media. de unidadpor ndispersi la da Nos XS = CV x _
Descripción Univariante
Tema II 76
variación de Pearson:
Ventajas:
1.-Es adimensional, no va a estar influido por la unidad de
medida.
2.-Podemos realizar comparaciones entre dos distribuciones
aunque las medias y las unidades sean distintas.
Inconvenientes:
1.-Si la media es igual a cero, pierde su sentido estadístico.
2.-No es invariante ante cambios de la variable. Es decir,
Demostración:
En cuanto a la interpretación, debemos saber que cuanto mayor
sea el coeficiente de variación, mayor será la desviación
′≠
′′′′→
CV CV
XS = CV
aX-X
= X X x0 _
CV x-X
S =
ax-X
aS
= XS = CV
aS = S
aS = S
)a
x-X-
ax-x(f = )X-x(f = S
a
x-X =
a
x-xfxxf = xf = X
0
x
0
x
x
xx2
2x
x
00i
2
i
k
1=ii
2i
k
1=ix
00ii
k
1=i0i
i
k
1=iii
k
1=i
= a
)-(
≠′′
′
′′
′′′
′′
∑∑
∑∑∑
_
ESTADÍSTICA I
Tema II 77
típica y por tanto, mayor será la dispersión. Es decir, la
media sintetizará peor la información cuanto mayor sea el
coeficiente de variación.
II.3.4.- Variable tipificada
Una variable estadística se dice está tipificada o
estandarizada si su media aritmética es 0 y su varianza 1.
Sea X una variable estadística cuya media aritmética viene dada
por : y su desviación típica es F. Sea Z la variable definida
por
En este caso, diremos que la variable Z es la variable
tipificada de X. Como ejercicio, demostrar que la media de Z
vale cero y su varianza 1.
II.3.5.-MEDIDAS DE FORMA: ASIMETRIA Y CURTOSIS.
II.3.5.1.-Medidas de Asimetría
Las medidas de asimetría van dirigidas a la elaboración de una
medida que permita establecer el grado de simetría (o
asimetría) que presenta la distribución.
Vamos a representar gráficamente una distribución de
frecuencias. Si trazamos una línea perpendicular al eje de
abcisas por la media aritmética, tomando esta perpendicular
como eje de asimetría, se nos pueden presentar varios casos:
A) Distribución simétrica: Diremos que una distribución es
simétrica cuando existe el mismo número de valores a ambos
lados de dicho eje, equidistantes de la media dos a dos y tales
que cada par de valores equidistantes a la media tengan la
misma frecuencia.
σµ−
=x
z
Descripción Univariante
Tema II 78
� � � � � � � � � � � � � � � � � ��� � ��� � ��� � � � � � � � � � ������� � � ������� � � � ��� � � � � ��� � � � ��� � � ��� � � � ��� � � � � � ��� � � � � � ��� � � ������������������������� ������������������������ _ _
X X
S I M E T R I C A S I M E T R I C A
Esto es, una distribución es simétrica con respecto a la media
aritmética si al "doblar" la distribución por la media, las dos
partes de la gráfica diferencial se superponen.
B) Distribución Asimétrica a Derechas:
Una distribución es asimétrica a derechas cuando tiene mayor
número de valores a la derecha que a la izquierda del eje de
asimetría (media aritmética).
� � � � � � � ��� � ��� � � ��� � � ��� � ��� � � � � � ��� ��� � � � � � � � � � ��� ��� � � � � � �� � � � � � � ��� � � � ��� � � � ��� � � � � � ��� � � � � � � � � � � ��� � � � � � � � � � � � � � � � � � � ��� � � � � � � � � � � ������������������������� ���������������������� _ _
X X
ASIMETRICA A DERECHAS ASIMETRICA A DERECHAS
C) Distribución Asimétrica a Izquierdas:
Será aquella distribución que tiene un mayor número de valores
a la izquierda que a la derecha del eje de asimetría.
ESTADÍSTICA I
Tema II 79
� � � � � � � ��� � � ��� � � ��� � � � ��� � � � � ��� � � � � ��� ��� � � � � � � � � � ��� � � � � ��� � � � ��� � � � ��� ��� � � � ��� � � � � � � � � � � ��� � � � � � ��� � � � � � � � � � � � � ��� � � � ������������������������� ������������������������ _ _
X X
ASIMETRICA A IZQUIERDAS ASIMETRICA A IZQUIERDAS
En definitiva, si una distribución es simétrica, existirá el
mismo número de valores a la derecha que a la izquierda de la
media, y por tanto, el mismo número de desviaciones con signo
positivo que con signo negativo, siendo la suma de desviaciones
positivas igual a la suma de las negativas.
Una vez visto lo que se entiende por distribución simétrica,
vamos a pasar al estudio de algunas medidas de simetría entre
las que destacamos las siguientes: Coeficiente de Asimetría de
R.A.Fisher y Coeficiente de Asimetría de Pearson.
* Coeficiente de Asimetría de Fisher:
Es un índice que se basa en la idea de media, realizando una
comparación entre las distancias de las observaciones que están
a un lado y a otro de la media aritmética.
Se define de la siguiente forma:
Descripción Univariante
Tema II 80
cubo. altípica desviación = S
3. orden de centrado momento= m donde,
,n
)X-x([
n)X-x(N1
= Sm =
3x
3
i
i2
k
1=i
3/2
ii
3k
1=i3x
31
]N
∑
∑γ
izquierda.la hacia sesgada o
izquierda la a asimétrica es óndistribuciLa 0)<m( 0 < i S
derecha.la hacia sesgada o
derecha la a asimétrica es óndistribuciLa 0)>m( 0 > Si
trica. es óndistribuciLa 0)=m( 0 = Si
31
31
31
_
_
_simé_
γ
γ
γ
* Coeficiente de Asimetría de Pearson:
En distribuciones unimodales y moderadamente acampanadas se
verifica que la mediana está entre la moda y la media
aritmética, coincidiendo las tres en el caso de que la
distribución sea simétrica:
Mo = Me = X
ESTADÍSTICA I
Tema II 81
Si la distribución no es simétrica se cumplirá que:
Pearson se basa en esta propiedad para definir su coeficiente
de asimetría de la siguiente forma:
En el caso de que la distribución sea asimétrica positiva o
sesgada hacia la derecha, la media aritmética se desplaza a la
derecha de la moda. Es decir,
Si por el contrario, la distribución es asimétrica negativa o
sesgada hacia la izquierda, la media aritmética se desplaza a
la izquierda de la moda. Es decir,
Por lo tanto, tendremos que:
II.3.5.2.-Medidas de Apuntamiento o Curtosis: Estas medidas tratan de estudiar la mayor o menor concentración
de frecuencias alrededor de la media aritmética. Esta mayor o
menor concentración dará lugar a una distribución más o menos
Mo Me X bien X Me Mo bien ≤≤≤≤
SMo-X
= Ap
0 > Mo-X
0 < Mo-X
negativa. asimétrica es óndistribuciLa 0 < A Si
positiva. asimétrica es óndistribuciLa 0 > A Si
. simétricaes óndistribuciLa 0 = ASi
p
p
p
_
_
_
Descripción Univariante
Tema II 82
apuntada.
Como coeficiente de Curtosis se utiliza la siguiente expresión:
Según el valor que tome este coeficiente, la distribución puede
ser:
Ejemplo:
Dada la siguiente distribución de sueldos entre los empleados
de una empresa (salarios mensuales en miles de ptas):
[ei-1,ei) ni
80-100 10
100-120 30
120-150 40
150-200 15
200-300 5
100
Vamos a calcular los coeficientes de asimetría y curtosis.
Solución:
cuarta.la a elevada típica desviación = S
4. orden de centrado momento = m donde
3-Sm =
4x
4
4x
42γ
0 < Si ca Platicúrti
0 > Si ca Leptocúrti
0 = Si a(normal)Mesocúrtic
2
2
2
γ
γ
γ
ESTADÍSTICA I
Tema II 83
Ci fi Cifi Ci2fi Ci3fi Ci4fi
90 0,10 9 810 72900 6561000
110 0,30 33 3630 399300 43923000
135 0,40 54 7290 984150 132860250
175 0,15 26,25 4593,75 803906,25 140683590
250 0,05 12,50 3125 781250 195312500
'=134,75 '=19448,75
3041506,25 519340340
Un coeficiente de asimetría que podemos calcular es el
coeficiente de asimetría de Fisher que viene dado por la
siguiente expresión:
El momento centrado de orden tres lo podemos calcular a través
de los momentos no centrados, es decir,
Sm =
3x
31γ
46396,366 = )1291,1875( = S
:valor eltoma ,S cubo, alelevada tÍpica ndesviaci la Y
72812,16 = m
(134,75)2+)(134,75)3(19448,75-3041506,25 = m
fx = X = ; fx = ; fx = ,donde
2+3- = m
33x
3x
3
33
ii
n
1=i1i
2i
n
1=i2i
3i
n
1=i3
311233
∑∑∑ ααα
αααα
Descripción Univariante
Tema II 84
Por tanto, el coeficiente de asimetría nos quedará como sigue:
Para determinar el coeficiente de curtosis necesitamos calcular
antes el momento centrado de orden cuatro, ya que este
coeficiente viene dado por la siguiente expresión:
El momento centrado de orden cuatro lo calculamos a través de
su relación con los momentos no centrados, es decir,
Por tanto, el coeficiente de Curtosis toma el siguiente valor:
Positiva. AsimÇtrica 0 > 1,5693505 = 46396,36672812,16
= 1 _γ
3-Sm =
4x
42γ
9728579,5 = m
(134,75)3-(134,75))6(19448,75+
+)25)(134,754(3041506,-519340340 = m
134,75 = X = fx = ; 19448,75 = fx =
3041506,25 = fx = ; 519340340 = fx = ,donde
3-6+4- = m
4
42
4
ii
n
1=i1i
2i
n
1=i2
i3i
n
1=i3i
4i
n
1=i4
41
2121344
∑∑
∑∑
αα
αα
αααααα
ca.Leptocœrti 0 > 2,8354023 = 3-)1291,1875(
9728579,5 = 42 _γ
ESTADÍSTICA I
Tema II 85
II.3.6.-COEFICIENTES DE CONCENTRACION.
Las medidas de concentración tienen por objeto poner de
manifiesto el mayor o menor grado de igualdad en el reparto del
total de los valores de la variable. Por ello se dice que son
indicadores del grado de equidistribución de la variable.
Para estudiar la concentración vamos a suponer una distribución
de rentas con n rentistas. Podremos encontrarnos con dos
situaciones extremas:
1.-Concentración máxima: cuando sólo un rentista de los n
rentistas percibe el total de la renta y los demás nada. Es
decir,
2.-Concentración mínima o equidistribución: cuando todos los n
rentistas perciben la misma cantidad. Es decir,
A la hora de analizar la concentración se definen dos tipos de
medidas, una analítica, el índice de Gini,y otra gráfica, que
es la curva de Lorenz. En ambos casos para llevar a cabo su
cálculo es necesrio su ordenación de menor a mayor.
II.3.6.1.-INDICE DE GINI.
Sea (xi, ni), una distribución de frecuencias cuya variable
hace referencia a una variable monetaria.
El índice de Gini vendrá dado por la siguiente expresión:
0 xpara 0 = x =...= x = x = x n1-n321 ≠
x =...= x = x n21
Descripción Univariante
Tema II 86
Obsérvese que pi lo que nos da es la proporción de individuos
que han recibido una cantidad igual o inferior a xi. Por otro
lado qi nos da la proporción de dinero total repartido entre
los Ni individuos. En consecuencia, el numerador de la
expresión del índice de Gini nos da la diferencia que existe
entre lo que se ha repartido hasta la modalidad i-ésima y la
proporción de individuos entre los que se ha repartido.
Veámos el valor que tomaría este índice en las dos situaciones
extremas: A)Caso de máxima equidad, B)Caso de mínima equidad.
A) Caso de máxima equidad.
xi ni Ni pi=Ni/N*100 xini ìi qi=ìi/ìn*100
X 1 1 1/N*100 X X X/NX*100
X 1 2 2/N*100 X 2X 2X/NX*100
X 1 3 3/N*100 X 3X 3X/NX*100
... ... ... ... ... ... ...
X 1 N N/N*100 X NX NX/NX*100
Donde,
Y el índice de Gini tomará el siguiente valor:
100* = q ; xnN
p
p
)q-p( = I
n
iitt
i
1=ti
i
i
i
1-n
1=i
ii
1-n
1=iG
= ; 100*N
= ,donde
µµ
µ ∑
∑
∑
100* = q ; 100*NN = p ; xn =
n
ii
iitt
i
1=ti µ
µµ ∑
ESTADÍSTICA I
Tema II 87
B) Caso de mínima equidad.
xi ni Ni pi xini ìi qi
0 1 1 1/N*100 0 0 0
0 1 2 2/N*100 0 0 0
0 1 3 3/N*100 0 0 0
... ... ... ... ... ... ...
X 1 N N/N*100 X X X/X*100
Es decir, nos quedaría la siguiente tabla:
xi ni Ni pi xini ìi qi
0 N-1 N-1 N-1/N*100 0 0 0
X 1 1 N/N*100 X X 100
Y en este caso, el índice de Gini quedaría como sigue:
nulo. esGini de Índice el ión,concentracmínima
equidad,máxima de caso el en tanto, loPor
0 = 100*
N1-N0 =
p
)q-p( = I
i
1-n
1=i
ii
1-n
1=iG
∑
∑
Descripción Univariante
Tema II 88
Por lo tanto, podemos decir que el índice de Gini sólo tomará
valores en el intervalo [0,1]:
II.3.6.2.-CURVA DE LORENZ.
La curva de Lorenz no es más que una representación gráfica en
la cual, en uno de los ejes tenemos los valores de pi y en el
otro eje los valores de qi.
Consiste, por tanto, en ir representando los puntos (pi,qi),
ordenados según el orden creciente de x, que al unirlos entre
sí, nos determinan una curva poligonal llamada Curva de Lorenz.
La curva que nos indicará la máxima equidad, mínima
concentración, coincidirá con la diagonal OB ya que en ella
pi=qi. En este caso, todos los rentistas percibirán la misma
1 = = - = p
p
p
qp
p
)q-p( = I
1
1
1
11
i
1-n
1=i
ii
1-n
1=iG
∑
∑
[0,1] I G∈
ESTADÍSTICA I
Tema II 89
cantidad.
El caso más desfavorable, máxima concentración, estaría formado
por los lados OA y AB del cuadrado.
Descripción Univariante
Tema II 90
Ejemplo:
Calcúlese el índice de Gini de la siguiente distribución:
[ei-1,ei) ni
0 a 4 3
4 a 6 5
6 a 8 12
8 a 10 10
10 a 14 11
14 a 16 17
16 a 20 20
20 a 24 15
24 a 30 10
30 a 40 10
Solución:
Ci Ni Cini pi ìi qi (pi-qi)
2 3 6 2.65486 6 0.31545 2.33940
5 8 25 7.07964 31 1.62986 5.44978
7 20 84 17.69911 115 6.04626 11.65284
9 30 90 26.54867 205 10.77812 15.77054
12 41 132 36.28318 337 17.71819 18.56499
15 58 255 51.32743 592 31.12513 20.20230
18 78 360 69.02654 952 50.05257 18.97397
22 93 330 82.30088 1282 67.40273 14.89815
27 103 270 91.15044 1552 81.59831 9.55212
35 113 350 100.00000 1902 100.00000 0.00000
ESTADÍSTICA I
Tema II 91
Por tanto, el índice de Gini tomará el siguiente valor:
0.3056835 = 384.07075117.40409 =
p
)q-p( = I
i
1-n
1=i
ii
1-n
1=iG
∑
∑
Descripción Univariante
Tema II 92
PROBLEMAS RESUELTOS
((1)) A 50 aspirantes a una plaza de administrativo en la
Universidad de Las Palmas se les sometió a un test. Las
puntuaciones obtenidas por los aspirantes fueron las
siguientes: 8, 6, 4, 5, 5, 6, 5, 7, 8, 9, 8, 8, 7, 7, 6, 6, 4,
4, 2, 10, 1, 9, 5, 3, 4, 5, 6, 6, 7, 6, 8, 7, 6, 5, 4, 4, 4, 2,
3, 4, 6, 5, 7, 6, 6, 5, 7, 6, 6, 5.
Se pide:
A) Distribución estadística del fenómeno (tabla numérica).
B) Representación gráfica.
Solución:
A) Distribución estadística:
xi ni
1 1
2 2
3 2
4 8
5 9
6 13
7 7
8 5
9 2
10 1
ESTADÍSTICA I
Tema II 93
B) Representación gráfica:
Al tratarse de un caracter cuantitativo discreto, una de las
posibles representaciones gráficas sería el Diagrama de Barras.
((2)) Con los mismos datos del ejercicio anterior y
considerando cuatro posibles modalidades:
-Suspenso ( de 1 a 4 ).
-Aprobado ( de 5 a 7 ).
-Notable ( de 8 a 9 ).
-Sobresaliente ( 10 ).
Se pide:
A) Distribución estadística del atributo.
B) Representación gráfica.
Solución:
Descripción Univariante
Tema II 94
A) Distribución Estadística:
xi ni
Suspenso 13
Aprobado 29
Notable 7
Sobresaliente 1
B) Representación gráfica:
Se trata de un caracter cualitativo o atributo y por tanto,
será susceptible de ser representado gráficamente a través de
un diagrama de sectores, diagrama de barras o pictograma.
*Diagrama de sectores:
Haciendo el reparto proporcional de los 360o de una
circunferencia:
50-----------360o
13-----------Suspenso Suspenso=93,6o
50-----------360o
29-----------Aprobado Aprobado=208,8o
50-----------360o
7-----------Notable Notable=50,4o
50-----------360o
1-----------Sobresaliente Sobresaliente=7,2o
ESTADÍSTICA I
Tema II 95
*Diagrama de barras:
Descripción Univariante
Tema II 96
((3)) El curso de 4� de Econometría de la Facultad de C.C.E.E
obtiene en el 2� parcial de la asignatura las siguientes
puntuaciones:
48 40 42 50 63 64 65 67 54 47 32 35 41
57 72 68 52 35 44 33 78 61 30 35 80 36
46 68 50 74 31 59 69 35 46 79 48 54 37
40
Se pide:
A) Formar una distribución de frecuencias, con 10 intervalos.
B) Hacer la representación gráfica del polígono acumulativo de
frecuencias.
C) Hacer la representación gráfica del histograma de
frecuencias.
D) Obtener la función de densidad y la función de distribución.
Solución:
A)Distribución de frecuencias:
[ei-1,ei) ni Ni fi fi/ai Fi
[30,35) 4 4 0,10 0,02 0,10
[35,40) 6 10 0,15 0,03 0,25
[40,45) 5 15 0,125 0,025 0,375
[45,50) 5 20 0,125 0,025 0,50
[50,55) 5 25 0,125 0,025 0,625
[55,60) 2 27 0,05 0,01 0,675
[60,65) 3 30 0,075 0,015 0,75
[65,70) 5 35 0,125 0,025 0,875
[70,75) 2 37 0,05 0,01 0,925
[75,80] 3 40 0,075 0,015 1,00
N=40
B) Polígono Acumulativo de Frecuencias:
ESTADÍSTICA I
Tema II 97
C) Histograma de Frecuencias:
D) * Función de Densidad: ������ � 0 si x < 30 � 0,02 si 30 # x < 35 � 0,03 si 35 # x < 40 � 0,025 si 40 # x < 45 � 0,025 si 45 # x < 50 f(x)=� 0,025 si 50 # x < 55 � 0,01 si 55 # x < 60 � 0,015 si 60 # x < 65 � 0,025 si 65 # x < 70 � 0,01 si 70 # x < 75 � 0,015 si 75 # x # 80 � 0 si x > 80 ������
• Función de Distribución:
Descripción Univariante
Tema II 98
����� � � 0 si x < 30 � 0,020(x-30)+0 si 30 # x < 35 � 0,030(x-35)+0,1 si 35 # x < 40 � 0,025(x-40)+0,25 si 40 # x < 45 � 0,025(x-45)+0,375 si 45 # x < 50 F(x)=� 0,025(x-50)+0,5 si 50 # x < 55 � 0,010(x-55)+0,625 si 55 # x < 60 � 0,015(x-60)+0,675 si 60 # x < 65 � 0,025(x-65)+0,75 si 65 # x < 70 � 0,01(x-70)+0,875 si 70 # x < 75 � 0,015(x-75)+0,9 si 75 # x < 80 � 1 si x $ 80 � �����
((4))Investigados los precios de un determinado detergente en
50 supermercados de una ciudad, se han obtenido los siguientes
resultados:
700, 300, 500, 400, 500, 700, 400, 750, 800, 500, 500, 750, 300
700, 1000, 1500, 500, 750, 1200, 800, 400, 500, 300, 500, 1000
300, 400, 500, 700, 500, 300, 400, 700, 400, 700, 500, 400, 700
1000, 750, 700, 800, 750, 700, 750, 800, 700, 700, 1200, 800
Determínese:
A.- La distribución de los precios:
(1) agrupados en frecuencias.
(2)agrupados en 5 intervalos de igual amplitud.
B.- Calcúlese la media aritmética, geométrica y armónica de
dichas distribuciones.
C.- Calcúlese la mediana y moda de estas distribuciones.
D.- Calcúlese la dispersión absoluta y la dispersión relativa
de ambas distribuciones.
E.-�Es simétrica la distribución discreta?
F.-�Es mesocúrtica la distribución discreta? G.-
Calcúlese el índice de Gini de la distribución discreta.
A))Solución:
(1) Agrupados en frecuencias:(DISTRIBUCION DISCRETA)
ESTADÍSTICA I
Tema II 99
xi ni xini ln(xi) niln(xi) Ni ni/xi Fi
300 5 1500 5.70378 28.518912 5 0.0166 0.1
400 7 2800 5.99146 41.940252 12 0.0175 0.24
500 10 5000 6.214608 62.146081 22 0.0200 0.44
700 11 7700 6.551080 72.061884 33 0.01571 0.66
750 6 4500 6.620073 39.720439 39 0.0080 0.78
800 5 4000 6.684611 33.423059 44 0.00625 0.88
1000 3 3000 6.907755 20.723266 47 0.00300 0.94
1200 2 2400 7.090076 14.180154 49 0.00166 0.98
1500 1 1500 7.313220 7.313220 50 0.00066 1.00
N=50 32400 320.02727 0.08946
(2) Agrupados en 5 intervalos de igual amplitud:(DISTRIBUCION
CONTINUA)
ni Ci Cini ln(Ci) niln(Ci) ai fi/ai% fi Ni
22 420 9240 6.040254 132.8856 240 0.1833 0.44 22
17 660 11220 6.492239 110.3680 240 0.1416 0.34 39
8 900 7200 6.802394 54.4191 240 0.0666 0.16 47
2 1140 2280 7.038783 14.0775 240 0.0166 0.04 49
1 1380 1380 7.229838 7.2298 240 0.0083 0.02 50
' ' 31320 318.9800 240 1.00
B))Solución:
(1) Distribución Discreta:
*Media aritmética:
*Media geométrica:
648 = 32400501
= xnN1
= X ii
k
1=i∑
Descripción Univariante
Tema II 100
*Media armónica:
(2) Distribución Continua:
*Media aritmética:
*Media geométrica:
*Media armónica:
602.17337 = e =G
e xn =G ; x( =G
320.02727501
ii
k
1=iN1
in
k
1=i
N1
)i ln∑∏
6558.909009 = 0.08946
50 =
xn
N = A
i
ik
1=i∑
626.4 = 31320501
= CnN1
= X ii
k
1=i∑
8589.691783 = e = e Cn =G 318.98501
ii
k
1=iN1 ln∑
558.6190 = 0.08951
50 =
Cn
N = A
i
ik
1=i∑
ESTADÍSTICA I
Tema II 101
ni/Ci
0.0524
0.02576
0.00888
0.00175
0.00072
'=0.08951
C)) Solución:
(1) Caso Discreto:
*Mediana:
*Moda:
La moda se define como aquel valor que se presenta más
frecuentemente, por tanto:
(2) Caso Continuo:
*Mediana:
La mediana pertenece a la clase [540, 780) y por tanto, vendrá
dada por la siguiente expresión:
700 = Me 0.66 < 21
< 0.44
21
= )xF( x = Me ii
_
_
700 = Mo
Descripción Univariante
Tema II 102
*Moda:
La clase modal es la clase [300, 540) y por ello, la moda
tomará el siguiente valor:
D)) Solución:
Una medida de dispersión absoluta de cualquier variable es
la varianza, que viene dada por la siguiente expresión:
582.352941 = 540+17
22-25*240 = e+
n
N-2N
*a = Me 1-ii
1-i
i
0.04167 = 0.14166-0.18333 = a
f-
a
f = Z
0.18333 = 0-0.18333 = a
f-
a
f = Z ,donde
495.552 = 0.04167+0.18333
0.18333*240+300 = e+
Z+ZZ*a = Mo
[300,540) Mo
1+i
1+i
i
i2
1-i
1-i
i
i1
1-i21
1i
∈
αα 212ii
2n
1=i
2x - = n)X-X(
N1
= S ∑
ESTADÍSTICA I
Tema II 103
*Caso Discreto:
xini xi2ni xi3ni xi4ni
1500 450000 135000000 40500000000
2800 1120000 448000000 179200000000
5000 2500000 1250000000 625000000000
7700 5390000 3773000000 2641100000000
4500 3375000 2531250000 1898437500000
4000 3200000 2560000000 2048000000000
3000 3000000 3000000000 3000000000000
2400 2880000 3456000000 4147200000000
1500 2250000 3375000000 5062500000000
'=32400 '=24165000 '=20528250000 '= 19641937500000
Por tanto,
Una medida de dispersión relativa es el coeficiente de
variación, que viene dado por la siguiente expresión:
63396 = (648)-483300 = S ,donde De
648 = 50
32400 =
483300 = 50
24165000 =
N
nx =
22x
1
i2i
n
1=i2
α
α∑
Descripción Univariante
Tema II 104
* Caso continuo:
Varianza:Dispersión Absoluta.
Cini Ci2ni Ci3ni Ci4ni
9240 3880800 1629936000 684573120000
11220 7405200 4887432000 3225705100000
7200 6480000 5832000000 5248800000000
2280 2599200 2963088000 3377920300000
1380 1904400 2628072000 3626739400000
'=31320 '=22269600 '=17940528000 '=16163737920000
Por tanto,
Dispersión Relativa: Coeficiente de variación.
E)) Solución:
Para poder contestar a esta pregunta calculamos el coeficiente
de asimetría de Fisher que viene dado por la siguiente
expresión:
0.388558 = 64863396
= CV ,donde De
XS = CV x
53015.04 = (626.4)-445392 = )50
31320(-
5022269600
= S2
22x
230.24995 = 53015.04+ = S+ = S donde,
0.3675765 = 626.4
230.24995 =
XS = CV
2xx
x
ESTADÍSTICA I
Tema II 105
Como el momento centrado de orden tres es igual a la siguiente
ecuación:
Y como además, Sx3 es igual a la desviación típica elevada al
cubo, es decir,
Sustituyendo en la expresión del coeficiente de asimetría, nos
quedará lo siguiente:
Sm =
3x
31γ
)(xsuX+Xx2-x( = f)X-x( = m 2
i2i
n
1=iii
3n
1=i3 ∑∑
αααααααααααα 31123
31
3121
31123
i
n
1=i
32ii
n
1=ii
2i
n
1=i
2ii
n
1=ii
2i
n
1=ii
3i
n
1=i
2+3- = -2+-+
fX-Xfx2+fxX-Xfx+Xfx2-fx =
2- =
= ∑∑∑∑∑∑
15225384 = (648)2+648)3(483300)(-410565000 = m
648 = ; 483300 =
410565000 = 50
02052825000 =
N
nx = fx = : como Y
2+3- = m ,tantoPor
33
12
i3i
n
1=ii
3i
n
1=i3
311233
αα
α
αααα
∑∑
15962201 = )(251.78562 = S33
x
Descripción Univariante
Tema II 106
F)) Solución:
Para poder saber si se trata de una distribución mesocúrtica,
debemos calcular el coeficiente de curtosis que viene dado por
la siguiente expresión:
Como el momento centrado de orden cuatro viene dado por:
El coeficiente de Curtosis tomará el siguiente valor:
derechas.a AsimÇtrica 0 > 710.95383988 = 1596220115225384 = 1 _γ
ca.platicœrti n Distribuci 0 < i s
ca.leptocœrti n Distribuci 0 > si
a mesocœrtic n Distribuci 0 = si Y 3-Sm =
2
2
24x
42
_
_
_
γ
γ
γγ
21733378155 = m
(648)3-(483300)(648)6+565000)4(648)(410-003928387500=m
:valor siguienteeltomar ,m centrado, momento Dicho
648 = ; 483300 =
410565000 = 00;3928387500 = 50
00001964193750 = donde,
3-6+4- = m
4
424
4
12
34
412
213144
_
αα
αα
αααααα
ESTADÍSTICA I
Tema II 107
G)) Solución:
pi ìi qi (pi-qi)
10 1500 4.62962963 5.37037037
24 4300 13.27160491 10.72839506
44 9300 28.7037037 15.2962963
66 17000 52.4691358 13.5308642
78 21500 66.35802469 11.64197531
88 25500 78.7037037 9.2962963
94 28500 86.96296296 6.03703704
98 30900 95.37037037 2.62962963
100 32400 100.0000000 0.0000000
escasa.muy es iónconcentracla ,tantoPor
70.14846785 = 502
174.5308642 = p
)q-p( = I
i
1-n
1=i
ii
1-n
1=iG
∑
∑
ca.leptocœrti es n distribucila quedecir puede se ,tantoPor
0 > 51.31290215 = 3-4019052816
21733378155 = 3-
(63396)21733378155
= 22γ
Descripción Univariante
Tema II 108
((5)) � Qué mide la función de distribución de una variable estadística? Solución: Lo mismo que la frecuencia relativa acumulada. Es decir, la proporción de individuos que presentan una modalidad igual o inferior a la considerada.
((6)) � Qué mide la función de densidad ? Solución: La función de densidad mide la proporción de individuos que hay en cada unidad de clase. Es una función que se define en el ámbito de las variables estadísticas continuas.
((7)) � Qué mide la función de cuantía ? Solución: La función de cuantía mide la proporción de individuos que presentan una determinada modalidad de una variable estadística discreta.
((8)) Desde el punto de vista del tratamiento estadístico, � cuántos tipos de caracteres nos podemos encontrar ? Indique cada uno de ellos. Solución: Nos podemos encontrar con cuatro tipo de caracteres: atributos nominales, atributos ordinales, variables estadísticas discretas y variables estadísticas continuas. ((9)) De los tipos de caracteres mencionados en la pregunta 4,
� a cuántos de ellos tiene sentido calcularle la densidad de individuos por unidad de clase? Solución: Tiene sentido calcularlo para las variables estadísticas continuas.
((10)) � Qué es una distribución de frecuencias ? Solución:
ESTADÍSTICA I
Tema II 109
Llamamos distribución de frecuencias al par formado por las modalidades de una carácter y cualquiera de las frecuencias definidas para ese tipo de carácter.
((11)) � En qué consiste el proceso de tabulación de un carácter ? Solución: La tabulación de una carácter consiste en la elaboración de una tabla formada por dos columnas. En una de ellas están las modalidades de del carácter (ordenas, si el carácter lo permite, de menor a mayor) y en la segunda columna el recuento de cuantos individuos presentan cada una de las modalidades.
((12)) � Es lo mismo el diagrama de barras de una atributo que el de una variable discreta ? Solución: No. En el diagrama de barras de un atributo el eje X no tiene unidades de medida, las modalidades se colocan equidistantemente cada una de la siguiente y se levantan barras hasta la altura de la frecuencia relativa (o absoluta). En una variable estadística discreta el eje X tiene unidades y las modalidades del carácter son colocadas de forma coherente con el valor de la variable. En cada modalidad del carácter se levanta una linea hasta la altura de la frecuencia relativa (o absoluta).
((13)) � Qué es una histograma de frecuencias ? Solución: Un histograma de frecuencias es la representación cartesiana de una variable estadística continua en donde en el eje X se colocan las extremos de clase y en Y las densidades de cada clase.
((14)) � Se puede representar una variable estadistica discreta mediante un diagrama de sectores ? Solución: Si, repartiendo los 360 grados de la circunferencia proporcionalmente a las frecuencias absolutas de cada
Descripción Univariante
Tema II 110
modalidad. ((15)) Interprete la expresión: F(x5) = 0.80 Solución: El 80% de los individuos estudiados presentan una modalidad de la variable X igual o inferior a x5. ((16)) Si X mide el número de hijos, interprete la expresión: f(X=4)=0.12 Solución: El 12% de las familias analizadas tienen 4 hijos. ((17)) Si X es el nivel de renta anual de las familias, y
sabemos que F(X=2000000)=0.53, y F(X=3000000)=0.59, � que proporción de familias tienen una renta anual entre los dos y tres millones de pesetas ? Solución: Un 6% de las familias estudiadas tienen un niel de renta entre los dos y los tres millones de pesetas. ((18)) Demuestre que el área que queda entre el histograma de frecuencias y el eje X suman 1 si usamos fi/ai y N si usamos ni/ai Solución: fi/ai �-----------����� � � � � � � ��---�������� ���������� � � � � � � � � z � � �----� � � ������ � � � � � � � � � � � � ��������������������������������������� X ei-2 ei-1 ei ei+1 ei+2 El área z viene dada por: z = base * altura = (ei - ei-1)*(fi/ai) = fi
ESTADÍSTICA I
Tema II 111
Por tanto, cada rectángulo es una frecuencia relativa. La suma de todas las frecuencias relativas es la suma de todas las áreas, pero, como sabemos, la suma de las frecuencias relativas es igual a 1. Para demostralo con ni lo único que hay que cambiar es fi por ni y llegamos a la conclusión de que cada área z es su frecuencia absoluta, y, por tanto, la suma de todas las frecuencias absolutas es la suma de todas las áreas, y la suma de todas las frecuencias absolutas es igual a N. ((19)) Demuestre que
Solución:
ffffnnnn
=NN=F j
j
1=ij21
j21j
j
1=ijj =+...++=
N+...++=
N∑
∑
((20)) Demuestre que Fi - Fi-1 = fi Solución:
Fi - Fi-1 = f1+f2+...+fi-1+fi-(f1+f2+...+fi-1) = fi ((21)) Sea X la variable número de hijos, siendo su función de cuantía
a.- Calcular las frecuencias relativas acumuladas
f=F i
j
1=ij ∑
≠ ,5,6}{0,1,2,3,4 siX0
6= siX0.05
5= siX0.05
4= siX0.10
3= siX0.15
2= siX0.20
1= siX0.25
0= siX0.20
=f(X)
Descripción Univariante
Tema II 112
b.- Si el número de familias estudiadas es 100, �cuántas familias tienen dos o tres hijos ?.
c.- �Qué tipo de carácter estamos estudiando? d.- Dibuje su diagrama de barras. e.- Calcule todas las posibles frecuencias. f.- Calcule su función de distribución. g.- Dibujar la curva de acumulación.
h.- �Cuántos individuos de los estudiados tienen más de tres hijos?
Solución: a.-
X F
0 0.20
1 0.45
2 0.65
3 0.80
4 0.90
5 0.95
6 1.00
b.- N� de familias con dos o tres hijos = 0.20*100+0.15*100=35 familias c.- Variable estadística discreta. d.- fi � 0.25-�---- � � 0.20-�---�--- � � � 0.15-�---�---�--- � � � � 0.10-�---�---�---�---- � � � � � 0.05-�---�---�---�---�-------- � � � � � � � ������������������������������ N� de hijos 0 1 2 3 4 5 6
ESTADÍSTICA I
Tema II 113
e.-
X ni fi Ni Fi
0 20 0.20 20 0.20
1 25 0.25 45 0.45
2 20 0.20 65 0.65
3 15 0.15 80 0.80
4 10 0.10 90 0.90
5 5 0.05 95 0.95
6 5 0.05 100 1.00
f.-
≥
∈
∈
∈
∈
∈
∈
6X si 1.00
[5,6)X si 0.95
[4,5)X si 0.90
[3,4)X si 0.80
[2,3)X si 0.65
[1,2)X si 0.45
[0,1)X si 0.20
0< siX0
=F(X)
Descripción Univariante
Tema II 114
g.- F(X) 1.00-�-----------------------------������������������� 0.95-�------------------------������ 0.90-�-------------------������ � -� � � � 0.80-�--------------������ � � -� � � � � -� � � � � 0.65-�---------������ � � � -� � � � � � -� � � � � � -� � � � � � 0.45-�----������ � � � � -� � � � � � � -� � � � � � � -� � � � � � � -� � � � � � � 0.20-������ � � � � � -� � � � � � � -� � � � � � � -� � � � � � � ���������������������������������������������� N� de hijos 0 1 2 3 4 5 6 h.-
N� de individuos que tienen más de tres hijos = [1 - F(X=3)]*100 =[1 - 0.80]*100 = 20 individuos. ((22)) Sea X la variable con la que denotamos la reta percápita anual, siendo su función de densidad la siguiente
a.- Calcular las frecuencias relativas. b.- Calcular las frecuencias relativas acumuladas. c.- Función de distribución. d.- Si el número de individuos analizados es de 22000,
calcular las frecuencias absolutas, acumuladas y no
∈
∈
∈
∈
∈
10000000]-[4000000xsi0.00000004
4000000)-[1000000xsi0.00000011
1000000)-[600000xsi0.00000057
600000)-[200000xsi0.00000034
200000)-[180000xsi0.00000455
10000000>x ï 180000<xsi0
=f(x)
ESTADÍSTICA I
Tema II 115
acumuladas.
e.- � Qué tipo de carácter estamos estudiando. f.- Dibujar el histograma de frecuencias. g.- Dibujar la curva de acumulación.
h.- � Qué proporción de individuos tiene una renta percápita anual superior a las 600000 pesetas ?
Solución: a.- La función de densidad se define como
∈
e>xsi0
)e-e[xsia/f
e<xsi0
=f(x)
k
i1-iii
0
por tanto,
0.00000455=f1/a1, de donde, f1=0.00000455*a1
0.00000034=f2/a2, de donde, f2=0.00000034*a2
0.00000057=f3/a3, de donde, f3=0.00000057*a3
0.00000011=f4/a4, de donde, f4=0.00000011*a4
0.00000004=f5/a5, de donde, f5=0.00000004*a5
siendo a1=20000, a2=400000, a3=400000, a4=3000000, a5=6000000
En consecuencia
ei-1 ei clase ci ai fi
180000 200000 1 190000 20000 0.090909
200000 600000 2 400000 400000 0.136364
600000 1000000 3 800000 400000 0.227273
1000000 4000000 4 2500000 3000000 0.318182
4000000 10000000 5 7000000 6000000 0.227273
Descripción Univariante
Tema II 116
b.-
ei-1 ei clase fi Fi
180000 200000 1 0.090909 0.090909
200000 600000 2 0.136364 0.227273
600000 1000000 3 0.227273 0.454545
1000000 4000000 4 0.318182 0.772727
4000000 10000000 5 0.227273 1
c.-
d.-
clase fi ni Ni
1 0.090909 2000 2000
2 0.136364 3000 5000
3 0.227273 5000 1000
4 0.318182 7000 17000
5 0.227273 5000 22000
e.- Variable estadística continua. f.-
≥
∈
∈
∈
∈
∈
10000000xsi1
10000000]-[4000000xsi4000000)-(x*0.00000004+0.772727
4000000)-[1000000xsi1000000)-(x*0.00000011+0.454545
1000000)-[600000xsi600000)-(x*0.00000057+0.227273
600000)-[200000xsi200000)-(x*0.00000034+0.090909
200000)-[180000xsi180000)-(x*0.0000045
18000<xsi0
=F(x)
ESTADÍSTICA I
Tema II 117
g.-
h.- Proporción de personas que tienen una renta superior a 600000 pesetas es iagual a 0.227273+0.318182+0.227273 = 0.772728. O bien Proporción de personas con renta inferior a 600000 = 1-F(600000) = =1-[0.227273+0.00000057*(600000-600000)]=1-0.227273=0.772728 ((23)) Sea X una variable estadística discreta de media ì x y desviación típica óx. Sea Y la variable estadística tipificada de X. Demostrar que la media de Y vale cero y su desviación típica 1.
Descripción Univariante
Tema II 118
Solución: Sabemos que Y se obtiene como
expresión que se debe calcular para cada valor posible de X, obteniendo el correspondiente valor de Y. Por tanto podemos crear la siguiente tabla
xi ni ni*xi yi ni yi*ni
x1 n1 n1*x1
σµ-x=y 1
1
n1
n*-x
11
σµ
x2 n2 n2*x2
σµ-x=y 2
2
n2
n*-x
22
σµ
.. .. .. .. ..
xk nk nk*xk
σµ-x=y k
k
nk
n*-x
kk
σµ
La media de X viene dada por
La media de Y viene dada por
σ
µ-x=Y i
N
*nx=
Nn*x+...+n*x+n*x=
ii
k
1=ikk2211x
∑µ
ESTADÍSTICA I
Tema II 119
0=-=Nx
xx
x
i
k
1=ix
x
x
kx2x1xkk2211
kx
xk2
x
x21
x
x1
kk2211y
n*-
=N)n*+...+n*+n*(
-N
n*x+...+n*x+n*x
=
=N
n*-x+...+n*-x+n*-x
=N
n*y+...+n*y+n*y=
σ
µµ
σ
µµ
σ
µµµ
σµ
σµ
σµ
µ
∑
Por tanto la media de Y vale siempre cero. La demostración anterior se puede hacer mucho más rápido si tenemos en cuenta las propiedades de las operaciones con los sumatorios
0=N
*-
N
*=
N
* nnx*
1=n*)-x(*
N*1
=N
n*-x
ny=
i
k
1=ixii
k
1=i
xixi
k
1=ix
ix
xik
1=iii
k
1=iy
∑∑∑
∑∑ µ
σµ
σσ
µ
µ
Demostramos ahora que la desviación típica de Y es igual a 1. Lo haremos a partir de la varianza y teniendo en cuenta que la media de Y ya hemos demostrado que vale cero. Por definición, la varianza de Y viene dada por
1==f*)-x(*1
=f*)-x(fy=f*)-y(=
2x
2x
i2
xi
k
1=i2x
i2
x
xik
1=ii
2i
k
1=ii
2yi
k
1=i
2y =*
σσµ
σσ
µµσ ∑∑∑∑
((24)) Calcular la media aritmética, media geométrica, media armónica, mediana, moda, los cuartiles, el decil octavo, el recorrido, la varianza, la desviación típica, el coeficiente de variación, coeficiente de asimetría, coeficiente de curtosis, indice de Gini y curva de Lorenz para la variable X del ejercicio 21 Solución:
Media aritmética:2.05
Media geométrica:Indeterminada
Media armónica:Indeterminada
Moda:1
Mediana:2
Q1:1
Q2:2
Q3:3
D8:3
Descripción Univariante
Tema II 120
Recorrido:6
Varianza:2.848
Desciación típica:1.687 Coef. de variación:0.823 Coef. de asimetría:0.671 Coef. de curtosis:-0.37 Indice de Gini:0.352
((25)) Calcular la media aritmética, media geométrica, media armónica, mediana, moda, los cuartiles, el decil octavo, el recorrido, la varianza, la desviación típica, el coeficiente de variación, coeficiente de asimetría, coeficiente de curtosis, indice de Gini y curva de Lorenz para la variable X del ejercicio 22 Solución: Media aritmetica:2640000 Media geometrica:1502545 Media armonica:791634.5 Clase modal:[180000-200000) Moda:190291.399 Clase mediana:[1000000-4000000) Mediana:1428575.5 Clase de Q1:[600000-1000000) Q1:639999.5 Clase de Q2:[1000000-4000000) Q2:1428575.5
ESTADÍSTICA I
Tema II 121
Clase de Q3:[1000000-4000000) Q3:3793618.9 Clase de d8:[4000000-10000000) D8:4720006.3 Recorrido:9820000 Varianza:6.33e+12 Desciacion tipica:2515145 Coef. de variacion:0.952706 Coef. de asimetria:0.914514 Coef. de curtosis:-0.71496 Indice de Gini:0.658868 ((26)) Tipificar la variable X del ejercicio 1.17. Calcular la media aritmética, media geométrica, media armónica, mediana, moda, los cuartiles, el decil octavo, el recorrido, la varianza, la desviación típica, el coeficiente de variación, coeficiente de asimetría, coeficiente de curtosis, indice de Gini y curva de Lorenz para la variable tipificada. Comparar los resultados con los obtenidos en el ejercicio 24 Solución: Media aritmetica:0.00 Media geometrica:No calcular Media armonica:No calcular Moda:-0.62 Mediana:-0.02 Q1:-0.62 Q2:-0.02 Q3:0.562 D8:0.562 Recorrido:3.556 Varianza:1 Desciacion tipica:1 Coef. de variacion:Indeterminado Coef. de asimetria:0.671 Coef. de curtosis:-0.37 Indice de Gini:No tiene sentido Coef. de asimetria:0.914514 Coef. de curtosis:-0.71496 Indice de Gini:0.658868
ESTADÍSTICA I
Tema II
119
PROBLEMAS PROPUESTOS
1. Calcular la media aritmética, armónica y geométrica del
número de horas de estudio por día, dada la siguiente
distribución de frecuencias.
Número de horas de
Estudio por día
1
2
3
4
5
Numero de alumnos
5
15
20
8
2
Solución: Media aritmética, 2.74; media armónica, 2.318, media
geométrica, 2.543582
2. Realizado un control de calidad sobre de 200 tubos
fluorescentes de un determinado tipo, para determinar su
duración en horas de funcionamiento en condiciones
prefijadas, se obtuvieron los siguientes resultados.
Duraci
ón
0-720
720-
1440
1440-
2160
2160-
2880
2880-
3600
3600-
4320
4320-
5040
5040-
5760
5760-
6480
6480-
7200
Nºde
tubos
1
4
9
32
56
51
34
8
3
2
Desestimado del total el 10% de los tubos de menor duración y
el 5% de los que presentan duración máxima. Determínese los
valore mínimo y máximo de la duración de los tubos restantes.
Solución: entre 2295 y 5310 horas
3. Una empresa inmobiliaria ofrece apartamentos en régimen de
alquiler en la Costa del Sol cuyos precios mensuales y
número de apartamentos de cada precio son los siguientes
Descripción univariante
Tema II 120
Alquiler mensual Nº de apartamentos
70000-100000 21
100000-110000 27
110000-130000 34
130000-150000 14
150000-180000 8
180000-200000 11
200000-210000 10
Obtener el precio de alquiler mensual más frecuente.
Solución: 103333.3 pesetas por mes.
4. Con los datos del ejercicio anterior, calcular el alquiler
medio por apartamento y el precio que divide a la oferta en
dos partes iguales.
Solución: Media aritmética, 128960; mediana, 118529.41
5. Con los datos del ejercicio 4, calcular la dispersión
absoluta y relativa de la variable precio de los
apartamentos.
Solución: Desviación típica, 36847.23; Coeficiente de
variación, 0.2857
6. Calcular el índice de concentración de la población española
por provincias según los datos de la siguiente tabla y
construir la curva de Lorenz.
Nº de Habitantes Provincias
50000-200000 8
200000-400000 9
400000-500000 10
500000-700000 8
700000-1000000 6
1000000-2000000 8
2000000-5000000 3
ESTADÍSTICA I
Tema II
121
Solución: Índice de Gini, 0.4638
7. Dada la siguiente distribución de sueldos entre los
empleados de una empresa (salarios mensuales en miles de
pesetas), calcular el coeficiente de asimetría de Fisher y
el coeficiente de curtosis.
Sueldos Nº de empleados
80-100 10
100-120 30
120-150 40
150-200 15
200-300 5
Solución: Coeficiente de asimetría, 1.57, asimétrica positiva;
coeficiente de curtosis, 2.84, leptocúrtica.
8. Sean X e Y dos distribuciones simétricas de las que
conocemos
Distribución X Distribución Y
Mediana = 15 Moda = 20
Varianza = 36 Varianza = 36
Determinar cuál de las dos distribuciones presenta una mayor
variabilidad.
Solución: Y es menos dispersa.