¡error! marcador no definido.descripciÓn univariante · este es un término estadístico...

ESTADÍSTICA I

Tema II 15

TEMA II: ¡Error! Marcador no definido.DESCRIPCIÓN UNIVARIANTE

II.1.- Notación y tabulación.

II.2.- Descripción gráfica.

II.3.- Descripción numérica.

II.3.1.- Momentos estadísticos.

II.3.1.1. Momentos con respecto al origen.

II.3.1.2.- Momentos con respecto a la media

II.3.2.- Medidas de posición.

II.3.2.1.- Medidas de posición central. Media

aritmética, geométrica, armónica y mediana.

II.3.2.2.- Medidas de posición no central. Moda y

cuantiles.

II.3.3.- Medidas de dispersión. Recorrido, varianza,

desviación típica y coeficiente de variación.

II.3.4.- Variable tipificada.

II.3.5.- Medidas de forma.

II.3.5.1.- Coeficiente de asimetría de Fisher.

II.3.5.2.- Coeficiente de curtosis.

II.3.6.- Medidas de concentración.

II.3.6.1.- Índice de Gini

II.3.6.2.- Curva de Lorenz.

Descripción Univariante

Tema II 16

II.1.- Notación y tabulación

La información es el punto de partida para el análisis

estadístico, y el primer paso que hay que realizar con esta

información es su tabulación, entendiendo como tal el

ordenamiento de la información de tal forma que se simplifique

la aplicación de las técnicas estadísticas.

Sin embargo, nuestro objetivo no es tabular una información

concreta o específica, sino que lo que se pretende es

establecer el marco general con el que poder tabular cualquier

tipo de información y, en consecuencia, tenemos que fijar una

notación que nos permita expresarnos en términos generales. Con

este objetivo estableceremos la siguiente notación.

Denotaremos por X, Y, Z (con letras mayúsculas) a los

caracteres que queremos estudiar. Así, por ejemplo, cuando

hablamos del carácter X podemos estar hablando del nivel de

renta de los individuos de Las Palmas de Gran Canaria, o los

beneficios de las empresas españolas, etc…

Denotaremos por xi, yi, zi a cada una de las modalidades de X, Y

o Z respectivamente, en donde i toma los valores 1,2,3,..., k,

en donde k es el número máximo de modalidades del carácter X.

De esta manera, si la variable que estamos estudiando, que

podemos denotar por X, es el número de hijos de las familias de

Las Palmas, xi puede tomar los valores 0,1,2,3,…, lo que indica

que x1 = 0, x2 = 1, x3 = 2, etc…

Un caso particular lo forman las variables continuas. En este

caso, el número de modalidades es infinito, es decir k es

infinito. Para este tipo de modalidades, la tabulación se suele

realizar mediante la definición de clases. Una clase no es más

que un intervalo que contiene un número infinito de posibles

valores de la variable. Estas clases deben de ser de tal manera

que, por una parte, entre sí sean excluyentes y, por otra

parte, contengan a todos los posibles valores de la variable.

Es decir, cada individuo debe de pertenecer a una única clase y

ESTADÍSTICA I

Tema II 17

no debe existir ningún individuo que no este en alguna clase.

Como ejemplo podemos usar la información procedente de las

mediciones de las temperaturas. Esta variable puede tomar

infinitos valores, pero sabemos que las mismas se encuentran

siempre entre los –100 grados centígrados y los 100 grados

centígrados. Esta es una variable continua, y su información la

podemos agrupar en distintas clases. Así, para su tratamiento

estadístico los valores de la misma los podemos agrupar en, por

ejemplo, 6 clases, definidas como:

Clase 1: temperaturas entre los –100º y los –20º(sin incluir el –20)

Clase 2: Temperaturas entre los –20º y los 0º (sin incluir los 0º)

Clase 3: Temperaturas entre los 0º y los 10º (sin incluir los 10º)



Clase 6: Temperaturas entre los 30º y los 60º.

En este caso, en términos genéricos hablamos de clase 1, clase

2, etc… Además, cada una de las clases tiene unos extremos de

clase, que son el valor inferior y el valor superior de cada

una de las clases, unas marcas de clase, que son los puntos

intermedios de cada clase y unas amplitudes de clase, que son

los tamaños de cada una de las clases.

Para las variables continuas la notación que seguiremos es la

siguiente:

La letra i representa a la clase i-ésima. Esta clase tiene unos

extremos de clase que representaremos por e de tal forma que la

clase i-ésima vendrá representada genéricamente de la forma

[ei-1, ei]

La amplitud de clase la representaremos por la letra a, y ai se

corresponderá con la amplitud de la clase i. Es evidente que la

amplitud de la clase i la podemos obtener mediante los valores

de los extremos de esa clase. Es inmediato deducir que la

amplitud de la clase i se puede calcular como


Tema II 18

ai = ei – ei-1

La marca de clase la denotaremos por ci, y como hemos dicho no

es más que el punto intermedio de la clase i. Su cálculo

también se obtiene a partir del conocimiento de los extremos de

clase

ci = (ei-1 + ei)/2

Una vez que hemos establecido la forma de representar a las

variables estadísticas y a los atributos, el primer concepto

que debemos analizar es el concepto de frecuencia. Este es un

término estadístico ampliamente usado en la vida real. Desde el

punto de vista estadístico nos podemos encontrar con varias

formas de medir la frecuencia:

La frecuencia absoluta. Es el número de veces que aparece una

determinado valor o clase de un carácter. La denotaremos por n,

siendo ni el número de veces que aparece la modalidad xi de la

variable X, o la clase i de dicha variable. Denotaremos por N

al número total de individuos estudiados. Es evidente que N la

podemos calcular como suma de las distintas frecuencias

absolutas.

N = n1 + n2 + n3 + … + nk

En donde k es el número de modalidades de X o el número de

clases de la misma.

La frecuencia relativa. Es la proporción de individuos que

presentan una determinada modalidad. La denotaremos por fi y su

forma de cálculo viene dada por

fi = ni / N

En muchos casos se usa la frecuencia relativa multiplicada por

100, indicando en este caso el porcentaje de individuos que

presentan una determinada modalidad.

ESTADÍSTICA I

Tema II 19

Es inmediato demostrar que la suma de las frecuencias relativas

es igual a 1.

∑=

=k

1ii 1f

Frecuencia Absoluta Acumulada. Nos informa del número de

individuos que presentan una modalidad igual o inferior a la

considerada. Lo denotaremos por Ni y se calcula como:

Frecuencia Relativa Acumulada. Nos informa de la proporción de

individuos que presentan una modalidad igual o inferior a la

considerada. La vamos a denotar por Fi y es el resultado de

dividir cada frecuencia absoluta acumulada por el número total

de datos. Es decir,

Algunos resultados inmediatos son los siguientes.

(1) La suma de todas las frecuencias relativas debe ser igual a

la unidad:

(2) La última frecuencia relativa acumulada es la unidad. Es

decir,

n=N r

i

1=ri ∑

NN=F i

i

1=NN=

N+...+

N+

N=

nnnf

n21

i

n

1=i∑


Tema II 20

Llamaremos distribución de frecuencias a los pares (xi,ni) ó

(xi,Fi) ó (xi,fi) ó (xi,Ni).

Observen que en función del tipo de dato con el que estemos

trabajando alguna de las medidas definidas hasta ahora ya no

tienen sentido. Por ejemplo, supóngase que estamos interesados

en estudiar la profesión de los residentes en una determinada

zona geográfica. Los resultados que obtenemos son:

¡Error!

Marcador no

definido.PR

OFESION

FRECUENCIA

ABSOLUTA

FRECUENCIA

RELATIVA

FRECUENCIA

RELATIVA %

FRECUENC.

ABSOLUTA

ACUMULADA

Agricultor 2000 0.444 44.4% 2000

Peón

Industrial

500 0.111 11.1% 2500

Ganadero 1700 0.377 37.7% 4200

Empresario

industrial

50 0.011 1.1% 4250

Comerciante 250 0.055 5.5% 4500

Como se puede deducir fácilmente no tiene sentido en este caso

calcular la frecuencia acumulada. Es decir, no tienen sentido

decir que existan 4200 personas que tienen una modalidad igual

o inferior a ganadero puesto que el orden en el que se han

colocado las profesiones es arbitrario. Si tiene pleno sentido

el análisis de las frecuencias no acumuladas. Esto es, estamos

en una zona geográfica fundamentalmente dedicada a la

agricultura y ganadería, un 82% de la población, quedando el

resto dedicado a la industria y comercio.

En conclusión, la frecuencia acumulada no tiene sentido para

1=NN

=N

n+...+n+n=NN=F

n21nn

ESTADÍSTICA I

Tema II 21

datos que provengan de una medición nominal.

El proceso de tabulación no es más que la colocación en una

tabla de los datos que definen la distribución de frecuencias.

En términos genéricos la tabulación en el caso unidimensional

viene dada por (ejemplo aplicable a un atributo o a una

variable discreta

X n f N F

x1 n1 f1 N1 F1

x2 n2 f2 N2 F2

xk nk fk Nk Fk

II.2.- Descripción gráfica

A la hora de introducirnos en el estudio de las

representaciones gráficas, debemos distinguir entre los dos

tipos de caracteres existentes: Cuantitativos y Cualitativos.

Representaciones gráficas de los caracteres cualitativos

(atributos):

Entre las diferentes formas posibles de representar un carácter

cualitativo distinguimos los siguientes:

-Diagrama de sectores.

-Diagrama de barras.

-Pictograma.

*DIAGRAMA DE SECTORES:

Consiste en repartir los 360o de una circunferencia de forma

proporcional a las frecuencias absolutas.


Tema II 22

Ejemplo:

Calificaciones ni �� Suspenso � 30 Aprobado � 40 Notable � 20 Sobresaliente� 10 �� N=100

Y haciendo un reparto proporcional de los 360o grados entre las

ni:

100---- 360o

30---- X X= Suspensos = 108o

100---- 360o

40---- Y Y= Aprobados = 144o

100---- 360o

20---- Z Z= Notables = 72o

100---- 360o

10---- W W= Sobresalientes = 36o

ESTADÍSTICA I

Tema II 23

* DIAGRAMA DE BARRAS:

Representación gráfica que consiste en colocar en unos ejes

cartesianos, las modalidades en el eje de abcisas, el valor de

la frecuencia absoluta en el eje de ordenadas y levantar barras

de igual base cuya altura sea la de dicha frecuencia.

Vamos a realizar un diagrama de barras con el mismo ejemplo que

utilizamos para el caso del diagrama de sectores:

CALIFICACION � ni �� Suspenso � 30 Aprobado � 40 Notable � 20 Sobresaliente � 10 �� N=100


Tema II 24

* PICTOGRAMA:

Representación gráfica consistente en asignar un valor a una

determinada figura, representando la distribución de

frecuencias en función de esta asignación.

Ejemplo: CALIFICACION � ni �� Suspenso � 30 Aprobado � 40 Notable � 20 Sobresaliente � 10 �� N=100

Asignamos el valor de 10 alumnos a la siguiente figura

Por tanto,

alumnos. 10 = ⊕

SUSPENSO= ⊕⊕⊕

ESTADÍSTICA I

Tema II 25

Representaciones gráficas de los caracteres cuantitativos:

Hemos visto que existen dos tipos de caracteres cuantitativos:

Discretos y Continuos. Teniendo en cuenta este hecho,

distinguiremos entre las representaciones gráficas de los

caracteres cuantitativos discretos y las respectivas

representaciones de los continuos.

Caracteres Cuantitativos Discretos:

Entre los diferentes tipos de representaciones distinguimos:

-Diagrama de barras.

-Diagrama de escalera o curva de acumulación.

*DIAGRAMA DE BARRAS.

Consideremos la distribución de frecuencias dada de la forma

(xi,ni) ó (xi,fi), donde xi = (x1,...,xk); ni=(n1,..., nk);

fi=(f1,..., fk).

LLamaremos "Diagrama de Barras" de un carácter discreto a la

parte vertical de la representación cartesiana de los puntos

(xi,fi) ó (xi,ni).

APROBADO = ⊕⊕⊕⊕

NOTABLE = ⊕⊕ 4

ENTE SOBRESALI= ⊕


Tema II 26

Analíticamente, la función cuya representación gráfica es el

diagrama de barras viene dada por:

a f(x) la denominaremos función cuantía.

* DIAGRAMA DE ESCALERA O CURVA DE ACUMULACION.

Es la gráfica que se obtiene al graficar la función F(x)

definida de la siguiente manera:

≠

→ℜ∈

ℜ→ℜ

x=x si ; f xx si ; 0

=f(x) x

:f

ii

i

∈∀

ℜ→ℜ

N=F(x) F=NN=F(x) _ )x ,x[ x

: F

iii

1+ii

ESTADÍSTICA I

Tema II 27

La función F(x) se denomina función de distribución, cuya

gráfica será la curva de acumulación o diagrama de escalera.

Esta segunda denominación es evidente después del análisis de

esta función.

Por tanto,

Obsérvese que tanto el diagrama de barras como la curva de

acumulación se han definido en función de la frecuencia

absoluta (ni el diagrama de barras, Ni la curva de acumulación)

y en función de la frecuencia relativa (fi el diagrama de

barras, Fi la curva de acumulación). Es recomendable, sobre

todo si se desea utilizar la representación gráfica para

comparar varias situaciones utilizar, tanto para el diagrama de

barras como para la curva de acumulación, las frecuencias

1=F(x)]x ,x[ x Si . . .

NN=F(x))x ,x[ x Si

NN=F(x))x ,x[ x Si

0=F(x))x ,[- x Si

k1-k

232

121

1

→∈

→∈

→∈

→∞∈


Tema II 28

relativas.

Pongamos un ejemplo, supongamos que estamos estudiando como

están formadas las familias, en cuanto al número de miembros de

las mismas, en la Comunidad de Madrid y de Canarias. La

diferencia en población de estas dos comunidades es muy grande.

Supongamos en consecuencia que en Canarias hay 500.000 familias

y en Madrid 1.500.000 con la siguiente distribución.

¡Error! Marcador no definido.

CANARIAS

MADRID

N� MIEMBROS FRECUENCIA N� MIEMBROS FRECUENCIA

1 50000 1 150000

2 100000 2 300000

3 150000 3 450000

4 150000 4 450000

5 25000 5 75000

6 15000 6 45000

7 10000 7 30000

Si queremos comparar Canarias con Madrid en cuanto a tamaño del

número de familias, es evidente que lo podemos hacer usando

únicamente los valores totales, esto es, 500.000 familias en

Canarias y 1.500.000 familias en Madrid.

Si queremos estudiar gráficamente estas dos distribuciones la

forma correcta consistiría en realizar la representación sobre

el mismo gráfico. Si para ello usamos la frecuencia absoluta el

gráfico que obtendríamos sería de la forma:

ESTADÍSTICA I

Tema II 29

Como se puede observar, la diferencia de escala entre una y

otra comunidad dificulta claramente el estudio de la variable

de interés. Sin embargo, si en vez de utilizar la frecuencia

absoluta utilizamos la frecuencia relativa la conclusión sería

mucho más evidente. Esto es, la distribución relativa del

tamaño de las familias es la misma en las dos comunidades como

aparece en el siguiente gráfico:

Por último, podemos decir que la función de distribución de un

carácter cuantitativo discreto no es más que la expresión

analítica de la curva de acumulación de dicho carácter.

* Caracteres Cuantitativos Continuos:

Antes de introducirnos en el estudio de las representaciones

gráficas de los caracteres continuos recordemos que este tipo

de variables tienen algunos elementos que le son propios.

- Clase: Llamamos clase a cada uno de los intervalos en que se

ha dividido el rango posible de valores de la variable.

Hablaremos, por tanto, de clase 1, 2, 3, ..., k.

- Extremo de clase: Llamaremos extremo de clase y lo denotamos

por ei a los extremos de las clases. Por notación diremos que

la clase i viene dada como [ei-1, ei). Esto es el número de la


Tema II 30

clase lo define el subíndice superior, siendo la clase cerrada

por la izquierda y abierta por la derecha.

- Marca de clase: Se define como el punto medio de una clase.

Por ejemplo, la marca de la clase i será:

- Amplitud de clase: No es más que el tamaño de la clase. Lo

denotamos por ai:

- Recorrido: Es la diferencia entre el mayor y menor valor de

la variable y lo vamos a denotar por Re. Es decir,

Re= Max (x) - Min (x)= ek - e0

- Frecuencia relativa absoluta por unidad de clase: es el

resultado que se obtiene al dividir la frecuencia relativa o

absoluta por el tamaño de cada clase (ai). Es decir, es una

medida, en términos relativos o absolutos, de la densidad de

individuos en cada una de las clases.

Una vez vistos estos conceptos básicos pasamos al estudio de

las representaciones gráficas continuas, entre las cuales

destacamos:

- Histograma de frecuencias.

- Curva de acumulación o Polígono acumulativo de frecuencias.

* HISTOGRAMA DE FRECUENCIAS:

Representación gráfica que se construye levantando sobre cada

clase un rectángulo de área proporcional a la frecuencia

relativa (o frecuencia absoluta) por unidad de clase

correspondiente a dicha modalidad.

2e+e=c 1-ii

i

i. clasela de amplitud ,e-e=a 1-iii

ESTADÍSTICA I

Tema II 31

Supongamos que tenemos una distribución de frecuencias

(xi,fi):

� ni � fi � ai � fi/ai � � � � � � e0 �� n1 � f1 � a1 � f1/a1 � e1 �� n2 � f2 � a2 � f2/a2 � e2 �� n3 � f3 � a3 � f3/a3 � e3 �� . � . � . � . � . � . � . � . � . � . � . � . � . � . � . � � � � � �

ni/ai nos da el número de individuos por unidad de tamaño de

cada clase mientras que fi/ai nos da la proporción de

individuos por unidad de tamaño de cada clase.

Llamaremos "Histograma de Frecuencias" a la siguiente

representación gráfica:


Tema II 32

La representación que resulta de unir mediante rectas los

puntos medios de las bases superiores de los rectángulos del

histograma de frecuencias se conoce como polígono de

frecuencias.

En la representación gráfica del histograma de frecuencias

debemos de tener en cuenta:

- Si los intervalos son de amplitud constante, las alturas de

los rectángulos serán proporcionales a las frecuencias

relativas (o absolutas) respectivamente.

- Si los intervalos son de amplitud variables, las alturas de

los rectángulos se calculan como fi/ai ó ni/ai.

Aunque a la hora de construir el histograma de frecuencias se

pueden utilizar tanto (xi, fi/ai) como (xi, ni/ai), es mejor

utilizar el primer tipo de distribución ya que si tenemos k

clases y sumamos las áreas debajo del histograma:

- Con (xi, fi/ai):

- Con (xi, ni/ai):

Por tanto, la ventaja de utilizar la representación con

(xi,fi/ai) estriba en el hecho de que sea cual sea el número de

individuos, el área debajo del histograma es siempre igual a la

unidad y por ello, nos servirá para realizar comparaciones

entre dos distribuciones de frecuencias. La representación con

(xi,ni/ai) no permite comparar dos distribuciones que no tengan

1== fa

fa=

a

fa+...+

a

fa+

a

fa i

k

1=ii

ii

k

1=ik

kk

2

22

1

11 ∑∑

N== na

na=

an

a+...+an

a+an

a i

k

1=ii

i

i

k

1=ik

kk

2

22

1

11 ∑∑

ESTADÍSTICA I

Tema II 33

el mismo número de individuos o de datos (N).

Denominaremos función de densidad a la expresión analítica cuya

representación gráfica es el histograma de frecuencias. Esta

función viene dada por:

según se consideren relativas o absolutas.

* POLIGONO ACUMULATIVO DE FRECUENCIAS:

Llamaremos "Polígono Acumulativo de Frecuencias" o "Curva de

Acumulación" a la función poligonal que se obtiene uniendo,

mediante rectas, cada par consecutivo de los siguientes

valores:

Es decir,

an=f(x) ó

af=f(x), )e ,e[ x Si

: f

i

i

i

ii1-i∈

ℜ→ℜ

)N,e( ... )N,e( ... )N,e( )N,e( ,0)e( kkii22110

... )F,e( )F,e( ,0)e( bien 22110


Tema II 34

Para conocer la expresión analítica de la curva de acumulación,

es decir, la función cuya representación gráfica es la curva de

acumulación, tomamos sólo el segmento (ei-1,ei):

La expresión analítica de la recta que contiene al segmento

viene dada por:

donde,

(I) )eF(-)eF(

)eF(-F(x)=

e-ee-x

1-ii

1-i

1-ii

1-i

ESTADÍSTICA I

Tema II 35

Sustituyendo en (I):

Por tanto,

Y podremos decir que la curva de acumulación viene dada como la

representación gráfica de dicha función, que denominaremos

función de distribución.

Propiedades de la función de distribución:

f=Nn=)eF(-)eF(

N

n+...+n+n=N

N=)eF(

N

n+...+n+n=NN=)eF(

e-e=a

ii

1-ii

1-i211-i1-i

i21ii

1-iii

n.acumulació decurva

la deanalítica Expresión)_eF(+)e-(xaf= F(x)

f

)eF(-F(x)=ae-x

1-i1-ii

i

i

1-i

i

1-i

)eF(+)e-(xa

f=]_F(x)e,e[ x

:F

1-i1-ii

ii1-i∈

ℜ→ℜ


Tema II 36

Como se puede ver de lo dicho hasta ahora hemos aprovechado el

estudio de las representaciones gráficas para introducir el

concepto de función de cuantía, de densidad y de distribución.

Estos conceptos se estudiarán con detalle en la parte

correspondiente a la teoría de la probabilidad y más

específicamente al abordar el estudio de las variables

aleatorias. Su introducción en esta parte del temario permitirá

al alumno tener una idea más clara sobre el contenido y la

aplicación de estas funciones puesto que en este tema se

definen en términos de frecuencias cuya comprensión no supone

ninguna dificultad para el alumno, mientras que el nivel de

abstracción en el que se desarrollará este concepto en el

ámbito de la probabilidad es considerable.

II.3.- Descripción numérica.

II.3.1.- Momentos estadísticos

Los momentos estadísticos son el resultado de llevar a cabo

unas determinadas operaciones con la información suministrada

por la distribución de frecuencia. Su importancia radica en que

la mayoría de medidas que usaremos para describir y sintetizar

la información se pueden expresar en términos de momentos.

Sea (xi,fi) la distribución de frecuencias de una variable

discreta o atributo X, que presenta k modalidades. Sea b un

número perteneciente al conjunto de os números reales, y sea r

un número perteneciente al conjunto de los números naturales.

Llamaremos momento de orden r con respecto al punto b, y lo

1F(x)0 anterior, lo deia consecuenc como

0=F(x) (3)

1=F(x) (2)

creciente nfunci una es (1)F

x

x

≤≤

∞→

∞→

lim

lim

ESTADÍSTICA I

Tema II 37

denotaremos por :r,b, al resultado de realizar la operación rk

1iiib,r )bx(*f∑

=−=µ

Como se puede observar, según le vamos dando valores a r y b

vamos obteniendo distintos momentos. Así, por ejemplo, el

momento de orden 2 con respecto al punto 4 se calcularía

mediante la expresión

2k

1iii4,2 )4x(*f∑

=−=µ

aplicada a cualquier distribución de frecuencias.

Si en vez de trabajar con una atributo o una variable discreta,

trabajamos con una variable X que es continua, la expresión de

los momentos solo difiere en que en vez de aparecer xi se

utiliza ci, la marca de clase. Su expresión, por tanto, sería

rk

1iiib,r )bc(*f∑

=−=µ

II.3.1.1.- Momentos con respecto al origen.

Llamaremos momento de orden r con respecto al origen o momento

no centrado, y lo denotaremos por "r, al momento de orden r con

respecto al punto cero.

∑∑==

=−=µ=αk

1iii

ri

k

1ii0,rr x*f)0x(*f

Por ejemplo, el momento no centrado de orden cero es 1 sea cual

sea la distribución de frecuencias de X.

II.3.1.2.- Momentos con respecto a la media. Llamaremos momento de orden r con respecto a la media o momento

centrado de orden r, y lo denotaremos por :r, al momento de


Tema II 38

orden r con respecto al momento no centrado de orden 1.

r1i

k

1ii,rr )x(*f1 α−=µ=µ ∑

=α

Por ejemplo, el momento centrado de orden cero es 1 sea cual

sea la distribución de frecuencias de X.

II.3.2.- Medidas de posición.

Las medidas de posición no son más que promedios cuyo objetivo

es obtener una medida que nos informe de cómo se sitúan los

individuos dentro de la distribución. Dentro de ellos,

encontramos dos grandes grupos: Medidas de Posición Central,

nos suministran un valor central de la distribución (media

aritmética, media geométrica, media armónica, mediana); Medidas

de Posición No Central: la moda y los cuantiles.

II.3.2.1.-Medidas de Posición Central. Media aritmética, geométrica, armónica y mediana.

Dentro de las medidas de posición central vamos a distinguir

las siguientes:

- Media Aritmética.

- Media Geométrica.

- Media Armónica.

- Mediana.

**MEDIA ARITMETICA:

Si tenemos una distribución de frecuencias dada por (xi,fi),

llamamos Media Aritmética de la variable X a la suma de todos

los valores de la distribución dividida por el número total de

datos. La representamos por:

ESTADÍSTICA I

Tema II 39

A la hora de estudiar la media aritmética debemos identificar

el tipo de variable con el que trabajamos: variable estadística

discreta o variable estadística continua.

- Variables estadísticas discretas:

La expresión de la media aritmética diferirá dependiendo del

tipo de datos con los que trabajemos: agrupados o no agrupados.

Lo que nos va a proporcionar la media aritmética es el valor

central de la distribución que coincide con su centro de

gravedad.

- Variables estadísticas continuas:

Al trabajar con variables continuas, no tenemos valores de Xi

sino extremos de clase, ei, y por tanto, utilizaremos las

marcas de clase Ci. Obsérvese que ahora el caso de datos no

agrupados no tendría sentido. Se tiene:

*Propiedades de la media aritmética:

1) La suma algebraica de las desviaciones de los valores de la

X. deMedia =X

Nx =

Nx+...+x+x=X :AGRUPADOS NO DATOS

fx=Nnx=

Nnx+...+nx+nx=X :AGRUPADOS DATOS

ik

1=i

k21

ii

k

1=i

iik

1=i

kk2211

∑

∑∑

fC = nCN1

=X :AGRUPADOS DATOS ii

n

1=iii

n

1=i∑∑


Tema II 40

variable con respecto a la media aritmética ponderada por su

frecuencia relativa o absoluta es igual a cero.

Demostración:

2) La media de los cuadrados de las desviaciones de los valores

observados respecto a cualquier número Q resulta mínima cuando

ese número K es igual a la media aritmética.

Esto se expresa diciendo que:

se hace mínima si, y solamente si:

Demostración:

De donde,

0 = X - X = X - X = X =)X-( ff-xfxf i

n

1=ii

n

1=iii

n

1=iii

n

1=i∑∑∑∑

f)Q-x( =S i2

i

k

1=i∑

X=Q

Q)]-X)(X-2(++[

Q-(

xQ)-X()X-x(f=

=Q)]-X(+)X-x[(f)xf=S

i2

i2

i

k

1=i

i

2i

k

1=i

2ii

k

1=i

∑

∑∑

ESTADÍSTICA I

Tema II 41

En donde el valor de Q que hace mínimo S es la media

aritmética, es decir:

3) Si tenemos una variable estadística X y le sumamos un valor

constante è a todos los valores de la variable, la media se ve

incrementada en esa constante. Es decir,

Demostración:

4) Si todos los valores de una variable estadística los

multiplicamos por una constante , su media aritmética también

queda multiplicada por la misma constante. Es decir,

Q)-X(+)X-x(ffQ)-X(+)X-x(f

xfQ)-X2(+Q)-X(f+)X-x(f=S

2

i

2i

k

1=ii

k

1=i

2

i

2i

k

1=i

ii

n

1=I

2i

k

1=ii

2i

k

1=I

==

=)X-(

∑∑∑

∑∑∑

X=Q cuandovalor menor toma su queya

N

=N

=

=+N

)X-(Q

n)X-x(

nQ)-x(

)X-(Qn

Q)-x( = S

2

i

i2

k

1=i

i

i2

k

1=iQ

2i

i2

k

1=iQQ

∑∑

∑

min

minmin

θ

θθ

+ X = Z

i + X = Z + X = Si Z ii ∀→

θθ

θθ

+ X = + xf

f + xfxf= zf = Z

ii

n

1=i

i

n

1=iii

n

1=iii

n

1=iii

n

1=i

= Z

= ) + (

∑

∑∑∑∑


Tema II 42

Demostración:

* Ventajas e Inconvenientes de la media aritmética:

Ventajas:

- Utiliza todos los valores de la distribución.

- Es fácil de calcular.

- Es única y existe siempre.

- Es el centro de gravedad de la distribución.

Inconvenientes:

- Pierde representatividad cuando la variable toma valores muy

extremos. Este inconveniente no lo presenta la mediana.

**MEDIA GEOMETRICA:

Sea una distribución de frecuencias (xi, ni). La media

geométrica, que representaremos por G, se define como la raíz

N-ésima del producto de los N valores de la distribución

elevados a su correspondiente frecuencia absoluta. Es decir,

θ

θθ

* X = Z

i *X = Z * X = Si Z ii ∀→

X * = fx * = Z

* fx = f) * x( = fz = Z

fx = X

ii

k

1=i

ii

k

1=iii

k

1=iii

k

1=i

ii

k

1=i

θθ

θθ

∑

∑∑∑

∑

ESTADÍSTICA I

Tema II 43

Para el cálculo práctico de la media geométrica se suelen

aplicar logaritmos neperianos o logaritmos en base diez.

Aplicando logaritmos neperianos la expresión de la media

geométrica quedará como sigue:

* Ventajas e Inconvenientes de la media geométrica:

Ventajas:

- Utiliza todos los valores de la distribución.

- Es menos sensible que la media aritmética a los valores

extremos, por su carácter de producto.

Inconvenientes:

- Es de significado estadístico menos intuitivo que la media

aritmética.

- Su cómputo es más difícil.

- En ocasiones no queda determinada. Cuando la variable toma al

menos un xi=0, entonces G se anula y además, si la variable

toma valores negativos, se puede presentar una gama de casos en

los que tampoco la G queda determinada.

continuas. ablespara varai c(=c...cc= G

discretas. blespara varia x(=x...xx= G

)

)

ini

k

1=i

N1

nn

2nN

1n

in

k

1=i

N1

Nn

n2

n1

n

k21

ik21

∏

∏

e xn =G ,donde De

xnN1

=)xn + ... + xn + xn(N1

=G

)x...xxx N1

= x( =G

ii

k

1=i

N1

ii

k

1=ikk2211

kn

2n

1n

in

k

1=iin

k

1=i

N1

k21ik ( N1 = )

ln

lnlnlnlnln

lnlnln ln

∑

∑

∏∏


Tema II 44

Ejemplo:

Sea la distribución de salarios de los empleados de la empresa

de autobuses "Suárez S.A" que viene dada por la siguiente

tabla:

¡Error!

Marcador

no

definido.

xi

ni

250000 425

320000 834

412000 421

528000 265

630000 384

870000 128

Calcúlese la media geométrica de dicha distribución.

Solución:

¡Error!

Marcador

no

definido.

ni ln(xi) ni*ln(xi)

ESTADÍSTICA I

Tema II 45

xi

250000 425 12,4292162 5282,416885

320000 834 12,6760762 10571,847550

412000 421 12,9287786 5443,015791

528000 265 13,1768515 3491,865648

630000 384 13,3534751 5127,734438

870000 128 13,6762484 1750,559795

N=2457 '= 31667,44011

Por tanto,

La media geométrica es utilizada principalmente para promediar

porcentajes, tasas, índices,... es decir, aquellos casos en los

que la variable representa variaciones acumulativas.

**MEDIA ARMONICA:

La media armónica se define como:

395798,693 = e = e =G 112,888661011)(31667,440

24571


Tema II 46

Se suele utilizar para promediar velocidades, tiempos

promedios. Es decir, se utiliza para promediar datos que vienen

en términos relativos.

Ejemplo:

Vamos a calcular la producción media de 4 fincas que han

producido: 100, 120, 150 y 200 Tms. de plátanos con unos

rendimientos de 10, 15, 20 y 18 Tms. por hectárea

respectivamente.

Llamando xi al rendimiento y ni a la producción tenemos:

¡Error!

Marcador

no

definido.

xi

ni ni /

xi

xini

10 100 10 1000

12 120 12 1440

15 150 10 2550

18 200 11.11 3600

570 39.4 8590

cn

N = A

:bien o

xn

N = A

i

ik

1=i

i

ik

1=i

∑

∑

ESTADÍSTICA I

Tema II 47

La media armónica es: A = 570 / 43.1 = 13.22 Tms./hectárea.

La media aritmética para este caso es : 8590/570 = 15.07

Tms./hectárea.

* Ventajas e Inconvenientes de la media armónica:

Ventajas:

- Utiliza todos los valores.

- Si se realiza el cambio oportuno, se puede pasar de una media

armónica a una media aritmética.

- Hay casos en que es más representativo que la media

aritmética.

Inconvenientes:

- Cuando los valores de la variable están muy próximos a cero,

la media armónica pierde significación, es poco representativa.

- Si existe algún valor de la variable igual a cero (algún

xi = 0), la media armónica no se puede determinar.

**FORMULA DE FOSTER DE LOS PROMEDIOS:

La fórmula de Foster de los promedios nos va a permitir

obtener todas las medidas de posición central estudiadas hasta

ahora. Se define como:

Y dando diferentes valores a m, obtenemos las diferentes

medidas de posición central:

)nxN1

( nxN1

= M(m) iim

k

1=i

m1

m iim

k

1=i∑∑


Tema II 48

Además es posible demostrar que la relación entre las tres

medias estudiadas anteriormente es siempre:

**MEDIANA:

La mediana es aquel valor de la distribución que deja a su

izquierda y a su derecha el mismo número de frecuencias,

partiendo de la base de que la distribución ha sido ordenada de

menor a mayor.

De forma analítica, la mediana vendrá dada por la siguiente

expresión:

en donde Me indica la mediana y F(x) la función de distribución

de la variable X.

Hay que distinguir dos casos a la hora de hablar de la mediana

en función del tipo de variable con la que trabajamos. Es

X = M(1) 1 = m Si

G = M(0) 0 = m Si

A =

xn

N= nx

N1

= M(-1) 1- = mSi

i

in

1=i

1- ii1-

n

1=i

→

→

→

∑∑

x G A ≤≤

21

= F(x) que tal x = Me ,

ESTADÍSTICA I

Tema II 49

decir, Variables Estadísticas Discretas y Variables

Estadísticas Continuas.

A) Variables Estadísticas Discretas:

Dentro de este tipo de variables distinguimos dos casos:

Vamos a ver entonces, la expresión que tendría la mediana en el

caso (A-1):

Gráficamente:

21

= )XF( / XExisteNo 2)-A

21

= )XF( / X Existe 1)-A

ii

ii

_

X = Me

caso tal en

21

= )XF( / X

i

ii∃


Tema II 50

Ejemplo caso (A-1):

Sea la distribución de frecuencias dada por la tabla siguiente:

¡Error!

Marcado

r no

definid

o. xi

ni

6 3

12 7

18 5

24 3

30 2

Calcúlese la mediana.

Solución:

ESTADÍSTICA I

Tema II 51

¡Erro

r!

Marca

dor

no

defin

ido.

xi

ni fi Ni Fi

6 3 0,15 3 0,15

12 7 0,35 10 0,50

18 5 0,25 15 0,75

24 3 0,15 18 0,90

30 2 0,10 20 1,00

N=20 '=1,00

Por tanto,

Y la expresión de la mediana en el caso (A-2) será la

siguiente:

12 = Medonde, De

21 = 12)=X F(_

21 = )X F( ii

h)+XF(<21

<h)-XF(

0;h 0,>h X = Me

21

= )XF( / X ExisteNo

ii

i

ii

→_

_


Tema II 52

Gráficamente:

Ejemplo caso (A-2):

Sea la distribución de frecuencias dada por la tabla:

¡Erro

r!

Marca

dor

no

defin

ido.

xi

ni

6 3

12 6

ESTADÍSTICA I

Tema II 53

18 5

24 4

30 2

Calcúlese la mediana.

Solución:

¡Erro

r!

Marca

dor

no

defin

ido.

xi

ni fi Ni Fi

6 3 0,15 3 0,15

12 6 0,30 9 0,45

18 5 0,25 14 0,70

24 4 0,20 18 0,90

30 2 0,10 20 1,00

'=1,00

Por tanto,

B) Variables Estadísticas Continuas:

Supongamos que conocemos la función de distribución de la

variable X: F(X) y que sabemos que:

0h 0,>h h);+F(18<21

<h)-F(18 18 = Me

21

= )XF( / XExisteNo ii

→_

_


Tema II 54

por tanto, la mediana pertenece a la clase [ei-1, ei).

Gráficamente:

Y analíticamente,

(I) )eF(-)eF(

1))-eF(-21

)(e-e( = e-Me

)eF(-)eF(

)eF(-21

= e-ee-Me

Y-YY-Y

= X-XX-X

-1ii

i-1ii

-1i

-1ii

-1i

-1ii

-1i

12

1

12

1 _

21

)eF(y 21

1)-eF( ii ≥≤

ESTADÍSTICA I

Tema II 55

Ejemplo del caso continuo:

Calcular la mediana de la siguiente distribución de

salarios:

¡Error!

Marcado

r no

definid

o.

Clase

Salario Anual N� obreros

1 30000 a 35000 100

2 35000 a 40000 150

e-e = a

f = )eF(-)eF( :Donde

1-iii

i1-ii

e + )N-2N(

na = Me

N

N = )e F(;Nn = f como, lado otro Por

e + ))eF(-21

(fa = Me

f

))eF(-21

(a = e-Me

1-i1-ii

i

1-i1-i

ii

1-i1-ii

i

i

1-ii

1-i


Tema II 56

3 40000 a 45000 200

4 45000 a 50000 180

5 50000 a 55000 41

N=671

Solución:

¡Error

!

Marcad

or no

defini

do.

Clase

Ci ni Ni Fi

1 32500 100 100 0,14903

2 37500 150 250 0,37257

3 42500 200 450 0,67064

4 47500 180 630 0,93889

5 52500 41 671 1,00000

N=671

Por tanto,

ESTADÍSTICA I

Tema II 57

* Propiedades de la Mediana:

La mediana hace mínima la suma de todas las desviaciones

absolutas. Es decir, si representamos la mediana por Me,

tenemos que,

cuando la constante con respecto a la cual se toman las

desviaciones, Q, es igual a la mediana Me.

II.3.2.2.-Medidas de Posición No Central

**MODA:

La moda es el valor de la variable que se presenta más

frecuentemente, y por tanto, en la distribución de frecuencias

será el valor de la variable que tenga la máxima frecuencia.

Distinguimos dos casos: A) Variables Estadísticas Discretas. B)

Variables Estadísticas Continuas.

A) Variables Estadísticas Discretas:

42137,5 = Me

40000 + 25(85,5) = Me

40000 + 250]-[335,52005000

= Me

e + N-2N

na = Me

0,5 = (x) F 45000) [40000, Me

1-i1-ii

i

∈ _

n|Me-x| = n|Q-x| ii

k

1=iii

k

1=iQ ∑∑min


Tema II 58

La moda, Mo, viene dada por aquel valor que puede tomar la

variable que verifique que tiene la mayor frecuencia absoluta

(o relativa). Gráficamente, la moda será el valor máximo que

puede tomar el diagrama de barras.

De forma analítica:

Ejemplo:

Calcular la moda de la siguiente distribución de frecuencias:

¡Error!

Marcado

r no

definid

o. xi

ni

1 2

4 3

7 5

10 10

12 8

15 6

Solución:

i f>fi n>n / x = Mo irirr ∀∀

ESTADÍSTICA I

Tema II 59

¡Erro

r!

Marca

dor

no

defin

ido.

xi

ni fi

1 2 0,0588235

4 3 0,0882352

7 5 0,1470588

10 10 0,2941176

12 8 0,2352941

15 6 0,1764705

34 1

Por lo tanto, Mo = 10 puesto que la mayor frecuencia absoluta ó

relativa: n4 = 10 > ni úi ó f4 = 0,2941176 > fi

B) Variables Estadísticas Continuas:

La clase modal en las variables estadísticas continuas será

aquella que contiene la mayor densidad de frecuencia (fi/ai).

Supongamos que sabemos que la moda pertenece a la clase [ei-

1,ei). Dentro de ese intervalo modal, la moda se encuentra en

un punto en el que las distancias a los extremos inferior y

superior del intervalo son directamente proporcionales a las

diferencias entre la densidad de frecuencia del intervalo modal

y la de los intervalos contiguos a dichos extremos.

Gráficamente:


Tema II 60

De forma analítica, la moda vendrá dada por la siguiente

ecuación:

Por semejanza entre los triángulos que quedan definidos a

izquierda y derecha de Mo (que notaremos por A y B), podemos

deducir la expresión de m (recuérdese que dos triángulos

semejantes verifican que el cociente entre altura y base de

cada uno es el mismo). Así pues, m vendrá dado por la siguiente

expresión:

Y sustituyendo m en la expresión de la moda, ésta quedará como

sigue:

m + e = Mo 1-i

a *)

a

f-

a

f(+)

a

f-

a

f(

a

f-

a

f

= m

a

f-

a

f

m - a =

a

f-

a

f

m

i

1+i

1+i

i

i

1-i

1-i

i

i

1-i

1-i

i

i

1+i

1+i

i

i

i

1-i

1-i

i

i

ESTADÍSTICA I

Tema II 61

Ejemplo:

Calcúlese la moda de la siguiente distribución de frecuencias:

¡Error!

Marcador

no

definido

. [ei-

1,ei)

ni

0-2 12

2-4 14

4-6 26

6-8 22

8-10 16

10-12 10

Solución:

¡Erro

r!

Marca

dor

no

defin

ni fi fi/ai

a

f-

a

f = Z

a

f-

a

f = Z : siendo

Z+Z

Za + e = Mo

1+i

1+i

i

i2

1-i

1-i

i

i1

21

1i1-i


Tema II 62

ido.

Ci

1 12 0,12 0,06

3 14 0,14 0,07

5 26 0,26 0,13

7 22 0,22 0,11

9 16 0,16 0,08

11 10 0,10 0,05

'=1,00

La moda pertenece al intervalo [4, 6), el que contiene la mayor

densidad de frecuencia (fi/ai), y por tanto, vendrá dada por la

siguiente expresión:

**CUANTILES

Los cuantiles son aquellos valores de la distribución que la

dividen en partes iguales, es decir, en intervalos que

contienen la misma proporción de individuos.

Si tenemos una distribución de frecuencias (xi, ni) y sean r y

k dos números naturales, tal que r<k, llamaremos "Cuantil",

Cr/k, de orden r/k a la raíz de la ecuación F(X)=r/k. Es decir,

será aquel valor de la variable X que verifique la F(X)=r/k.

Los cuantiles tendrán denominaciones específicas según cual sea

el número de intervalos en que se divide la distribución. Entre

ellos distinguimos:

5,5 = 2 * 0,11)-(0,13+0,07)-(0,13

0,07-0,13 + 4 = Mo

m + e = Mo 1-i

ESTADÍSTICA I

Tema II 63

*Cuartiles:

Son aquellos valores de la distribución que la dividen en

cuatro partes iguales, en cada una de las cuales ha de estar el

25% de los individuos. Los denotaremos por Q1/4, Q2/4 y Q3/4.

Se presentan dos casos: A) Distribuciones discretas, B)

distribuciones continuas.

A) Distribución Discreta.

Si estamos estudiando una variable discreta llamaremos cuartil

primero y lo denotaremos por Q1 o Q1/4 a aquel valor de la

variable X que verifica:

donde: h > 0 Y h --> 0

De igual forma podríamos definir el cuartil segundo (Q2 o Q 2/4)

y el tercero (Q3 o Q3/4). Esto es xj es el cuartil de orden dos

si verifica:

Y x3 es el cuartil de orden tres si verifica:

Vemos un ejemplo.

¡Error

!

Marcad

or no

ni Ni Fi

0.50 )XF( )Q = XF( )XF( 0.25 h+i1ih-i ≥≤≤≤

0.50 )xF( )Q=xF( )xF( 0.50 h+j2jh-j ≥≤≤≤

0.75 )xF( )Q=xF( )xF( 0.75 h+s3sh-s ≥≤≤≤


Tema II 64

defini

do.

xi

16 5 5 0.05

19 5 10 0.1

21 10 20 0.2

23 20 40 0.4

24 20 60 0.6

25 30 90 0.9

30 5 95 0.95

32 5 100 1.00

B) Distribución Continua:

En este caso el primer paso a dar consiste en determinar cual

es la clase que contiene al cuartil. Este paso es inmediato. La

clase i contiene a Q1 si verifica que:

De igual forma diremos que la clase j contiene al segundo

cuartil si se verifica:

Y la clase s contiene al tercer cartil si se cumple:

25 = Q

24 = Q

23 = Q

43

42

41

)eF( 0.25 < )eF( i1-i ≤

)eF( 0.50 < )eF( j1-j ≤

ESTADÍSTICA I

Tema II 65

Una vez determinada la clase el cálculo del cuartil es

inmediato mediante la expresión:

en donde el subíndice i nos indica la clase que contiene a Qr/k

y que se ha determinado en un paso previo. Esta expresión se

deduce de forma similar a como se hizo con la fórmula de la

mediana.

Ejemplo:

Calcúlense los cuartiles de la siguiente distribución:

[ei-1,ei) ni

50-55 20

55-60 80

60-65 175

65-70 100

70-75 75

75-80 50

Solución:

)eF( 0.75 < )eF( s1-s ≤

4=k siendo ,n

N-Nkr

*a + e = Qi

1-i

i1-ikr


Tema II 66

[ei-1,ei) ni Ni Fi

50-55 20 20 0,04

55-60 80 100 0,20

60-65 175 275 0,55

65-70 100 375 0,75

70-75 75 450 0,90

75-80 50 500 1,00

'=500

Por tanto,

*Quintiles:

Serán aquellos valores de la distribución que la dividen en

cinco partes iguales. También distinguimos dos casos:

160,7142857 = 175

100-*50041

*5 + 60 = Q

65) [60, Q

41

41 ∈

8664,2857142 = 175

100-*50042

*5 + 60 = Q

65) [60, Q

42

42∈

70 = 100

275-*50043

*5 + 65 = Q

70) [65, Q

43

43 ∈

ESTADÍSTICA I

Tema II 67

distribución discreta y distribución continua; en ambos casos

los planteamientos son similares a los ya desarrollados para

los cuartiles y por tanto se presentarán ahora con un ejemplo.

A) Distribución Discreta.

Veámoslo con un ejemplo.

xi ni Ni fi Fi

1000 20 20(1) 0.2 0.2

2000 10 30 0.1 0.3

3000 15 45(2) 0.15 0.45

4000 25 70(3) 0.25 0.70

5500 10 80(4) 0.10 0.80

6000 15 95 0.15 0.95

6500 5 100 0.05 1.00

100 1.00


Tema II 68

B) Distribución Continua.

Los quintiles se obtienen a través de la siguiente expresión:

Ejemplo:

Calcular los quintiles de la siguiente distribución:

[ei-1,ei) ni Ni Fi

50-55 40 40 0.04

55-60 160 200 0.2

60-65 350 550 0.55

65-70 200 750 0.75

70-75 150 900 0.9

75-80 100 1000 1.00

Solución:

5500 = Qi 80=5

1004x (4)

4000 = Qi 60=5

1003x (3)

3000 = Qi 40=5

1002x (2)

1000 = Qi 20=5

1001x (1)

54

53

52

51

_

_

_

_

5=k siendo ,a * n

N-Nkr

+ e = Qi ii

1-i

1-ikr

ESTADÍSTICA I

Tema II 69

* Deciles:

Son aquellos valores de la distribución que la dividen en diez

intervalos iguales.

* Percentiles:

Dividen a la distribución en cien partes iguales, cada una de

las cuales contiene al 1% de la población.

II.3.3.- MEDIDAS DE DISPERSION.

Con las medidas de dispersión tratamos de estudiar hasta qué

punto, para una determinada distribución de frecuencias, las

medidas de posición central estudiadas son representativas como

síntesis de toda la información.

Para medir la representatividad de estas medidas tendremos que

cuantificar la separación entre los valores de la distribución

y estas medidas. A esta cuantificación, es decir, a la mayor o

menor separación de los valores respecto a otro que se pretende

771,6666666 = 5 * 150

750-100054

+ 70 = Qi

66,25 = 5 * 200

550-100053

+ 65 = Qi

662,8571428 = 5 * 350

200-100052

+ 60 = Qi

60 = 5 * 160

40-100051

+ 55 = Qi

54

53

52

51


Tema II 70

que sea su síntesis, se le llama Dispersión o Variabilidad.

Podemos distinguir dos tipos de medidas de dispersión: Medidas

de Dispersión Absolutas: Aquellas que no permiten establecer

comparaciones entre distribuciones heterogéneas.

Medidas de Dispersión Relativas: Aquellas que sí permiten

establecer estas comparaciones. Habitualmente son

adimencionales.

MEDIDAS DE DISPERSION ABSOLUTAS:

Entre ellas distinguimos las siguientes:

-Recorrido o Rango.

-Recorrido Intercuartílico.

-Media de las Desviaciones a un Promedio.

-Varianza.

-Desviación Típica o Standard.

-Cuasivarianza.

Veamos cada una de ellas:

*Recorrido o Rango:

Es la diferencia entre el mayor y el menor valor posible de la

distribución de una variable. Distinguimos dos casos:

-Variable Discreta: El recorrido vendrá dado por la siguiente

expresión:

-Variable Continua: El recorrido se obtiene a través de la


Esta medida tiene el inconveniente de que viene determinada

sólo por dos valores de la variable, siendo por ello, muy

sensible a la fluctuación de estos valores extremos.

X-X = Re 1k

e-e = Re 0k

ESTADÍSTICA I

Tema II 71

Ejemplo:

�� Xi � 5 7 9 20 25 30 � �� ni � 1 1 1 1 1 1 � ��

* Recorrido Intercuartílico:

Se define como la diferencia entre el tercer y el primer

cuartil. Es decir,

Como se puede observar esta medida nos indica la dispersión que

presenta el 50% de los individuos centrales de la distribución.

* Media de las Desviaciones a un Promedio:

Analíticamente,

Si analizamos esta expresión, vemos que al realizar el

sumatorio tendremos desviaciones positivas y negativas que se

compensarán y ello hará que la medida así definida tienda a

cero. Por lo tanto, no estaríamos cuantificando la dispersión.

Para solucionar este problema, podemos considerar los valores

absolutos de las desviaciones o elevarlas al cuadrado.

Dentro de esta primera solución (valores absolutos),

tenemos:

25 = 5-30 = Re

Q-Q =Ri 1/43/4

.cualquiera promedio un p siendo ,fp)-x( = D ii

k

1=i∑


Tema II 72

A) Desviación media respecto a la media aritmética:

Una desviación grande indica una gran dispersión en la

distribución.

B) Desviación media respecto a la mediana:

En el caso de obtener un DMe grande, la mediana no será

representativa.

* Varianza:

Es junto a la desviación típica la medida de dispersión más

utilizada. Es una medida que entra dentro de la segunda

solución (elevarla al cuadrado). Se define como la media de los

cuadrados de las desviaciones de los valores de la variable a

la media aritmética.

En general, cuanto más dispersas sean las observaciones,

mayores serán las desviaciones respecto a la media, y mayor por

tanto, el valor numérico de la varianza.

Propiedades de la Varianza:

1.-La varianza nunca puede ser negativa.

f|X-x| = D ii

k

1=iX ∑

f|Me-x| = D ii

k

1=iMe ∑

f)X-X( = S

m = S

i2

i

k

1=i

2x

22x

∑

ESTADÍSTICA I

Tema II 73

2.-Si sumamos a todos los valores de la variable una constante

è, la varianza no varía.

Demostración:

3.-Al multiplicar los valores de una distribución de

frecuencias por una constante è, la varianza queda multiplicada

por el cuadrado de la constante.

Demostración:

0 S 2x ≥

S = S tanto,Por

S = f)X-x( =

=f)] + X(-) + x[( = f)X-x( = )S(

+ X = X + X = X si que Sabemos

2x

2x

2xii

2k

1=i

ii2

k

1=iii

2k

1=i

2x

′

′′′

′′

∑

∑∑ θθ

θθ _

S* = )X-x(f =

= )*X-*x(f = )X-x(f = )S(

*X = X X* = X ahora Sea

f)X-x( = S ; fx = X

2x

2i

2i

k

1=i

2

i

2i

k

1=ii

2i

k

1=ix

2

ii2

k

1=i

2xii

k

1=i

θθ

θθ

θθ

∑

∑∑

∑∑

′′′

′′ _


Tema II 74

* Desviación Típica o Standard:

Se define como la raíz cuadrada, con signo positivo, de la

varianza. Es decir,

Al ser la raíz cuadrada de la varianza, vendrá expresada en las

mismas unidades de medida que la distribución de la variable.

Ello nos permitirá realizar una interpretación más clara de la

dispersión.

Es una medida de dispersión absoluta que no nos permite

comparar dos distribuciones salvo en el caso de que las medias

de ambas y las unidades en que vienen expresadas sean iguales.

* Cuasivarianza:

Se define como:

Es fácil obtener una relación entre la cuasivarianza y la

varianza. Para ello basta multiplicar y dividir por N:

f)X-x(+ = S+ = S ii2

n

1=i

2xx ∑

1-N

* n)X-x( = S

i

i2

n

1=i

2*x ∑

ESTADÍSTICA I

Tema II 75

Por tanto,

Esta medida se interpreta de forma similar a la varianza.

Realmente cuando N tiende a infinito la cuasivarianza tiende a

la varianza. Sin embargo cuando N es pequeña estas dos medidas

son distintas, jugando en este caso la cuasivarianza un papel

importante en la estadística inferencial.

MEDIDAS DE DISPERSION RELATIVAS:

El objetivo de este tipo de medidas es permitirnos comparar la

dispersión de distribuciones distintas, posibilitando así,

resolver el inconveniente que presentan las medidas de

dispersión absoluta. Dentro de ellas nos vamos a centrar en el

estudio del coeficiente de variación de Pearson.

* Coeficiente de Variación de Pearson:

Se define como la relación por cociente entre la desviación

típica y la media aritmética. Es decir,

Ventajas e Inconvenientes en el uso del coeficiente de

S1-N

N = )x-x(f

1-NN

=

= )X-x(NN

1-Nn = S

2xi

2i

k

1=i

i

2ik

1=i

2*x

∑

∑

1-N

NS = S 2

x2*

x

media. de unidadpor ndispersi la da Nos XS = CV x _


Tema II 76

variación de Pearson:

Ventajas:

1.-Es adimensional, no va a estar influido por la unidad de

medida.

2.-Podemos realizar comparaciones entre dos distribuciones

aunque las medias y las unidades sean distintas.

Inconvenientes:

1.-Si la media es igual a cero, pierde su sentido estadístico.

2.-No es invariante ante cambios de la variable. Es decir,

Demostración:

En cuanto a la interpretación, debemos saber que cuanto mayor

sea el coeficiente de variación, mayor será la desviación

′≠

′′′′→

CV CV

XS = CV

aX-X

= X X x0 _

CV x-X

S =

ax-X

aS

= XS = CV

aS = S

aS = S

)a

x-X-

ax-x(f = )X-x(f = S

a

x-X =

a

x-xfxxf = xf = X

0

x

0

x

x

xx2

2x

x

00i

2

i

k

1=ii

2i

k

1=ix

00ii

k

1=i0i

i

k

1=iii

k

1=i

= a

)-(

≠′′

′

′′

′′′

′′

∑∑

∑∑∑

_

ESTADÍSTICA I

Tema II 77

típica y por tanto, mayor será la dispersión. Es decir, la

media sintetizará peor la información cuanto mayor sea el

coeficiente de variación.

II.3.4.- Variable tipificada

Una variable estadística se dice está tipificada o

estandarizada si su media aritmética es 0 y su varianza 1.

Sea X una variable estadística cuya media aritmética viene dada

por : y su desviación típica es F. Sea Z la variable definida

por

En este caso, diremos que la variable Z es la variable

tipificada de X. Como ejercicio, demostrar que la media de Z

vale cero y su varianza 1.

II.3.5.-MEDIDAS DE FORMA: ASIMETRIA Y CURTOSIS.

II.3.5.1.-Medidas de Asimetría

Las medidas de asimetría van dirigidas a la elaboración de una

medida que permita establecer el grado de simetría (o

asimetría) que presenta la distribución.

Vamos a representar gráficamente una distribución de

frecuencias. Si trazamos una línea perpendicular al eje de

abcisas por la media aritmética, tomando esta perpendicular

como eje de asimetría, se nos pueden presentar varios casos:

A) Distribución simétrica: Diremos que una distribución es

simétrica cuando existe el mismo número de valores a ambos

lados de dicho eje, equidistantes de la media dos a dos y tales

que cada par de valores equidistantes a la media tengan la

misma frecuencia.

σµ−

=x

z


Tema II 78

� � � � � � � � � � � � � � � � � �� _ _

X X

S I M E T R I C A S I M E T R I C A

Esto es, una distribución es simétrica con respecto a la media

aritmética si al "doblar" la distribución por la media, las dos

partes de la gráfica diferencial se superponen.

B) Distribución Asimétrica a Derechas:

Una distribución es asimétrica a derechas cuando tiene mayor

número de valores a la derecha que a la izquierda del eje de

asimetría (media aritmética).

� � � � � � � �� _ _

X X

ASIMETRICA A DERECHAS ASIMETRICA A DERECHAS

C) Distribución Asimétrica a Izquierdas:

Será aquella distribución que tiene un mayor número de valores

a la izquierda que a la derecha del eje de asimetría.

ESTADÍSTICA I

Tema II 79

� � � � � � � �� _ _

X X

ASIMETRICA A IZQUIERDAS ASIMETRICA A IZQUIERDAS

En definitiva, si una distribución es simétrica, existirá el

mismo número de valores a la derecha que a la izquierda de la

media, y por tanto, el mismo número de desviaciones con signo

positivo que con signo negativo, siendo la suma de desviaciones

positivas igual a la suma de las negativas.

Una vez visto lo que se entiende por distribución simétrica,

vamos a pasar al estudio de algunas medidas de simetría entre

las que destacamos las siguientes: Coeficiente de Asimetría de

R.A.Fisher y Coeficiente de Asimetría de Pearson.

* Coeficiente de Asimetría de Fisher:

Es un índice que se basa en la idea de media, realizando una

comparación entre las distancias de las observaciones que están

a un lado y a otro de la media aritmética.

Se define de la siguiente forma:


Tema II 80

cubo. altípica desviación = S

3. orden de centrado momento= m donde,

,n

)X-x([

n)X-x(N1

= Sm =

3x

3

i

i2

k

1=i

3/2

ii

3k

1=i3x

31

]N

∑

∑γ

izquierda.la hacia sesgada o

izquierda la a asimétrica es óndistribuciLa 0)<m( 0 < i S

derecha.la hacia sesgada o

derecha la a asimétrica es óndistribuciLa 0)>m( 0 > Si

trica. es óndistribuciLa 0)=m( 0 = Si

31

31

31

_

_

_simé_

γ

γ

γ

* Coeficiente de Asimetría de Pearson:

En distribuciones unimodales y moderadamente acampanadas se

verifica que la mediana está entre la moda y la media

aritmética, coincidiendo las tres en el caso de que la

distribución sea simétrica:

Mo = Me = X

ESTADÍSTICA I

Tema II 81

Si la distribución no es simétrica se cumplirá que:

Pearson se basa en esta propiedad para definir su coeficiente

de asimetría de la siguiente forma:

En el caso de que la distribución sea asimétrica positiva o

sesgada hacia la derecha, la media aritmética se desplaza a la

derecha de la moda. Es decir,

Si por el contrario, la distribución es asimétrica negativa o

sesgada hacia la izquierda, la media aritmética se desplaza a

la izquierda de la moda. Es decir,

Por lo tanto, tendremos que:

II.3.5.2.-Medidas de Apuntamiento o Curtosis: Estas medidas tratan de estudiar la mayor o menor concentración

de frecuencias alrededor de la media aritmética. Esta mayor o

menor concentración dará lugar a una distribución más o menos

Mo Me X bien X Me Mo bien ≤≤≤≤

SMo-X

= Ap

0 > Mo-X

0 < Mo-X

negativa. asimétrica es óndistribuciLa 0 < A Si

positiva. asimétrica es óndistribuciLa 0 > A Si

. simétricaes óndistribuciLa 0 = ASi

p

p

p

_

_

_


Tema II 82

apuntada.

Como coeficiente de Curtosis se utiliza la siguiente expresión:

Según el valor que tome este coeficiente, la distribución puede

ser:

Ejemplo:

Dada la siguiente distribución de sueldos entre los empleados

de una empresa (salarios mensuales en miles de ptas):

[ei-1,ei) ni

80-100 10

100-120 30

120-150 40

150-200 15

200-300 5

100

Vamos a calcular los coeficientes de asimetría y curtosis.

Solución:

cuarta.la a elevada típica desviación = S

4. orden de centrado momento = m donde

3-Sm =

4x

4

4x

42γ

0 < Si ca Platicúrti

0 > Si ca Leptocúrti

0 = Si a(normal)Mesocúrtic

2

2

2

γ

γ

γ

ESTADÍSTICA I

Tema II 83

Ci fi Cifi Ci2fi Ci3fi Ci4fi

90 0,10 9 810 72900 6561000

110 0,30 33 3630 399300 43923000

135 0,40 54 7290 984150 132860250

175 0,15 26,25 4593,75 803906,25 140683590

250 0,05 12,50 3125 781250 195312500

'=134,75 '=19448,75

3041506,25 519340340

Un coeficiente de asimetría que podemos calcular es el

coeficiente de asimetría de Fisher que viene dado por la


El momento centrado de orden tres lo podemos calcular a través

de los momentos no centrados, es decir,

Sm =

3x

31γ

46396,366 = )1291,1875( = S

:valor eltoma ,S cubo, alelevada tÍpica ndesviaci la Y

72812,16 = m

(134,75)2+)(134,75)3(19448,75-3041506,25 = m

fx = X = ; fx = ; fx = ,donde

2+3- = m

33x

3x

3

33

ii

n

1=i1i

2i

n

1=i2i

3i

n

1=i3

311233

∑∑∑ ααα

αααα


Tema II 84

Por tanto, el coeficiente de asimetría nos quedará como sigue:

Para determinar el coeficiente de curtosis necesitamos calcular

antes el momento centrado de orden cuatro, ya que este

coeficiente viene dado por la siguiente expresión:

El momento centrado de orden cuatro lo calculamos a través de

su relación con los momentos no centrados, es decir,

Por tanto, el coeficiente de Curtosis toma el siguiente valor:

Positiva. AsimÇtrica 0 > 1,5693505 = 46396,36672812,16

= 1 _γ

3-Sm =

4x

42γ

9728579,5 = m

(134,75)3-(134,75))6(19448,75+

+)25)(134,754(3041506,-519340340 = m

134,75 = X = fx = ; 19448,75 = fx =

3041506,25 = fx = ; 519340340 = fx = ,donde

3-6+4- = m

4

42

4

ii

n

1=i1i

2i

n

1=i2

i3i

n

1=i3i

4i

n

1=i4

41

2121344

∑∑

∑∑

αα

αα

αααααα

ca.Leptocœrti 0 > 2,8354023 = 3-)1291,1875(

9728579,5 = 42 _γ

ESTADÍSTICA I

Tema II 85

II.3.6.-COEFICIENTES DE CONCENTRACION.

Las medidas de concentración tienen por objeto poner de

manifiesto el mayor o menor grado de igualdad en el reparto del

total de los valores de la variable. Por ello se dice que son

indicadores del grado de equidistribución de la variable.

Para estudiar la concentración vamos a suponer una distribución

de rentas con n rentistas. Podremos encontrarnos con dos

situaciones extremas:

1.-Concentración máxima: cuando sólo un rentista de los n

rentistas percibe el total de la renta y los demás nada. Es

decir,

2.-Concentración mínima o equidistribución: cuando todos los n

rentistas perciben la misma cantidad. Es decir,

A la hora de analizar la concentración se definen dos tipos de

medidas, una analítica, el índice de Gini,y otra gráfica, que

es la curva de Lorenz. En ambos casos para llevar a cabo su

cálculo es necesrio su ordenación de menor a mayor.

II.3.6.1.-INDICE DE GINI.

Sea (xi, ni), una distribución de frecuencias cuya variable

hace referencia a una variable monetaria.

El índice de Gini vendrá dado por la siguiente expresión:

0 xpara 0 = x =...= x = x = x n1-n321 ≠

x =...= x = x n21


Tema II 86

Obsérvese que pi lo que nos da es la proporción de individuos

que han recibido una cantidad igual o inferior a xi. Por otro

lado qi nos da la proporción de dinero total repartido entre

los Ni individuos. En consecuencia, el numerador de la

expresión del índice de Gini nos da la diferencia que existe

entre lo que se ha repartido hasta la modalidad i-ésima y la

proporción de individuos entre los que se ha repartido.

Veámos el valor que tomaría este índice en las dos situaciones

extremas: A)Caso de máxima equidad, B)Caso de mínima equidad.

A) Caso de máxima equidad.

xi ni Ni pi=Ni/N*100 xini ìi qi=ìi/ìn*100

X 1 1 1/N*100 X X X/NX*100

X 1 2 2/N*100 X 2X 2X/NX*100

X 1 3 3/N*100 X 3X 3X/NX*100

... ... ... ... ... ... ...

X 1 N N/N*100 X NX NX/NX*100

Donde,

Y el índice de Gini tomará el siguiente valor:

100* = q ; xnN

p

p

)q-p( = I

n

iitt

i

1=ti

i

i

i

1-n

1=i

ii

1-n

1=iG

= ; 100*N

= ,donde

µµ

µ ∑

∑

∑

100* = q ; 100*NN = p ; xn =

n

ii

iitt

i

1=ti µ

µµ ∑

ESTADÍSTICA I

Tema II 87

B) Caso de mínima equidad.

xi ni Ni pi xini ìi qi

0 1 1 1/N*100 0 0 0

0 1 2 2/N*100 0 0 0

0 1 3 3/N*100 0 0 0

... ... ... ... ... ... ...

X 1 N N/N*100 X X X/X*100

Es decir, nos quedaría la siguiente tabla:

xi ni Ni pi xini ìi qi

0 N-1 N-1 N-1/N*100 0 0 0

X 1 1 N/N*100 X X 100

Y en este caso, el índice de Gini quedaría como sigue:

nulo. esGini de Índice el ión,concentracmínima

equidad,máxima de caso el en tanto, loPor

0 = 100*

N1-N0 =

p

)q-p( = I

i

1-n

1=i

ii

1-n

1=iG

∑

∑


Tema II 88

Por lo tanto, podemos decir que el índice de Gini sólo tomará

valores en el intervalo [0,1]:

II.3.6.2.-CURVA DE LORENZ.

La curva de Lorenz no es más que una representación gráfica en

la cual, en uno de los ejes tenemos los valores de pi y en el

otro eje los valores de qi.

Consiste, por tanto, en ir representando los puntos (pi,qi),

ordenados según el orden creciente de x, que al unirlos entre

sí, nos determinan una curva poligonal llamada Curva de Lorenz.

La curva que nos indicará la máxima equidad, mínima

concentración, coincidirá con la diagonal OB ya que en ella

pi=qi. En este caso, todos los rentistas percibirán la misma

1 = = - = p

p

p

qp

p

)q-p( = I

1

1

1

11

i

1-n

1=i

ii

1-n

1=iG

∑

∑

[0,1] I G∈

ESTADÍSTICA I

Tema II 89

cantidad.

El caso más desfavorable, máxima concentración, estaría formado

por los lados OA y AB del cuadrado.


Tema II 90

Ejemplo:

Calcúlese el índice de Gini de la siguiente distribución:

[ei-1,ei) ni

0 a 4 3

4 a 6 5

6 a 8 12

8 a 10 10

10 a 14 11

14 a 16 17

16 a 20 20

20 a 24 15

24 a 30 10

30 a 40 10

Solución:

Ci Ni Cini pi ìi qi (pi-qi)

2 3 6 2.65486 6 0.31545 2.33940

5 8 25 7.07964 31 1.62986 5.44978

7 20 84 17.69911 115 6.04626 11.65284

9 30 90 26.54867 205 10.77812 15.77054

12 41 132 36.28318 337 17.71819 18.56499

15 58 255 51.32743 592 31.12513 20.20230

18 78 360 69.02654 952 50.05257 18.97397

22 93 330 82.30088 1282 67.40273 14.89815

27 103 270 91.15044 1552 81.59831 9.55212

35 113 350 100.00000 1902 100.00000 0.00000

ESTADÍSTICA I

Tema II 91

Por tanto, el índice de Gini tomará el siguiente valor:

0.3056835 = 384.07075117.40409 =

p

)q-p( = I

i

1-n

1=i

ii

1-n

1=iG

∑

∑


Tema II 92

PROBLEMAS RESUELTOS

((1)) A 50 aspirantes a una plaza de administrativo en la

Universidad de Las Palmas se les sometió a un test. Las

puntuaciones obtenidas por los aspirantes fueron las

siguientes: 8, 6, 4, 5, 5, 6, 5, 7, 8, 9, 8, 8, 7, 7, 6, 6, 4,

4, 2, 10, 1, 9, 5, 3, 4, 5, 6, 6, 7, 6, 8, 7, 6, 5, 4, 4, 4, 2,

3, 4, 6, 5, 7, 6, 6, 5, 7, 6, 6, 5.

Se pide:

A) Distribución estadística del fenómeno (tabla numérica).

B) Representación gráfica.

Solución:

A) Distribución estadística:

xi ni

1 1

2 2

3 2

4 8

5 9

6 13

7 7

8 5

9 2

10 1

ESTADÍSTICA I

Tema II 93

B) Representación gráfica:

Al tratarse de un caracter cuantitativo discreto, una de las

posibles representaciones gráficas sería el Diagrama de Barras.

((2)) Con los mismos datos del ejercicio anterior y

considerando cuatro posibles modalidades:

-Suspenso ( de 1 a 4 ).

-Aprobado ( de 5 a 7 ).

-Notable ( de 8 a 9 ).

-Sobresaliente ( 10 ).

Se pide:

A) Distribución estadística del atributo.

B) Representación gráfica.

Solución:


Tema II 94

A) Distribución Estadística:

xi ni

Suspenso 13

Aprobado 29

Notable 7

Sobresaliente 1

B) Representación gráfica:

Se trata de un caracter cualitativo o atributo y por tanto,

será susceptible de ser representado gráficamente a través de

un diagrama de sectores, diagrama de barras o pictograma.

*Diagrama de sectores:

Haciendo el reparto proporcional de los 360o de una

circunferencia:

50-----------360o

13-----------Suspenso Suspenso=93,6o

50-----------360o

29-----------Aprobado Aprobado=208,8o

50-----------360o

7-----------Notable Notable=50,4o

50-----------360o

1-----------Sobresaliente Sobresaliente=7,2o

ESTADÍSTICA I

Tema II 95

*Diagrama de barras:


Tema II 96

((3)) El curso de 4� de Econometría de la Facultad de C.C.E.E

obtiene en el 2� parcial de la asignatura las siguientes

puntuaciones:

48 40 42 50 63 64 65 67 54 47 32 35 41

57 72 68 52 35 44 33 78 61 30 35 80 36

46 68 50 74 31 59 69 35 46 79 48 54 37

40

Se pide:

A) Formar una distribución de frecuencias, con 10 intervalos.

B) Hacer la representación gráfica del polígono acumulativo de

frecuencias.

C) Hacer la representación gráfica del histograma de

frecuencias.

D) Obtener la función de densidad y la función de distribución.

Solución:

A)Distribución de frecuencias:

[ei-1,ei) ni Ni fi fi/ai Fi

[30,35) 4 4 0,10 0,02 0,10

[35,40) 6 10 0,15 0,03 0,25

[40,45) 5 15 0,125 0,025 0,375

[45,50) 5 20 0,125 0,025 0,50

[50,55) 5 25 0,125 0,025 0,625

[55,60) 2 27 0,05 0,01 0,675

[60,65) 3 30 0,075 0,015 0,75

[65,70) 5 35 0,125 0,025 0,875

[70,75) 2 37 0,05 0,01 0,925

[75,80] 3 40 0,075 0,015 1,00

N=40

B) Polígono Acumulativo de Frecuencias:

ESTADÍSTICA I

Tema II 97

C) Histograma de Frecuencias:

D) * Función de Densidad: �� 0 si x < 30 � 0,02 si 30 # x < 35 � 0,03 si 35 # x < 40 � 0,025 si 40 # x < 45 � 0,025 si 45 # x < 50 f(x)=� 0,025 si 50 # x < 55 � 0,01 si 55 # x < 60 � 0,015 si 60 # x < 65 � 0,025 si 65 # x < 70 � 0,01 si 70 # x < 75 � 0,015 si 75 # x # 80 � 0 si x > 80 ��

• Función de Distribución:


Tema II 98

�� 0 si x < 30 � 0,020(x-30)+0 si 30 # x < 35 � 0,030(x-35)+0,1 si 35 # x < 40 � 0,025(x-40)+0,25 si 40 # x < 45 � 0,025(x-45)+0,375 si 45 # x < 50 F(x)=� 0,025(x-50)+0,5 si 50 # x < 55 � 0,010(x-55)+0,625 si 55 # x < 60 � 0,015(x-60)+0,675 si 60 # x < 65 � 0,025(x-65)+0,75 si 65 # x < 70 � 0,01(x-70)+0,875 si 70 # x < 75 � 0,015(x-75)+0,9 si 75 # x < 80 � 1 si x $ 80 � ��

((4))Investigados los precios de un determinado detergente en

50 supermercados de una ciudad, se han obtenido los siguientes

resultados:

700, 300, 500, 400, 500, 700, 400, 750, 800, 500, 500, 750, 300

700, 1000, 1500, 500, 750, 1200, 800, 400, 500, 300, 500, 1000

300, 400, 500, 700, 500, 300, 400, 700, 400, 700, 500, 400, 700

1000, 750, 700, 800, 750, 700, 750, 800, 700, 700, 1200, 800

Determínese:

A.- La distribución de los precios:

(1) agrupados en frecuencias.

(2)agrupados en 5 intervalos de igual amplitud.

B.- Calcúlese la media aritmética, geométrica y armónica de

dichas distribuciones.

C.- Calcúlese la mediana y moda de estas distribuciones.

D.- Calcúlese la dispersión absoluta y la dispersión relativa

de ambas distribuciones.

E.-�Es simétrica la distribución discreta?

F.-�Es mesocúrtica la distribución discreta? G.-

Calcúlese el índice de Gini de la distribución discreta.

A))Solución:

(1) Agrupados en frecuencias:(DISTRIBUCION DISCRETA)

ESTADÍSTICA I

Tema II 99

xi ni xini ln(xi) niln(xi) Ni ni/xi Fi

300 5 1500 5.70378 28.518912 5 0.0166 0.1

400 7 2800 5.99146 41.940252 12 0.0175 0.24

500 10 5000 6.214608 62.146081 22 0.0200 0.44

700 11 7700 6.551080 72.061884 33 0.01571 0.66

750 6 4500 6.620073 39.720439 39 0.0080 0.78

800 5 4000 6.684611 33.423059 44 0.00625 0.88

1000 3 3000 6.907755 20.723266 47 0.00300 0.94

1200 2 2400 7.090076 14.180154 49 0.00166 0.98

1500 1 1500 7.313220 7.313220 50 0.00066 1.00

N=50 32400 320.02727 0.08946

(2) Agrupados en 5 intervalos de igual amplitud:(DISTRIBUCION

CONTINUA)

ni Ci Cini ln(Ci) niln(Ci) ai fi/ai% fi Ni

22 420 9240 6.040254 132.8856 240 0.1833 0.44 22

17 660 11220 6.492239 110.3680 240 0.1416 0.34 39

8 900 7200 6.802394 54.4191 240 0.0666 0.16 47

2 1140 2280 7.038783 14.0775 240 0.0166 0.04 49

1 1380 1380 7.229838 7.2298 240 0.0083 0.02 50

' ' 31320 318.9800 240 1.00

B))Solución:

(1) Distribución Discreta:

*Media aritmética:

*Media geométrica:

648 = 32400501

= xnN1

= X ii

k

1=i∑


Tema II 100

*Media armónica:

(2) Distribución Continua:

*Media aritmética:

*Media geométrica:

*Media armónica:

602.17337 = e =G

e xn =G ; x( =G

320.02727501

ii

k

1=iN1

in

k

1=i

N1

)i ln∑∏

6558.909009 = 0.08946

50 =

xn

N = A

i

ik

1=i∑

626.4 = 31320501

= CnN1

= X ii

k

1=i∑

8589.691783 = e = e Cn =G 318.98501

ii

k

1=iN1 ln∑

558.6190 = 0.08951

50 =

Cn

N = A

i

ik

1=i∑

ESTADÍSTICA I

Tema II 101

ni/Ci

0.0524

0.02576

0.00888

0.00175

0.00072

'=0.08951

C)) Solución:

(1) Caso Discreto:

*Mediana:

*Moda:

La moda se define como aquel valor que se presenta más

frecuentemente, por tanto:

(2) Caso Continuo:

*Mediana:

La mediana pertenece a la clase [540, 780) y por tanto, vendrá

dada por la siguiente expresión:

700 = Me 0.66 < 21

< 0.44

21

= )xF( x = Me ii

_

_

700 = Mo


Tema II 102

*Moda:

La clase modal es la clase [300, 540) y por ello, la moda

tomará el siguiente valor:

D)) Solución:

Una medida de dispersión absoluta de cualquier variable es

la varianza, que viene dada por la siguiente expresión:

582.352941 = 540+17

22-25*240 = e+

n

N-2N

*a = Me 1-ii

1-i

i

0.04167 = 0.14166-0.18333 = a

f-

a

f = Z

0.18333 = 0-0.18333 = a

f-

a

f = Z ,donde

495.552 = 0.04167+0.18333

0.18333*240+300 = e+

Z+ZZ*a = Mo

[300,540) Mo

1+i

1+i

i

i2

1-i

1-i

i

i1

1-i21

1i

∈

αα 212ii

2n

1=i

2x - = n)X-X(

N1

= S ∑

ESTADÍSTICA I

Tema II 103

*Caso Discreto:

xini xi2ni xi3ni xi4ni

1500 450000 135000000 40500000000

2800 1120000 448000000 179200000000

5000 2500000 1250000000 625000000000

7700 5390000 3773000000 2641100000000

4500 3375000 2531250000 1898437500000

4000 3200000 2560000000 2048000000000

3000 3000000 3000000000 3000000000000

2400 2880000 3456000000 4147200000000

1500 2250000 3375000000 5062500000000

'=32400 '=24165000 '=20528250000 '= 19641937500000

Por tanto,

Una medida de dispersión relativa es el coeficiente de

variación, que viene dado por la siguiente expresión:

63396 = (648)-483300 = S ,donde De

648 = 50

32400 =

483300 = 50

24165000 =

N

nx =

22x

1

i2i

n

1=i2

α

α∑


Tema II 104

* Caso continuo:

Varianza:Dispersión Absoluta.

Cini Ci2ni Ci3ni Ci4ni

9240 3880800 1629936000 684573120000

11220 7405200 4887432000 3225705100000

7200 6480000 5832000000 5248800000000

2280 2599200 2963088000 3377920300000

1380 1904400 2628072000 3626739400000

'=31320 '=22269600 '=17940528000 '=16163737920000

Por tanto,

Dispersión Relativa: Coeficiente de variación.

E)) Solución:

Para poder contestar a esta pregunta calculamos el coeficiente

de asimetría de Fisher que viene dado por la siguiente

expresión:

0.388558 = 64863396

= CV ,donde De

XS = CV x

53015.04 = (626.4)-445392 = )50

31320(-

5022269600

= S2

22x

230.24995 = 53015.04+ = S+ = S donde,

0.3675765 = 626.4

230.24995 =

XS = CV

2xx

x

ESTADÍSTICA I

Tema II 105

Como el momento centrado de orden tres es igual a la siguiente

ecuación:

Y como además, Sx3 es igual a la desviación típica elevada al

cubo, es decir,

Sustituyendo en la expresión del coeficiente de asimetría, nos

quedará lo siguiente:

Sm =

3x

31γ

)(xsuX+Xx2-x( = f)X-x( = m 2

i2i

n

1=iii

3n

1=i3 ∑∑

αααααααααααα 31123

31

3121

31123

i

n

1=i

32ii

n

1=ii

2i

n

1=i

2ii

n

1=ii

2i

n

1=ii

3i

n

1=i

2+3- = -2+-+

fX-Xfx2+fxX-Xfx+Xfx2-fx =

2- =

= ∑∑∑∑∑∑

15225384 = (648)2+648)3(483300)(-410565000 = m

648 = ; 483300 =

410565000 = 50

02052825000 =

N

nx = fx = : como Y

2+3- = m ,tantoPor

33

12

i3i

n

1=ii

3i

n

1=i3

311233

αα

α

αααα

∑∑

15962201 = )(251.78562 = S33

x


Tema II 106

F)) Solución:

Para poder saber si se trata de una distribución mesocúrtica,

debemos calcular el coeficiente de curtosis que viene dado por

la siguiente expresión:

Como el momento centrado de orden cuatro viene dado por:

El coeficiente de Curtosis tomará el siguiente valor:

derechas.a AsimÇtrica 0 > 710.95383988 = 1596220115225384 = 1 _γ

ca.platicœrti n Distribuci 0 < i s

ca.leptocœrti n Distribuci 0 > si

a mesocœrtic n Distribuci 0 = si Y 3-Sm =

2

2

24x

42

_

_

_

γ

γ

γγ

21733378155 = m

(648)3-(483300)(648)6+565000)4(648)(410-003928387500=m

:valor siguienteeltomar ,m centrado, momento Dicho

648 = ; 483300 =

410565000 = 00;3928387500 = 50

00001964193750 = donde,

3-6+4- = m

4

424

4

12

34

412

213144

_

αα

αα

αααααα

ESTADÍSTICA I

Tema II 107

G)) Solución:

pi ìi qi (pi-qi)

10 1500 4.62962963 5.37037037

24 4300 13.27160491 10.72839506

44 9300 28.7037037 15.2962963

66 17000 52.4691358 13.5308642

78 21500 66.35802469 11.64197531

88 25500 78.7037037 9.2962963

94 28500 86.96296296 6.03703704

98 30900 95.37037037 2.62962963

100 32400 100.0000000 0.0000000

escasa.muy es iónconcentracla ,tantoPor

70.14846785 = 502

174.5308642 = p

)q-p( = I

i

1-n

1=i

ii

1-n

1=iG

∑

∑

ca.leptocœrti es n distribucila quedecir puede se ,tantoPor

0 > 51.31290215 = 3-4019052816

21733378155 = 3-

(63396)21733378155

= 22γ


Tema II 108

((5)) � Qué mide la función de distribución de una variable estadística? Solución: Lo mismo que la frecuencia relativa acumulada. Es decir, la proporción de individuos que presentan una modalidad igual o inferior a la considerada.

((6)) � Qué mide la función de densidad ? Solución: La función de densidad mide la proporción de individuos que hay en cada unidad de clase. Es una función que se define en el ámbito de las variables estadísticas continuas.

((7)) � Qué mide la función de cuantía ? Solución: La función de cuantía mide la proporción de individuos que presentan una determinada modalidad de una variable estadística discreta.

((8)) Desde el punto de vista del tratamiento estadístico, � cuántos tipos de caracteres nos podemos encontrar ? Indique cada uno de ellos. Solución: Nos podemos encontrar con cuatro tipo de caracteres: atributos nominales, atributos ordinales, variables estadísticas discretas y variables estadísticas continuas. ((9)) De los tipos de caracteres mencionados en la pregunta 4,

� a cuántos de ellos tiene sentido calcularle la densidad de individuos por unidad de clase? Solución: Tiene sentido calcularlo para las variables estadísticas continuas.

((10)) � Qué es una distribución de frecuencias ? Solución:

ESTADÍSTICA I

Tema II 109

Llamamos distribución de frecuencias al par formado por las modalidades de una carácter y cualquiera de las frecuencias definidas para ese tipo de carácter.

((11)) � En qué consiste el proceso de tabulación de un carácter ? Solución: La tabulación de una carácter consiste en la elaboración de una tabla formada por dos columnas. En una de ellas están las modalidades de del carácter (ordenas, si el carácter lo permite, de menor a mayor) y en la segunda columna el recuento de cuantos individuos presentan cada una de las modalidades.

((12)) � Es lo mismo el diagrama de barras de una atributo que el de una variable discreta ? Solución: No. En el diagrama de barras de un atributo el eje X no tiene unidades de medida, las modalidades se colocan equidistantemente cada una de la siguiente y se levantan barras hasta la altura de la frecuencia relativa (o absoluta). En una variable estadística discreta el eje X tiene unidades y las modalidades del carácter son colocadas de forma coherente con el valor de la variable. En cada modalidad del carácter se levanta una linea hasta la altura de la frecuencia relativa (o absoluta).

((13)) � Qué es una histograma de frecuencias ? Solución: Un histograma de frecuencias es la representación cartesiana de una variable estadística continua en donde en el eje X se colocan las extremos de clase y en Y las densidades de cada clase.

((14)) � Se puede representar una variable estadistica discreta mediante un diagrama de sectores ? Solución: Si, repartiendo los 360 grados de la circunferencia proporcionalmente a las frecuencias absolutas de cada


Tema II 110

modalidad. ((15)) Interprete la expresión: F(x5) = 0.80 Solución: El 80% de los individuos estudiados presentan una modalidad de la variable X igual o inferior a x5. ((16)) Si X mide el número de hijos, interprete la expresión: f(X=4)=0.12 Solución: El 12% de las familias analizadas tienen 4 hijos. ((17)) Si X es el nivel de renta anual de las familias, y

sabemos que F(X=2000000)=0.53, y F(X=3000000)=0.59, � que proporción de familias tienen una renta anual entre los dos y tres millones de pesetas ? Solución: Un 6% de las familias estudiadas tienen un niel de renta entre los dos y los tres millones de pesetas. ((18)) Demuestre que el área que queda entre el histograma de frecuencias y el eje X suman 1 si usamos fi/ai y N si usamos ni/ai Solución: fi/ai �-----------�� ---�� z � � �----� � � �� X ei-2 ei-1 ei ei+1 ei+2 El área z viene dada por: z = base * altura = (ei - ei-1)*(fi/ai) = fi

ESTADÍSTICA I

Tema II 111

Por tanto, cada rectángulo es una frecuencia relativa. La suma de todas las frecuencias relativas es la suma de todas las áreas, pero, como sabemos, la suma de las frecuencias relativas es igual a 1. Para demostralo con ni lo único que hay que cambiar es fi por ni y llegamos a la conclusión de que cada área z es su frecuencia absoluta, y, por tanto, la suma de todas las frecuencias absolutas es la suma de todas las áreas, y la suma de todas las frecuencias absolutas es igual a N. ((19)) Demuestre que

Solución:

ffffnnnn

=NN=F j

j

1=ij21

j21j

j

1=ijj =+...++=

N+...++=

N∑

∑

((20)) Demuestre que Fi - Fi-1 = fi Solución:

Fi - Fi-1 = f1+f2+...+fi-1+fi-(f1+f2+...+fi-1) = fi ((21)) Sea X la variable número de hijos, siendo su función de cuantía

a.- Calcular las frecuencias relativas acumuladas

f=F i

j

1=ij ∑

≠ ,5,6}{0,1,2,3,4 siX0

6= siX0.05

5= siX0.05

4= siX0.10

3= siX0.15

2= siX0.20

1= siX0.25

0= siX0.20

=f(X)


Tema II 112

b.- Si el número de familias estudiadas es 100, �cuántas familias tienen dos o tres hijos ?.

c.- �Qué tipo de carácter estamos estudiando? d.- Dibuje su diagrama de barras. e.- Calcule todas las posibles frecuencias. f.- Calcule su función de distribución. g.- Dibujar la curva de acumulación.

h.- �Cuántos individuos de los estudiados tienen más de tres hijos?

Solución: a.-

X F

0 0.20

1 0.45

2 0.65

3 0.80

4 0.90

5 0.95

6 1.00

b.- N� de familias con dos o tres hijos = 0.20*100+0.15*100=35 familias c.- Variable estadística discreta. d.- fi � 0.25-�---- � � 0.20-�---�--- � � � 0.15-�---�---�--- � � � � 0.10-�---�---�---�---- � � � � � 0.05-�---�---�---�---�-------- � � � � � � � �� N� de hijos 0 1 2 3 4 5 6

ESTADÍSTICA I

Tema II 113

e.-

X ni fi Ni Fi

0 20 0.20 20 0.20

1 25 0.25 45 0.45

2 20 0.20 65 0.65

3 15 0.15 80 0.80

4 10 0.10 90 0.90

5 5 0.05 95 0.95

6 5 0.05 100 1.00

f.-

≥

∈

∈

∈

∈

∈

∈

6X si 1.00

[5,6)X si 0.95

[4,5)X si 0.90

[3,4)X si 0.80

[2,3)X si 0.65

[1,2)X si 0.45

[0,1)X si 0.20

0< siX0

=F(X)


Tema II 114

g.- F(X) 1.00-�-----------------------------�� 0.95-�------------------------�� 0.90-�-------------------�� -� � � � 0.80-�--------------�� -� � � � � -� � � � � 0.65-�---------�� -� � � � � � -� � � � � � -� � � � � � 0.45-�----�� -� � � � � � � -� � � � � � � -� � � � � � � -� � � � � � � 0.20-�� -� � � � � � � -� � � � � � � -� � � � � � � �� N� de hijos 0 1 2 3 4 5 6 h.-

N� de individuos que tienen más de tres hijos = [1 - F(X=3)]*100 =[1 - 0.80]*100 = 20 individuos. ((22)) Sea X la variable con la que denotamos la reta percápita anual, siendo su función de densidad la siguiente

a.- Calcular las frecuencias relativas. b.- Calcular las frecuencias relativas acumuladas. c.- Función de distribución. d.- Si el número de individuos analizados es de 22000,

calcular las frecuencias absolutas, acumuladas y no

∈

∈

∈

∈

∈

10000000]-[4000000xsi0.00000004

4000000)-[1000000xsi0.00000011

1000000)-[600000xsi0.00000057

600000)-[200000xsi0.00000034

200000)-[180000xsi0.00000455

10000000>x ï 180000<xsi0

=f(x)

ESTADÍSTICA I

Tema II 115

acumuladas.

e.- � Qué tipo de carácter estamos estudiando. f.- Dibujar el histograma de frecuencias. g.- Dibujar la curva de acumulación.

h.- � Qué proporción de individuos tiene una renta percápita anual superior a las 600000 pesetas ?

Solución: a.- La función de densidad se define como

∈

e>xsi0

)e-e[xsia/f

e<xsi0

=f(x)

k

i1-iii

0

por tanto,

0.00000455=f1/a1, de donde, f1=0.00000455*a1

0.00000034=f2/a2, de donde, f2=0.00000034*a2

0.00000057=f3/a3, de donde, f3=0.00000057*a3

0.00000011=f4/a4, de donde, f4=0.00000011*a4

0.00000004=f5/a5, de donde, f5=0.00000004*a5

siendo a1=20000, a2=400000, a3=400000, a4=3000000, a5=6000000

En consecuencia

ei-1 ei clase ci ai fi

180000 200000 1 190000 20000 0.090909

200000 600000 2 400000 400000 0.136364

600000 1000000 3 800000 400000 0.227273

1000000 4000000 4 2500000 3000000 0.318182

4000000 10000000 5 7000000 6000000 0.227273


Tema II 116

b.-

ei-1 ei clase fi Fi

180000 200000 1 0.090909 0.090909

200000 600000 2 0.136364 0.227273

600000 1000000 3 0.227273 0.454545

1000000 4000000 4 0.318182 0.772727

4000000 10000000 5 0.227273 1

c.-

d.-

clase fi ni Ni

1 0.090909 2000 2000

2 0.136364 3000 5000

3 0.227273 5000 1000

4 0.318182 7000 17000

5 0.227273 5000 22000

e.- Variable estadística continua. f.-

≥

∈

∈

∈

∈

∈

10000000xsi1

10000000]-[4000000xsi4000000)-(x*0.00000004+0.772727

4000000)-[1000000xsi1000000)-(x*0.00000011+0.454545

1000000)-[600000xsi600000)-(x*0.00000057+0.227273

600000)-[200000xsi200000)-(x*0.00000034+0.090909

200000)-[180000xsi180000)-(x*0.0000045

18000<xsi0

=F(x)

ESTADÍSTICA I

Tema II 117

g.-

h.- Proporción de personas que tienen una renta superior a 600000 pesetas es iagual a 0.227273+0.318182+0.227273 = 0.772728. O bien Proporción de personas con renta inferior a 600000 = 1-F(600000) = =1-[0.227273+0.00000057*(600000-600000)]=1-0.227273=0.772728 ((23)) Sea X una variable estadística discreta de media ì x y desviación típica óx. Sea Y la variable estadística tipificada de X. Demostrar que la media de Y vale cero y su desviación típica 1.


Tema II 118

Solución: Sabemos que Y se obtiene como

expresión que se debe calcular para cada valor posible de X, obteniendo el correspondiente valor de Y. Por tanto podemos crear la siguiente tabla

xi ni ni*xi yi ni yi*ni

x1 n1 n1*x1

σµ-x=y 1

1

n1

n*-x

11

σµ

x2 n2 n2*x2

σµ-x=y 2

2

n2

n*-x

22

σµ

.. .. .. .. ..

xk nk nk*xk

σµ-x=y k

k

nk

n*-x

kk

σµ

La media de X viene dada por

La media de Y viene dada por

σ

µ-x=Y i

N

*nx=

Nn*x+...+n*x+n*x=

ii

k

1=ikk2211x

∑µ

ESTADÍSTICA I

Tema II 119

0=-=Nx

xx

x

i

k

1=ix

x

x

kx2x1xkk2211

kx

xk2

x

x21

x

x1

kk2211y

n*-

=N)n*+...+n*+n*(

-N

n*x+...+n*x+n*x

=

=N

n*-x+...+n*-x+n*-x

=N

n*y+...+n*y+n*y=

σ

µµ

σ

µµ

σ

µµµ

σµ

σµ

σµ

µ

∑

Por tanto la media de Y vale siempre cero. La demostración anterior se puede hacer mucho más rápido si tenemos en cuenta las propiedades de las operaciones con los sumatorios

0=N

*-

N

*=

N

* nnx*

1=n*)-x(*

N*1

=N

n*-x

ny=

i

k

1=ixii

k

1=i

xixi

k

1=ix

ix

xik

1=iii

k

1=iy

∑∑∑

∑∑ µ

σµ

σσ

µ

µ

Demostramos ahora que la desviación típica de Y es igual a 1. Lo haremos a partir de la varianza y teniendo en cuenta que la media de Y ya hemos demostrado que vale cero. Por definición, la varianza de Y viene dada por

1==f*)-x(*1

=f*)-x(fy=f*)-y(=

2x

2x

i2

xi

k

1=i2x

i2

x

xik

1=ii

2i

k

1=ii

2yi

k

1=i

2y =*

σσµ

σσ

µµσ ∑∑∑∑

((24)) Calcular la media aritmética, media geométrica, media armónica, mediana, moda, los cuartiles, el decil octavo, el recorrido, la varianza, la desviación típica, el coeficiente de variación, coeficiente de asimetría, coeficiente de curtosis, indice de Gini y curva de Lorenz para la variable X del ejercicio 21 Solución:

Media aritmética:2.05

Media geométrica:Indeterminada

Media armónica:Indeterminada

Moda:1

Mediana:2

Q1:1

Q2:2

Q3:3

D8:3


Tema II 120

Recorrido:6

Varianza:2.848

Desciación típica:1.687 Coef. de variación:0.823 Coef. de asimetría:0.671 Coef. de curtosis:-0.37 Indice de Gini:0.352

((25)) Calcular la media aritmética, media geométrica, media armónica, mediana, moda, los cuartiles, el decil octavo, el recorrido, la varianza, la desviación típica, el coeficiente de variación, coeficiente de asimetría, coeficiente de curtosis, indice de Gini y curva de Lorenz para la variable X del ejercicio 22 Solución: Media aritmetica:2640000 Media geometrica:1502545 Media armonica:791634.5 Clase modal:[180000-200000) Moda:190291.399 Clase mediana:[1000000-4000000) Mediana:1428575.5 Clase de Q1:[600000-1000000) Q1:639999.5 Clase de Q2:[1000000-4000000) Q2:1428575.5

ESTADÍSTICA I

Tema II 121

Clase de Q3:[1000000-4000000) Q3:3793618.9 Clase de d8:[4000000-10000000) D8:4720006.3 Recorrido:9820000 Varianza:6.33e+12 Desciacion tipica:2515145 Coef. de variacion:0.952706 Coef. de asimetria:0.914514 Coef. de curtosis:-0.71496 Indice de Gini:0.658868 ((26)) Tipificar la variable X del ejercicio 1.17. Calcular la media aritmética, media geométrica, media armónica, mediana, moda, los cuartiles, el decil octavo, el recorrido, la varianza, la desviación típica, el coeficiente de variación, coeficiente de asimetría, coeficiente de curtosis, indice de Gini y curva de Lorenz para la variable tipificada. Comparar los resultados con los obtenidos en el ejercicio 24 Solución: Media aritmetica:0.00 Media geometrica:No calcular Media armonica:No calcular Moda:-0.62 Mediana:-0.02 Q1:-0.62 Q2:-0.02 Q3:0.562 D8:0.562 Recorrido:3.556 Varianza:1 Desciacion tipica:1 Coef. de variacion:Indeterminado Coef. de asimetria:0.671 Coef. de curtosis:-0.37 Indice de Gini:No tiene sentido Coef. de asimetria:0.914514 Coef. de curtosis:-0.71496 Indice de Gini:0.658868

ESTADÍSTICA I

Tema II

119

PROBLEMAS PROPUESTOS

1. Calcular la media aritmética, armónica y geométrica del

número de horas de estudio por día, dada la siguiente

distribución de frecuencias.

Número de horas de

Estudio por día

1

2

3

4

5

Numero de alumnos

5

15

20

8

2

Solución: Media aritmética, 2.74; media armónica, 2.318, media

geométrica, 2.543582

2. Realizado un control de calidad sobre de 200 tubos

fluorescentes de un determinado tipo, para determinar su

duración en horas de funcionamiento en condiciones

prefijadas, se obtuvieron los siguientes resultados.

Duraci

ón

0-720

720-

1440

1440-

2160

2160-

2880

2880-

3600

3600-

4320

4320-

5040

5040-

5760

5760-

6480

6480-

7200

Nºde

tubos

1

4

9

32

56

51

34

8

3

2

Desestimado del total el 10% de los tubos de menor duración y

el 5% de los que presentan duración máxima. Determínese los

valore mínimo y máximo de la duración de los tubos restantes.

Solución: entre 2295 y 5310 horas

3. Una empresa inmobiliaria ofrece apartamentos en régimen de

alquiler en la Costa del Sol cuyos precios mensuales y

número de apartamentos de cada precio son los siguientes

Descripción univariante

Tema II 120

Alquiler mensual Nº de apartamentos

70000-100000 21

100000-110000 27

110000-130000 34

130000-150000 14

150000-180000 8

180000-200000 11

200000-210000 10

Obtener el precio de alquiler mensual más frecuente.

Solución: 103333.3 pesetas por mes.

4. Con los datos del ejercicio anterior, calcular el alquiler

medio por apartamento y el precio que divide a la oferta en

dos partes iguales.

Solución: Media aritmética, 128960; mediana, 118529.41

5. Con los datos del ejercicio 4, calcular la dispersión

absoluta y relativa de la variable precio de los

apartamentos.

Solución: Desviación típica, 36847.23; Coeficiente de

variación, 0.2857

6. Calcular el índice de concentración de la población española

por provincias según los datos de la siguiente tabla y

construir la curva de Lorenz.

Nº de Habitantes Provincias

50000-200000 8

200000-400000 9

400000-500000 10

500000-700000 8

700000-1000000 6

1000000-2000000 8

2000000-5000000 3

ESTADÍSTICA I

Tema II

121

Solución: Índice de Gini, 0.4638

7. Dada la siguiente distribución de sueldos entre los

empleados de una empresa (salarios mensuales en miles de

pesetas), calcular el coeficiente de asimetría de Fisher y

el coeficiente de curtosis.

Sueldos Nº de empleados

80-100 10

100-120 30

120-150 40

150-200 15

200-300 5

Solución: Coeficiente de asimetría, 1.57, asimétrica positiva;

coeficiente de curtosis, 2.84, leptocúrtica.

8. Sean X e Y dos distribuciones simétricas de las que

conocemos

Distribución X Distribución Y

Mediana = 15 Moda = 20

Varianza = 36 Varianza = 36

Determinar cuál de las dos distribuciones presenta una mayor

variabilidad.

Solución: Y es menos dispersa.

¡error! marcador no definido.descripciÓn univariante · este es un término estadístico...

Documents