estadistica unacv juliaca

89
7/18/2019 estadistica unacv juliaca http://slidepdf.com/reader/full/estadistica-unacv-juliaca 1/89 Capítulo 1 Conceptos previos 1.2. ¿Qué es la estadística? La Estadística se ocupa de los métodos y procedimientos para recoger, clasifcar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la fnalidad de ayudar a la toma de decisiones y en su caso ormular predicciones. Podríamos por tanto clasifcar la Estadística en descriptiva, cuando los resultados del anlisis no pretenden ir ms all del con!unto de datos, e inerencial cuando el ob!etivo del estudio es derivar las conclusiones obtenidas a un con!unto de datos ms amplio. 1.3. Elementos. Población. Caracteres Establecemos a continuaci"n algunas defniciones de conceptos bsicos y undamentales bsicas como son# elemento, poblaci"n, muestra, caracteres, variables, etc., a las cuales haremos reerencia continuamente a lo largo del te$to Individuos o elementos# personas u ob!etos %ue contienen cierta inormaci"n %ue se desea estudiar. Población con!unto de individuos o elementos %ue cumplen ciertas propiedades comunes. !uestra subcon!unto representativo de una poblaci"n.

Upload: cristian-mamani

Post on 14-Jan-2016

16 views

Category:

Documents


0 download

DESCRIPTION

zcdz

TRANSCRIPT

Page 1: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 1/89

Capítulo 1

Conceptos previos

1.2. ¿Qué es la estadística?

La Estadística se ocupa de los métodos y procedimientos para recoger,

clasifcar, resumir, hallar regularidades y analizar los datos, siempre y cuando

la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así 

como de realizar inferencias a partir de ellos, con la fnalidad de ayudar a latoma de decisiones y en su caso ormular predicciones.

Podríamos por tanto clasifcar la Estadística en descriptiva, cuando los

resultados del anlisis no pretenden ir ms all del con!unto de datos, e

inerencial cuando el ob!etivo del estudio es derivar las conclusiones obtenidas

a un con!unto de datos ms amplio.

1.3. Elementos. Población. Caracteres

Establecemos a continuaci"n algunas defniciones de conceptos bsicos y

undamentales bsicas como son# elemento, poblaci"n, muestra, caracteres,

variables, etc., a las cuales haremos reerencia continuamente a lo largo del

te$to

Individuos o elementos# personas u ob!etos %ue contienen cierta

inormaci"n %ue se desea estudiar.

Población con!unto de individuos o elementos %ue cumplen ciertas

propiedades comunes.

!uestra subcon!unto representativo de una poblaci"n.

Page 2: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 2/89

Par"metro unci"n defnida sobre los valores numéricos de características

medibles de una poblaci"n.

Estadístico unci"n defnida sobre los valores numéricos de una muestra.

En relaci"n al tama&o de la poblaci"n, ésta puede ser#

#inita, como es el caso del n'mero de personas %ue llegan al

servicio de urgencia de un hospital en un día;

In$nita, si por e!emplo estudiamos el mecanismo aleatorio %ue

describe la secuencia de caras y cruces obtenida en el lanzamiento

1.%. &r'ani(ación de los datos1.%.1. )ariables estadísticas

(uando hablemos de variable haremos reerencia a un símbolo

) *,+,,-,... %ue puede tomar cual%uier modalidad )valor de un con!unto

determinado, %ue llamaremos dominio de la variable o ran'o. En unci"n

del tipo de dominio, las variables las clasifcamos del siguiente modo#

)ariables cualitativas* cuando las modalidades posibles son de tipo

nominal. Por e!emplo, el grupo sanguíneo tiene por modalidades# /rupos

0anguíneos posibles# A, B, AB, O

)ariables cuasicuantitativas u ordinales son las %ue, aun%ue sus

modalidades son de tipo nominal, es posible establecer un orden entre ellas.

Por e!emplo, si estudiamos el grado de recuperaci"n de un paciente al aplicarle

un tratamiento, podemos tener como modalidades# /rado de recuperaci"n#

Nada, Poco, Moderado, Bueno, Muy Bueno.

veces se representan este tipo de variables en escalas numéricas, por

e!emplo, puntuar el dolor en una escala de 1 a 2. 3ebemos evitar sin embargo

Page 3: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 3/89

realizar operaciones algebricas con estas cantidades. 45n dolor de intensidad

4 no duele el doble%ue otro de intensidad 2.

)ariables cuantitativas o numéricas son las %ue tienen por

modalidades cantidades numéricas con las %ue podemos hacer

operaciones aritméticas. 3entro de este tipo de variables podemos

distinguir dos grupos#

+iscretas* cuando no admiten siempre una modalidad intermedia entre

dos cuales%uiera de sus modalidades. 5n e!emplo es el n'mero de hi!os en

una poblaci"n de amilias#

6'mero de hi!os posibles# 0, 1, 2, 3, 4, 5, ...

Continuas* cuando admiten una modalidad intermedia entre dos

cuales%uiera de sus modalidades, v.g. el peso  de un ni&o al nacer.

7curre a veces %ue una variable cuantitativa continua por naturaleza,

aparece como discreta. Este es el caso en %ue hay limitaciones en lo %ue

concierne a la precisi"n del aparato de medida de esa variable, v.g. si

medimos la altura en metros de personas con una regla %ue orece dos

decimales de precisi"n, podemos obtenerlturas medidas en cm# 1.50,1.51, 1.52, 1.53,...

En realidad lo %ue ocurre es %ue con cada una de esas mediciones

e$presamos %ue el verdadero valor de la misma se encuentra en un

intervalo de radio 8,882. Por tanto cada una de las observaciones de   

representa ms bien un intervalo %ue un valor concreto.

 9al como hemos citado anteriormente, las modalidades son las dierentes

situaciones posibles %ue puede presentar la variable. veces éstas son

muy numerosas )v.g. cuando una variable es continua y conviene reducir

su n'mero, agrupndolas en una cantidad inerior de clases. Estas clases

Page 4: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 4/89

deben ser construidas, tal como hemos citado anteriormente, de modo

%ue sean e!"austi#as y e!c$uyentes, es decir, cada modalidad debe

pertenecer a una y s"lo una de las clases.

)ariable cualitativa %uella cuyas modalidades son de tipo nominal.

)ariable cuasicuantitativa :odalidades de tipo nominal, en las %ue

e$iste un orden.

)ariable cuantitativa discreta 0us modalidades son valores enteros.

)ariable cuantitativa continua 0us modalidades son valores reales.

.%.2. ,ablas estadísticas

#recuencia absoluta de la clase ci es el n'mero ni, de observaciones %ue

presentan una modalidad perteneciente a esa clase.

#recuencia relativa de la clase ci es el cociente f i, entre las recuencias

absolutas de dicha clase y el n'mero total de observaciones, es decir

7bsérvese %ue f i es el tanto por uno de observaciones %ue estn en la

clase ci. :ultiplicado por 188 representa el porcenta!e de la

poblaci"n %ue comprende esa clase.

#recuencia absoluta acumulada Ni, se calcula sobre variables

cuantitativas o cuasicuantitativas, y es el n'mero de elementos de la

poblaci"n cuya modalidad es inerior o e%uivalente a la modalidad ci#

i

Ni < n1 = n> = ... = ni <*

n %

 %<1

Page 5: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 5/89

#recuencia relativa acumulada , & i, se calcula sobre variables

cuantitativas o cuasicuantitativas, siendo el tanto por uno de los

elementos de la poblaci"n %ue estn en alguna de las clases y %ue

presentan una modalidad inerior o igual a la ci, es decir,

Llamaremos distribución de -recuencias al con!unto de clases !unto a

las recuencias correspondientes a cada una de ellas. 5na tabla

estadística sirve para presentar de orma ordenada las distribuciones de

recuencias. 0u orma general es la siguiente#

Eemplo de c"lculo con -recuencias

(alcular los datos %ue altan en la siguiente tabla#

$i?1 @ $i ni f i N

i

8 @ 18 A

8

f 1 A

818 @

>8

n> 8,

B

N

>

>8 @

C8

C

8

f C 1

D

8C8 @

188

nB 8,

1

N

B

188 @

>88

n2 f 2 >

8

8n

Page 6: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 6/89

/olución

0abemos %ue la 'ltima recuencia acumulada es igual al total de

observaciones, luego n < >88.

(omo NC < 1D8 y nC < C8, entonces

N> < NC ? nC < 1D8 ? C8 < 1B8.

dems al ser n1 < A8, tenemos %ue

n> < N> ? n1 < 1B8 ? A8 < 8.

Por otro lado podemos calcular nB teniendo en cuenta %ue conocemos la

recuencia relativa correspondiente#

<F nB < f B G n < 8,1 H >88 < >8

sí#

NB < nB = NC < >8 = 1D8 < 1I8.

Este 'ltimo clculo nos permite obtener

n2 < N2 ? NB < >88 ? 1I8 < 18.

l haber calculado todas las recuencias absolutas, es inmediato obtener las

relativas#

Escribimos entonces la tabla completa#

1

Page 7: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 7/89

sistemtica y resumida . Para darnos cuenta de un s'$o #ista(o de lascaracterísticas de la poblaci"n resulta a'n ms esclarecedor el uso degrfcos y diagramas, cuya construcci"n abordamos en esta secci"n.

1.0.1.r"$cos para variables cualitativas

Los grfcos ms usuales para representar variables de tipo nominal son lossiguientes#

+ia'ramas de barras 0iguiendo la fgura 1.1, representamos en el e!e deordenadas las modalidades y en abscisas las recuencias absolutas o bien, lasrecuencias relativas. 0i, mediante el grfco, se intenta comparar variaspoblaciones entre sí, e$isten otras modalidades, como las mostradas en lafgura 1.>. (uando los tama&os de las dos poblaciones son dierentes, esconveniente utilizar las recuencias relativas, ya %ue en otro caso podrían

resultar enga&osas.

Page 8: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 8/89

>

B

A

recuencias

3ivorciadosJiudos(asados0olteros

recuencias

autocar >

autocar 1relativas

Kigura 1.1# 3iagrama de barras para una variable cualitativa.

Solteros Casados Viudos Divorciados

Kigura 1.># 3iagramas de barras para comparar una variable cualitativa en

dierentes poblaciones. 0e ha de tener en cuenta %ue la altura de cada barra

es proporciona$ al n'mero de observaciones )recuencias relativas.

Page 9: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 9/89

CD2 individuosCD,2

>28 individuos>2

1>,2

>28 individuos>2

rupo

rupo

rupo +

rupo C

1>2 individuos

+ia'ramas de sectores )también llamados tartas. 0e divide un círculo en

tantas porciones como clases e$istan, de modo %ue a cada clase le

corresponde un arco de círculo proporcional a su recuencia absoluta o

relativa )fgura 1.C.

Kigura 1.C# 3iagrama de sectores.

El arco de cada porci"n se calcula usando la re)$a de tres#

(omo en la situaci"n anterior, puede interesar comparar dos poblaciones. Eneste caso también es aconse!able el uso de las recuencias relativas

)porcenta!es de ambas sobre grfcos como los anteriores. 7tra posibilidades comparar las > poblaciones usando para cada una de ellas un diagramasemicircular, al igual %ue en la fgura 1.B. 0ean n1 n> los tama&osrespectivos de las > poblaciones. La poblaci"n ms pe%ue&a se representacon un semicírculo de radio r 1 y la mayor con otro de radio r >.La relaci"n e$istente entre los radios, es la %ue se obtiene de suponer %ue larelaci"n entre las areas de las circunerencias es igual a la de los tama&os delas poblaciones respectivas, es decir#

Page 10: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 10/89

4o -umadores

D28individuos.

D2#umadores

>28 ind.

>2

4o -umadores

Poblac.

1888 individuos

Poblac.

>28 individuos

#umadores

1>2ind.

28

1>2ind.

28

Kigura 1.B# 3iagrama de sectores para comparar dos poblaciones

El escalamiento de los dibu!os debe ser tal %ue el *rea de cada uno de ellossea proporcional a la recuencia de la modalidad %ue representa. Este tipo de

grfcos suele usarse en los medios de comunicaci"n, para %ue sean

comprendidos por el p'blico no especializado, sin %ue sea necesaria una

e$plicaci"n comple!a.

Eemplo de re'resentación 'r"$ca

(lasifcadas 1> amilias por su n'mero de hi!os se obtuvo#

6'mero de hi!os ) ! i 1 > C B Krecuencias )ni 1 C 2 C

Page 11: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 11/89

recuencias

absolutas

1

C

1

B

D

recuencias

absolutas

acumuladas

0 1 2 3 0 1 2 3

Kigura 1.A# 3iagrama dierencial )barras e integral para una variablediscreta. 7bsérvese %ue el diagrama integral )creciente contabiliza eln'mero de observaciones de la variable ineriores o iguales a cada punto dele!e de abcisas.

(omparar los diagramas de barras para recuencias absolutas y relativas.Mealizar el diagrama acumulativo creciente.

/olución En primer lugar, escribimos la tabla de recuencias en el modo

habitual#

Jariable K. bsolutas K. Melativas K. cumuladas

Page 12: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 12/89

absolutasrecuencias

recuenciasabsolutasacumuladas

1 > C B

1 > C B

1

C

21>

1 > C B

1>1N

CN1>

21>N

1

B

I

recuenciasrelativas

(on las columnas relativas a ! i y ni realizamos el diagrama de barras para

recuencias absolutas, lo %ue se muestra en la fgura 1.D. (omo puede versees identico )salvo un cambio de escala en el e!e de ordenadas al diagramade barras para recuencias relativas y %ue ha sido calculado usando lascolumnas de ! i y f i. El diagrama escalonado )acumulado se ha construido conla inormaci"n procedente de las columnas ! i y Ni.

Kigura 1.D# 3iagramas de recuencias para una variable discreta

r"$cos para variables continuas

(uando las variables son continuas, utilizamos como diagramas dierencialeslos "isto)ramas y los po$+)onos de frecuencias.

5n "isto)rama se construye a partir de la tabla estadística, representandosobre cada intervalo, un rectngulo %ue tiene a este segmento como base. El

criterio para calcular la altura de cada rectngulo es el de mantener la

Page 13: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 13/89

Peso de 25 individuos

fr ecuencia absoluta

B8 28 A8 D8 8

proporcionalidad entre las recuencias absolutas )o relativas de cada

intervalo y el rea de los mismos. Jéase la fgura 1..

El  po$+)ono de frecuencias se construye cilmente si tenemosrepresentado previamente el histograma, ya %ue consiste en unir mediantelineas rectas los puntos del histograma %ue corresponden a las marcas declase. Para representar el polígono de recuencias en el primer

Peso

Kigura 1.# Oistograma para una variable continua. lo, suponemos%ue adyacentes a ellos e$isten otros intervalos de la misma amplitud yrecuencia nula, y se unen por una línea recta los puntos del histograma %uecorresponden a sus marcas de clase. 7bsérvese %ue de este modo, elpolígono de recuencias tiene en com'n con el histograma el %ue las reasde la grfcas sobre un intervalo son idénticas. Jeanse ambas grfcasdierenciales representadas en la parte superior de la fgura 1.I.

Page 14: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 14/89

1

>

C

B

8 > B A 18

8 > B A 18

>

B

A

18

1>

3iagramas dierenciales

3iagrama acumulado

ni

6i

En la %ue se representa a modo de ilustraci"n los diagramas

correspondientes a la variable cuantitativa continua e$presada en la tablasiguiente#

ntervalos ci ni Ni

8 @ > 1 > >> @ B C 1 CB @ A 2 B DA @ D C 1

8

Kigura 1.I# 3iagramas dierenciales e integrales para una variable continua.Eemplo

La siguiente distribuci"n se refere a la duraci"n en horas ) completas deun lote de 288 tubos#

3uraci"n en 6'mero de

Page 15: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 15/89

horas tubos

C88 @ 288 28288 @ D88 128

D88 @ 1.188 >D2ms de

1.188

>2

 9otal 288Mepresentar el histograma de recuencias relativas y el polígono de

recuencias.

 9razar la curva de recuencias relativas acumuladas.

3eterminar el n'mero mínimo de tubos %ue tienen una duraci"ninerior a I88 horas.

 9ipo de

variable

3iagrama

J. (ualitativa -arras, sectores, pictogramas

J. 3iscreta 3ierencial ) barras

J. (ontinua

ntegral )en escalera

3ierencial )histograma, polígono derecuencias

ntegral )diagramas acumulados

Page 16: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 16/89

Capítulo 2

!edidas descriptivas2.1. Introducción

En el capítulo anterior hemos visto c"mo se pueden resumir los datosobtenidos del estudio de una muestra )o una poblaci"n en una tablaestadística o un grfco. 6o obstante, tras la elaboraci"n de la tabla y surepresentaci"n grfca, en la mayoría de las ocasiones resulta ms efcazQcondensarR dicha inormaci"n en algunos n'meros %ue la e$presen de ormaclara y concisa.

Los en"menos biol"gicos no suelen ser constantes, por lo %ue sernecesario %ue !unto a una medida %ue indi%ue el valor alrededor del cual seagrupan los datos, se asocie una medida %ue haga reerencia a la variabilidad%ue reSe!e dicha Suctuaci"n.

Por tanto el siguiente paso y ob!eto de este capítulo consistir en defniralgunos tipos de medidas )estadísticos o parmetros %ue los sintetizan a'nms.

Es decir, dado un grupo de datos organizados en una distribuci"n derecuencias )o bien una serie de observaciones sin ordenar, pretendemosdescribirlos mediante dos o tres cantidades sintéticas.

En este sentido pueden e$aminarse varias características, siendo las mscomunes#

La tendencia centra$ de los datos;

a dispersi'n o #ariaci'n con respecto a este centro;

Los datos %ue ocupan ciertas posiciones.

La simetr+a de los datos.

Page 17: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 17/89

1NB 1NB1N>

Centro +ispersion

Posicion simetria*

*

*

La forma en la %ue los datos se agrupan.

Kigura >.1# :edidas representativas de un con!unto de datos estadísticos

lo largo de este capítulo, y siguiendo este orden, iremos estudiandolos estadísticos %ue nos van a orientar sobre cada uno de estos niveles deinormaci"n# valores alrededor de los cuales se agrupa la muestra, lamayor o menor Suctuaci"n alrededor de esos valores, nos interesaremosen ciertos valores %ue marcan posiciones características de unadistribuci"n de recuencias así como su simetría y su orma.

2.2. Estadísticos de tendencia central

Las tres medidas ms usuales de tendencia central son#

la media, la

mediana, la

moda.

En ciertas ocasiones estos tres estadísticos suelen coincidir, aun%uegeneralmente no es así. (ada uno de ellos presenta venta!as e

Page 18: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 18/89

$ <$1 = ... =$n

n

inconvenientes%ue precisaremos ms adelante. En primer lugar vamos a

defnir los conceptos anteriores.

2.2.1. 6a media

La media aritmética de una variable estadística es la suma de todos susposibles valores, ponderada por las recuencias de los mismos. Es decir, sila tabla de valores de una variable  es

la media es el valor %ue podemos escribir de las siguientes ormase%uivalentes#

0i los datos no estn ordenados en una tabla, entonces

 )>.1

Page 19: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 19/89

l'unos inconvenientes de la media

La media presenta inconvenientes en algunas situaciones#5no de ellos es %ue es muy sensible a los valores e$tremos de la

variable# ya %ue todas las observaciones intervienen en el clculo dela media, la aparici"n de una observaci"n e$trema, har %ue la mediase desplace en esa direcci"n. En consecuencia,

no es recomendable usar la media como medida central en lasdistribuciones muy asimétricas;

0i consideramos una variable discreta, por e!emplo, e$ nmero de

"i%os en $as fami$ias espa-o$as el valor de la media puede nopertenecer al con!unto de valores de la variable; Por e!emplo ! < 1,>hi!os.

&tras medias !edias 'enerali(adas

En unci"n del tipo de problema varias generalizaciones de la mediapueden ser consideradas. Oe a%uí algunas de ellas aplicadas a unasobservaciones ! 1, ..., ! n#

6a media 'eométrica ! ), es la media de los logaritmos de los valores dela variable#

!edia armónica ! a, se defne como el recíproco de la media aritmética delos recíprocos, es decir,

Por tanto,

Page 20: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 20/89

057

75

1557

n82

i914

n

i4

5

l l!edi i91

,rian'. /emeantes

C

:

C:

6a media cuadr"tica ! c, es la raíz cuadrada de la media aritmética de loscuadrados#

2.2.2. 6a mediana

(onsideramos una variable discreta  cuyas observaciones en una tabla

estadística han sido ordenadas de menor a mayor. Llamaremos mediana,Med al primer valor de la variable %ue de!a por deba!o de sí al 28 de lasobservaciones.

Kigura >.># (lculo geométrico de la mediana

En el caso de variables continuas, las clases vienen dadas por intervalos,

y a%uíla "rmula de la mediana se complica un poco ms )pero nodemasiado# 0ea )$i?1,$iT el intervalo donde hemos encontrado %ue pordeba!o estn el 28 de las observaciones. Entonces se obtiene la mediana

Page 21: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 21/89

:ed < li?1 =

n

>? 6i?1

niG ai

a partir de las recuencias absolutas acumuladas, mediante interpolaci"n

lineal ) teorema de 9hales como sigue )fgura >.>#

<F )>.>

Esto e%uivale a decir %ue $a mediana di#ide a$ "isto)rama en dos partes de

*reas i)ua$es a .

Propiedades de la mediana

Entre las propiedades de la mediana, vamos a destacar las siguientes#

(omo medida descriptiva, tiene la venta!a de no estar aectada por

las observaciones e$tremas, ya %ue no depende de los valores %uetoma la variable, sino del orden de las mismas. Por ello es adecuadosu uso en distribuciones asimétricas.

Es de clculo rpido y de interpretaci"n sencilla.

dierencia de la media, la mediana de una variable discretaes siempre un valor de la variable %ue estudiamos )e!. La mediana deuna variable nmero de "i%os toma siempre valores enteros.

;n eemplo de c"lculo de mediana

Page 22: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 22/89

0ea  una variable discreta %ue ha presentado sobre una muestra las

modalidades

  >,2,D,I,1> <F ! < D, Med < D0i cambiamos la 'ltima observaci"n por otra anormalmente grande, estono aecta a la mediana, pero si a la media#

  >,2,D,I,1>2 <F ! < >I,A; Med < D

En este caso la media no es un posible valor de la variable )discreta, y seha visto muy aectada por la observaci"n e$trema. Este no ha sido el casopara la mediana.

;n eemplo de c"lculo de media < mediana

7btener la media aritmética y la mediana en la distribuci"n ad!unta.3eterminar grfcamente cul de los dos promedios es ms signifcativo.

/olución

Page 23: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 23/89

0

35

=5

>5

5 155352515

!edia

!ediana

La media aritmética es#

La primera recuencia absoluta acumulada %ue supera el valor n/ > < 188es Ni < 1B8. Por ello el intervalo mediano es U18;>8. sí#

Para ver la representatividad de ambos promedios, realizamos elhistograma de la fgura >.C, y observamos %ue dada la orma de ladistribuci"n, la mediana es ms representativa %ue la media.

Kigura >.C# Para esta distribuci"n de recuencias es ms representativo usarcomo estadístico de tendencia central la mediana %ue la media.

2.2.3. 6a moda

Llamaremos moda a cual%uier m$imo relativo de la distribuci"n derecuencias, es decir, cual%uier valor de la variable %ue posea una

recuencia mayor %ue su anterior y su posterior.

Page 24: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 24/89

&bservación

3e la moda destacamos las siguientes propiedades#

Es muy cil de calcular.

Puede no ser 'nica.(uadro >.1#Mesumen de

las medidas deposici"ncentrales.

:edia

:ediana

:oda

:edidas de tendencia central3atos sin agrupar

)ordenados ! 1, ! >, ..., ! N

3atos agrupados

nterv. ! i ni Ni

$8@$1  ! 1 n1 N1 $1

@$>  ! > n> N>

... ... ... ... $ ?1@

$  !  n N 

Primera observaci"n

%ue de!a deba!o de sí 

estrictamente a lasUN/ >T observaciones

menores# ! UN/ >T=1

ed< i?1 =

G ini

Moda < ! i de mayor

recuencia

Page 25: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 25/89

2.2.%. elación entre media* mediana < moda

En el caso de distribuciones unimodales, la mediana est con recuenciacomprendida entre la media y la moda )incluso ms cerca de la media.

En distribuciones %ue presentan cierta inclinaci"n, es ms aconse!ableel uso de la mediana. 0in embargo en estudios relacionados con prop"sitosestadísticos y de inerencia suele ser ms apta la media.

2.3. Estadísticos de posición

Los estadísticos de posici"n van a ser valores de la variablecaracterizados por superar a cierto porcenta!e de observaciones en la

poblaci"n )o muestra. 9enemos undamentalmente a los  percenti$es comomedidas de posici"n, y asociados a ellos veremos también los cuarti$es,deci$es y cuarti$es.

Percentiles

Para una variable discreta, se defne el percentil de orden  , como laobservaci"n, P , %ue de!a por deba!o de si el de la poblaci"n. Jéase lafgura >.B. Esta defnici"n nos recuerda a la mediana, pues comoconsecuencia de la defnici"n es evidente %ue

Med < P28

Page 26: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 26/89

Peso de 155 individuos

frecuencia r elativa

B8 28 A8 D8 8 I8

8.88

8.81

8.8>

8.8C 

8.8B

P>2 P28 PD2

Peso

Kigura >.B# Percentiles >2, 28 y D2 de una variable. Los %ue se muestrandividen a la muestra en cuatro intervalos con similar n'mero de individuosy reciben también el nombre de cuartiles.

  el caso de una variable continua, el intervalo donde se encuentra P V)$i?1,$iT, se calcula buscando el %ue de!a deba!o de si al de lasobservaciones. 3entro de él, P se obtiene seg'n la relaci"n#

Page 27: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 27/89

PW < li?1 =n W

188? 6i?1

niG ai

 )>.C

Cuartiles

Los cuartiles, $, son un caso particular de los percentiles. Oay C, y sedefnen como#

1

< P>2 )>.B

>

< P28 < Med )>.2

C

< PD2 )>.A

+eciles

0e defnen los deciles como los valores de la variable %ue dividen alas observaciones en 18 grupos de igual tama&o. :s precisamente,

defnimos 1,>, ..., I como#

i < P18i i < 1, ..., I

Eemplo de c"lculo de cuartiles con una variable discreta

3ada la siguiente distribuci"n en el n'mero de hi!os de cien amilias,calcular sus cuartiles.

Page 28: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 28/89

/olución

1. Primer cuartil#

< >2; Primera Ni n/ B < CI; luego X1 < >.

>. 0egundo cuartil#

< 28; Primera Ni >n/ B < A2; luego X> < C.

C. 9ercer cuartil#

< D2; Primera Ni Cn/ B < 2; luego XC < B.

Eemplo

Page 29: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 29/89

(alcular los cuartiles en la siguiente distribuci"n de una variable continua#

/olución

1. Primer cuartil

D2; Primera Ni n/ B < >>; La línea i es la del intervalo U1 ; >

>. 0egundo cuartil#

2; Primera Ni >n/ B < CB; La línea i es la del intervalo U> ; C

C. 9ercer cuartil

>2; Primera Ni Cn/ B < BB; La línea i es la del intervalo UC ; B

Page 30: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 30/89

Eemplo de c"lculo de cuartiles con una variable continua Oansido ordenados los pesos de >1 personas en la siguiente tabla#

ntervalos .a.

Encontrar a%uellos valores %ue dividen a los datos en B partes con el mismon'mero de observaciones.

/olución Las cantidades %ue buscamos son los tres cuartiles# X1, X> y XC.Para calcularlos, le a&adimos a la tabla las columnas con las recuenciasacumuladas, para localizar %ué intervalos son los %ue contienen a loscuartiles buscados#

 se encuentran en el intervaloB2 @ 2> > 2 2>@2I, ya %ue NC < 1> es la primera

.a.a. %ue supera a >1 G 1 / B y >1 G > / B.2I @ AA C 12 XC est en AA@DC, pues N2 < >1 es

el primer Ni mayor %ue >1 G C / B.

sí se tiene %ue#

Page 31: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 31/89

7bsérvese %ue X> < Med. Esto es l"gico, ya %ue la mediana divide a ladistribuci"n en dos partes con el mismo n'mero de observaciones, y X>,hace lo mismo, pues es de!a a dos cuartos de los datos por arriba y otrosdos cuartos por aba!o.

Eemplo

La distribuci"n de una variable tiene por polígono acumulativo derecuencias el de la fgura >.2. 0i el n'mero total de observaciones es 28#

Elaborar una tabla estadística con los siguientes elementos# intervalos,marcas de clase, recuencia absoluta, recuencia absoluta acumulada,recuencias relativa y recuencias relativa acumulada.

1. (untas observaciones tuvieron un valor inerior a 18, cuntasinerior a y cuntas ueron superior a 11.

>. 3etermine los cuartiles.

Page 32: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 32/89

2 D 1> 12

8,>

8,D

8,

1

8

D 1>a 2D 18a $

Y 2 2C $

F $ < C H22

<C

C. /olución

1. En la siguiente tabla se proporciona la inormaci"n pedida y algunosclculos au$iliares %ue nos permitirn responder a otras cuestiones.

nterval

os

ni Ni f i & i  ! i ai ni

8

8 Z 2 1

8

1

8

8,

>

8,

C

>,

2

2 >

2 Z D >

2

C

2

8,

2

8,

D

A > 1>

, 2D Z 1> 2 B

8

8,

1

8,

I,

2

2 1

1> Z 12 1

8

2

8

8,

>

1 1C,

2

D C ,

CC>. (alculemos el n'mero de observaciones pedido#

Kigura >.2# 3iagrama acumulado de recuencias relativas.

Page 33: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 33/89

D 1>a 2D a $

Y2 21 $

F $ <1 H2

2<1

D 1>a 2D 11a $

Y2 2B $

F $ <B H2

2<B

18 = >2=C < C observaciones tomaron un valor inerior a 18

18 = >2=1 < CA observaciones tomaron un valor inerior a

28 [)18 = >2=B < 28[CI<11 observaciones tomaron un valor superior a 11

C. (uartiles#

Page 34: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 34/89

2.%. !edidas de variabilidad o dispersión

Los estadísticos de tendencia centra$ o posici'n nos indicandonde se situ un grupo de puntuaciones. Los de #ariabi$idad odispersi'n nos indican si esas puntuaciones o valores estnpr"$imas entre sí o si por el contrario estn o muy dispersas.

2.%.1. an'o

5na medida razonable de la variabilidad podría ser laamplitud o ran'o, %ue se obtiene restando el valor ms ba!ode un con!unto de observaciones del valor ms alto.

Propiedades del ran'o

Es cil de calcular y sus unidades son las mismas %uelas de la variable.

6o utiliza todas las observaciones )s"lo dos de ellas;

0e puede ver muy aectada por alguna observaci"ne$trema;

El rango aumenta con el n'mero de observaciones, obien se %ueda igual. En cual%uier caso nunca disminuye.

2.%.2. )arian(a

La varian(a, 0>, se defne como la media de las dierenciascuadrticas de n puntuaciones con respecto a su media

aritmética, es decir

Page 35: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 35/89

0> <1

n

n*

i<1

)$i ?$>

 )>.D

Esta medida es siempre una cantidad positiva, conpropiedades interesante para la realizaci"n de inerenciaestadística. (omo sus unidades son las del cuadrado de lavariable, es ms sencillo usar su raíz cuadrada, %ue es la %uevemos en la siguiente secci"n.

2.%.3. +esviación típica o est"ndar

La varianza no tiene la misma magnitud %ue lasobservaciones )e!. si las observaciones se miden en metros, la

varianza lo hace en metros cuadrados. 0i %ueremos %ue lamedida de dispersi"n sea de la misma dimensionalidad %ue lasobservaciones bastar con tomar su raíz cuadrada. Por ello sedefne la desviación típica, 0, como

\

0 < 0>

2.%.%. Eemplo de c"lculo de medidas dedispersión

(alcular el rango, varianza y desviaci"n típica de lassiguientes cantidades medidas en metros#

C,C,B,B,2

/olución El rango de esas observaciones es la dierenciaentre la mayor y menor de ellas, es decir, 2?C < >. Paracalcular las restantes medidas de dispersi"n es necesariocalcular previamente el valor con respecto al cual vamos a

medir las dierencias. Este] es la media#

 ! < )C = C = B = B = 2 / 2 < C, metros

Page 36: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 36/89

La varianza es#

2A metros>

siendo la desviaci"n típica su raíz cuadrada#

0 < 0> <p8,2A < 8,DB metros

Propiedades de la varian(a < desviacion típica

mbas son sensibles a la variaci"n de cada una de laspuntuaciones, es decir, si una puntuaci"n cambia, cambiacon ella la varianza. La raz"n es %ue si miramos sudefnici"n, la varianza es unci"n de cada una de $as

 puntuaciones.

a des#iaci'n t+pica tiene $a propiedad de ue en e$

inter#a$o

) ! ? >0,! = >0 de ^ ! _ >0

se encuentra, a$ menos, e$ 657 de $as obser#aciones8nc$uso si tenemos muc"os datos y estos pro#ienen deuna distribuci"n normal 9 se de:nir* este concepto m*sade$ante;, podremos $$e)ar a$ <5 7.

No es recomendab$e e$ uso de e$$as, cuando tampoco $o

sea e$ de $a media como medida de tendencia centra$.

2.%.0. Coe$ciente de variación

Oemos visto %ue las medidas de centralizaci"n y dispersi"n nosdan inormaci"n sobre una muestra. 6os podemos preguntar sitiene sentido usar estas magnitudes para comparar dospoblaciones. Por e!emplo, si nos piden comparar la dispersi"nde los pesos de las poblaciones de eleantes de dos circos

dierentes, 0 nos dar inormaci"n 'til.

Page 37: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 37/89

(J<0 *

$

`Pero %ué ocurre si lo %ue comparamos es la altura de unoseleantes con respecto a su peso 9anto la media como ladesviaci"n típica,  ! y 0, se e$presan en las mismas unidades

%ue la variable. Por e!emplo, en la variable altura podemos usarcomo unidad de longitud el metro y en la variable peso, elWilogramo. (omparar una desviaci"n )con respecto a la mediamedida en metros con otra en Wilogramos no tiene ning'nsentido.

El problema no deriva s"lo de %ue una de las medidas seade longitud y la otra sea de masa. El mismo problema seplantea si medimos cierta cantidad, por e!emplo la masa, dedos poblaciones, pero con distintas unidades. Este es el caso en%ue comparamos el peso en tone$adas de una poblaci"n de 188eleantes con el correspondiente en mi$i)ramos de unapoblaci"n de 28 hormigas.

El problema no se resuelve tomando las mismas escalaspara ambas poblaciones. Por e!emplo, se nos puede ocurrirmedir a las hormigas con las mismas unidades %ue loseleantes )toneladas. 0i la ingeriería genética no nos sorprendecon alguna barbaridad, lo l"gico es %ue la dispersi"n de lavariable peso de $as "ormi)as sea practicamente nula )4un%uehaya algunas %ue sean 1.888 veces mayores %ue otras

En los dos primeros casos mencionados anteriormente, elproblema viene de la dimensiona$idad de las variables, y en el

tercero de la dierencia enorme entre las medias de ambaspoblaciones. El coe:ciente de #ariaci'n es lo %ue nos permiteevitar estos problemas, pues elimina la dimensionalidad de lasvariables y tiene en cuenta la proporci"n e$istente entremedias y desviaci"n típica. 0e defne del siguiente modo#

 )>.

Propiedades del coefciente de variaci"n

Page 38: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 38/89

 0"lo se debe calcular para variables con todos los valorespositivos. 9odo índice de variabilidad es esencialmente nonegativo. Las observaciones pueden ser positivas o nulas, pero

su variabilidad debe ser siempre positiva. 3e ahí %ue s"lodebemos traba!ar con variables positivas, para la %ue tenemoscon seguridad %ue $ 8.

 6o es invariante ante cambios de origen. Es decir, si a losresultados de una medida le sumamos una cantidad positiva, b 8, para tener + < * = b, entonces (J+ (J*.

 Es invariante a cambios de escala. sí por e!emplo elcoefciente de variaci"n de una variable medida en metros esuna cantidad adimensional %ue no cambia si la medici"n serealiza en centímetros.

 9ipifcaci"n 0e conoce por tipifcaci"n al proceso de restar lamedia y dividir por su desviaci"n típica a una variable *. 3eeste modo se obtiene una nueva variable

  )>.I

de media z < 8 y desviaci"n típica 0 < 1, %ue denominamosvariable tipifcada.

Esta nueva variable carece de unidades y permite hacercomparables dos medidas %ue en un principio no lo son. sí pore!emplo nos podemos preguntar si un eleante es ms grueso%ue una hormiga determinada, cada uno en relaci"n a supoblaci"n. 9ambién es aplicable al caso en %ue se %uierancomparar individuos seme!antes de poblaciones dierentes. Pore!emplo si deseamos comparar el nivel académico de dosestudiantes de dierentes 5niversidades para la concesi"n deuna beca de estudios, en principio sería in!usto concederladirectamente al %ue posea una nota media ms elevada, ya

%ue la difcultad para conseguir una buena califcaci"n puedeser mucho mayor en un centro %ue en el otro, lo %ue limita las

Page 39: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 39/89

posibilidades de uno de los estudiante y avorece al otro. Eneste caso, lo ms correcto es comparar las califcaciones deambos estudiantes, pero tipifcadas cada una de ellas por las

medias y desviaciones típicas respectivas de las notas de losalumnos de cada 5niversidad.

6o conundir coefciente de variaci"n y tipifcaci"n

Los coefentes de variaci"n sirven para comparar lasvariabilidades de dos con!untos de valores )muestras opoblaciones, mientras %ue si deseamos comparar a dosindividuos de cada uno de esos con!untos, es necesario usar losvalores tipifcados. 6inguno de ellos posee unidades y es unerror recuente entre estudiantes de bioestadísticaconundirlos.

2.0. simetría < apuntamiento

0abemos c"mo calcular valores alrededor de los cuales sedistribuyen las observaciones de una variable sobre unamuestra y sabemos c"mo calcular la dispersi"n %ue orecen losmismos con respecto al valor de central. 6os proponemos darun paso ms all en el anlisis de la variable. En primer lugar,nos vamos a plantear el saber si los datos se distribuyen de

orma simétrica con respecto a un valor central, o si bien lagrfca %ue representa la distribuci"n de recuencias es de unaforma diferente de$ $ado derec"o ue de$ $ado i(uierdo.

0i la simetría ha sido determinada, podemos preguntarnos sila curva es ms o menos apuntada )larga y estrecha. Esteapuntamiento habr %ue medirlo comparado a ciertadistribuci"n de recuencias %ue consideramos norma$ )no porcasualidad es éste el nombre %ue recibe la distribuci"n dereerencia.

Estas ideas son las %ue vamos a desarrollar en lo %ue resta del

capítulo.

Page 40: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 40/89

2.0.1. Estadísticos de asimetría

Para saber si una distribuci"n de recuencias es simétrica, hay%ue precisar con respecto a %ué. 5n buen candidato es lamediana, ya %ue para variables continuas, divide al histogramade recuencias en dos partes de igual rea. Podemos basarnosen ella para, de orma natural, decir %ue una distribución de-recuencias es simétrica si el lado derecho de la grfca ) apartir de la mediana es la imagen por un espe!o del ladoiz%uierdo)fgura

>.A.

(uando la variable es discreta, decimos %ue es simétrica, silo es con respecto a la media.

3entro de los tipos de asimetría posible, vamos a destacarlos dos undamentales#

simetría positiva 0i las recuencias ms altas seencuentran en el lado iz%uierdo de la media, mientras %ueen derecho hay recuencias ms pe%ue&as )co$a.

simetría ne'ativa (uando la cola est en el lado iz%uierdo.

(uando realizamos un estudio descriptivo es altamente

improbable %ue la distribuci"n de recuencias sea totalmentesimétrica. En la prctica diremos %ue la distribuci"n derecuencias es simétrica si lo es de un modo

Page 41: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 41/89

!ediana

Colasim. Positiva

Cola

sim. 4e'ativa

!ediana

!ediana!ediana

705 057 705 057

057057

705 057

Kigura >.A# 3istribuciones de recuencias simétricas yasimétricas

apro$imado. Por otro lado, a'n observando cuidadosamente lagrfca, podemos no ver claro de %ué lado estn las recuenciasms altas. 0e defnen entonces toda una amilia de estadísticos%ue ayuden a interpretar la asimetría, denominados índices

de asimetría. El principal de ellos es el momento centra$ detercer orden %ue defnimos a continuaci"n.

!omento central de tercer orden

0ea  una variable cuantitativa y p V 8N. Llamamos momentode orden p a#

 )>.18

Page 42: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 42/89

0e denomina momento central de orden p a la cantidad

 )>.11Los momentos de orden  p impar, son siempre nulos en el

caso de variables simétricas, ya %ue para cada i %ue esté a unlado de la media, con ) ! i ? !  = 8, le corresponde unaobservaci"n % del otro lado de la media tal %ue ) !  % ? !  < ?) ! i? ! . Elevando cada una de esas cantidades a  p impar, ysumando se tiene %ue

m p < 8 si la distribuci"n es simétrica.

0i la distribuci"n uese asimétrica positiva, las cantidades) ! i? !  p, con p C impar positivas estarían muy aumentadas alelevarse a  p. Esta propiedad nos indica %ue un índice deasimetría posible consiste en tomar  p < C y elegir comoestadístico de asimetría al momento central de tercer orden.

poyandonos en esteíndice, diremos %ue hay asimetríapositiva si aC 8, y %ue la asimetría es negativa si aC = 8.

o bien,

  )>.12 3iremos%ue hay asimetría positiva si s 8 y negativa si s = 8

Page 43: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 43/89

Coe-. sim. @ 5

X1 X> XC

$

Coe-. sim.A5

X1 X> XC

$

Kigura >.# 3ierencias entre las medidas de tendencia central,

o bien entre las distancias entre cuartiles consecutivos indicanasimetría.

Eemplo

Las edades de un grupo de personas se reSe!an en la tablasiguiente#

ntervalos ni

D @ I BI @ 11 1

11 @

1>

1

B1> @

1C

>

D1C @

1B

B

>

1B @12 C112 @ >

Page 44: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 44/89

2

18

12

>8

>2

C8

C2

B8

edadD I 18 11 1> 1C 1B 12 1A 1D 1 1I

media<1C,12

moda<1C,2D

1D 81D @

1I

1

2.0.2. Estadísticos de apuntamiento

0e defne el coe$ciente de aplastamiento de #isBercurtosisD como#

donde mB es el momento empírico de cuarto orden. Es éste uncoefciente adimensional, invariante ante cmbios de escala y

de origen. 0irve para medir si una distribuci"n de recuenciases muy apuntada o no. Para decir si la distribuci"n es larga yestrecha, hay %ue tener un patr"n de reerencia. El patr"n dereerencia es la distribuci'n norma$ o )aussiana2 para la %ue setiene

>

Page 45: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 45/89

Kigura >.I# La distribuci"n de recuencias de la edad presentauna ligera asimetría negativa.

3e este modo, atendiendo a > >, se clasifcan las distribucionesde recuencias en

6eptocrtica(uando

> >

8, o sea, si la distribuci"n derecuencias es ms apuntada %ue la normal;

!esocrtica (uando > > < 8, es decir, cuando la distribuci"nde recuencias es tan apuntada como la normal;

Platicrtica (uando > > = 8, o sea, si la distribuci"n derecuencias es menos apuntada %ue la normal;

curtosis<0curtosis=0 curtosis>0

Kigura >.18# puntamiento de distribuciones de recuencias

1.

Page 46: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 46/89

BA

Capítulo 3

)ariables bidimensionales

3.1. introducción

En lo estudiado anteriormente hemos podido aprender c"mo a partir de lagran cantidad de datos %ue describen una muestra mediante una variable,

  , se representan grfcamente los mismos de modo %ue resulta msintuitivo hacerse una idea de como se distribuyen las observaciones.

7tros conceptos %ue seg'n hemos visto, también nos ayudan en elanlisis, son los estadísticos de tendencia central, %ue nos indican haciadonde tienden a agruparse los datos )en el caso en %ue lo hagan, y losestadísticos de dispersi"n, %ue nos indican si las dierentes modalidades %uepresenta la variable estn muy agrupadas alrededor de cierto valor central,o si por el contrario las variaciones %ue presentan las modalidades conrespecto al valor central son grandes.

 9ambién sabemos determinar ya si los datos se distribuyen de orma

simétrica a un lado y a otro de un valor central.En este capítulo pretendemos estudiar una situaci"n muy usual y por

tanto de gran interés en la prctica#

0i ? es otra variable defnida sobre la misma poblaci"n %ue   ,`ser posible determinar si e$iste alguna relaci"n entre lasmodalidades de  y de ?

DC5n e!emplo trivial consiste en considerar una poblaci"n ormada por

alumnos de primero de :edicina y defnir sobre ella las variables   altura medida en centímetros,

?  altura medida en metros,

ya %ue la relaci"n es determinista y clara# ? < / 188. 7bsérvese %ue aun%uela variable ? , como tal puede tener cierta dispersi"n, vista como funci'n de  , su dispersi"n es nula.

5n e!emplo ms parecido a lo %ue nos interesa realmente lo tenemos

cuando sobre la misma poblaci"n defnimos las variables

Page 47: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 47/89

BD  altura medida en centímetros, ? pesomedida en Wilogramos.

ntuitivamente esperamos %ue e$ista cierta relaci"n entre ambas variables,por e!emplo,

? <  ? 118_ dispersión

%ue nos e$presa %ue )en media a mayor altura se espera mayor peso. Larelaci"n no es e$acta y por ello ser necesario introducir alg'n termino %uee$prese la dispersi"n de ? con respecto a la variable  .

Es undamental de cara a realizar un traba!o de investigaci"ne$perimental, conocer muy bien las técnicas de estudio de variablesbidimensionales )y nZdimensionales en general. -aste para ello pensar %ue

normalmente las relaciones entre las variables no son tan evidentes comose mencion" arriba. Por e!emplo#

`0e puede decir %ue en un grupo de personas e$iste alguna relaci"nentre  < tensi"n arterial e ? < edad

un%ue en un principio la notaci"n pueda resultar a veces algodesagradable, el lector podr comprobar, al fnal del capítulo, %ue esbastante3.2. @ABA OB N@CAA

accesible. Por ello le pedimos %ue no se asuste. l fnal ver %ue no son paratanto.

3.2. ,ablas de doble entrada

(onsideramos una poblaci"n de n individuos, donde cada uno de ellos

presenta dos caracteres %ue representamos mediante las variables   e ? .Mepresentamos mediante

 ! 1,! >,...,! i,...,!  

las modalidades %ue presenta la variable  , y mediante

? y 1,y >,...,y  %,...,y  p

las p modalidades de ? .

(on la intenci"n de reunir en una s"la estructura toda la inormaci"n

disponible, creamos una tabla ormada por G  p casillas, organizadas deorma %ue se tengan flas y  p columnas. La casilla denotada de orma

Page 48: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 48/89

 + y1 y> ... y ! ... yp

*$1 n11 n1> ... n1! ... n1p n1

$> n>1 n>> ... n>! ... n>p n>

... ... ... ...... ... ... ...$i ni1 ni> ... ni! ... nip ni

... ... ... ... ...... ... ...$W nW1 nW> ... nW! ... nWp nW

n1 n> ... n ! ... np n

Bgeneral mediante el subíndicei% har reerencia a los elementos de lamuestra %ue presentan simultneamente las modalidades ! i e y  %.

3e este modo, parai

< 1,..., 

, %

< 1,...,p

, se tiene %uen

i% es el n'mero deindividuos o -recuencia absoluta, %ue presentan a la vez las modalidades ! i e y  %.

El n'mero de individuos %ue presentan la modalidad  ! i, es lo %uellamamos -recuencia absoluta mar'inal de ! i y se representa como ni. Esevidente la igualdad

 p

ni < ni1 = ni> = GGG = nip < *ni%

 %<1

7bsérvese %ue hemos escrito un símbolo QR en la Dparte de $as %otasE %uesimboliza %ue estamos considerando los elemento %ue presentan lamodalidad  ! i, independientemente de las modalidades %ue presente lavariable ? . 3e orma anloga se defne la recuencia absoluta marginal de lamodalidad y  % como

 

n % < n1 % = n> % = GGG = n% <*ni%

i<1

Estas dos distribuciones de recuenciasni

parai

< 1,..., 

, yn %

para %

<1,...,p reciben el nombre de distribuciones mar'inales de   e ? respectivamente.

El n'mero total de elementos de la poblaci"n )o de la muestra, n loobtenemos de cual%uiera de las siguientes ormas, %ue son e%uivalentes#

p p

n < n < *ni < *n % < **ni% i<1 %<1 i<1 %<1

3.3. Covarian(a

Page 49: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 49/89

* *

 +  +

??) $ , y

??) $ , y

? =

?==

? =

? Cuando F crece* G decreceCuando F crece* G crece

BILa covarian(a 0 ? , es una medida %ue nos hablar de la variabilidad

con!unta de dos variables numéricas )cuantitativas. 0e defne como#

;na interpretación 'eométrica de la covarian(a

(onsideremos la nube de puntos ormadas por las n pare!as de datos ) ! i,y i.El centro de gravedad de esta nube de puntos es ) !,y , o bien podemosescribir simplemente ) !,y  si los datos no estn ordenados en una tabla dedoble entrada. 9rasladamos los e!es  ? al nuevo centro de coordenadas) !,y . Xueda así dividida la nube de puntos en cuatro cuadrantes como se

observa en la fgura C.1. Los puntos %ue se encuentran en el primer y tercercuadrante contribuyen positivamente al valor de 0 ? , y los %ue seencuentran en el segundo y el cuarto lo hacen negativamente.

3e este modo#

0i hay mayoría de puntos en el tercer y primer cuadrante, ocurrir%ue 0 ? 8, lo %ue se puede interpretar como %ue la variable ? tiende aaumentar cuando lo hace  ;

3.4. FOGAC8ANHA

.

Casi todos los puntos pertenecen

a los cuadrantes primero y

tercero

Casi todos los puntos

 pertenecen a los cuadrantes

segundo y cuarto.

Kigura C.1# nterpretaci"n geométrica de 0 ? 

Page 50: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 50/89

6as dos variables sonHa< dependencia entre

La (ovarianza

0i 0 *+ a8 las dos variablescreceno decrecen la vez )nubedepuntoscreciente.

0i 0 *+ a8 cuandouna variablecrece,la otra tiene tendenciadecrecer)nubede puntosdecreciente.

intensidadalrededor0i los puntosse repartencon igual de )$,y,0 *+ <8 )nohayrelaci]onlineal.

280i la mayoría de puntos estn repartidos entre el segundo y cuarto

cuadrante entonces 0 ? 8, es decir, las observaciones ? tienentendencia a disminuir cuando las de  aumentan;

0i los puntos se reparten con igual intensidad alrededor de ) !,y  ,entonces se tendr %ue 0 ? < 8. Jéase la fgura C.> como ilustraci"n.

.

Sxy

=0S xy =0

aunqueindependientes.

la covarianza sea nula..

Kigura C.># (uando los puntos se reparte de modo ms o menos homogéneoentre los cuadrantes primero y tercero, y segundo y cuarto, se tiene %ue 0 ? 

8. Eso no %uiere decir de ning'n modo %ue no pueda e$istir ningunarelaci"n entre las dos variables, ya %ue ésta puede e$istir como se apreciaen la fgura de la derecha.

3.5. FO&8F8N@ FOCCAF8ONI 8NA PACON

3.%. Coe$ciente de correlación lineal de Pearson

Page 51: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 51/89

r <0*+

0* 0 +

21La covarianza es una medida de la variabilidad com'n de dos variables

)crecimiento de ambas al tiempo o crecimiento de una y decremimiento dela otra, pero est aectada por las unidades en las %ue cada variable se

mide. sí pues, es necesario defnir una medida de la relaci"n entre dosvariables, y %ue no esté aectada por los cambios de unidad de medida. 5naorma de conseguir este ob!etivo es dividir la covarianza por el producto delas desviaciones típicas de cada variable, ya %ue asíse obtiene uncoefciente adimensional, r , %ue se denomina coe$ciente de correlaciónlineal de Pearson

 )C.1

Propiedades del coe$ciente de correlación lineal

(arece de unidades de medida ) adimensional .

Es invariante para transormaciones lineales )cambio de origen yescala de las variables. 0"lo toma valores comprendidos entre

?1 y 1 ,

(uando jr j esté pr"$imo a uno, se tiene %ue e$iste una re$aci'n $inea$muy uerte entre las variables.

(uando r 8, puede afrmarse %ue no e$iste relaci"n lineal entreambas variables. 0e dice en este caso %ue las variables sonincorreladas.

3.0. e'resión

Las técnicas de regresi"n permiten hacer predicciones sobre los valores decierta variable ? 9dependiente;, a partir de los de otra   9independiente;,

entre las %ue intuimos %ue e$iste una relaci"n. Para ilustrarlo retomemos

Page 52: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 52/89

r91

r1

r95*JK

r5*JK r5*03

r5

2>

Kigura C.C# r < _1 es lo mismo %ue decir %ue las observaciones de ambasvariables estn perectamente alineadas. El signo de r , es el mismo %ue elde 0 ? , por tanto nos indica el crecimiento o decrecimiento de la recta. Larelaci"n lineal es tanto ms perecta cuanto r est cercano a _1.los e!emplos mencionados al principio del capítulo. 0i sobre un grupo depersonas observamos los valores %ue toman las variables

   altura medida en centímetros, )C.>

?  altura medida en metros, )C.C

no es necesario hacer grandes esuerzos para intuir %ue la relaci"n %ue hayentre ambas es#

.

7btener esta relaci"n es menos evidente cuando lo %ue medimos sobreel mismo grupo de personas es

  altura medida en centímetros, ? peso en Wilogramos.

La raz"n es %ue no es cierto %ue conocida la altura ! i de un individuo,podamos determinar de modo e$acto su peso y i )v.g. dos personas %uemiden 1,D8m pueden tener pesos de A8 y A2 Wilos. 0in embargo,alguna relaci"n entre ellas debe e$istir, pues parece mucho msprobable %ue un individuo de >m pese ms %ue otro %ue mida 1,>8m.Es ms, nos puede parecer ms o menos apro$imada una relaci"nentre ambas variables como la siguiente

? <  ? 118 _ error.

la deducci"n, a partir de una serie de datos, de este tipo de relacionesentre variables, es lo %ue denominamos re'resión.

Page 53: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 53/89

,

,pro$imacion

7bservacion +

*

y<)$) $ , y

) $ , yi i

i i

2C:ediante las técnicas de regresi"n inventamos una variable ? k como

unci"n de otra variable  )o viceversa,

? k < f )  .

Esto es lo %ue denominamos relación -uncional. El criterio paraconstruir ? k, tal como citamos anteriormente, es %ue la dierenciaentre ? e ? k sea pe%ue&a.

? k < f )  , ? ? ? k < error,

El término %ue hemos denominado error debe ser tan pe%ue&o comosea posible )fgura C.B. El ob!etivo ser buscar la unci"n )tambiéndenominada modelo de re'resión ? k < f )   %ue lo minimice. Jéase

la fgura C.2.

Kigura C.B# :ediante las técnicas de regresi"n de una variable ? sobreuna variable   , buscamos una unci"n %ue sea una buenaapro$imaci"n de una nube de puntos ) ! i,y i, mediante una curva del

tipo ? k

< f )  . Para ello hemos de asegurarnos de %ue la dierenciaentre los valores y i e y ki sea tan pe%ue&a como sea posible.

3.0.1. ondad de un auste

(onsideremos un con!unto de observaciones sobre n individuos de unapoblaci"n, en los %ue se miden ciertas variables  e ? #

  ! 1,! >,...,! 

n

? y 1,y >,...,y 

n

Page 54: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 54/89

-uen a!uste

(uando $ crece,

:odelo lineal

:odelo lineal

-uen a!uste

(uando $ crece,

(uando $ crece,y crecey crece

y decrece

(uando $ crece,

y decrece

:odelo lineal:al a!uste

:odelo no lineal

-uen a!uste

(uando $ crece,y crece

:odelo no lineal

-uen a!uste

Jariables no relacionadas6inguna curva de regresion

es adecuada

2BEstamos interesamos en hacer regresi"n para determinar, de modoapro$imado, los valores de ? conocidos los de  , debemos defnir ciertavariable

? k < f )  , %ue debe tomar los valores

? ky k1 < f ) ! 1,y k> < f ) ! >,...,y kn < f ) ! n

de modo %ue#

Kigura C.2# 3ierentes nubes de puntos y modelos de regresi"n paraellas.

3.0.2. e'resión lineal

La re'resión lineal consiste en encontrar apro$imar los valores deuna variable a partir de los de otra, usando una relaci"n uncional detipo lineal, es decir, buscamos cantidades a y b tales %ue se puedaescribir

? k < a = b G   )C.2

con el menor error posible entre ? ke ? .

Page 55: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 55/89

a <y ?b$

b <0*+

0>*

22Las cantidades a y b %ue minimizan dicho error son los llamados

coe:cientes de re)resi'n#

La cantidad b se denomina coe:ciente de re)resi'n de ? sobre  .

En el modelo lineal de regresi"n la bondad de$ a%uste essimplemente r >. (on lo cual el modelo lineal dar me!ores prediccionescuando r sea pr"$imo a 1 " [1.Interpretación de los coe$cientes de re'resión

7bsérvese %ue la relaci"n C.2 e$plica cosas como %ue si   varía en 1unidad, ? k varía la cantidad b. Por tanto#

0i b 8, las dos variables aumentan o disminuyen ala vez; 0i b = 8, cuando una variable aumenta, la

otra disminuye.

Eemplo de c"lculo con un modelo de re'resión lineal

En una muestra de 1.288 individuos se recogen datos sobre dosmedidas antropométricas   e ? . Los resultados se muestranresumidos en los siguientes estadísticos#

7btener el modelo de regresi"n lineal %ue me!or apro$ima ? enunci"n de  . 5tilizando este modelo, calcular de modo apro$imado lacantidad ? esperada cuando  < 12.

/olución

Lo %ue se busca es la recta, ? k < a = b G   , %ue me!or apro$ima losvalores de ? )seg'n el criterio de los mínimos cuadrados en la nubede puntos %ue resulta de representar en un plano ) ,? las 1.288observaciones. Los coefcientes de esta recta son#

 sí, el modelo lineal consiste en#

Page 56: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 56/89

2A? k < ?2D,2 = 11,>2 G  

Por tanto, si ! < 12, el modelo lineal predice un valor de ? de#

 y k < ?2D,2 = 11,>2 G ! < ?2D,2 = 11,>2 H 12 < 111,>2

Eemplo

3e una muestra de ocho observaciones con!untas de valores de dosvariables  e ? , se obtiene la siguiente inormaci"n#

* * * ! i < >B;  ! i y i < AB;  y i < B8 ;

0? > < 1>; 0  > < A.

(alcule#

1. La recta de regresi"n de ? sobre   . E$pli%ue el signifcado de losparmetros.

>. El coefciente de determinaci"n. (omente el resultado e indi%ue el tanto porciento de la variaci"n de ? %ue no est e$plicada por el modelo lineal deregresi"n.

C. 0i el modelo es adecuado, `cul es la predicci"n y k para ! < B.

/olución

1. En primer lugar calculamos las medias y las covarianza entreambas variables#

 )C.18(on estas cantidades podemos determinar los parmetros a y bde la recta. La pendiente de la misma es b, y mide la variaci"n de? cuando  aumenta en una unidad#

l ser esta cantidad negativa, tenemos %ue la pendiente de la

recta es negativa, es decir, a medida %ue   aumenta, la

Page 57: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 57/89

2Dtendencia es a la disminuci"n de ? . En cuanto al valor de laordenada en el origen, a, tenemos#

sí, la recta de regresi"n de ? como unci"n de  es#

? k < ,2 ? 1,1AAD G  

>. El grado de bondad del a!uste lo obtenemos a partir del coefcientede determinaci"n#

82

Es decir, el modelo de regresi"n lineal e$plica el A de lavariabilidad de ? en unci"n de la de  . Por tanto %ueda un C>de variabilidad no e$plicada.

C. La predicci"n %ue realiza el modelo lineal de regresi"n para  ! < Bes# y k < ,2 ? 1,1AAD G ! < ,2 ? 1,AAAD H B < C,CC

la cual hay %ue considerar con ciertas reservas, pues como

hemos visto en el apartado anterior,hay una razonable cantidadde variabilidad %ue no es e$plicada por el modelo.

Eemplo de c"lculo en re'resión lineal

En un grupo de pacientes se miden las cantidades antropométricas peso y edad, obteniéndose los siguientes resultados#

Mesultado de las mediciones   edad 1> 18 11 D D 18 1B

?  peso 2 B> 21 2B B8 CI BI 2A

`E$iste una relaci"n lineal importante entre ambas variables (alcularla recta de regresi"n de la edad en unci"n del peso y la del peso enunci"n de la edad. (alcular la bondad del a!uste `En %ué medida, portérmino medio, varía el peso cada a&o `En cunto aumenta la edadpor cada Wilo de peso /olución

Para saber si e$iste una relaci"n lineal entre ambas variables se calcula elcoefciente de correlaci"n lineal, %ue vale#

ya %ue

Page 58: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 58/89

2

D2 a&os

A>2 g

C2IB a&os>

<F 0  < >,C128 a&os

BBB g>

<F 0? < A,IAC1 g

>8C1 g G a&o

Page 59: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 59/89

)W < PU* <WT <e?W

W, W <8,1,> ,...

Capítulo %

C"lculo de probabilidades < variablesaleatorias

%.1. introducción

0i el 'nico prop"sito del investigador es describir los resultados de une$perimento concreto, los métodos analizados en los capítulos anteriorespueden considerarse sufcientes. 6o obstante, si lo %ue se pretende esutilizar la inormaci"n obtenida para e$traer conclusiones generales sobretodos a%uellos ob!etos del tipo de los %ue han sido estudiados, entoncesestos métodos constituyen s"lo el principio del anlisis, y debe recurrirse amétodos de inerencia estadística, los cuales implican el uso inteligente dela teoría de la probabilidad.

.

%.2.=. +istribución de Poisson o de los sucesos raros

5na v.a.  posee una le< de distribución de probabilidades del tipoPoisson cuando

 )A.1>

Este tipo de leyes se aplican a sucesos con probabilidad muy ba!a deocurrir, obteniéndose como la distribuci"n límite de una sucesi"n devariable binomiales, )n,p, donde n G p < J, y n )por tanto p 8=.

En general utilizaremos la distribuci"n de Poisson como apro$imaci"n dee$perimentos binomiales donde el n'mero de pruebas es muy alto, pero laprobabilidad de é$ito muy ba!a. veces se suele utilizar como criterio deapro$imaci"n#

n C8, p 8,1 F )n,p^

< Poi)n G p

0u valor esperado y varianza coinciden#

EU  T < )arU  T < J )A.1C

Page 60: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 60/89

)$ <

1

b?a si a $ b

Eemplo de distribución de Poisson

(ierta enermedad tiene una probabilidad muy ba!a de ocurrir,  p <

1 / 188,888. (alcular la probabilidad de %ue en una ciudad con 288,888habitantes haya ms de C personas con dicha enermedad. (alcular eln'mero esperado de habitantes %ue la padecen./olución 0i consideramos la v.a.  %ue contabiliza el n'mero de personas%ue padecen la enermedad, es claro %ue sigue un modelo binomial, pero%ue puede ser muy bien apro$imado por un modelo de Poisson, de modo%ue

  Poi) J < 2

sí el n'mero esperado de personas %ue padecen la enermedad es EU  T <2. (omo )arU  T < 2, e$iste una gran dispersi"n, y no sería e$tra&oencontrar %ue en realidad hay muchas ms personas o menos %ue estnenermas. La probabilidad de %ue haya ms de tres personas enermas es#

%.3. +istribuciones continuas

En esta secci"n estudiaremos las distribuciones ms importantes de v.a.continuas unidimensionales. El soporte de una v.a. continua se defnecomo a%uella regi"n de 8C donde su densidad es no nula, f ) !  A< 8. Para las

distribuciones %ue enunciaremos, podr ser bien todo 8C, 8C= < )8,= obien un segmento de la orma Ua,bT 8C.

%.3.1. +istribución uni-orme o rectan'ular

0e dice %ue una v.a.  posee una distribución uni-orme en el intervalo

Ua,bT ,si su unci"n de densidad es la siguiente#

 )A.1B

Page 61: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 61/89

?8.2 8.8 8.2 1.8 1.2 >.8 >.2 C.8

8.8 

8.>

8.B

8.A

8.E 

1.8 

5ni )a<8 b<>

 )$

K)$

%.3.2. +istribución eLponencial La distribuci"n e$ponencial es ele%uivalente continuo de la distribuci"n geométrica discreta. Esta ley dedistribuci"n describe procesos en los %ue#

6os interesa saber el tiempo hasta %ue ocurre determinado evento,sabiendo %ue,

  el tiempo %ue pueda ocurrir desde cual%uier instante dado t ,hasta %ue ello ocurra en un instante t f , no depende del tiempotranscurrido anteriormente en el %ue no ha pasado nada.

Page 62: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 62/89

8 1 > C B

8.8 

8.> 

8.B 

8.A

8.E

1.8 

 )$<e?$

  para<1

Kigura A.B# Kunci"n de densidad, f , de una ELp) J.

Eemplo de variable eLponencial

En un e$perimento de laboratorio se utilizan 18 gramos de .0abiendo %ue la duraci"n media de un tomo de esta materia es de 1B8días,

Page 63: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 63/89

8 1 > C B

8.8

8.>

8.B 

8.A

8.E 

1.8 

 )$<e?$

K)$<1?1

e

?$

)$ < 1q

\> e?1

> ) $?q >

, $ V M

%.3.3. +istribución normal o 'aussiana

La distribuci'n )aussiana, recibe también el nombre de distribuci'nnorma$, ya %ue una gran mayoría de las v.a continuasC de la naturalezasiguen esta distribuci"n. 0e dice %ue una v.a.   sigue una distribución

normal de parmetros K y L >, lo %ue representamos del modo 4si su unci"n de densidad es#

 )A.1D

&bservación

Estos dos parmetros  K y L > coinciden adems con la media) esperanza y la varianza respectivamente de la distribuci"n como sedemostrar ms adelante#

C

Page 64: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 64/89

?C ?> ?1 8 1 > C

8.8

8.1 

8.>

8.C 

8.B6)<8 q<1

qq

EU  T <  K )A.

1

)arU  

T< L > )A.

1I

La orma de la unci"n de densidad es la llamada campana de auss.

Para el lector es un e!ercicio interesante comprobar %ue ésta alcanza un'nico m$imo 9moda; en K, %ue es simétrica con respecto al mismo, y por

Kigura A.A# (ampana de /auss o unci"n de densidad de una v.a. dedistribuci"n normal. EL parmetro K indica el centro y L la dispersi"n. Ladistancia del centro a los puntos de inSe$i"n es precisamente L .

tanto PU   KT < PU   KT < 1 / >, con lo cual en K coinciden la media, lamediana y la moda, y por 'ltimo,calcular sus puntos de inSe$i"n.

El soporte de la distribuci"n es todo 8C, de modo %ue la mayor partede la masa de probabi$idad )rea comprendida entre la curva y el e!e de

abcisas se encuentra concentrado alrededor de la media, y las ramasde la curva se e$tienden asint"ticamente a los e!es, de modo %ue

Page 65: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 65/89

?C ?> ?1 8 1 > C

8.8 

8.1 

8.>

8.C

8.B

P)$ V_>q<8.I2

P)$ V_q<8.A

6)<8 q<1

cual%uier valor Qmuy ale!adoRde la media es posible )aun%ue pocoprobable.

La orma de la campana de /auss depende de los parmetros K y L #

 K indica la posici"n de la campana 9par*metro decentra$i(aci'n;;L > )o e%uivalentemente, L  ser el parmetro de dispersi"n.

(uanto menor sea, mayor cantidad de masa de probabilidad habrconcentrada alrededor de la media )grao de f muy apuntado cerca de Ky cuanto mayor sea Qms aplastadoRser.

Kigura A.D# una distancia %ue no supera en una desviaci"n de la mediatenemos una probabilidad del A. dos desviaciones tenemos el I2 .

%.3.0. +istribución t de /tudent

Page 66: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 66/89

 9 <

% 1n

>n

; tn

8

8.8>

8.8B

8.8A

8.8

8.1

8 >8 B8 A8 8 188

-in)188;8,26)np,np%

La distribuci"n tZ0tudent se construye como un cociente entre una normal y

la raíz de una  > independientes. 3e modo preciso, llamamos distribuciónt M/tudent con n 'rados de libertad, tn a la de una v.a. @ ,

 )A.>C

donde H4 . Este tipo de distribuciones aparece cuando tenemosn = 1 v.a. independientes

 4Kigura A.11# La misma comparaci"n %ue en la fgura anterior, pero realizadacon parmetros con los %ue damos la apro$imaci"n normal de la binomial esme!or.

  i4 i < 1,...,n

y nos interesa la distribuci"n de

La distribuci"n t de 0tudent tiene propiedades parecidas a 4)8,1#

Es de media cero, y simétrica con respecto a la misma;

Page 67: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 67/89

8 > B A

8.8 

8.1 

8.>

8.C

8.B

8.2 

>>

B>

A>

Es algo ms dispersa %ue la normal, pero la varianza decrece hasta 1cuando el n'mero de grados de libertad aumenta;

Kigura A.1># Kunci"n de densidad de para valores pe%ue&os de n.

Para un n'mero alto de grados de libertad se puede apro$imar ladistribuci"n de 0tudent por la normal, es decir,

n

tn ? 4)8,1

%.3.=. 6a distribución # de /nedecor

7tra de la distribuciones importantes asociadas a la normal es la %ue sedefne como cociente de distribuciones  > independientes. 0ean  >n e ?  >m

v.a. independientes. 3ecimos entonces %ue la variable

Page 68: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 68/89

K <1n *1

m +

<m

n

*

 +; #n,m

?B ?> 8 > B

8.8 

8.1 

8.>

8.C 

8.B tC8t<6)8 1

tC

t1

)A.>B

sigue una distribución de probabilidad de /nedecor* con )n,m 'radosde libertad. 7bsérvese %ue #n,m A< #m,n.

Kigura A.1C# (uando aumentan los grados de libertad, la distribuci"n de0tudent se apro$ima a la distribuci"n normal tipifcada.

La orma ms habitual en %ue nos encontraremos esta distribuci"n seren el caso en %ue tengamos n = m v.a. independientes

  i4 i < 1,...,n

?  %4 i < 1,...,m

y así 

Page 69: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 69/89

8.8 8.2 1.8 1.2 >.8 >.2 C.8

8.8 

8.> 

8.B 

8.A

8.E

K18 18

K18 >8

K18 2

#n,m

Es claro %ue la distribuci"n de 0nedecor no es simétrica, pues s"lo tienendensidad de probabilidad distinta de cero, los punto de 8C=. 7tra propiedadinteresante de la distribuci"n de 0nedecor es#.4. PCOBMA

Kigura A.1B# Kunci"nes de densidad para la distribuci"n & de 0nedecor.

Page 70: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 70/89

Capítulo 0

Introducción a la in-erencia

0.1. Introducción

El prop"sito de un estudio estadístico suele ser, como hemos venidocitando, e$traer conclusiones acerca de la naturaleza de una poblaci"n. lser la poblaci"n grande y no poder ser estudiada en su integridad en lamayoría de los casos, las conclusiones obtenidas deben basarse en ele$amen de solamente una parte de ésta, lo %ue nos lleva, en primer lugara la !ustifcaci"n, necesidad y defnici"n de las dierentes técnicas de

muestreo.Los primeros términos obligados a los %ue debemos hacer reerencia,

defnidos en el primer capítulo, sern los de estadístico y estimador.

3entro de este conte$to, ser necesario asumir un estadístico oestimador como una variable aleatoria con una determinada distribuci"n, y%ue ser la pieza clave en las dos amplias categorías de la inerenciaestadística# la estimaci"n y el contraste de hip"tesis.

El concepto de estimador, como herramienta undamental, locaracterizamos mediante una serie de propiedades %ue nos servirn paraelegir el Qme!orRpara un determinado parmetro de una poblaci"n,

asícomo algunos métodos para la obtenci"n de ellos, tanto en laestimaci"n puntual como por intervalos.

Page 71: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 71/89

En el capítulo anterior dedu!imos ciertas leyes de probabilidad medianteun método deductivo a partir del conocimiento del mecanismo generador

3e este modo pudimos deducir las leyes de probabilidad binomial ohipergeométrica por e!emplo. sí una vez precisamente determinada la leyprobabilística %ue subyace en el e$perimento aleatorio, podemos obtenermuestras de la v.a. siguiendo esa ley de probabilidad. En este momentonos interesamos por el proceso contrario, es decir#

`("mo deducir la ley de probabilidad sobre determinado carcter de unapoblaci"n cuando s"lo conocemos una muestra

Este es un problema al %ue nos enrentamos cuando por e!emplotratamos de estudiar la relaci"n entre el fumar y el c*ncer de pu$m'n eintentamos e$tender las conclusiones obtenidas sobre una muestra alresto de individuos de la poblaci"n.

La tarea undamental de la estadística in-erencial, es hacer inerenciasacerca de la poblaci"n a partir de una muestra e$traída de la misma.

0.2. ,écnicas de muestreo sobre una población

La teor+a de$ muestreo tiene por ob!etivo, el estudio de las relacionese$istentes entre la distribuci"n de un carcter en dicha poblaci"n y lasdistribuciones de dicho carcter en todas sus muestras.

Las venta!as de estudiar una poblaci"n a partir de sus muestras sonprincipalmente#

Coste reducido 0i los datos %ue buscamos los podemos obtener a partirde una pe%ue&a parte del total de la poblaci"n, los gastos de recogiday tratamiento de los datos sern menores. Por e!emplo, cuando serealizan encuestas previas a un reeréndum, es ms barato preguntara B,888 personas su intenci"n de voto, %ue a C8,888,888 ;

!a<or rapide( Estamos acostumbrados a ver c"mo con los resultadosdel escrutinio de las primeras mesas electorales, se obtiene unaapro$imaci"n bastante buena del resultado fnal de unas elecciones,muchas horas antes de %ue el recuento fnal de votos haya fnalizado;

!"s posibilidades Para hacer cierto tipo de estudios, por e!emplo el deduraci"n de cierto tipo de bombillas, no es posible en la prcticadestruirlas todas para conocer su vida media, ya %ue no %uedaríanada %ue vender. Es me!or destruir s"lo una pe%ue&a parte de ellas ysacar conclusiones sobre las dems.

3e este modo se ve %ue al hacer estadística inerencial debemosenrentarnos con dos problemas#

Page 72: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 72/89

Elecci"n de la muestra 9muestreo;, %ue es a lo %ue nos dedicaremosen este capítulo.

E$trapolaci"n de las conclusiones obtenidas sobre la muestra, alresto de la poblaci"n 9inferencia;.

El tipo de muestreo ms importante es el muestreo a$eatorio, en el %uetodos los elementos de la poblaci"n tienen la misma probabilidad de sere$traídos; un%ue dependiendo del problema y con el ob!etivo de reducirlos costes o aumentar la precisi"n, otros tipos de muestreo pueden serconsiderados como veremos ms adelante# muestreo sistem*tico,estrati:cado y por con)$omerados.

0.2.1. !uestreo aleatorio

(onsideremos una poblaci"n fnita, de la %ue deseamos e$traer unamuestra. (uando el proceso de e$tracci"n es tal %ue garantiza a cada unode los elementos de la poblaci"n la misma oportunidad de ser incluidos endicha muestra, denominamos al proceso de selecci"n muestreoaleatorio.

El muestreo aleatorio se puede plantear ba!o dos puntos de vista#

0in reposici"n de los elementos; (on

reposici"n.

!uestreo aleatorio sin reposición

(onsideremos una poblaci"n ormada por N elementos. 0iobservamos un elemento particular, e V , en un muestreo aleatorio

sin reposici"n se da la siguiente circunstancia#

La probabilidad de %ue e sea elegido en primer lugar es ;

0i no ha sido elegido en primer lugar )lo %ue ocurre con una probabilidad

de , la probabilidad de %ue sea elegido en el segundo intento es de

.

!uestreo aleatorio con reposición

0obre una poblaci"n de tama&o N podemos realizar e$tracciones de nelementos, pero de modo %ue cada vez el elemento e$traído es repuesto altotal de la poblaci"n. 3e esta orma un elemento puede ser e$traído variasveces.

El muestreo aleatorio con reposici"n es también denominado muestreoaleatorio simple, y se caracteriza por%ue cada elemento de la poblaci"n

tiene la misma probabilidad de ser elegido, y las observaciones se realizan

Page 73: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 73/89

con reemplazamiento. 3e este modo, cada observaci"n es realizada sobrela misma poblaci"n )%ue no disminuye con las e$tracciones sucesivas.

0.2.2. !uestreo aleatorio estrati$cado

5n muestreo aleatorio estrati$cado es a%uel en el %ue se divide lapoblaci"n de N individuos, en subpoblaciones o estratos, atendiendo acriterios %ue puedan ser importantes en el estudio, de tama&os respectivosN1, ..., N ,

N < N1 = N> = GGG = N 

y realizando en cada una de estas subpoblaciones muestreos aleatoriossimples de tama&o ni i < 1,..., .

continuaci"n nos planteamos el problema de cuantos elementos demuestra se han de elegir de cada uno de los estratos. Para ello tenemosundamentalmente dos técnicas# la asignaci"n proporcional y la asignaci"noptima.

si'nación proporcional

0ea n el n'mero de individuos de la poblaci"n total %ue orman parte dealguna muestra#

n < n1 = n> = GGG = n 

(uando la asignaci"n es proporcional el tama&o de la muestra decada estrato es proporcional al tama&o del estrato correspondiente conrespecto a la poblaci"n total#

0.2.3. !uestreo sistem"tico

(uando los elementos de la poblaci"n estn ordenados en fchas o enuna lista, una manera de muestrear consiste en

0ea ;

Elegir aleatoriamente un n'mero m, entre 1 y  ; 9omarcomo muestra los elementos de la lista#

no em, em= , em=> , ...,em=)n?1 

Page 74: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 74/89

Esto es lo %ue se denomina muestreo sistem"tico. (uando el criterio deordenaci"n de los elementos en la lista es tal %ue los elementos msparecidos tienden a estar ms cercanos, el muestreo sistemtico suele ser

ms preciso %ue el aleatorio simple, ya %ue recorre la poblaci"n de unmodo ms uniorme. Por otro lado, es a menudo ms cil no cometererrores con un muestreo sistemtico %ue con este 'ltimo.

El método tal como se ha defnido anteriormente es sesgado si no esentero, ya %ue los 'ltimos elementos de la lista nunca pueden serescogidos. 5n modo de evitar este problema consiste en considerar la listacomo si uese circu$ar )el elemento N = 1 coincide con el primero y#

0ea el entero ms cercano a ;

0e selecciona un n'mero al azar m, entre 1 y N;

0e toma como muestra los elementos de la lista %ue consisten en irsaltando de elementos en  , a partir de m, teniendo en cuenta %ue lalista es circular.

0e puede comprobar %ue con este método todos los elementos de la listatienen la misma probabilidad de selecci"n.

0.2.%.!uestreo por con'lomerados

0i intentamos hacer un estudio sobre los habitantesde una ciudad, el muestreo aleatorio simple puederesultar muy costoso, ya %ue estudiar una muestra detama&o n implica enviar a los encuestadores a n puntosdistintos de la misma, de modo %ue en cada uno de elloss"lo se realiza una entrevista. En esta situaci"n es msecon"mico realizar el denominado muestreo porcon'lomerados, %ue consiste en elegir aleatoriamenteciertos barrios dentro de la ciudad, para después elegircalles y edifcios. 5na vez elegido el edifcio, seentrevista a todos los vecinos.

Page 75: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 75/89

Capítulo =

Contrastes de Bipótesis

=.1. Introducción

Oasta ahora hemos estudiado c"mo a partir de una muestra de una

poblaci"n podemos obtener una estimaci"n puntual o bien establecer unintervalo ms o menos apro$imado para encontrar los parmetros %ue rigenla ley de probabilidad de una v.a. defnida sobre la poblaci"n. Es lo %uedenominbamos estimaci'n puntua$ y estimaci'n con:dencia$respectivamente.

Pueden presentarse en la prctica, situaciones en las %ue e$ista unateoría preconcebida relativa a la característica de la poblaci"n sometida aestudio. 9al sería el caso, por e!emplo si pensamos %ue un tratamientonuevo puede tener un porcenta!e de me!oría mayor %ue otro estndar, ocuando nos planteamos si los ni&os de las distintas comunidades espa&olastienen la misma altura. Este tipo de circunstancias son las %ue nos llevan al

estudio de la parcela de la Estadística nerencial %ue se recoge ba!o el títulogenérico de Contraste de Hipótesis. mplica, en cual%uier investigaci"n,la e$istencia de dos teorías o hip"tesis implícitas, %ue denominaremoship"tesis nula e hip"tesis alternativa, %ue de alguna manera reSe!arn esaidea a priori %ue tenemos y %ue pretendemos contrastar con la QrealidadR.3e la misma manera aparecen, implícitamente, dierentes tipos de errores%ue podemos cometer durante el procedimiento. 6o podemos olvidar %ue,habitualmente, el estudio y las conclusiones %ue obtengamos para unapoblaci"n cual%uiera, se habrn apoyado e$clusivamente en el anlisis des"lo una parte de ésta. 3e la probabilidad con la %ue estemos dispuestos aasumir estos errores, depender, por e!emplo, el tama&o de la muestra

re%uerida. 3esarrollamos en este capítulo los contrastes de hip"tesis paralos parmetros ms usuales %ue venimos estudiando en los capítulosanteriores# medias, varianzas y proporciones, para una o dos poblaciones.Los contrastes desarrollados en este capítulo se apoyan en %ue los datos departida siguen una distribuci"n normal.

Los contrastes de si'ni$cación se realizan#

suponiendo a priori %ue la ley de distribuci"n de la poblaci"n es conocida.

Page 76: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 76/89

0e e$trae una muestra aleatoria de dicha poblaci"n.

0i la distribuci"n de la muestra es QdierenteR de la distribuci"n deprobabilidad %ue hemos asignado a priori a la poblaci"n, concluimos %ueprobablemente sea err"nea la suposici"n inicial.

Eemplo

0upongamos %ue debemos realizar un estudio sobre la altura media delos habitantes de cierto pueblo de Espa&a. ntes de tomar una muestra, lo

l"gico es hacer la siguiente suposici"n a priori, )hip"tesis %ue se deseacontrastar y %ue denotamos 8#

8 # La altura media no difere de la del resto del país.

l obtener una muestra de tama&o n < , podríamos encontrarnos ante unode los siguientes casos#

1. :uestra < 1,28 ;1,2>; 1,B; 1,22; 1,A8; 1,BI; 1,22; 1,ACw

>. :uestra < 1,A2; 1,8; 1,DC; 1,2>; 1,D2; 1,A2; 1,D2; 1,Dw

ntuitivamente, en el caso a sería l"gico suponer %ue salvo %ue lamuestra obtenida sobre los habitantes del pueblo sea muy pocorepresentativa, la hip"tesis 8 debe ser rechazada. En el caso b tal vezno podamos afrmar con rotundidad %ue la hip"tesis 8 sea cierta, sinembargo no podríamos descartarla y la admitimos por una cuesti"n desimplicidad.

Este e!emplo sirve como introducci"n de los siguientes conceptos# En uncontraste de hip"tesis )también denominado test de "ip'tesis o

Fontraste de si)ni:caci'n se decide si cierta hip"tesis 8 %uedenominamos Bipótesis nula puede ser rechazada o no a la vista delos datos suministrados por una muestra de la poblaci"n. Para realizar elcontraste es necesario establecer previamente una Bipótesisalternativa )1 %ue ser admitida cuando 8 sea rechazada.6ormalmente 1 es la negaci"n de 8, aun%ue esto no esnecesariamente así.

El procedimiento general consiste en defnir un estadístico @ relacionadocon la hip"tesis %ue deseamos contrastar. éste lo denominamosestadístico del contraste. continuaci"n suponiendo %ue 8 esverdadera se calcula un intervalo de denominado intervalo de

Page 77: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 77/89

aceptaci"nB de la hip"tesis nula, )@ i,@ s de manera %ue al calcular sobrela muestra @ < @ e!p el criterio a seguir sea#

no rechazamos 8 )Fxrechazamos 1 ; rechazamos 8

y aceptamos 1

Es importante observar este hecho curioso# :ientras %ue en el e!emploanterior no e$istía una evidencia signifcativa para decir %ue K A< 1DB cm,el Qsimple hechoRde plantearnos un contraste %ue parece el mismo pero enversi"n unilateral nos conduce a rechazar de modo signifcativo %ue K < 1DBy aceptamos %ue K = 1DB cm. Es por ello %ue podemos decir %ue no s"lo

Kigura I.2# El valor te @ e!p est en la regi"n crítica, por tanto e$iste unaevidencia signifcativa en contra de 8, y a avor de 1.

BR.

Page 78: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 78/89

Capítulo K

Contrastes basados en el estadístico NiMCuadrado

K.1. Introducción

E$isten multitud de situaciones en el mbito de la salud en el %ue lasvariables de interés, las cuales no pueden cuantifcarse mediantecantidades numéricas, entre las %ue el investigador esté interesado endeterminar posibles relaciones. E!emplos de este tipo de variablespueden ser las complicaciones tras una intervenci"n %uir'rgica, else$o, el nivel socio[cultural, etc. En este caso tendríamos, a lo sumo,las observaciones agrupadas en orma de recuencia, dependiendo delas modalidades %ue presente cada paciente en cada una de lasvariables, por los %ue los métodos estudiados en los capítulosanteriores no serían aplicables.

El ob!etivo de este tema es el estudio de este tipo de cuestiones en

relaci"n con las variables cualitativas )y también v.a. discretas ocontinuas agrupadas en intervalo. Estos son los contrastes asociadoscon el estadístico  >. En general este tipo de tests consisten en tomaruna muestra y observar si hay dierencia signifcativa entre lasrecuencias observadas y las especifcadas por la ley te"rica delmodelo %ue se contrasta, también denominadas QrecuenciasesperadasR.

0in embargo, aun%ue éste sea el aspecto ms conocido, el uso del test

  > no se limita al estudio de variables cualitativas. Podríamos decir %uee$isten tres aplicaciones bsicas en el uso de este test, y cuyodesarrollo veremos en el transcurso de este capítulo#

 9res son los temas %ue abordaremos de esta manera#

Pearson propuso el estadístico

Page 79: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 79/89

8 2 18 12 >8 >2

n 1?>

0e rechazaO86o se rechazaO8

n>

  para n<18

el cual, siguiendo la linea de razonamiento anterior debe tomarvalores pe%ue&os si 8 es cierta. 0i al tomar una muestra, su valor esgrande eso pone en evidencia %ue la hip"tesis inicial es

 probab$emente alsa. Para decidir cuando los valores de   > songrandes es necesario conocer su ley de probabilidad. 0e tieneentonces el siguiente resultado

,eorema

n"lisis de la varian(a

K.1. Introducción

3el mismo modo %ue el contraste   > generalizaba el contraste de dosproporciones, es necesario defnir un nuevo contraste de hip"tesis %ue seaaplicable en a%uellas situaciones en las %ue el n'mero de medias %ue

%ueremos comparar sea superior a dos. Es por ello por lo %ue elan"lisis de

la varian(a* 4&) surge como una generalizaci"n del contraste para dosmedias de la t de 0tudent, cuando el nmero de muestras a contrastar esmayor ue dos.

Por e!emplo, supongamos %ue tenemos C muestras de dierentestama&os %ue suponemos %ue provienen de tres poblaciones normales con lamisma varianza#

Q! 1 V 8Cn1   14

Q! > V 8Cn>   >4

Page 80: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 80/89

Q! C V 8CnC   C4

0i %ueremos realizar el contraste

>C 

  8

 

1

#

 

#

 K1 < K> < KC

 K1 A< K> " K1 A< KC " K>

A< KC

podríamos en plantearnos como primer método el f!ar una cantidad R

pr"$ima a cero y realizar los < C contrastes siguientes con R comonivel de signifcaci"n#

nivel de signifcaci"n R

nivel de signifcaci"n Rnivel de signifcaci"n R

de modo %ue se aceptaría 1 y se rechazaría 8 s"lo si alguna de las

hip"tesis alternativas es aceptada y rechazada sucorrespondiente hip"tesis nula. El error de tipo 8 para este contraste es#

hiProb Mechazar 8j8 es cierta

h i< 1 ?Prob 6o rechazar 8j8 es cierta

h i< 1 ?Prob 6o rechazarson ciertas

< 1 ? )1 ? RC

Page 81: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 81/89

Por ello el nivel de signifcaci"n obtenido para este contraste sobre laigualdad de medias de tres muestras no es R como hubiésemos

esperado obtener inicialmente, sino 1?)1?RC. Por e!emplo, sitomamos un nivel de signifcaci"n R < 881 para cada uno de loscontrastes de igualdad de dos medias, se obtendría %ue el nivel designifcaci"n )error de tipo 8 para el contraste de las tres medias es de1 ? 8,IC < 8,>D, lo %ue es una cantidad muy alta para lo %ueacostumbramos a usar.

En consecuencia, no es adecuado rea$i(ar e$ contraste de i)ua$dadde medias de #arias muestras mediante una mu$titud de contrastesde i)ua$dad de medias de dos muestras.

5na técnica %ue nos permite realizar el contraste de modoconveniente es la %ue e$ponemos en este capítulo y %ue se denominaan"lisis de la varian(a.

K.2. 4&) con un -actor

0e denomina modelo -actorial con un -actor o 4&) con un-actor al modelo )lineal en el %ue la variable analizada la hacemosdepender de un s"lo actor de tal manera %ue las causas de suvariabilidad son englobadas en una componente aleatoria %ue sedenomina error eLperimental#

  < actor _ error

Jamos a e$poner esto con ms claridad. (onsideremos unavariable sobre la %ue actu un actor %ue puede presentarse ba!o undeterminado n'mero de niveles, t . Por e!emplo podemos considerar unrmaco %ue se administra a t < C grupos de personas y se les realizacierta medici"n del eecto causado#

Mesultado de la medici"n

/ripe )nivel 1pendicitis )nivel

> 0anos )nivel CEn este caso los actores

%ue inSuyen en lasobservaciones son tres#

el %ue la persona padezca la gripe, apendicitis, o %ue esté sana.

3e modo general podemos representar las t muestras )o niveles delsiguiente modo#

6iveles 7bservaciones de  tama&os muestrales6ivel 1 N1 n1

2 C > 2 B C n1 <

A I A D I 1

8

1

8

n> <

I> C > 1 > C > nC <

D

 ! 11

 ! 1>

GGG  ! 1n1

 ! >1

 ! >>

GGG ! >n>

... ! t 1  ! t > GGG  ! t 

nt 

Page 82: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 82/89

6ivel > N> n>

... ...

6ivel t Nt nt 

donde por supuesto, los tama&os de cada muestra ni, no tienen por %ueser iguales. En este caso decimos %ue se trata del modelo noeOuilibrado.

&bservación

3e ahora en adelante asumiremos %ue las siguientes condiciones sonverifcadas por las t muestras#

Las observaciones proceden de poblaciones normales;

Las t muestras son aleatorias e independientes. dems, dentro decada nivel las observaciones son independientes entre sí.

En el modelo de un actor suponemos %ue las observacionesdel nivel i,  ! i%, provienen de una variable  i% de orma %ue todastienen la misma varianza @hip"tesis de homocedasticidad#

  i%4  % < 1,...,ni

o lo %ue es lo mismo,

, donde i%4

3e este modo Ki es el valor esperado para las observaciones delnivel i, y los errores i% son variables aleatorias independientes, convalor esperado nulo, y con el mismo grado de dispersi"n paratodas las observaciones.

7tro modo de escribir lo mismo consiste en introducir unacantidad  K %ue sea el valor esperado para una personacual%uiera de la poblaci"n )sin tener en cuenta los dierentesniveles, y considerar los eectos Ri introducidos por los niveles,de modo %ue

 Ki

<  K = Ri i <

1,...,t *

niRi

< 8

i<1

Page 83: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 83/89

K.2.1. Especi$cación del modelo

(on todo lo anterior, el modelo 67J de un actor puede escribirsecomo

, donde i%4

y con la siguiente interpretaci"n#

 K es una constante com'n a todos los niveles;

Ri es el eecto producido por el iZésimo nivel. l sumarlos

todos deben compensarse los eectos negativos con los positivospara %ue la media com'n a todos los niveles sea realmente  K. Estoimplica en particular %ue los eectos, Ri, de los niveles no sonindependientes;

i% es la parte de la variable  i% no e$plicada por K ni Ri, y %ue sedistribuye del mismo modo )aun%ue independientemente paracada observaci"n, seg'n la ley gaussiana#

i%4

Esta] es la condici"n de Bomocedasticidad, y es undamental en elanlisis de la varianza.

7bsérvese %ue ahora podemos escribir el contraste de %ue los dierentesniveles no tienen inSuencia sobre la observaci"n de la variable como#

8 #

  1 #

o bien

 K1 < K> < GGG < Kt 

l menos dos son

distintos

    8

  1

# R1 < R> < GGG < Rt <8

# lg'n Ri A< 8&bservación

0e utiliza el nombre de an*$isis de $a #arian(a ya %ue el elemento bsicodel anlisis estadístico ser precisamente el estudio de la variabilidad.

 9e"ricamente es posible dividir la variabilidad de la variable %ue se estudiaen dos partes#

La originada por el actor en cuesti"n;

Page 84: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 84/89

z1,>,C

La producida por los restantes actores %ue entran en !uego, conocidos ono, controlables o no, %ue se conocen con el nombre de error e$perimental.

0i mediante los contrastes estadísticos adecuados la variaci"n producidapor cierto actor es signifcativamente mayor %ue la producida por el errore$perimental podemos aceptar la hip"tesis de %ue los distintos niveles delactor actun de orma distinta.

Eemplo

(onsideremos dos muestras tomadas en dierentes niveles de unavariable, de orma %ue ambas tengan la misma varianza muestral )lo %ue

indica %ue no se puede rechazar la igualdad de varianzas poblacionales ymedias muestrales bastante dierentes. Por e!emplo#

nivel 1 n1 < C  wj

;

 ! 1 < >

nivel

wj

La dispersi"n calculada al medir la de los dos niveles con!untamente esmucho mayor %ue la de cada uno de ellos por separado. Por tanto puedededucirse %ue ambos niveles no tienen el mismo valor esperado.

Page 85: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 85/89

8 1 > C B

Kn m 1?

0e rechazaO86o rechaza la igualdad de medias#O8

Kn m   para n<C, m<1A

Kigura 11.># Megi"n crítica en un contraste 67J.

Eemplo

0e aplican B tratamientos distintos a B grupos de 2 pacientes,

obteniéndose los resultados de la tabla %ue se ad!unta. Xueremos saber sise puede concluir %ue todos los tratamientos tienen el mismo eecto. Paraello vamos a suponer %ue estamos en condiciones de aplicar el modelo deun actor

 ! >i  *ni >

 9ratamientos 7bservaciones ni  ! i ! 

i%

ni %<1

 9ratamiento 1

 9ratamiento >

 9ratamientoC

 9ratamientoB

N < >8  !  <D B <1,8CC 2  A <>A2

BIF <

Kuente de grados 0uma (uas Est adístico

[

1

1 > 8 [

1

2 1 1N2 D

[

>

[

B

[

2

[

B

[

D

2 [>> BBN2 118

8 [

1

[

>

[

B

[

1

2 [ ABN2 >>

1 B A C 2 >> BBN2 1>A

Page 86: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 86/89

8 2 18 12 >8

KC  1A 8.I2

KC 1A

Ke$p<1.A

0e rechaza la igualdad de medias#O8

de cuadrados ivarianzasJariaci"n Liberta

d

Entret ? 1 <

C

0(E < B ?

F

0

k>

& e !p

tratamien

tos

<>8B,12 <A,

1AD

& t eo

<1,ADA

<

& t ?1,N?t 

3entro de

los

N ? t 

< 1A

0(3 < A ?

B

0

k>

tratamien

tos

<2,B <C,A

2

<C ,

>BEn conclusi"n, & e!p & teo, por tanto se ha de rechazar la igualdad de

eectos de los tratamientos.

En la Kigura 11.B se representan las observaciones de cada nivel detratamiento mediante una curva normal cuyos parmetros se han estimadopuntualmente a partir de las observaciones. 7bsérvese %ue las dierenciasms importantes se encuentran entre Los tratamientos > y B. Esto motivalos contrastes de comparaciones m'ltiples )dos a dos, para %ue, en el casoen %ue la igualdad de medias sea rechazada, se pueda establecer %uéniveles tuvieron mayor inSuencia en esta decisi"n.

K.2.0. n"lisis de los resultados del 4&) Comparacionesmltiples

5na vez contrastado el %ue e$isten dierencias signifcativas mediante elanlisis de la varianza, nos interesa conocer %ue niveles del actor son los%ue han inSuido ms para %ue se de este resultado. (omo ilustraci"n, en

Kigura 11.C# 0e rechaza la hip"tesis de %ue los tratamientos tienen elmismo eecto en los dierentes grupos. Oay gran evidencia estadística encontra.

Page 87: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 87/89

el 'ltimo e!emplo se ve claramente %ue los tratamientos segundo y cuartodan resultados muy dierentes, y probablemente de ahívenga el %ue se

haya rechazado la igualdad de todos los eectos.

El método ms simple es el de Bonferroni, %ue consiste en realizar todaslas comparaciones por pare!as#

  8 # K i < K %

i,% < 1,...,t i A< %contrastes

  1 # Ki A< K %

lo %ue corresponde a los ya conocidos contrastes de la t de 0tudent, %uetienen en este caso como estadístico e$perimental a )de nuevo suponiendola homocedasticidad en todas las muestras#

tN?t 

Page 88: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 88/89

Kigura 11.B# Las dierencias ms importantes se encuentranentre los niveles > y B.

ya %ue la intravarianza 0k

, es un estimador de L > con N ? t 

grados de libertad.

0in embargo el nivel de signifcaci"n de los contrastes debeser disminuido para tener en cuenta %ue ahora al hacermultitud de contrastes aumenta la probabilidad del error detipo . Para una probabilidad de error de tipo )nivel designifcaci"n R, el procedimiento de comparaciones m'ltiplesde -onerroni nos indica %ue declaremos signifcativas las

dierencias entre muestras cuando estas sean signifcativas encontrastes bilaterales para el estadístico anterior para el nivelde signifcaci"n

2. 0e desea saber si el grado de ansiedad es el mismo, portérmino medio, en tres enermedades distintas. Para ello setomaron tres muestras de 18, 1> y personas,respectivamente, con esas enermedades, pasndoles a cadauna de ellas un test %ue mide el grado de ansiedad delindividuo. Los resultados se dan en la tabla ad!unta.

Enermedad /rado de ansiedad B A 2 2 A C C > A 2- > 1 2 2 B A B B B C C >( D 2 D I C 2 2

`Xue puede concluirse de los datos.

Page 89: estadistica unacv juliaca

7/18/2019 estadistica unacv juliaca

http://slidepdf.com/reader/full/estadistica-unacv-juliaca 89/89

3. En una e$periencia para comparar la efcacia de diversastécnicas en el tratamiento del dolor producido por unaintervenci"n %uir'rgica superfcial, > pacientes se agruparonal azar en B grupos de D, tratando al primero con placebo, y a

los siguientes con dos tipos de analgésicos ) y - yacupuntura. Los datos se dan en la siguiente tabla#

 9ratamiento :inutos para la remisi"n del dolorPlacebo C2 >

>

2 1

B

C

B

>

A

2nalgésic

o

2

8

B

A

A

1

I

I

11

B

1

1

8nalgésic

o -

18

8

18

D

1B

>

A

C

I

B

D

8cupuntu

ra

A 1>

2

18

C

I

I

12

B

D

2

1

A

8`Xue conclusiones pueden obtenerse de esta e$periencia.