estadis c.sociales ii

52
Estadística aplicada a las Ciencias Sociales II Licenciatura de Sociología. Curso 2001/02 Mayte Rodríguez

Upload: gatoumx

Post on 21-Jun-2015

1.074 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Estadis c.sociales II

Estadística aplicada a las Ciencias Sociales II

Licenciatura de Sociología. Curso 2001/02

Mayte Rodríguez

Page 2: Estadis c.sociales II

PROGRAMAPrimera parte. Probabilidad

1. Azar y Probabilidad

1.1 Introducción

1.2 Experimentos aleatorios. Sucesos

1.3 Operaciones básicas con sucesos aleatorios

1.4 Frecuencia y Probabilidad

1.5 Propiedades de la Probabilidad

1.6 Ejercicios

2. Probabilidad condicionada e independencia

2.1 Probabilidad condicionada

2.2 Independencia

2.3 Teoremas fundamentales del cálculo de probabilidades

2.4 Ejercicios

3. Variables aleatorias

3.1 Distribución de una variable aleatoria

3.2 Variables aleatorias discretas

3.3 Variables aleatorias continuas

3.4 Ejercicios

4. Variables aleatorias discretas

4.1 El modelo de Bernoulli

4.2 La distribución binomial

4.3 La distribución geométrica

4.4 La distribución de Poisson

4.5 Ejercicios

5. Variables aleatorias continuas

5.1 La distribución uniforme

5.2 La distribución exponencial

5.3 La distribución normal

1

Page 3: Estadis c.sociales II

5.4 La dsitribución logarítmico-normal

5.5 Ejercicios

Segunda parte. Inferencia

6 Estimación de una proporción

6.1 Introducción a la inferencia

6.2 Distribución en el muestreo de una proporción

6.3 Estimadores centrados

6.4 El error típico de estimación de la proporción

6.5 Intervalos de confianza

6.6 Estimación en poblaciones pequeñas

6.7 Determinación del tamaño muestral

6.8 Ejercicios

7 Estimación de una media

7.1 Distribución en el muestreo de una media

7.2 Estimadores centrados

7.3 El error típico de estimación

7.4 Intervalos de confianza

7.5 Corrección por poblaciones finitas

7.6 Determinación del tamaño muestral

7.7 Ejercicios

8 Contrastes de hipótesis

8.1 Introducción

8.2 Tipos de hipótesis

8.3 La hipótesis nula y la alternativa

8.4 Nivel de significación

8.5 Metodología del contraste de hipótesis

8.6 Contraste para una proporción

8.7 Contraste para una media

8.8 Ejercicios

2

Page 4: Estadis c.sociales II

BIBLIOGRAFÍA

• Peña, D. y Romo, J. (1997). Introducción a la Estadística para las CienciasSociales. McGraw-Hill.

• De la Horra, J. (1995). Estadística Aplicada. Diaz de Santos.• Álvarez, S. J. (2000). Estadística Aplicada. Clag.• Peña, D. (2001). Fundamentos de Estadística. Alianza Editorial.

3

Page 5: Estadis c.sociales II

Parte I

Probabilidad

4

Page 6: Estadis c.sociales II

Capítulo 1

Azar y Probabilidad

1.1 Introdución

Si el único propósito del investigador es describir los resultados de un experi-mento concreto, los métodos descriptivos pueden considerarse suficientes. Noobstante, si lo que se pretende es utilizar la información obtenida para extraerconclusiones generales sobre todos aquellos objetos del tipo de los que han sidoestudiados, entonces estos métodos constituyen sólo el principio del análisis, ydebe recurrirse a métodos de inferencia estadística, los cuales implican el uso dela teoría de la probabilidad.La probabilidad constituye por sí misma un concepto básico que refleja su

relación con la faceta del mundo exterior que pretende estudiar: los fenómenosaleatorios, que suponen unas ciertas reglas de comportamiento. De alguna man-era el concepto de probabilidad se relaciona o recuerda las propiedades de lafrecuencia relativa. A partir de ella, y junto con las definiciones de probabilidadcondicionada y la de sucesos independientes, que se estudiarán en el siguientecapítulo, se deducen los resultados fundamentales del Cálculo de Probabilidades.El nexo que une la teoría de la probabilidad y la estadística es la noción de

variable aleatoria, mostrando de esta manera cómo puede emplearse la teoría dela probabilidad para extraer conclusiones precisas acerca de una población sobrela base de una muestra extraída de ella. Muchos de los análisis estadísticos son,de hecho, estudio de las propiedades de una o más variables aleatorias.

1.2 Experimentos aleatorios. Sucesos

Se dice que un experimento es aleatorio si se verifican las siguientes condiciones:

• Se puede repetir indefinidamente, siempre en las mismas condiciones;

5

Page 7: Estadis c.sociales II

• Antes de realizarlo, no se puede predecir el resultado que se va a obtener;• El resultado que se obtenga, e, pertenece a un conjunto conocido previa-mente de resultados posibles. A este conjunto, de resultados posibles, lodenominaremos espacio muestral y lo denotaremos normalmente medi-ante la letra E. Los elementos del espacio muestral se denominan sucesoselementales. Cualquier subconjunto de E se denominará suceso aleato-rio, y se denotará normalmente con las letras A,B, ...

Se puede observar que los sucesos elementales son sucesos aleatorios com-puestos por un sólo elemento. Por supuesto los sucesos aleatorios son más gen-erales que los elementales. Sucesos aleatorios que aparecen con gran frecuenciaen el cálculo de probabilidades son los siguientes:Suceso seguro: Es aquel que siempre se verifica después del experimento

aleatorio, es decir, el mismo E.Suceso imposible: Es aquel que nunca se verifica como resultado del ex-

perimento aleatorio. Como debe ser un subconjunto de E, la única posibilidades que el suceso imposible sea el conjunto vacío: ∅ ⊂ E.Suceso complementario a un suceso A: También se denomina contrario

de A, y es el suceso que se verifica si, como resultado del experimento aleatorio,no se verifica A. Se acostumbra a denotar con el símbolo A ó Ac. Así, A ={e ∈ E : e /∈ A} .Sucesos incompatibles: son aquellos que no pueden ocurrir a la vez.EjemploSi realizamos el experimento aleatorio de lanzar un dado al aire, tenemos:

Sucesos elementales −→ 1, 2, 3, 4, 5, 6

Espacio muestral −→ E = {1, 2, 3, 4, 5, 6}

Sucesos aleatorios −→

∅ suceso imposibleE suceso seguro

{1, 2, 3}{4, 5}

{2, 4, 6} = {1, 2, 3}· · ·

Para trabajar con el cálculo de probabilidades es necesario fijar previamentecierta terminología. Vamos a introducir parte de ella a continuación.

1.3 Operaciones básicas con sucesos aleatorios

Al ser los sucesos aleatorios nada más que subconjuntos de un conjunto E, es-pacio muestral, podemos aplicar las conocidas operaciones con conjuntos, comoson la unión, intersección y diferencia:Unión: Dados dos sucesos aleatorios A,B ⊂ E, se denomina suceso unión

de A y B al conjunto formado por todos los sucesos elementales que pertenecen

6

Page 8: Estadis c.sociales II

a A o bien pertenecen a B, incluyendo los que están en ambos simultáneamente,es decir

A ∪B = {e ∈ E : e ∈ A ó e ∈ B} .

Como ejemplo, tenemos que la unión de un suceso cualquiera con su com-plementario es el suceso seguro.Volviendo al ejemplo del lanzamiento de un dado, si A = {1, 2, 3} y B =

{3, 4}, el suceso unión de A y B es A ∪B = {1, 2, 3, 4} .

Intersección: Dados dos sucesos aleatorios A,B ⊂ E, se denomina sucesointersección de A y B al conjunto formado por todos los sucesos elementalesque pertenecen a A y B a la vez, es decir,

A ∩B = {e ∈ E : e ∈ A y además e ∈ B} .

Un ejemplo de intersección es la de un suceso aleatorio cualquiera, A ⊂ E,con su complementario, que es el suceso imposible.Volviendo al ejemplo del dado, si A = {1, 2, 3} y B = {3, 4}, el suceso

intersección de A y B es A ∩B = {3} .En este mismo ejemplo, si A = {1, 2, 3} y B = {4, 5}, entonces A∩B = {∅} ,

es decir, A y B son incompatibles o disjuntos.

Diferencia: Dados dos sucesos aleatorios aleatorios A,B ⊂ E, se llamasuceso diferencia de A y B, y se representa mediante A\B, o bien A − B, alsuceso formado por todos los sucesos elementales que pertenecen a A, pero noa B:

A−B = {e ∈ E : e ∈ A y además e /∈ B} = A ∩Bc.Por ejemplo, si A = {1, 2, 3} y B = {3, 4}, A−B = {1, 2} y B −A = {4}Obsérvese que el suceso complementario de un suceso A, puede escribirse

como la diferencia del suceso seguro menos éste, o sea, A = {e ∈ E : e /∈ A} =E\A.Hay ciertas propiedades que relacionan la unión, intersección y suceso con-

trario, que son conocidas bajo el nombre de Leyes de Morgan:

A ∪B = A ∩BA ∩B = A ∪B

1.4 Frecuencia y Probabilidad

En los experimentos aleatorios que se pueden repetir indefinidamente bajo condi-ciones similares, se observa que cuando el número de experimentos aumenta, lasfrecuencias relativas con las que ocurre cierto suceso se estabilizan y tienden

7

Page 9: Estadis c.sociales II

a converger hacia cierta cantidad que recibe el nombre de probabilidad delsuceso.Por ejemplo, en la Figura 1 se presenta la evolución de la frecuencia relativa

del número de caras obtenido en el lanzamiento de una moneda en 100 ocasiones(simulado por un ordenador). En principio la evolución de las frecuencias rela-tivas es errática, pero a medida que el número de tiradas aumenta, tiende a loque entendemos por probabilidad de cara.

Figura 1: Convergencia a 1/2 de la frecuencia relativa del número de caras obtenidoen lanzamientos sucesivos de una moneda (simulación en ordenador).

Supongamos, en general, que un suceso A ocurre An veces en n repeticionesdel experimento. Resultaría, entonces, la definición frecuentista de la probabil-idad de A como

P (A) = limn

Ann,

supuesto que existe el límite. Con esta definición se tiene

• P (A) ≥ 0 para todo suceso A• P (E) = 1, siendo E el suceso seguro• P (A ∪B) = P (A) + P (B), supuestos A y B incompatibles.

Observación: Si generalizamos lo anterior a un número mayor de sucesos,A = A1 ∪A2 ∪ · · · , con Ai ∩Aj = ∅, entonces P (A) = P (A1) + P (A2) + · · ·

8

Page 10: Estadis c.sociales II

En muchas ocasiones, por razones de simetría física o lógica, encontramostodos los resultados igualmente verosímiles y se apela al concepto clásico deprobabilidad que se define mediante el cociente entre el número de casos favor-ables al suceso y al número de casos posibles. Si un experimento cualquierapuede dar lugar a un número finito de resultados posibles, y no existe ningunarazón que privilegie unos resultados en contra de otros, se calcula la probabili-dad de un suceso aleatorio A, según la regla de Laplace, como el cociente entreel número de casos favorables a A, y el de todos los posibles resultados delexperimento:

P (A) =número de casos favorables a Anúmero de casos posibles

.

Ejemplo

Calcular la probabilidad de que al lanzar un dado se obtenga un número impar.Solución: El espacio muestral es E = {1, 2, 3, 4, 5, 6} . Vamos a llamar A,

al suceso consistente en que el resultado es impar, A = {1, 3, 5} . Como nosuponemos que ninguna de las caras ofrece una probabilidad de ocurrencia difer-ente a las demás, podemos aplicar la regla de Laplace para obtener que

P (A) =número de casos favorables a Anúmero de casos posibles

=

=número de elementos en Anúmero de elementos en E

=3

6= 0.5

Ejemplo

Deseamos calcular la probabilidad de que al extraer una carta de una baraja depóker (52 cartas) obtengamos una pica. Si A es el suceso obtener pica se tiene

P (A) =13

52=1

4.

Ejemplo

Tiramos dos dados, uno blanco y otro negro. Se desea calcular las probabilidadesde los sucesos:- Sacar un 4 en el dado negro:

P (A) =6

36=1

6.

- Sacar más puntuación en el dado blanco que en el negro:

P (B) =5 + 4 + 3 + 2+ 1

36=15

36=5

12.

9

Page 11: Estadis c.sociales II

- Sacar 2, 3 ó 12

P (C) =1 + 2 + 1

36=1

9.

- La mayor puntuación es 5:

P (D) =9

36=1

4.

Es fácil comprobar que las probabilidades así definidas son, en efecto, proba-bilidades. Si nA designa el número de casos favorables al suceso A y n al númerode casos posibles, resulta que

• P (A) = nAn≥ 0, pues nA ≥ 0.

• P (E) = nEn=n

n= 1

• P (A∪B) = nA∪Bn

=nA + nB

n=nAn+nBn= P (A)+P (B), si A∩B = ∅.

1.5 Propiedades de la probabilidad

• La probabilidad del suceso contrario de A, debe valerP (Ac) = 1− P (A).

Esto en realidad puede deducirse del siguiente razonamiento:

1 = P (E) = P (A ∪Ac) = P (A) + P (Ac) =⇒ P (Ac) = 1− P (A).

• 0 ≤ P (A) ≤ 1• P (∅) = 0• P (A ∩B) = 0 si A y B son incompatibles

• La probabilidad de la intersección de dos sucesos debe ser menor o igualque la probabilidad de cada uno de los sucesos por separado,

P (A ∩B) ≤ P (A)

P (A ∩B) ≤ P (B)

10

Page 12: Estadis c.sociales II

• La probabilidad de la unión de sucesos debe ser mayor o igual que la decada uno de los sucesos por separado,

P (A ∪B) ≥ P (A)

P (A ∪B) ≥ P (B)

Más aún, si los sucesos son incompatibles debe ocurrir que

A ∩B = ∅ =⇒ P (A ∪B) = P (A) + P (B)

• En general, P (A ∪B) = P (A) + P (B)− P (A ∩B)

1.6 Ejercicios

1. Cada muestra de cuatro hipotecas para vivienda está clasificada como deinterés fijo (F) o interés variable (V).

(a) Construir el espacio muestral.

(b) ¿Qué elementos del espacio muestral están en el suceso de que exac-tamente tres de las hipotecas seleccionadas sean de interés fijo?

(c) ¿Qué elementos están en el suceso de que las cuatro hipotecas seandel mismo tipo?

(d) ¿Qué elementos están en el suceso de que a lo sumo una de las cuatrohipotecas sea de interés variable?

(e) ¿Cual es la unión de los sucesos de las partes c) y d)? ¿Cual es suintersección?

(f) ¿Cual es la unión de los sucesos de las partes b) y c)? ¿Cual es suintersección?

(g) Si hay el mismo número de hipotecas de interés fijo y de interésvariable, calcular la probabilidad de todos los sucesos anteriores.

(h) Si tres de cada cuatro hipotecas es de interés variable, calcular laprobabilidad de todos los sucesos elementales y la del suceso delapartado c).

2. Un departamento de la Universidad Carlos III de Madrid acaba de termi-nar una votación secreta para elegir al director de departamento. La urnacontiene cuatro papeletas con tres votos para el candidato A y dos parael candidato B, correspondientes a las cinco personas que han ejercido suderecho a voto. Supongamos que esas papeletas se sacan de la urna unapor una. Mostrar todos los posibles resultados en los cuales el candidatoA permanece siempre delante de B conforme se van obteniendo los votos.Calcular la probabilidad del suceso anterior.

11

Page 13: Estadis c.sociales II

3. En una ciudad se publican tres periódicos A, B y C. El 30% de lapoblación lee A, el 20% lee B y el 15% lee C; el 12% lee A y B, el9% lee A y C, el 6% lee B y C; y finalmente, el 3% lee A, B y C. Se pide:

(a) ¿Cuál es el espacio muestral?

(b) Dar dos ejemplos de sucesos incompatibles

(c) Calcular la probabilidad de que sólo se lea el periódico A

(d) Calcular la probabilidad de que se lea B o C, pero no A

(e) Calcular la probabilidad de que se lean, al menos, uno de los tresperiódicos

4. Hallar la probabilidad de sacar por suma 8 puntos al lanzar dos dados.Construir primero el espacio muestral.

5. Sea un dado tal que la probabilidad de las distintas caras es proporcionalal número de puntos inscritos en ellas. Hallar la probabilidad de obtenercon este dado un número par.

6. En un taller de máquinas de una escuela de formación profesional, el 60%de todos los daños a la maquinaria ocurre en tornos y el 15% en taladros.Sean los sucesos: A=”el siguiente daño a una maquina es un torno”, B=”elsiguiente daño a una máquina es un taladro”. Calcular las probabilidadesde los sucesos A, A ∪B y A ∩ B.

7. Se escriben al azar las cinco vocales. ¿Cuál es la probabilidad de que la”e” aparezca la primera y la ”o” la última?

8. En una urna hay 50 bolas numeradas del 1 al 50. ¿Qué probabilidad hayde sacar, una a una, las 50 bolas en el orden natural?

9. Se lanza un dado seis veces, ¿cuál es la probabilidad de sacar algún 1 enlos seis lanzamientos?

10. Si la probabilidad de que se realice un suceso es 1/3. ¿Cuál es la proba-bilidad de que se realice efectuando 4 pruebas?

12

Page 14: Estadis c.sociales II

Capítulo 2

Probabilidad condicionadae independencia

2.1 Probabilidad condicionada

En numerosas ocasiones, tendremos que modelizar una situación en la que sedispone de información adicional, debiendo condicionarse a sucesos o circun-stancias. Suponemos que estamos interesados en un suceso A; hemos calculadoP (A), nos informan de que ha ocurrido B y queremos saber cómo cambia laprobabilidad de A.Obviamente, en algunos casos no cambiará dicha probabilidad, pero en la

mayor parte de los casos, sin embargo, el aporte de nueva información modificala probabilidad.El concepto básico para modelizar tales ideas es la probabilidad condicionada

P (A|B). Su definición es la siguiente.Sea B ⊂ E un suceso aleatorio de probabilidad no nula, P (B) > 0. Para

cualquier otro suceso A ⊂ E, se llama probabilidad condicionada de A respectode B a la cantidad que representamos mediante P (A|B) , y se calcula como

P (A|B) = P (A ∩B)P (B)

.

EjemploSe lanza un dado al aire ¿Cuál es la probabilidad de que salga el número 4? Si

sabemos que el resultado ha sido un número par, ¿se modifica esta probabilidad?Solución: El espacio muestral que corresponde a este experimento es E =

{1, 2, 3, 4, 5, 6} y se ha de calcular la probabilidad del suceso A = {4}. Si eldado no está trucado, todos los números tienen la misma probabilidad de saliry, siguiendo la definición de probabilidad de Laplace,

P (A) =casos favorablescasos posibles

=1

6

13

Page 15: Estadis c.sociales II

Obsérvese que para calcular la probabilidad de A según la definición deLaplace hemos tenido que suponer previamente que todos los elementos delespacio muestral tienen la misma probabilidad de salir, es decir:

P (1) = P (2) = P (3) = P (4) = P (5) = P (6).

Por otro lado, si se sabe que ha salido un número par, de nuevo por ladefinición de probabilidad de Laplace tendríamos

P (A|par) = casos favorablescasos posibles

=número de elementos en {4}

número de elementos en {2, 4, 6} =1

3.

Esta misma probabilidad se podría haber calculado siguiendo la definiciónde la probabilidad condicionada, ya que si escribimos

P (A) =1

6,

P (par) =1

6+1

6+1

6=1

2

P (A ∩ par) =1

6,

y entonces

P (A|par) = P (A ∩ par)P (par)

=1/6

1/2=1

3,

que por supuesto coincide con el mismo valor que calculamos usando la definiciónde probabilidad de Laplace.

ObservaciónObsérvese que según la definición de probabilidad condicionada, se puede

escribir la probabilidad de la intersección de dos sucesos de probabilidad nonula como

P (A ∩B) = P (A)P (B|A) = P (B)P (A|B),o sea, la probabilidad de la intersección de dos sucesos, es la probabilidad deuno cualquiera de ellos, multiplicada por la probabilidad del segundo sabiendoque ha ocurrido el primero.

2.2 Independencia

Si entre dos sucesos no existe ninguna relación cabe esperar que el conocimientode la ocurrencia de uno de los sucesos no aporte ninguna información sobrela probabilidad del otro suceso. De este modo introducimos el concepto deindependencia de dos sucesos A y B como:

A es independiente de B ⇐⇒ P (A ∩B) = P (A)P (B).

14

Page 16: Estadis c.sociales II

Esta relación puede ser escrita de modo equivalente: dados dos sucesos deprobabilidad no nula (de manera que P (A) 6= 0 6= P (B)) diremos que A esindependiente de B si y sólo si P (A) = P (A|B) ó equivalentemente P (B) =P (B|A).

2.3 Teoremas fundamentales del cálculo de prob-abilidades

Hay algunos resultados importantes del cálculo de probabilidades que son cono-cidos bajo los nombres de teorema de la probabilidad compuesta, teoremade la probabilidad total y teorema de Bayes. Veamos cuáles son estos teo-remas, pero previamente vamos a enunciar, a modo de recopilación, una seriede resultados elementales:ProposiciónSean A,B ⊂ E no necesariamente disjuntos. Se verifican entonces las sigu-

ientes propiedades:

• Probabilidad de la unión de sucesos:

P (A ∪B) = P (A) + P (B)− P (A ∩B).

• Probabilidad de la intersección de sucesos:

P (A ∩B) = P (A)P (B|A) = P (B)P (A|B).

• Probabilidad del suceso contrario:

P (Ac) = 1− P (A).

• Probabilidad condicionada del suceso contrario:

P (Ac|B) = 1− P (A|B).

EjemploEn una universidad el 50% de los alumnos habla inglés, el 20% francés y el

5% los dos idiomas ¿Cuál es la probabilidad de encontrar alumnos que hablenalguna lengua extranjera?Solución:Sea A el suceso hablar inglés: P (A) = 0.5. Sea B el suceso hablar francés:

P (B) = 0.2 y sea A∩B el suceso hablar francés e inglés: P (A∩B) = 0.05. Así,

P (A ∪B) = P (A) + P (B)− P (A ∩B) = 0.5 + 0.2− 0.05 = 0.65.Ejemplo

15

Page 17: Estadis c.sociales II

En una estación de esquí, para navidades, la experiencia indica que haytiempo soleado sólo el 15% de los días. Por otro lado, se ha calculado quecuando un día es soleado, hay una probabilidad del 20% de que el día posteriortambién lo sea. Calcular la probabilidad de que, en navidades, un fin de semanacompleto sea soleado.Solución: Llamemos S al suceso sábado soleado y D al suceso domingo

soleado. La única manera en que un fin de semana completo sea soleado es quelo sea en primer lugar el sábado, y que el domingo posterior también. Es decir:

P (S ∩D) = P (S)P (D|S) = 0.15 · 0.2 = 0.03.

Luego sólo el 3% de los fines de semana son soleados.

El primero de los teoremas que vamos a enunciar es una generalización dela probabilidad de la intersección de dos sucesos a la de un número cualquiera,pero finito, de ellos.Teorema (Ley multiplicativa)Sea A1, A1, . . . , An ⊂ E una colección de sucesos aleatorios, entonces

P (A1 ∩A2 ∩ . . . ∩An) = P (A1)P (A2|A1)P (A3|A1 ∩A2) · · ·P (An|A1 ∩A2 ∩ . . . ∩An−1).

Los siguientes teoremas nos dicen cómo calcular las probabilidades de sucesoscuando tenemos que el suceso seguro está descompuesto en una serie de sucesosincompatibles de los que conocemos su probabilidad. Para ello necesitamosintroducir un nuevo concepto: se dice que la colección A1,A1, . . . , An ⊂ E esuna partición si se verifica:

n[i=1

Ai = E

Ai ∩Aj = ∅,∀i 6= jTeorema de la Probabilidad totalSea A1, A1, . . . , An ⊂ E una partición. Entonces, ∀B ⊂ E, se verifica que

P (B) =nXi=1

P (B|Ai)P (Ai).

EjemploSe tienen dos urnas, y cada una de ellas contiene un número diferente de

bolas blancas y rojas:

• Primera urna, U1: 3 bolas blancas y 2 rojas;• Segunda urna, U2: 4 bolas blancas y 2 rojas.

16

Page 18: Estadis c.sociales II

Se realiza el siguiente experimento aleatorio: Se tira una moneda al aire ysi sale cara se elige una bola de la primera urna, y si sale cruz de la segunda.¿Cuál es la probabilidad de que salga una bola blanca?Solución: La situación que tenemos puede ser esquematizada como

3B 2R U1 P (U1) = 1/2 P (B|U1) = 3/5

4B 2R U2 P (U2) = 1/2 P (B|U2) = 4/6Como U1 y U2 forman un sistema incompatible y excluyente de sucesos (la

bola resultado debe provenir de una de esas dos urnas y de una sólo de ellas),el teorema de la probabilidad total permite afirmar entonces que

P (B) = P (B|U1) · P (U1) + P (B|U2) · P (U2) = 3

5· 12+4

6· 12=19

30.

Teorema de BayesSea A1, A1, . . . , An ⊂ E una partición. Sea B ⊂ E un suceso del que cono-

cemos las siguientes probabilidades: P (B|Ai) para todo i = 1, . . . n, entonces severifica, para todo j = 1, . . . n,

P (Aj |B) = P (B|Aj) · P (Aj)Pni=1 P (B|Ai) · P (Ai)

.

EjemploSe tienen tres urnas. Cada una de ellas contiene un número diferente de

bolas blancas y rojas:

• Primera urna, U1: 3 bolas blancas y 2 rojas;• Segunda urna, U2: 4 bolas blancas y 2 rojas;• Tercera urna, U3: 3 bolas rojas.Se realiza el siguiente experimento aleatorio: Alguien elige al azar y con la

misma probabilidad una de las tres urnas, y saca una bola.Si el resultado del experimento es que ha salido una bola blanca, ¿cuál es la

probabilidad de que provenga de la primera urna? Calcular lo mismo para lasotras dos urnas.Solución: Vamos a representar en un esquema los datos de que disponemos:

3B 2R U1 P (U1) = 1/3 P (B|U1) = 3/5

4B 2R U2 P (U2) = 1/3 P (B|U2) = 4/6

17

Page 19: Estadis c.sociales II

0B 3R U3 P (U3) = 1/3 P (B|U3) = 0

En este caso U1, U2 y U3 forman un sistema incompatible y excluyente desucesos (la bola resultado debe provenir de una de esas tres urnas y de una sólode ellas), por tanto es posible aplicar el teorema de Bayes:

P (U1|B) =P (B|U1) · P (U1)

P (B|U1) · P (U1) + P (B|U2) · P (U2) + P (B|U3) · P (U3) =

=35 · 13

35 · 13 + 4

6 · 13 + 0 · 13=9

19.

Con respecto a las demás urnas es lo mismo:

P (U2|B) =P (B|U2) · P (U2)

P (B|U1) · P (U1) + P (B|U2) · P (U2) + P (B|U3) · P (U3) =

=46 · 13

35 · 13 + 4

6 · 13 + 0 · 13=10

19.

P (U3|B) =P (B|U3) · P (U3)

P (B|U1) · P (U1) + P (B|U2) · P (U2) + P (B|U3) · P (U3) =

=0 · 13

35 · 13 + 4

6 · 13 + 0 · 13= 0.

EjemploTenemos una bolsa con 5 bolas con dos posibles colores, blanco y rojo. Se

necesita tener una idea de cuántas bolas blancas hay. Sea j tal número. Estepuede ser 0, 1, 2, 3, 4 ó 5. En ausencia de información suponemos que todos losvalores son igualmente probables, esto es,

P (0) = P (1) = · · · = P (5) = 1

6.

Podemos realizar un experimento informativo consistente en sacar una bola yobservar su color. En este experimento, si B designa sacar bola blanca, se tieneque

P (B|0) = 0 P (B|1) = 1/5 P (B|2) = 2/5 · · · P (B|5) = 1.

Se realiza el experimento y se obtiene bola blanca. Las probabilidades deinterés son P (j|B). Se tiene que

P (j|B) = P (j ∩B)P (B)

=P (B|j)P (j)Pi P (B|i)P (i)

.

18

Page 20: Estadis c.sociales II

Por ejemplo,

P (4|B) = 4/5 · 1/60 · 1/6 + 1/5 · 1/6 + · · ·+ 1 · 1/6 .

Se obtiene la siguiente tabla:

j 0 1 2 3 4 5P (j) 1/6 1/6 1/6 1/6 1/6 1/6P (j|B) 0 1/15 2/15 3/15 4/15 5/15

Así, la composición 5 pasa a ser la más probable.

A continuación, deseamos saber las probabilidades de sacar otra bola blanca,esto es, deseamos calcular P (B2|B1), si la extracción se hace con reemplazamien-to.En este ejemplo, si sabemos j (la composición de la bolsa), B1 no aporta

información para predecir B2, por lo que

P (B2|j ∩B1) = P (B2|j).

Por ser con reemplazamiento, P (B2|j) = P (B1|j), como antes, esto es,P (B2|j) = j

5 .Así,

P (B2|B1) = P (B2|0) · P (0|B1) + · · ·+ P (B2|5) · P (5|B1) == 0 · 0 + 1

5· 115+ · · ·+ 1 · 5

15=11

15.

Se obtiene fácilmente que

P (B2) =Xj

P (B2|j) · P (j) = 1

2.

Como

P (B2) 6= P (B2|B1),

B2 y B1 son sucesos dependientes, más aún, como P (B2|B1) > P (B2), estánrelacionados positivamente.

2.4 Ejercicios

1. Una urna contiene 12 bolas blancas y 8 negras. Si se sacan dos bolas alazar, ¿cuál es la probabilidad de que sean del mismo color?

19

Page 21: Estadis c.sociales II

2. Se extraen tres cartas de una baraja de 40 cartas.

(a) ¿Cuál es la probabilidad de que sean tres sotas?

(b) ¿Y de que sean un as, un dos y un tres?

(c) ¿Y de que salga un rey, seguido de un cinco y éste de un siete?

3. Se considera el experimento aleatorio ”lanzar dos veces un dado”. ¿Cuáles la probabilidad de obtener un número par en el segundo lanzamientocondicionado a obtener impar en el primero? Probar que estos dos sucesosson independientes.

4. Se tienen tres urnas de igual aspecto. En la primera hay 3 bolas blancas y4 negras; en la segunda hay 5 negras y en la tercera 2 blancas y 3 negras.Se desea saber:

(a) Si se extrae una bola de una urna, elegida al azar, ¿cuál es la proba-bilidad de que la bola extraída sea negra?

(b) Se ha extraído una bola negra de una de las urnas. ¿Cuál es laprobabilidad de que haya sido extraída de la segunda urna?

5. En un hospital especializado en enfermedades de torax, ingresan un 50%de enfermos con bronquitis, un 30% con neumonía y un 20% con gripe. Laprobabilidad de curación completa en cada una de dichas enfermedadeses, respectivamente, 0.7, 0.8 y 0.9. Un enfermo internado en el hospital hasido dado de alta completamente curado. Hallar la probabilidad de que elenfermo dado de alta hubiera ingresado con bronquitis.

6. La probabilidad de que un artículo provenga de una fábrica A1 es 0.7, yla probabilidad de que provenga de otra fábrica A2 es 0.3. Se sabe que lafábrica A1 produce un 4 por mil (40/00) de artículos defectuosos y la A2un 80/00.

(a) Se observa un artículo y se ve que está defectuoso. ¿Cuál es la prob-abilidad de que provenga de la fábrica A2?

(b) Se pide un artículo a una de las dos fábricas, elegida al azar. ¿Cuáles la probabilidad de que esté defectuoso?

7. En una población animal hay una epidemia. El 10% de los machos yel 18% de las hembras están enfermos. Se sabe además que hay doblenúmero de hembras que de machos y se pide:

(a) Elegido al azar un individuo de esa población, ¿cuál es la probabilidadde que esté enfermo?

(b) Un individuo de esa población se sabe que está enfermo, ¿qué prob-abilidad hay de que el citado individuo sea macho?

20

Page 22: Estadis c.sociales II

8. Un trasnochador disone de un llavero con tres llaves indistinguibles en laoscuridad, de las cuales sólo una abre la puerta de su casa. Para dar conla llave en cuestión sigue uno de los siguientes métodos:

PRIMER MÉTODO: Prueba las llaves una tras otra teniendo cuidado deno volver a usar la misma llave.

SEGUNDO MÉTODO: Prueba una llave y, si no sirve, agita el llavero yprueba otra vez (con el riesgo de volverla a usar).

(a) ¿Cuál es la probabilidad de que abra al tercer intento si usa el primermétodo?

(b) ¿Cuál es la probabilidad de que abra al tercer intento si usa el segundométodo?

(c) Además, se sabe que usa el segundo método cuando ha bebido unpoco más de la cuenta (lo que ocurre uno de cada tres días) y elprimero si está sobrio. Si se sabe que los dos primeros intentos hanfracasado, ¿cuál es la probabilidad de que esté borracho?

9. En cierto municipio, para ascender de barrendero a jefe de escoba hay unagran competencia. Se puede ascender por tres caminos: por oposición, porconcurso de méritos y por enchufe con el concejal delegado de limpiezapública.

La probabilidad de que un opositor alcance plaza es 0.25. El 78% de losconcursantes también consiguen plaza y todos los enchufados del concejalde limpieza consiguen el puesto.

Sabiendo que el 75% de los aspirantes a jefes de escoba son opositores, el20% concursantes y el 5% consiguen el enchufe, calcular:

(a) ¿Cuántos de los 300 jefes de escoba que hay en activo consiguieronel puesto por enchufe?

(b) La probabilidad de que un determinado jefe de escoba haya consegui-do el puesto por oposición.

21

Page 23: Estadis c.sociales II

Capítulo 3

Variables aleatorias

3.1 Distribución de una variable aleatoria

En este tema se introducen algunos resultados básicos sobre variables aleatoriasy se introducen las familias de distribuciones más relevantes para este curso. Enocasiones nos interesarán una o más transformaciones de los resultados de unexperimento aleatorio, lo que conduce al concepto de variable aleatoria.

EjemploNormalmente, los resultados posibles (espacio muestral E) de un experimen-

to aleatorio no son valores numéricos. Por ejemplo, si un experimento consisteen lanzar de modo ordenado tres monedas al aire, para observar el número decaras (C) y cruces (R) que se obtienen, el espacio muestral asociado a dichoexperimento aleatorio sería:

E = {CCC, CCR, CRC,CRR,RCC,RCR,RRC,RRR} .En Cálculo de Probabilidades resulta más fácil utilizar valores numéricos enlugar de trabajar directamente con los elementos de un espacio muestral comoel anterior. Así, se prefiere identificar los sucesos {CRR,RCR,RRC} con elvalor numérico 1 que representa el número de caras obtenidas al realizar elexperimento.De este modo, aparece el concepto de variable aleatoria unidimensional como

el de una función

X : E −→ Re −→ X(e)

que a cada suceso elemental e del espacio muestral E, le atribuye un úniconúmero real, X(e).

22

Page 24: Estadis c.sociales II

En el ejemplo anterior, se puede definir la variable aleatoria X ≡ número decaras, del siguiente modo:

X : E −→ R

X (CCR) = X (CRC) = X (RCC) = 2X (RRC) = X (RCR) = X (CRR) = 1X (RRR) = 0

ObservaciónLa variable X no recibe el calificativo de aleatoria por el hecho de que

atribuya de modo imprevisible un valor cualquiera a un elemento e ∈ E yaque este valor está definido de forma precisa (determinística). Lo que es aleato-rio, en realidad, es que al realizar el experimento, no sabemos qué elemento deE puede ocurrir.

En función de los valores que tome la variable, ésta puede ser clasificada endiscreta o continua del siguiente modo:

v.a. discreta: es aquella que sólo puede tomar un número finito o infinitonumerable de valores. Por ejemplo,

X : E −→ N

v.a. continua: es la que puede tomar un número infinito no numerable devalores.

X : E −→ R

ObservaciónSi sobre los elementos de E existe una distribución de probabilidad, ésta se

transmite a los valores que toma la variable X. Es decir, podemos calcular lasprobabilidades:

P [X = x] = P [{e ∈ E : X (e) = x}]P [X ∈ (a, b)] = P [{e ∈ E : X (e) ∈ (a, b)}]

En general, dada la v.a. X sobre el espacio E, asociado a un experimentoaleatorio, se define la probabilidad de que la variable pertenezca a cualquiersubconjunto A de la recta real como:

P (X ∈ A) = P {e ∈ E : X(e) ∈ A}

Vamos a estudiar los conceptos más importantes relacionados con la distribu-ción de probabilidad de una v.a., diferenciando entre los casos de v.a. discretay v.a. continua.

23

Page 25: Estadis c.sociales II

3.2 Variables aleatorias discretas

Dada una v.a. discreta X : E −→ N, f, se define su función de masa deprobabilidad , de modo que f(xi) es la probabilidad de que X tome ese valorconcreto:

f : R −→ [0, 1]

xi −→ f (xi) = P [X = xi] = P [{e, tal que X(e) = xi}]Si xi no es uno de los valores que puede tomar X, entonces f(xi) = 0. Larepresentación gráfica de la función de masa de probabilidad se realiza medianteun diagrama de barras análogo al de distribución de frecuencias relativas paravariables discretas en Estadística Descriptiva.Por ejemplo, si se considera el caso del lanzamiento de 3 monedas de forma

que cada una de ellas tenga probabilidad 1/2 de obtener el resultado de cara ocruz, se tiene que

f(3) = P [X = 3] = P [{CCC}] = 1

2· 12· 12=1

8

f(2) = P [X = 2] = P [{RCC, CCR, CRC}] = 1

8+1

8+1

8=3

8

f(1) = P [X = 1] = P [{RRC,RCR, CRR}] = 1

8+1

8+1

8=3

8

f(0) = P [X = 0] = P [{RRR}] = 1

2· 12· 12=1

8

ObservaciónObsérvese que X está definido sobre el espacio muestral de sucesos E, mien-

tras que f lo está sobre el espacio de números reales R.ProposiciónSi x1, x2, . . . xk son todos los valores que puede tomar la v.a. X, entonces la

suma de las probabilidades de todos los posibles valores de la variable es 1.

kXi=1

f(xi) =kXi=1

P [X = xi] = 1

y además todas las probabilidades son no negativas:

f(xi) ≥ 0

∀i = 1, . . . , k

Otro concepto importante es el de función de distribución de una variablealeatoria discreta, F , que se define de modo que si xi ∈ R, F (xi) es igual a laprobabilidad de que X tome un valor inferior o igual a xi:

F : R −→ [0, 1]

xi −→ F (xi) = P [X ≤ xi] = P [{e, tal que X(e) ≤ xi}]

24

Page 26: Estadis c.sociales II

Volviendo al ejemplo de las tres monedas, se tiene que

F (0) = P [X ≤ 0] = P [X = 0] = f(0) =1

8

F (1) = P [X ≤ 1] = f(0) + f(1) = 1

8+3

8=4

8

F (2) = P [X ≤ 2] = f(0) + f(1) + f(2) = 1

8+3

8+3

8=7

8

F (3) = P [X ≤ 3] = f(0) + f(1) + f(2) + f(3) = 1

8+3

8+3

8+1

8=8

8= 1

La función de distribución está definida para toda la recta real, incluidos losvalores no admisibles de la variable aleatoria. Por ejemplo,

F (−1) = P [X ≤ −1] = P [∅] = 0

Figura: Función de masa de probabilidad a la izquierda, y función de distribución ala derecha de una v.a. discreta

ProposiciónLa función de distribución F , es una función monótona no decreciente, es

decir,

x1 < x2 =⇒ F (x1) ≤ F (x2)Además, es continua a la derecha

limx→a+

F (x) = F (a)

y

F (−∞) = limxi→−∞

F (xi) = 0

F (+∞) = limxi→+∞

F (xi) = 1

Nota: De lo anterior se deduce que

P (X > x) = 1− F (x)P (x1 < X ≤ x2) = F (x2)− F (x1).

Ejemplos

25

Page 27: Estadis c.sociales II

• Sea la funciónf(x) =

x− 25,

con soporte {1, 2, 3, 4} . No es una función de masa de probabilidad porque,por ejemplo, f(1) = −1/5 < 0.

• Sea la función

h(x) =x2

25,

con soporte {0, 1, 2, 3, 4} . No es una función de masa de probabilidadporque

P4i=0 h(i) > 1.

• Sea la funcióng(x) =

1

5,

con soporte {0, 1, 2, 3, 4} . Es una función de masa de probabilidad porqueg(i) ≥ 0, i = 0, . . . 4 y

P4i=0 g(i) = 1. La correspondiente función de

distribución tiene como gráfica:

26

Page 28: Estadis c.sociales II

Momentos de una variable aleatoria discretaEn ocasiones se está interesado en resumir una variable aleatoria, típicamente

a través de sus momentos. Los principales son:- La esperanza o media de la variable aleatoria X

E [X] = µ =Xi

xif(xi),

que constituye una medida de localización.

Se puede observar en esta medida, así como en las que siguen, el paralelismocon los momentos muestrales, aunque no se deben confundir.- La varianza

V ar[X] = σ2 =Xi

(xi − µ)2 f(xi),

que constituye una medida de dispersión. Alternativamente, se tiene que

σ2 =Xi

(xi − µ)2 f(xi) =Xi

¡x2i − 2µxi + µ2

¢f(xi) =

=Xi

x2i f(xi)− µ2.

- La desviación típica

σ =

sXi

(xi − µ)2 f(xi).

EjemploPara la v.a. con soporte {0, 1, 2, 3, 4} y función de masa de probabilidad

g(x) = 15 , se tiene

µ =0+ 1 + 2 + 3 + 4

5= 2

σ2 =Xi

x2i f(xi)− µ2 =4Xi=0

i21

5− 4 = 30

5− 4 = 2

σ =√2,

3.3 Variables aleatorias continuasSe presentan ahora los conceptos básicos sobre variables aleatorias continuas.Se repiten las mismas ideas que en el caso discreto, con funciones de densidaden lugar de funciones de masa e integrales en lugar de sumas.

27

Page 29: Estadis c.sociales II

En numerosos experimentos, los resultados podrán ser valores en un conjuntocontinuo; por ejemplo, si estamos midiendo tiempos de espera en la cola de uncine, las mediciones serían valores en el intervalo (0,∞] .

Es necesario introducir un nuevo concepto que sustituya en v.a. continuas,al de función de masa de una v.a. discreta. Este concepto es el de función dedensidad de una v.a. continua, que se define como una función f : R −→ R, nonegativa sobre la recta real, que verifica las dos propiedades siguientes:

f(x) ≥ 0,Z +∞

−∞f(x)dx = 1,

P (X ∈ A) =

ZA

f(x)dx.

Así, dados a < b, se tiene que

P [a ≤ X ≤ b] =Z b

a

f(x)dx.

Se puede observar que la probabilidad de un punto es nula:

P [X = a] = P [a ≤ X ≤ a] =Z a

a

f(x)dx = 0,

y por ello, calcular la probabilidad de un intervalo no afecta nada el que éstesea abierto o cerrado por cualquiera de sus extremos, pues estos son puntos ypor tanto de probabilidad nula:

P [a ≤ X ≤ b] = P [a ≤ X < b] = P [a < X ≤ b] = P [a < X < b]

EjemploDeterminar k para que la función

f(x) =

½0 x ≤ 0

kxe−4x2

x > 0

sea una función de densidad.Solución:En primer lugar, debe ser k ≥ 0. Además,Z ∞

−∞f(x)dx =

Z ∞

0

kxe−4x2

dx = −k8

Z ∞

0

−8xe−4x2dx = −k8

he−4x

2i∞0=k

8= 1,

por lo que k = 8. ¥

28

Page 30: Estadis c.sociales II

Función de distribuciónLa función de distribución se define de manera que dado x ∈ R , F (x) es la

probabilidad de que X sea menor o igual que x, es decir

F (x) = P (X ≤ x) =Z x

−∞f(t)dt.

Se verifican las propiedades ya mencionadas en el caso discreto:

P [a < X ≤ b] = F (b)− F (a)

F es monótona no decreciente.

F (−∞) = 0, F (+∞) = 1

F es continua por la derecha.

Además,

dF (x)

dx= f(x),

si existe la derivada.

EjemploSea la función de densidad

f(x) =

½15 x ∈ [0, 5]0 resto

Resulta que

F (x) =

0 x < 0x5 0 ≤ x ≤ 51 x > 5

cuya gráfica es

29

Page 31: Estadis c.sociales II

Para 0 ≤ a ≤ b ≤ 5, queda

P [a ≤ X ≤ b] = F (b)− F (a) = b− a5. ¥

EjemploDada la función de densidad

f(x) =

½2e−2x x > 00 resto

La función de distribución es

F (x) =

½0 x ≤ 01− e−2x x > 0

30

Page 32: Estadis c.sociales II

Calcular la probabilidad de obtener un valor entre 1 y 3. Calcular la proba-bilidad de obtener un valor mayor que 0.5. Resulta

P (1 < X ≤ 3) =

Z 3

1

2e−2tdt =£−e−2t¤3

1= e−2 − e−6 = 0.133

P (X ≥ 0.5) =

Z ∞

0.5

2e−2tdt =£−e−2t¤∞

0.5= e−1 = 0.368. ¥

MomentosComo en el caso discreto, en ocasiones se está interesado en resumir la dis-

tribución de X a través de sus momentos.La esperanza de una variable X es

µ =

Z ∞

−∞xf(x)dx

y la varianza es

σ2 =

Z ∞

−∞(x− µ)2 f(x)dx =

Z ∞

−∞x2f(x)dx− µ2.

EjemploPara la v.a. del ejemplo anterior se tiene que

µ =

Z ∞

−∞xf(x)dx =

Z ∞

0

x2e−2xdx =1

2,

σ2 =

Z ∞

−∞x22e−2xdx− 1

4=1

4. ¥

31

Page 33: Estadis c.sociales II

3.4 Ejercicios

1. Una compañía de refrescos anuncia premios en las chapas asegurando queen cada 1000 chapas hay 500 con ”inténtalo otra vez”, 300 con premio de0.3 euros, 150 con premio de 0.6 euros, 40 con premio de 3 euros y 10 conpremio de 6 euros. Un individuo, al que no le gusta el refresco, decidecomprar una botella cuyo coste es de 0.6 euros. Caracterizar su gananciamediante una variable aleatoria. ¿Es razonable su decisión? Calcular suprobabilidad de perder dinero.

2. Sea X una variable aleatoria con función de densidad

f(x) =

x si 0 ≤ x < 1k − x si 1 ≤ x ≤ 20 en el resto

(a) Hallar k. Comprobarlo gráficamente.

(b) Hallar la función de distribución, E(X) y V (X).

3. Sea X una variable aleatoria continua con función de densidad

f(x) =

½k(1 + x2) si x ∈ (0, 3)

0 si x /∈ (0, 3)

Se pide:

(a) Hallar la constante k y la función de distribución.

(b) Probabilidad de que X esté comprendida entre 1 y 2.

(c) Probabilidad de que X sea menor que 1.

(d) Sabiendo que X es mayor que 1, probabilidad de que sea menor que2.

4. La función de densidad de una variable aleatoria continua es:

f(x) =ax2 + b si x ∈ (0, 2)0 si x /∈ (0, 2)

Determinar a y b, sabiendo que P (1/2 < X ≤ 1) = 0.1357.5. De una estación parte un tren cada 20 minutos. Un viajero llega deimproviso. Hallar:

(a) La función de distribución de la variable ”tiempo de espera”.

32

Page 34: Estadis c.sociales II

(b) La probabilidad de que espere al tren menos de 7 minutos.

(c) Esperanza y varianza de la variable aleatoria ”tiempo de espera”.

(d) Probabilidad de que espere exactamente 12 minutos.

6. La proporción de cierto aditivo en la gasolina determina su peso específico,lo que, a su vez, determina el precio. Supongamos que en la producción degasolina la proporción de aditivo es una variable aleatoria X con funciónde densidad:

f(x) =

½6x(1− x) si 0 ≤ x ≤ 1

0 en el resto

Si X < 0.5 tendremos gasolina del tipo 1 a 0.66 euros el litro, si 0.5 ≤X ≤ 0.8, tendremos gasolina del tipo 2 a 0.72 euros el litro; y, si X > 0.8,tendremos gasolina del tipo 3 a 0.79 euros el litro.

(a) Representar gráficamente la densidad y calcular la función de dis-tribución de X.

(b) Calcular los porcentajes de producción de cada tipo de gasolina.

(c) Calcular el precio medio por litro.

7. El tiempo de vida (en minutos) de un determinado virus, es una variablealeatoria con función de densidad:

(a)

f(x) =

½0.001 exp(−0.001x) si x > 0

0 en el resto

(b) Calcular la probabilidad de que el tiempo de vida sea superior a 100minutos e inferior a 1000 minutos.

(c) Observamos un virus a los 500 minutos y comprobamos que ha muer-to. ¿Cuál es la probabilidad de que estuviese vivo a los 100 minutos?

33

Page 35: Estadis c.sociales II

Capítulo 4

Variables aleatoriasdiscretas

4.1 El modelo de Bernoulli

Consiste en realizar un experimento aleatorio una sola vez y observar si ciertosuceso ocurre o no, siendo p la probabilidad de éxito y q = (1− p) de fracaso .En realidad se trata de una variable que únicamente puede tomar dos valores.Podríamos, por tanto, definir este experimento mediante una v.a. discreta Xque toma los valores X = 0 si el suceso no ocurre, y X = 1 en caso contrario,denotándose X ∼ Ber(p) si

X =

0 −→ q = (1− p) = P (X = 0)

1 −→ p = P (X = 1)

Por ejemplo, se lanza una moneda y se considera la v.a. X = numero de carasobtenidas, X = 1 con p = 1

2 y X = 0 con q = 12 .

Para una v.a. de Bernoulli, su función de masa de probabilidad es:

P (X = 1) = p

P (X = 0) = 1− p,y 0 en el resto.Su función de distribución es

F (x) =

0 si x < 0q si 0 ≤ x < 11 si x ≥ 1

34

Page 36: Estadis c.sociales II

Los principales momentos de la X son

E [X] = 0 · P (X = 0) + 1 · P (X = 1) = p

E£X2¤= 02 · P (X = 0) + 12 · P (X = 1) = p

V ar [X] = p− p2 = p (1− p) = pq.

4.2 La distribución binomial

Se utiliza la distribución binomial para modelizar el número de veces que se da unresultado al realizar varias pruebas idénticas e independientes de un experimentocon dos resultados posibles.Las hipótesis específicas que se hacen son:

• Se consideran n repeticiones independientes de un experimento.• El experimento tiene dos resultados posibles: éxito o fracaso.• La probabilidad p de éxito es la misma en cada repetición (o ensayo).

La variable X de interés es el número de éxitos obtenidos en esas n pruebas.Entonces, se dice que X tiene distribución binomial de parámetros n y p,

y se escribe como X ∼ Bin (n, p) , siendo la distribución

P (X = x) =

µn

x

¶px (1− p)n−x .

EjemploHay una probabilidad de 0.05 de que en un colegio de primaria un alumno

caiga enfermo de gripe en un día durante una epidemia de gripe. Un grupo deun centro escolar tiene 16 alumnos. ¿Cuál es la probabilidad de que a lo sumocaigan 2 alumnos enfermos de gripe? ¿y que al menos caigan 4?Solución:Si X designa el número de enfermos de gripe en un día, entonces X ∼

Bin (16, 0.05) .Nos piden primero

P (X ≤ 2) =µ16

0

¶0.0500.9516 +

µ16

1

¶0.0510.9515 +

µ16

2

¶0.0520.9514 = 0. 957 06

Después,

35

Page 37: Estadis c.sociales II

P (X ≥ 4) = 1− P (X ≤ 3) =

1−µ16

0

¶0.0500.9516 −

µ16

1

¶0.0510.9515

−µ16

2

¶0.0520.9514 −

µ16

3

¶0.0530.9513 = 0.00 701

EjemploLa agencia tributaria anuncia que sólo el 10% de las declaraciones de hacien-

da anuales requieren una inspección. De las 20 declaraciones de los empleados deuna pequeña empresa, 5 de ellas fueron inspeccionadas el año pasado. ¿Apoyanestos datos el anuncio de la agencia tributaria?Solución:Sea X una v.a. con distribución Bin(20, 0.1). Se calcula la probabilidad de

que sean inspecconadas 5 o más declaracioness:

P (X ≥ 5) = 1−4Xx=0

µ20

x

¶0.1x0.920−x = 0.432

Por lo que por ser una probabilidad muy pequeña, se pone en duda el anunciode la agencia tributaria.

ProposiciónLa media y la varianza de una Bin(n, p) es

E [X] = µ = np

V ar [X] = σ2 = np(1− p).EjemploPara X ∼ Bin ¡n = 16, p = 1

2

¢resulta

µ = 16 · 12= 8,

σ2 = 16 · 12· 12= 4.

EjemploCalcular la esperanza y la varianza del número de caras obtenidas en 40000

tiradas de una moneda equilibrada.Solución:Si X designa el número de caras en 40000 tiradas de la moneda equilibrada,

tenemos que X ∼ Bin ¡40000, 12¢ .E [X] = 40000 · 1

2= 20000

V ar [X] = σ2 = 40000 · 12· 12= 10000

σ =√10000 = 100.

36

Page 38: Estadis c.sociales II

Es interesante remarcar la forma de la distribución binomial en función dep.

• Cuando p = 0.5 la distribución es simétrica

• Cuando p > 0.5 la distribución es asimétrica negativa

• Cuando p < 0.5 la distribución es asimétrica positiva

37

Page 39: Estadis c.sociales II

4.3 La distribución geométrica

Seguimos considerando la situación experimental anterior en la que se realizanexperimentos idénticos e independientes con dos posibles resultados. Ahora,en lugar de estar interesados por el número de éxitos en n ensayos, estamosinteresados en predecir el instante en el que se produce el primer éxito.

DefiniciónSe dice que una variable aleatoria X tiene una distribución geométrica de

parámetro p, X ∼ Ge(p) si

P (X = k) = p (1− p)k−1 ,

donde k = 1, 2, 3, 4, . . .Observación: Claramente, si el primer éxito se produce en el instante k,

deben producirse (k − 1) fracasos.EjemploSupongamos que la probabilidad de que un ordenador salga mal en una

línea de producción es de 0.05. Se desea saber la probabilidad de que el primerordenador defectuoso sea el sexto.Solución:Se tiene que X ∼ Ge(p = 0.05) y se quiere calcular

P (X = 6) = 0.05 (1− 0.05)6−1 = 0.039.

ProposiciónPara X ∼ Ge(p), E [X] = 1

p , V ar[X] =1p2 .

4.4 La distribución de Poisson

Como primera motivación, estamos interesados en contar el número de éxitosen n pruebas del tipo éxito o fracaso cuando n es grande y el suceso es raro(esto es, la probabilidad de éxito es pequeña).Específicamente, supongamos que X ∼ Bin(n, p), esto es,

P (X = x) =

µn

x

¶px (1− p)n−x

con n −→∞, np = λ, esto es, p = λn −→ 0. Sustituyendo, se tiene

P (X = x) −→n→∞ e

−λλx

x!,

x = 0, 1, 2, . . .

38

Page 40: Estadis c.sociales II

ProposiciónSe dice que una variable aleatoria X tiene una distribución de Poisson de

parámetro λ, X ∼ Po(λ) si

P (X = k) = e−λλx

x!,

donde k = 0, 1, 2, . . .

ProposiciónSi X ∼ Po(λ) entonces

E [X] = λ

V ar [X] = λ

EjemploEl 5% de los alumnos de una asignatura suspende. Calcular la probabilidad

de que 2 de 100 alumnos suspendan el examen de dicha asignatura.Solución:SiX designa el número de suspensos de 100, se tiene queX ∼ Bin (100, 0.05) .

Se pide

P (X = 2) =

µ100

2

¶0.052 · 0.9598 = 0.081

Alternativamente, como n es grande y p es pequeño, y aplicamos la aproxi-mación de Poisson, se tiene que λ = np = 100 · 0.05 = 5, y

P (X = 2) ≈ e−5 52

2!= 0.084

Observación:La aproximación de la distribución de Poisson a la binomial es buena cuando

n ≥ 30 y p ≤ 0.1.EjemploUna empresa inmobiliaria posee en su base de datos 3840 viviendas en

Madrid. La probabilidad de que uno de ellos no se venda en un año es de1/1200. Calcular la probabilidad de que no se vendan 0, 1, 2, . . . en un año.Solución:Empleamos la aproximación de la Poisson a la binomial con

λ = 38401

1200= 3.2

Así,

P (X = k) ≈ e−3.2 3.2x

x!,

39

Page 41: Estadis c.sociales II

y, por ejemplo,

P (X = 0) ≈ 0.041

P (X = 1) ≈ 0.13

P (X = 2) ≈ 0.209

· · ·

4.5 Ejercicios

1. En un puesto de feria se ofrece la posibilidad de lanzar a ciegas un dardoa unos globos. Si se consigue reventar un globo, se recibe un premio iguala una cantidad oculta tras el globo. Supongamos que la probabilidad deacertar con algún globo es 1/3.

Los premios se distribuyen de la siguiente manera:

• 40% de premios de 0.6 euros

• 30% de premios de 1.20 euros

• 20% de premios de 3 euros

• 10% de premios de 12 euros.

Si cada lanzamiento cuesta 0.6 euros, ¿cuál es la ganancia esperada deldueño del puesto en cada lanzamiento.

2. Suponiendo que la probabilidad de que un niño que nace sea varón es0.51, hallar la probabilidad de que una familia de 6 hijos tenga:

(a) Por lo menos, una niña.

(b) Por lo menos, un niño.

(c) Por lo menos, dos niños y una niña.

3. Dos personas juegan a cara o cruz. La partida termina cuando han salido,al menos, tres caras y tres cruces. Hallar la probabilidad de que el juegono haya terminado habiéndose hecho 10 tiradas.

4. Una compañía de seguros con 10000 asegurados halla que el 0.005% de lapoblación fallece cada año de un cierto tipo de accidente.

(a) Hallar la probabilidad de que la compañía tenga que pagar a más detres asegurados, por dicho accidente, en un año determinado.

(b) ¿Cuál es el número medio de accidentes por año?

40

Page 42: Estadis c.sociales II

5. La probabilidad de que un individuo tenga una reacción alérgica al in-yectarle un suero es 0.001. Hallar la probabilidad de que, entre 2000individuos, tengan reacción alérgica:

(a) Exactamente 3.

(b) Más de dos.

6. El número de erratas por página de un libro se supone que sigue unadistribución de Poisson. En una muestra de 95 páginas se han observadolas siguientes frecuencias:

Node erratas 0 1 2 3 4 5Frecuencia 40 30 15 7 2 1

Hallar la probabilidad de que en una página tomada al azar haya algunaerrata.

7. Un pájaro de cierta especie come mariposas de una población muy grande.Estas mariposas pueden comer, a su vez, de una planta venenosa, demanera que si el pájaro come una mariposa envenenada, deja de comermariposas ese día. Suponiendo que el 40% de la población de mariposascome de la planta venenosa, hallar el número medio de mariposas comidasen un día por el pájaro.

8. Un ledidopterista está interesado en los ejemplares de una clase de mari-posas que constituyen el 15% de todas las mariposas de la zona. Hallarla probabilidad de que tenga que cazar 10 mariposas de las que no leinteresan antes de encontrar un ejemplar de la clase deseada.

9. En un examen se plantean 10 cuestiones a las que debe responderse ver-dadero o falso. Un alumnomaprobará el examen si, al menos, 7 respuestasson acertadas. ¿Qué probabilidad tiene de aprobar un estudiante queresponde todo al azar? ¿Y uno que sabe el 30% de la asignatura?

41

Page 43: Estadis c.sociales II

Capítulo 5

Variables aleatoriascontinuas

5.1 La distribución uniforme

DefiniciónUna v.a. tiene distribución uniforme en (a, b) (y se representa como X ∼

U (a, b) ) si su función de densidad es

f(x) =

1

b− a a < x < b

0 resto

42

Page 44: Estadis c.sociales II

Su función de distribución

F (x) =

0 x ≤ ax−ab−a a < x < b

1 x ≥ b

Con esta ley de probabilidad, la probabilidad de que al hacer un experimentoaleatorio el valor de X esté comprendido en un cierto subintervalo de (a, b)depende únicamente de la longitud del mismo, no de su posición.Sus momentos son

µ =a+ b

2,

σ2 =(b− a)212

.

43

Page 45: Estadis c.sociales II

EjemploSe considera el experimento conocido como rueda de la fortuna. Se deja girar

una aguja hasta que se para y se mide el ángulo X que forma con el eje vertical(X ∈ [0, 2π]) . Se tiene que X ∼ U [0, 2π] .

E (X) =0 + 2π

2= π

V ar (X) =(0 + 2π)2

12=π2

3. ¥

5.2 La distribución exponencial

Esta ley de distribución describe procesos en los que interesa saber el tiempohasta que ocurre determinado evento.DefiniciónUna v.a. tiene distribución exponencial de parámetro α (y se representa

como X ∼ Exp (α) ), si su función de densidad es

f(x|α) =½αe−αx para x > 00 resto

con α > 0.

44

Page 46: Estadis c.sociales II

Se comprueba fácilmente que los momentos de la exponencial son

µ =1

α

V ar (X) =1

α2

y que su función de distribución es

F (x) =

½0 x ≤ 01− e−αx para x > 0

5.3 La distribución normal

La distribución normal ocupa un lugar central en la Estadística. Su origen estáen el descubrimiento de regularidades en los errores de medición por parte delmatemático Gauss: los patrones que se observan se aproximan por la denomi-nada curva normal de errores.Esta distribución tendrá importancia por tres razones básicas:

• Estaremos interesados en mediciones de diversas magnitudes, sometidas aerrores que, típicamente, modelizaremos como una distribución normal.

• Por sus propiedades estadísticas y probabilísticas, los cálculos de interésde carácter estadístico son relativamente sencillos.

• El Teorema Central del Límite nos asegura que, para muestras grandesy bajo condiciones apropiadas, muchas funciones de las observaciones seaproximan, en distribución, mediante la normal

DefiniciónUna v.a. tiene distribución normal de parámetros µ y σ (y se representa

como X ∼ N (µ,σ) ), si su función de densidad es

f(x|µ,σ) = 1√2πσ

exp

Ã−(x− µ)

2

2σ2

!

donde −∞ < x <∞.

45

Page 47: Estadis c.sociales II

Se comprueba fácilmente que

E (X) = µ

V ar (X) = σ2,

esto es, el parámetro µ es la media y σ2 es la varianza. Además la distribuciónes simétrica (respecto de µ) .Se considera ahora, específicamente, la denominada distribución z normal

estándar, con µ = 0 y σ = 1, es decir,

f(z) =1√2πexp

µ−z

2

2

¶,

donde −∞ < z <∞.Su función de distribución es

1− α = P (Z ≤ zα) =Z zα

−∞

1√2πe−

t2

2 dt.

No es posible, sin embargo, la determinación de esta integral en forma conc-reta. Dada su importancia se dispone de tablas que permiten calcular α paracualquier valor de interés.La tabla incluye α para algunos valores zα ≥ 0; por ejemplo, si deseamos cal-

cular P (Z ≤ 1.16) vamos a la fila 1.1, columna 0.06 y se ve que P (Z ≤ 1.16) =1− P (Z > 1.16) = 1− 0.1230 = 0.8770.Si queremos calcular P (Z ≤ 4.5) , tenemos que P (Z ≤ 4) = 1−0.0000317 =

0.9999683, P (Z ≤ 5) = 1 − 0.000000287 = 0.999999713 y se hace, entonces,P (Z ≤ 4.5) = 0.9999840065. ¥

46

Page 48: Estadis c.sociales II

En particular, P (Z ≤ −z) = P (Z ≥ z) .Así, recordando que

P (a < Z ≤ b) = P (Z ≤ b)− P (Z ≤ a) = P (Z > a)− P (Z > b)se pueden calcular prácticamente todas las probabilidades de interés para ladistribución normal.Ejemplos

P (z ∈ [0.87, 1.28]) = P (Z > 0.87)− P (Z > 1.28) = 0.1922− 0.1003 = 0.0919P (z ∈ [−0.34, 0.62]) = P (Z > −0.34)− P (Z > 0.62) = 1− P (Z > 0.34)− P (Z > 0.62) =1− 0.3669− 0.2676 = 0.3655

P (Z ≥ 0.85) = 0.1977

P (Z ≥ −0.65) = 1− P (Z ≥ 0.65) = 1− 0.2578 = 0.7422. ¥

Una operación de búsqueda inversa nos permite hallar los percentiles de lanormal estándar. Usualmente se designa mediante zα al valor tal que existe unaprobabilidad α de que Z sea mayor, esto es, P (Z ≥ zα) = α. Para ello, se miraen la tabla la entrada α y con su fila y su columna determinamos zα.

EjemploSe calcula z0.01. Se tiene que P (Z ≥ 2.32) = 0.0102 que se corresponde con

la fila 2.3, columna 0.03, esto es, z0.01 ≈ 2.33.Se calcula z0.05. Se tiene en la tabla que que P (Z ≥ 1.64) = 0.0505, por lo

que z0.05 ≈ 1.645. ¥

Para calcular probabilidades de distribuciones normales no estándar, se usael hecho de que si X ∼ N (µ,σ) , entonces,

Z =X − µσ

∼ N (0, 1) .

Así, si X ∼ N (µ,σ) , nos bastará con hacer

P (a ≤ X ≤ b) = P

µa− µσ

≤ X − µσ

≤ b− µσ

¶=

P

µZ ≥ a− µ

σ

¶− P

µZ ≥ b− µ

σ

¶.

EjemploEl tiempo en minutos que necesita una persona en ser atendido en una

ventanilla sigue una distribución normal con media µ = 4.35 horas y σ = 0.59horas. Calcular las probabilidades de que dicho tiempo esté entre 4.00 y 5.00horas. Lo mismo que sea mayor que 5.50.

47

Page 49: Estadis c.sociales II

Solución:

P (X ∈ [4, 5]) = P

µX − 4.350.59

∈·4− 4.350.59

,5− 4.350.59

¸¶=

= P

µZ ≥ 4− 4.35

0.59

¶− P

µZ ≥ 5− 4.35

0.59

¶= P (Z ≥ −0.59)− P (Z ≥ 1.10) =

= 1− P (Z ≥ 0.59)− P (Z ≥ 1.10) = 1− 0.2776− 0.1357 = 0.5867.por otro lado,

P (X ≥ 5.5) = P

µX − 4.350.59

≥ 5.5− 4.350.59

¶=

= P (Z ≥ 0.95) = 0.1711. ¥

Como se ha indicado, una de las propiedades importantes de la normal esque aproxima, en cierto sentido, muchas otras distribuciones. A continuaciónse presenta un ejemplo, sencillo de aplicar, para dar una idea de este tipo deresultados.

EjemploSuponemos que deseamos aproximar la binomial cuando n es grande y p está

entre 0.1 y 0.9, esto es, no podemos emplear la aproximación de Poisson. Ental caso, si n ≥ 30 y 0.1 < p < 0.9, podemos emplear la aproximación normalque indica que si X ∼ Bin (n, p) y definimos

Z =X − nppnp (1− p) ,

entonces, para n suficientemente grande,

F (z) 'Z z

−∞

1√2πe−

t2

2 dt.

EjemploSupongamos que el 20% de los artículos de una planta de producción son

defectuosos. Deseamos calcular la probabilidad de que en un lote de 100 artículosinspeccionados al azar,(i) A lo sumo haya 15 defectuosos(ii) Exactamente haya 15 defectuosos.Solución:Tenemos X ∼ Bin (100, 0.2) , entonces,

µ = 100 · 0.2 = 20σ =

√100 · 0.2 · 0.8 = 4.

48

Page 50: Estadis c.sociales II

La probabilidad pedida es aproximadamente igual a

P

µZ ≤ 15.5− 20

4

¶= P (Z ≤ −1.13) = P (Z > 1.13) = 0.1292.

Por otro lado,

P

µZ ≤ 15.5− 20

4

¶− P

µZ ≤ 14.5− 20

4

¶= P (Z ≤ −1.13)− P (Z ≤ −1.38)= P (Z > 1.13)− P (Z > 1.38) = 0.1292− 0.0838= 0.0454. ¥

5.4 Ejercicios

1. El coeficiente de inteligencia es una variable aleatoria que se distribuyesegún una N(100, 16). Calcular:

(a) La probabilidad de que un individuo elegido al azar tenga un coefi-ciente superior a 120.

(b) Suponiendo que un individuo con estudios universitarios debe tenerun coeficiente superior a 110, hallar la probabilidad de que tenga uncoeficiente superior a 120.

2. Lanzamos una moneda 400 veces.

(a) Hallar la probabilidad de que el número de caras esté comprendidoentre 160 y 190.

(b) Hallar el intervalo (a, b) centrado en 200, tal que la probabilidad deque el número de caras obtenido esté en dicho intervalo sea 0.95.

3. Cierto individuo valora como factor decisivo para la compra de un coche elconsumo de gasolina. Debe decidir entre dos modelos A y B. El fabricantede A afirma que su consumo sigue una distribución N(8, 5) (en litros/100Km.), mientras que el de B dice que es N(8, 3). Hallar la probabilidad deque ambos coches consuman más de 9 litros.

4. Un botánico ha observado que la anchura, X, de las hojas del álamo sigueuna distribución normal con media 6 cm. y que el 90% de las hojas tieneuna anchura inferior a 7.5 cm. Hallar la desviación típica. Hallar laprobabilidad de que una hoja mida más de 8 cm.

5. Se supone que el número de bacterias por mm3 de agua en un estanquees una variable aleatoria X con distribución de Poisson con parámetroλ = 0.5.

49

Page 51: Estadis c.sociales II

(a) ¿Cuál es la probabilidad de que en un mm3 de agua del estanque nohaya ninguna bacteria?

(b) En 40 tubos de ensayo se toman muestras de agua del estanque (1mm3 de agua en cada tubo). ¿Qué distribución sigue la variablealeatoria Y = ”node tubos de ensayo, entre los 40, que no contienenbacterias”?. Calcular, aproximadamente, P (Y ≥ 20).

(c) Si sabemos que en un tubo hay bacterias, ¿cuál es la probabilidad deque haya menos de tres?

6. Un canal de comunicación recibe impulsos independientes a razón de 200impulsos por microsegundo. La probabilidad de un error de transmisión esde 0.001 para cada impulso. Calcular las probabilidades de los siguientessucesos:

(a) No hay ningún error en un microsegundo

(b) Hay exactamente un error en un microsegundo

(c) Hay al menos un error en un microsegundo

(d) Hay exactamente dos errores en un microsegundo

7. Un tren de circulación diaria se retrasa, independientemente de un día aotro, un tiempo aleatorio con distribución exponencial de parámetro 0.25(el tiempo se mide en minutos). Calcular la probabilidad de que, a lo largode un año, el tren se retrase 6 o más minutos en más de 50 ocasiones.

8. Un zoólogo estudia una cierta especie de ratones de campo. Para ellocaptura ejemplares de una población grande en la que el porcentaje dedicha especie es 100p%.

(a) Si p = 0.3, hallar la probabilidad de que en 6 ejemplares capturadoshaya al menos 2 de los que le interesan.

(b) Si p = 0.05, hallar la probabilidad de que en 200 ejemplares captura-dos haya exactamente 3 de los que le interesan.

(c) Si p = 0.4, hallar la probabilidad de que en 200 ejemplares capturadoshaya entre 75 y 110 de los que le interesan.

(d) ¿Cuál es el número medio de ejemplares que tendrá que capturarpara encontrar uno de la especie que le interesa, si p = 0.2?

9. En una fábrica de turrón, la cantidad de almendra de una tableta deter-mina su calidad:

• Calidad normal: menos de 180 gr. de almendra• Calidad extra: entre 180 gr. y 200 gr. de almendra• Calidad superior: más de 200 gr. de almendra

50

Page 52: Estadis c.sociales II

Admitiremos que la cantidad de almendra por tableta es una variablealeatoria con distribución N(µ,σ). Además, sabemos que el 45% de lastabletas son de calidad superior y el 15% de calidad normal. Calcular:

(a) Valor de µ

(b) Valor de σ

(c) Probabilidad de que una tableta elegida al azar tenga entre 185 gr.y 205 gr. de almendra

(d) Probabilidad de que una tableta elegida al azar entre las de calidadsuperior, tenga una cantidad de almendra inferior a 208 gr.

(e) Elegimos 150 tabletas al azar (independientemente unas de otras)¿Cuál es la probabilidad de que al menos 2 tengan una cantidad dealmendra inferior a 158 gr.?

51