marclan/pye2010ipa/notas de probabilidad, fdeo.pdf · comentarios y agradecimientos: estas notas...

Introducción a la

Probabilidad

Nivel Terciario

Federico De Olivera Lamas

Comentarios y agradecimientos:

Estas notas fueron realizadas durante el dictado del curso 2007 de probabilidad

y estad́ıstica de IPA. Abarcan los temas correspondientes a probabilidad, no a

estad́ıstica cosa que aún tengo en el debe.

Debo notar que este curso no se ubica en la posición deseada dentro de la

carrera, ya que se dicta conjuntamente con Análisis II (donde se estudia varias

variables) mientras que debeŕıa ser Análisis II previa de Probabilidad y Estad́ısti-

ca, como lo es en todas las carreras que tienen este curso. Lamentablemente, por

motivos ajenos a lo que a mi respecta, en la nueva carrera de profesorado de

matemática este asunto no fue corregido.

Para el lector que recién comienza en estos temas le aclaro un poco más.

Cuando uno estudia lo básico de inferencia estad́ıstica se enfrenta a información

vectorial, por ejemplo si a cada persona se le pregunta edad, peso e ingresos

mensuales, entonces obtenemos un vector (x1, x2, x3) ∈ R3 para cada persona.

Cualquier tipo de modelización que queramos aplicarle a la información obteni-

da para un grupo de personas necesita del conocimiento de funciones de varias

variables.

El problema antes mencionado llevó a que la estructura de estas notas no

es la habitual. Comenzamos con el estudio de espacios de probabilidad y luego

pasamos a variables aleatorias, en este punto no se trabaja con vectores aleatorios

y se pasa al trabajo con esperanzas de variables aleatorias. Luego de estudiados

estos aspectos y con la “esperanza” de que en análisis II ya se hallan estudiado

integrales múltiples, nos introducimos en un rápido recorrido por los vectores

aleatorios y sus esperanzas. Por último nos introducimos en los tipos de conver-

gencias dando lugar a los important́ısimos teoremas: Ley de los Grandes Números

y Teorema del Ĺımite Central.

Un último comentario es que estas notas son realizadas apuntando a un nivel

terciario, por ende se requiere de cierta madurez del razonamiento, sin embargo,

hay algunos resultados que el estudiante puede asumir sin entrar en detalles, como

la existencias de conjuntos no medibles (referente a la medida de Lebesgue),

la construcción del proceso de Poisson o la integral de Riemann-Stieltjes (no

estudiada sobre esta carrera).

Mis gracias a Santiago y Marcela por el apoyo y la tolerancia brindados.

5 de mayo de 2008.


Índice general

1. Espacios de Probabilidad 1

1.1. Espacio muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2. Necesidad de una σ-álgebra . . . . . . . . . . . . . . . . . . . . . 3

1.3. Axiomas de la Probabilidad . . . . . . . . . . . . . . . . . . . . . 14

1.4. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . 28

1.5. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

1.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

1.7. Anexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

2. Variables Aleatorias 53

2.1. Conceptos iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . 54

2.2. Función de distribución . . . . . . . . . . . . . . . . . . . . . . . . 60

2.3. Tipos de Variables Aleatorias . . . . . . . . . . . . . . . . . . . . 66

2.3.1. Algunos modelos de variables aleatorias discretas . . . . . 77


ii ÍNDICE GENERAL

2.3.2. Algunos modelos de variables aleatorias

absolutamente continuas. . . . . . . . . . . . . . . . . . . . 92

2.4. Transformaciones de variables aleatorias . . . . . . . . . . . . . . 103

2.4.1. Simulación Montecarlo . . . . . . . . . . . . . . . . . . . . 110

2.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

3. Esperanza Matemática 127

3.1. Esperanza de una variable aleatoria . . . . . . . . . . . . . . . . . 128

3.2. Esperanza de una transformación de v.a. . . . . . . . . . . . . . . 140

3.3. Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

3.4. Función Generatriz de Momentos . . . . . . . . . . . . . . . . . . 153

3.5. Función caracteŕıstica . . . . . . . . . . . . . . . . . . . . . . . . . 161

3.6. Otras medidas de una variable aleatoria . . . . . . . . . . . . . . . 164

3.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

3.8. Anexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

4. Vectores Aleatorios 175

4.1. Conceptos iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . 176

4.2. Tipos de vectores aleatorios . . . . . . . . . . . . . . . . . . . . . 184

4.3. Independencia de variables aleatorias . . . . . . . . . . . . . . . . 192

4.4. Transformaciones de vectores aleatorios . . . . . . . . . . . . . . . 199

4.5. Esperanza de funciones de vectores aleatorios . . . . . . . . . . . 205


ÍNDICE GENERAL iii

4.5.1. Esperanza de la suma y el producto de v.a. . . . . . . . . . 206

4.5.2. Varianza de la suma de v.a. . . . . . . . . . . . . . . . . . 213

4.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216

5. Convergencias 223

5.1. Convergencia en Probabilidad . . . . . . . . . . . . . . . . . . . . 225

5.2. Convergencia casi segura . . . . . . . . . . . . . . . . . . . . . . . 228

5.3. Ley de los grandes números . . . . . . . . . . . . . . . . . . . . . 232

5.4. Convergencia en Ley . . . . . . . . . . . . . . . . . . . . . . . . . 236

5.5. Teorema del Ĺımite Central . . . . . . . . . . . . . . . . . . . . . 240

5.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246


Caṕıtulo 1

Espacios de Probabilidad

Ya desde algunos cursos en la educación secundaria se ha introducido la idea de

Probabilidad. En general, en esos cursos se estudia lo que se denomina definición

de Laplace o clásica.

En la definición clásica, las probabilidades se calculan con aquello de “casos

favorables sobre casos posibles”, si bien en aquél momento bastaba con esa idea de

probabilidad, es una versión muy simplificada de lo que significa “Probabilidad”.

En nuestro curso estudiaremos la probabilidad como una medida para nues-

tro grado de incertidumbre, asignándole el valor mı́nimo cero (total incertidum-

bre) y valor máximo uno.

Es claro que nos enfrentaremos con algunos problemas, el primero es: ¿a qué le

calcularemos la probabilidad, en qué condiciones?. estas y otras tantas preguntas

iremos estudiando a lo largo del curso, donde además intentaremos desarrollar

algunos modelos matemáticos que nos faciliten el abordaje del cálculo de proba-

bilidades.

2 1. Espacios de Probabilidad

1.1. Espacio muestral

Supongamos que un experimento sea realizado sobre ciertas condiciones fijas.

El conjunto Ω de los resultados elementales e indivisibles será llamado espacio

muestral o espacio de resultados posibles. A los elementos del espacio muestral

los llamaremos sucesos elementales y los notaremos ω.

Ejemplo 1

Se tira un dado y se observa la cantidad de puntos de la cara superior al caer.

Aqúı Ω = {1, 2, 3, 4, 5, 6} y sus elementos son sucesos elementales. Observemos

que el conjunto {1, 2} no es un resultado indivisible, por ende no es un elemento

del espacio muestral y por tanto no es un suceso elemental.

Śı son sucesos elementales ω1 = {1}, . . . , ω6 = {6}. /

En ocasiones no es tan sencillo determinar el espacio muestral, veamos el

siguiente ejemplo.

Ejemplo 2

Se selecciona un individuo de Montevideo y se mide su altura en metros.

¿ Cuál es el espacio muestral?.

Es claro que medir su altura con dos decimales, es una mera aproximación

de la verdadera altura del individuo. Un individuo podŕıa eventualmente medir

1, 70 metros, pero también podŕıa medir π/2 metros, aunque nuestros útiles de

medición no nos permitan saber con exactitud dicha medida.

De aqúı que la altura es un número real, claramente positivo y a priori no

acotado superiormente. En efecto, si suponemos que el individuo más alto mide

2, 10 metros, no hay nada que nos asegure que podamos encontrar en algún


1.2 Necesidad de una σ-álgebra 3

momento alguno que mida 2, 20 metros. Es claro que poner, por ejemplo mil

metros, es una cota más que razonable a los efectos prácticos. En éste ejemplo

nuestro espacio muestral es Ω = (0,+∞). /

En el ejemplo anterior se observa que muchos elementos del espacio mues-

tral son imposibles, es más, podŕıamos haber seleccionado a todos los números

reales como espacio muestral y no cambiaŕıa sustancialmente nuestro concepto de

espacio muestral, sólo que encontraŕıamos muchos sucesos que seŕıan imposibles.

1.2. Necesidad de una σ-álgebra

Manejando el concepto de probabilidad de los cursos de secundaria, si el ex-

perimento consiste en tirar un dado y observar la cantidad de puntos en la cara

superior, podŕıamos calcular la probabilidad de “obtener un 2”, de hecho, si dicho

suceso elemental lo anotamos con A, tenemos que:

P (A) =casos favorables

casos posibles=

1

6

Además podemos calcular la probabilidad de B=“obtener un número par”,

aunque éste no sea un suceso elemental, P (B) = 36. Sin mayor dificultad el lec-

tor podrá observar que en este ejemplo, podemos calcular la probabilidad de

cualquier subconjunto del espacio muestral, es decir, podemos calcular la proba-

bilidad de cualquier elemento de partes de Ω (partes de Ω, el conjunto de todos

los subconjuntos de Ω, lo anotaremos 2Ω o P(Ω)).

Lamentablemente no siempre es posible calcular la probabilidad de cualquier

subconjunto del espacio muestral. La justificación es basada en la medida de

Lebesgue de la que daremos una breve introducción. Comencemos introduciendo

el problema con un ejemplo.



Ejemplo 3

Tiramos un dardo sobre una pared, la base de la pared la medimos en una cierta

unidad tal que represente al intervalo [0, 1] y observamos la coordenada (horizon-

tal) en la que quedó el dardo. Es claro que Ω = [0, 1].

Haciendo una extensión de la noción de probabilidad anterior a), podŕıamos

tratar de calcular la probabilidad de que el dardo quede en el intervalo [1/3, 1/2].

Es razonable que dicha probabilidad sea calculada como la medida del intervalo

[1/3, 1/2] sobre la medida del intervalo [0, 1], es decir:

P (“dardo quede en [1/3, 1/2]”) =m([1/3, 1/2])

m([0, 1])=

1/2− 1/31− 0

= 1/6

De aqúı deducimos que, en este ejemplo, el cálculo de probabilidades se reduce

a medir conjuntos, por ejemplo, ¿cuál es la probabilidad de que el dardo quede

en una coordenada racional?, como hemos estudiado en Análisis I, la medida de

cualquier conjunto numerable es cero y por ende, tal probabilidad es cero.

¿ Para cualquier subconjunto E del intervalo [0, 1], podemos hallar la prob-

abilidad que el dardo quede en E?. Tal pregunta es equivalente a ¿a cualquier

subconjunto E del intervalo [0, 1] lo podemos medir con las nociones básicas de

medida?.

Como ya se mencionó, para responder tendremos que hacer una breve intro-

ducción a los conceptos de medida. /

La medida que extiende el concepto de longitud es la llamada medida de

Lebesgue, algunas propiedades que ésta debe cumplir son:

1. La medida del intervalo cerrado [0, 1] es uno, es decir, m([0, 1]) = 1.

2. Si trasladamos un conjunto, su medida no cambia, es decir, si E es un

conjunto de reales y x es un número real cualquiera, m(x + E) = m(E),

a)Aún no hemos definido a la probabilidad, pero nos manejamos con conceptos intuitivos.



donde x+ E = {x+ y : y ∈ E}.

Por ejemplo: m(2 + [0, 1]︸︷︷︸=[2,3]

) = m([2, 3]) = 3− 2 = 1 = m([0, 1]).

3. Si deseamos medir una colección numerable de conjuntos disjuntos (incom-

patibles) E1, E2, . . . , En, . . . ,donde Ei ∩ Ej = ∅ para i 6= j, es razonable

pedir que m(⋃+∞n=1En) =

∑+∞n=1En.

Por ejemplo: m([0, 1] ∪ [2, 3] ∪ [5, 8]) = m([0, 1]) +m([2, 3]) +m([5, 8]).

Veamos a continuación un ejemplo en el cual se muestra un conjunto no

medible:

Ejemplo 4 (Un conjunto no medible)

Consideremos el intervalo [0, 1] y sobre éste definamos la relación:

xRy ⇔ x− y ∈ Q, es decir, dos reales del intervalo [0, 1] se relacionan, si y sólo

si, distan un racional.

El lector podrá verificar que se trata de una relación de equivalencia.

Formemos ahora un conjunto E, tomando uno y sólo un elemento de cada clase

de equivalencia (axioma de elección b)). Por ejemplo: 0, 1/e y 1/π pertenecen a

clases distintas pues no distan un racional, de aqúı que 0, 1/e, 1/π ∈ E, entre

otros.

Tomemos ahora un racional q del intervalo [0, 1], que representa la “distancia”

a la que están los elementos en las clases, y formemos el conjunto Eq como sigue:

Eq = {(x+ q)mod(1) : x ∈ E}

En otras palabras, sin usar módulo, a cada elemento del conjunto E lo

b)Acá estamos usando el axioma de elección que dice, resumidamente, que si uno tiene una

familia de conjuntos y toma un elemento de cada uno, entonces obtiene también un conjunto.



trasladamos el racional q y los que sobrepasen al 1 lo trasladamos al comien-

zo para aseguramos que queden en [0, 1] , es decir:

Eq = {x+ q : x ∈ E si x+ q ≤ 1} ∪ {x+ q − 1 : x ∈ E si x+ q > 1}

Observemos que si 0 ∈ E entonces 1 6∈ E pues son de la misma clase, por lo

tanto la unión que determina a los Eq es disjunta.

Al hacer variar q sobre todos los racionales de [0, 1] obtenemos todos los

elementos de cada clase. Por ejemplo, como 1/e ∈ E, al sumarle q obtenemos el

elemento que dista el racional q de 1/e, al hacerlo para todos los racionales del

intervalo [0, 1] obtenemos todos los elementos de la clase de 1/e y ésto vale para

todos los elementos de E en donde hay un representante de cada clase.

De lo anterior deducimos que⋃

q∈Q∩[0,1]

Eq(1)=[0, 1].

Además, los conjuntos Eq son disjuntos. En efecto, observemos que si

a ∈ Eq ∩ Er, entonces a es representado por un elemento xα en E tal que

xα+q = a y también es representado por un elemento xβ en E tal que xβ +r = a

c). Pero xα “dista” de xβ el racional r − q 6= 0 y por lo tanto llegamos a que en

E hay dos elementos de una misma clase, en absurdo con la definición de E.

En resumen, los conjuntos Eq son una sucesión numerable de conjuntos dis-

juntos, donde de ser medibles tendŕıamos que

c) estamos suponiendo que xα + q ≤ 1 y xβ + q ≤ 1, es análogo si no fuera aśı.



m(Eq) = m({x+ q : x ∈ E si x+ q ≤ 1} ∪ {x+ q − 1 : x ∈ E si x+ q > 1})disj= m({x+ q : x ∈ E si x+ q ≤ 1}︸︷︷︸

(q+E)∩[0,1]

) +m({x+ q − 1 : x ∈ E si x+ q > 1}︸︷︷︸(q−1+E)∩[0,1]

)

= m(E ∩ [q, 1]) +m(E ∩ [0, q))disj= m

((E ∩ [0, q]) ∪ (E ∩ (q, 1])︸︷︷︸

E

)= m(E) = c

Concluimos que, de ser medible cada Eq, entonces miden todos una constante c.

A los racionales en [0, 1], por ser infinitos y numerables, renombremoslos con

qn, es decir, Q ∩ [0, 1] = ∪+∞n=1{qn}.

Utilizando las propiedades deseadas de medida tenemos que:

1 = m([0, 1])por (1)

= m(⋃

q∈Q∩[0,1]

Eq)︸︷︷︸m(∪+∞n=1Eqn )

disjuntos= =

+∞∑n=1

m(Eqn) =+∞∑n=1

c

Donde obtenemos un absurdo, pues si c = 0 llegamos a que 1 = 0 y si c > 0

llegamos a que 1 = +∞. El absurdo se genera al pensar que los conjuntos Eq son

medibles.

En resumen, como cada Eq resultaba de una traslación de E, concluimos que

E no es medible y esto responde negativamente la pregunta ¿todo subconjunto

de R es medible ?. /

Como resultado concluimos que no todo subconjunto de R es medible y por

tanto no podemos calcular la probabilidad de que el dardo quede en E para

cualquier subconjunto de [0, 1].

Es importante resaltar que, con lo mostrado arriba, el dominio de la proba-

bilidad no siempre podrá ser P(Ω). Necesitaremos introducir un nuevo concepto,

el de σ- álgebra, ésta será una subfamilia de subconjuntos del espacio muestral



en donde siempre podemos calcular probabilidades. En el caso de la recta real,

utilizaremos la σ- álgebra de Borel que será introducida más adelante.

Indagando los requisitos de una Probabilidad

Tratemos de indagar sobre los requisitos mı́nimos que deseamos que cumpla

una probabilidad, retomemos el ejemplo de la tirada de un dado, aqúı Ω =

{1, 2, 3, 4, 5, 6}.

Es claro que podemos calcular la probabilidad de A2 =“sale 2” y de A3 =“sale

3”, de donde A2 y A3 deben estar en el dominio de la probabilidad. Pero también

nos interesaŕıa calcular la probabilidad de A2 ∪A3 =“sale 2 o 3”, de donde, si A2y A3 están en el dominio de la probabilidad, entonces A2 ∪ A3 también lo está.

Es evidente que podemos extender este requerimiento para una unión finita, por

ejemplo, “sale 1, o 2, o 3, o 4, o 5, o 6”=A1∪A2∪A3∪A4∪A5∪A6 debe estar en el

dominio de la probabilidad, es más, según los conceptos previos de probabilidad,

dado que los conjuntos son disjuntos, P (∪6i=1Ai) =∑6

i=1 P (Ai)︸︷︷︸1/6

= 1.

Trabajar con uniones finitas no siempre es suficiente, supongamos que ob-

servamos la cantidad de autos que llegan a un peaje en un lapso de tiempo.

Aqúı Ω = {0, 1, 2, . . . , n, . . .} = N y por tanto, si podemos calcular la probabili-

dad de que hayan llegado n autos, debeŕıamos poder calcular la probabilidad de

que “llagaron 0, o 1, o 2,..., o n, ... autos” (a saber, tal probabilidad debe ser 1) y

por tanto, si A0, A1, . . . , An, . . . están en el dominio de la probabilidad, también

debe estar ∪+∞n=0An

Volviendo al ejemplo de la tirada del dado, si A =“sale 1, o 2” está en el

dominio de la probabilidad, entonces debe estar Ac =“sale 3, o 4, o 5, o 6”.

Hemos introducido el concepto de σ- álgebra, el que nos servirá como dominio

de la probabilidad.



Definición 1 (σ-álgebra)

Dado un conjunto Ω, llamamos σ- álgebra de Ω, o simplemente σ-álgebra, a una

familia A, de subconjuntos de Ω, tal que:

i) A 6= ∅

ii) Si A ∈ A entonces Ac ∈ A

iii) Si A1, A2, . . . , An, . . . ∈ A entonces+∞⋃n=1

An ∈ A

El lector podrá verificar que la definición de σ- álgebra, coincide con lo

deseábamos que cumpliera el dominio de la probabilidad.

Ejemplo 5

Dado un conjunto Ω, P(Ω) es una σ- álgebra, ya que Ω ∈ P(Ω) y por tanto P(Ω)

es no vaćıa. Si A ∈ P(Ω) entonces Ac también es un subconjunto de Ω, de donde

Ac ∈ P(Ω) y lo mismo ocurre para la unión. /

Si bien P(Ω) es una σ- álgebra, como vimos en el ejemplo 3, no siempre nos

servirá como dominio de la probabilidad, en donde debemos trabajar con otra σ-

álgebra.

Ejercicio 1

Dado un conjunto Ω. Probar queA = {∅,Ω} es una σ- álgebra. La σ- álgebra

A = {∅,Ω} es llamada σ- álgebra trivial. �

Ejemplo 6

Sea Ω un conjunto no numerable de números reales, probemos que

A = {A ⊂ Ω : Aes numerable o Ac es numerable}

es una σ- álgebra.



i) Es claro que ∅ es numerable y por tanto ∅ ∈ A y de aqúı que A no es vaćıa.

ii) Si A ∈ A entonces,

o bien A es numerable y Ac no lo es, pero (Ac)c = A es numerable y por

tanto Ac ∈ A

o bien A no es numerable pero por pertenecer a A, Ac es numerable y de

aqúı que Ac ∈ A.

iii) Si A1, A2, . . . , An, . . . ∈ A puede ocurrir que:

* todos los An son numerables y por tanto, como la unión numerable de

conjuntos numerables es numerable, tenemos que⋃+∞n=1An ∈ A.

* si alguno de los An es no numerable, supongamos que el Aj no lo es, en-

tonces⋃+∞n=1An no es numerable, pero su complemento (

⋃+∞n=1An)

c =⋂+∞n=1(An)

c ⊂ (Aj)c y como Aj ∈ A y Aj no es numerable, entonces

(Aj)c es numerable. De lo anterior concluimos que

⋃+∞n=1An tiene com-

plemento numerable y por tanto⋃+∞n=1An ∈ A.

/

Tratemos de introducir ahora una σ- álgebra que nos sea útil para calcular

probabilidades sobre intervalos de números reales.

Proposición 1

Sea A una σ- álgebra de subconjuntos de Ω, entonces ∅,Ω ∈ A.

Demostración: En efecto, como A es no vaćıa, tenemos que existe algún A tal

que A ∈ A, por la definición de σ- álgebra, Ac ∈ A y por tanto Ω = A∪Ac ∈ A.

Dado que Ω ∈ A, tenemos que ∅ = Ωc ∈ A. �



Proposición 2

Sea A una σ- álgebra de subconjuntos de Ω, si A1, A2, . . . , An, . . . ∈ A entonces⋂+∞n=1An ∈ A

Demostración: Como A1, A2, . . . , An, . . . ∈ A tenemos que Ac1, Ac2, . . . , Acn, . . . ∈

A y por lo tanto⋃+∞n=1A

cn ∈ A. Nuevamente,

+∞⋂n=1

An =+∞⋂n=1

(Acn)c︸︷︷︸

An

DeMorgan=

(+∞⋃n=1

Acn

)c∈ A

�

Proposición 3

Consideremos un conjunto Ω y las σ- álgebras Aλ de subconjuntos de Ω (λ ∈ L,

con L algún conjunto de ı́ndices). Entonces A =⋂λ∈ L

Aλ es también una σ- álgebra

de subconjuntos de Ω.

Demostración: i) Por ser Aλ σ- álgebra, ∅ ∈ Aλ ∀ λ ∈ L, por lo tanto,

∅ ∈⋂λ∈ LAλ y de aqúı que A es no vaćıa.

ii) Si A ∈ A, entonces A ∈ Aλ ∀ λ ∈ L, siendo Aλ σ- álgebra, Ac ∈ Aλ ∀ λ ∈ L

y por lo tanto Ac ∈⋂λ∈ LAλ

iii) Si A1, A2, . . . , An, . . . ∈ A entonces A1, A2, . . . , An, . . . ∈ Aλ ∀ λ ∈ L, siendo

Aλ σ- álgebra,⋃+∞n=1An ∈ Aλ ∀ λ ∈ L y por lo tanto

⋃+∞n=1An ∈

⋂λ∈ LAλ

�

Dada una familia F cualquiera de subconjuntos de Ω, siempre tenemos que

F ⊂ P(Ω) y por lo tanto siempre hay al menos una σ- álgebra que contiene a F .

Este resultado es vital para la siguiente definición.



Definición 2 (σ-álgebra generada)

Dada una familia F de subconjuntos de Ω, llamamos σ- álgebra generada por F ,

a la σ- álgebra M(F) =⋂Aλ donde la intersección es realizada sobre todas las

σ- álgebras que contienen a F .

Ejemplo 7

Sea Ω = {1, 2, 3} y F = {{1, 2}}. Veamos qué σ-álgebras contienen a F :

P(Ω) = {∅,Ω, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}}

también {∅,Ω, {3}, {1, 2}}

¿hay alguna otra?, el lector podrá verificar que no.

Por lo tanto, M(F) = P(Ω) ∩ {∅,Ω, {3}, {1, 2}} = {∅,Ω, {3}, {1, 2}}. /

Veamos ahora una σ- álgebra muy importante a la hora de avanzar en temas

de probabilidad.

Definición 3 (La σ- álgebra de Borel en R)

Sea R nuestro espacio muestral y consideremos a la familia de intervalos abiertos

de R:

F = {(a, b) : a, b ∈ R, a < b}

llamamos σ- álgebra de Borel a la σ- álgebra generada por F , que anotamos B.

Para aclarar ideas, la σ- álgebra de Borel en R, es la menor σ- álgebra que

contiene a los abiertos de R. Es erróneo pensar que B sólo contiene abiertos ya que

si (a, b) ∈ B entonces (a, b)c ∈ B y por ser el complemento de un abierto, (a, b)c es

cerrado. Además, como ya vimos, las uniones, las intersecciones y complementos

de elementos de B están en B.



Ejemplo 8

Los intervalos cerrados están en B. En efecto, dado un intervalo cerrado [a, b],

sabemos que [a, b] =⋂+∞n=1 (a− 1/n, b+ 1/n)︸︷︷︸

∈B

∈ B. /

La σ- álgebra de Borel goza de la propiedad que todos sus elementos son

medibles según la medida de Lebesgue, es por este motivo que la utilizaremos

como dominio de la probabilidad en casos como el introducido en el ejemplo

del dardo ( ejemplo 3). Sin lugar a duda, mostrar que los elementos de B son

medibles excede nuestros objetivos y podrá ser estudiado en un curso de Análisis

Real (medida).

Por último, veamos una extensión de la σ- álgebra de Borel a Rn.

Definición 4 (La σ- álgebra de Borel en Rn)

Sea Rn nuestro espacio muestral, la σ- álgebra de Borel en Rn, a la cual anotamos

Bn es la generada por los abiertos de Rn.

Excede también nuestro curso probar que Bn es efectivamente una σ- álgebra.

En el práctico se verán otros ejemplos de σ- álgebra.

A continuación definimos un espacio donde podremos definir una probabili-

dad:

Definición 5 (Espacio probabilizable)

A la pareja (Ω,A), donde Ω representa el espacio muestral y A es una σ- álgebra

de subconjuntos de Ω, la llamaremos espacio probabilizable. A los elementos

de A los llamaremos sucesos.



1.3. Axiomas de la Probabilidad

La probabilidad tal como la hemos venido introduciendo, es una medida para

nuestro grado de incertidumbre. En 1933, Kolmogórov publicó el libro Los fun-

damentos de la Teoŕıa de la Probabilidad, estableciendo las bases modernas de

la teoŕıa axiomática de la probabilidad.

Definición 6 (Axiomas de Kolmogórov)

Dado un espacio probabilizable (Ω,A), una probabilidad es una función

P : A → R tal que:

P (A) ≥ 0 para todo suceso A (A ∈ A)

P (Ω) = 1

Si A1, A2, . . . , An, . . . son sucesos disjuntos dos a dos (Ai∩Aj = ∅ con i 6= j)

entonces

P

(+∞⋃n=1

An

)=

+∞∑n=1

P (An)

Algunas cosas que son importantes resaltar son las siguientes, sólo podemos

calcularle la probabilidad a los elementos de la σ- álgebra, la probabilidad de

cualquier suceso es siempre mayor o igual a cero (más adelante veremos que

también es menor o igual a uno), la probabilidad de la unión disjunta es la suma

de las probabilidades.

Definición 7 (Espacio de probabilidad)

A la terna (Ω,A, P ) la llamamos espacio de probabilidades

Sólo cuando esté dado un espacio de probabilidades, es cuando se procede a

calcular probabilidades. A continuación veremos algunos ejemplos que nos per-


1.3 Axiomas de la Probabilidad 15

mitirán aclarar ideas.

Ejemplo 9

Se tira una moneda al aire y se observa la cara superior al caer.

Aqúı Ω = {“cara”,“número”}, consideremos la σ- álgebra A =

P(Ω) = {∅,Ω, “cara”, “número”} y supongamos que no tenemos indi-

cios para suponer que la moneda esté cargada, es decir, suponemos que

P (“cara”) = P (“número”) = 1/2.

Tenemos además que P (Ω) = 1 y como veremos más adelante, P (∅) = 0, de

donde tenemos definida la probabilidad para cualquier elemento de la σ- álgebra.

Hemos construido aśı, el espacio de probabilidades (Ω,A, P ).

Pero supongamos ahora que śı tenemos sospechas que la moneda esté cargada,

pues al tirarla 100 veces, se obtuvieron 20 caras y 80 números.

Podŕıamos suponer aqúı que P (“cara”) = 20/100 = 1/5 y

P (“número”) = 80/100 = 4/5.

Sin duda que este cambio altera sustancialmente nuestro concepto previo de

probabilidad, aqúı se refleja en la obtención de un espacio de probabilidades

distinto al anterior.

Por ahora no estudiaremos como “estimar” dichas probabilidades, es un tema

que se estudiará en estad́ıstica, en este ejemplo se trató de hacer notar que siempre

tenemos que trabajar sobre un espacio de probabilidades dado. /

Ejemplo 10 (El espacio de probabilidades clásico o de Laplace)

Supongamos que nuestro espacio muestral es finito, Ω = {ω1, ω2, . . . , ωn} y que

la σ- álgebra es A = P(Ω). Definamos las probabilidades como sigue:

P (ω1) = P (ω2) = · · · = P (ωn) =1

n



Siendo P una probabilidad, si A es un suceso cualquiera, compuesto por k sucesos

elementales, A = {ωi1 , . . . , ωik} = ∪kj=1{ωij}, entonces

P (A) = P (k⋃j=1

{ωij})(1)=

k∑j=1

P (ωij)︸︷︷︸1/n

=k

n

En (1) se usó que la unión es disjunta. El cociente k/n es lo que se conoce

habitualmente como “casos favorables (k), sobre casos posibles (n)”. /

El espacio de probabilidades clásico es utilizado cuando el espacio muestral

es finito y no hay indicios de que los sucesos elementales tengan probabilidades

distintas, por ejemplo, cuando tiramos un dado y observamos la cantidad de

puntos en la cara superior. Trabajando sobre el espacio de probabilidades clásico,

calculemos la probabilidad de obtener un número par. Nuestro suceso es A =

{“sale 2, o 4, o 6”}, por lo tanto P (A) = 3/6 = 1/2.

Antes de dar más ejemplos de cálculo de probabilidades pasemos a estudiar

las propiedades que ésta posee.

Proposición 4 (Propiedades de la probabilidad)

Dado un espacio de probabilidades (Ω,A, P )

1. P (A) = 1− P (Ac) para todo suceso A

2. P (∅) = 0

3. Si A y B son sucesos tales que A ⊂ B, entonces P (A) ≤ P (B)

4. P (A) ∈ [0, 1] para todo suceso A

5. Sean A y B dos sucesos cualesquiera, entonces

P (A ∪B) = P (A) + P (B)− P (A ∩B)



6. Sean A1, A2, . . . , An, . . . sucesos cualesquiera, entonces

P

(+∞⋃n=1

An

)≤

+∞∑n=1

P (An)

7. Sean A1, A2, . . . , An sucesos cualesquiera, entonces

P

(n⋃i=1

Ai

)=

n∑k=1

(−1)k+1∑

1≤i1


Observemos que los sucesos (B ∩ A) y (B ∩ Ac) son disjuntos y además

B = (B ∩ A) ∪ (B ∩ Ac), entonces

P (B) = P((B ∩ A) ∪ (B ∩ Ac)

) disjuntos= P (B ∩ A) + P (B ∩ Ac)

y si sustituimos este resultado en (1.1) obtenemos lo deseado.

6. Tratemos de escribir la unión⋃+∞n=1An como una unión disjunta. Definamos

E1 = A1, E2 = A2 − A1, E3 = A3 − (A1 ∪ A2), . . . , En = An −(∪n−1i=1 Ai

)y aśı sucesivamente para todo natural.

El lector podrá verificar fácilmente que En ⊂ An, An = ∪ni=1Ei y que

∪+∞n=1An = ∪+∞n=1En, donde los En son disjuntos dos a dos por construcción.

Luego

P

(+∞⋃n=1

An

)= P

(+∞⋃n=1

En

)disjuntos

=+∞∑n=1

P ( En︸︷︷︸⊂An

)

︸︷︷︸≤P (An)

≤+∞∑n=1

P (An)

7. El estudiante interesado puede ver la demostración por inducción completa

en el Anexo 1.7.

�

Las anteriores propiedades serán muy útiles al momento de calcular probabili-

dades, por ejemplo, en muchas oportunidades es más fácil calcular la probabilidad

del complemento que la del propio suceso.

Veamos ahora algunos ejemplos donde aplicamos las propiedades anteriores:

Ejemplo 11

Un estudiante tiene una probabilidad p de responder una pregunta en un examen

oral. Se le ofrecen dos alternativas: a) Hacerle sólo una pregunta; b) Hacerle tres

preguntas pero para salvar debe responder correctamente al menos dos.



¿Cuál alternativa es más favorable?

Según la opción a), la probabilidad de salvar es p. Según la opción b), la

probabilidad de ganar se calcula como sigue:

El estudiante puede:

A=“responder correctamente las dos primeras y mál la última”, este suceso

tiene probabilidad p2(1− p)

B=“responder correctamente la primera y la tercera y mál la segunda”, este

suceso también tiene probabilidad p2(1− p)

C=“responder correctamente las dos últimas y mal la primera”, este suceso

tiene probabilidad p2(1− p)

D=“responder correctamente las tres preguntas”, este suceso tiene proba-

bilidad p3.

Por ende, que el estudiante salve es el suceso A ∪ B ∪ C ∪ B, la cual es una

unión disjunta (¿por qué?) y por lo tanto la probabilidad que el estudiante salve

con la opción b) es 3p2(1− p) + p3.

Ahora analisemos que opción es más conveniente, para ello veamos que opción

tiene mayor probabilidad de salvar. Para que la opción a) sea más conveniente que

la b) debemos tener p > 3p2(1− p) + p3, resolviendo la desigualdad y teniendo en

cuenta que p es una probabilidad, tenemos que si p ∈ (0, 1/2) conviene la opción

a), si p ∈ (1/2, 1) conviene la opción b).

Si p = 1/2 es indiferente, además si p = 0 perdemos con probabilidad uno en

cualquiera de los casos y si p = 1 salvamos con probabilidad uno, ¿por qué?. /

Ejercicio 2

Una determinada traveśıa puede hacerse con aviones bimotores o con cuadrimo-



tores. Los bimotores pueden volar con un sólo motor y los cuadrimotores sólo con

dos. La probabilidad de que un motor falle en la traveśıa es p. ¿Cuáles aviones

son los más seguros?. �

Ejemplo 12

Tenemos dos urnas con n bolillas cada una, numeradas de 1 a n. Se extrae al azar

una bolilla de la primer urna y otra de la segunda urna, sin reponer las bolillas se

repite el procedimiento hasta agotar las n bolillas. Se desea hallar la probabilidad

de que en alguna extracción se tenga al menos una coincidencia.

Observemos que nuestro experimento termina cuando se extrajeron todas las

bolillas, es por tal motivo que los elementos del espacio muestral son del tipo i1 i2 · · · inj1 j2 · · · jn

donde i1, i2, · · · , in ∈ {1, 2, · · · , n} y j1, j2, · · · , jn ∈ {1, 2, · · · , n} representan

el número de la bolilla extráıda en cada lugar.

Notemos que los casos posibles son (n!)2, ya que cualquier permutación de las

n bolillas de la primer urna es posible y por cada una de éstas, podemos hacer

una permutación de las n bolillas de la segunda urna.

Recordemos que queremos calcular la probabilidad de que al menos haya una

coincidencia, lo que puede pensarse como, hay una coincidencia en el primer

lugar o hay una coincidencia en el segundo lugar, ..., o hay una coincidencia en

el n-ésimo lugar. Sea Ai el suceso “hay una coincidencia en el i-ésimo lugar”, la

probabilidad deseada es P (⋃ni=1Ai). Uno puede verse tentado a calcularla como

la suma de las probabilidades de los sucesos Ai, pero lamentablemente esto no

es posible ya que los sucesos Ai no son incompatibles. Notemos que si hay una

coincidencia en el primer lugar, podŕıa también haber una en el segundo.

Para solucionar el problema anterior uno podŕıa definir los sucesos Bi como “



hay exactamente una coincidencia y es en el lugar i-ésimo”, estos sucesos śı son

disjuntos pero se torna muy dif́ıcil contar los casos favorables a cada suceso. El

lector interesado puede tratar de contarlos.

En definitiva, tenemos que calcular P (⋃ni=1 Ai), donde Ai es el suceso “hay una

coincidencia en el i-ésimo lugar”. De las propiedades de la probabilidad tenemos

que

P

(n⋃i=1

Ai

)=

n∑k=1

(−1)k+1∑

1≤i1


Observemos que la probabilidad no depende de quienes son los k lugares donde

queremos las coincidencias, es decir, P (Ai1 ∩· · ·∩Aik) no depende de i1, i2, . . . , iky por tanto la suma

∑1≤i1


Para calcular la probabilidad de que gane el premio el jugador b) procedemos

como sigue:

La probabilidad de no ganar en el primer sorteo es 1 − 1/N = (N − 1)/N ;

la probabilidad de no ganar en ni en el primer ni en el segundo sorteo es[(N −

1)/N]2

, y la probabilidad de no sacar ninguna vez el premio en los n sorteos es[(N − 1)/N

]n.

Por lo tanto, la probabilidad de que el jugador b) saque el premio por lo menos

una vez es:

Pb = 1−[

(N − 1)N

]nUsando la desigualdad de Bernoulli, (1 + a)δ > 1 + aδ con a ≥ −1 y δ > 1,

tenemos que

[(N − 1)N

]n=

[1− 1

N

]n> 1− n

N

de donde Pa > Pb.

Es decir, el jugador a) tiene mayor probabilidad de sacar el premio, sin em-

bargo, el jugador b) lo puede sacar más veces. /

Ejemplo 14 (Opcional)

Tenemos m bolillas y las queremos colocar aleatoriamente en n frascos, supong-

amos n ≥ 1 y m ≥ n− 1. Puede que más de una bolilla quede en un frasco.

El problema original consiste en hallar la probabilidad de que exactamente

un frasco quede libre.

Sea Bi, el suceso: “el frasco i-ésimo es el único que queda libre”, la probabil-

idad deseada es P (⋃ni=1Bi), aqúı los sucesos Bi son disjuntos, pues si el frasco 1



es el único que queda libre, no puede ocurrir que el frasco 2 quede libre y aśı suce-

sivamente. Pero... ¿ cómo calculamos P (Bi) ?, dejamos al lector indagar sobre la

dificultad de tratar de contar los casos favorables.

Tratemos de trabajar sobre un caso más sencillo, tratemos de calcular la

probabilidad de que algún frasco quede libre. Sea Ai el suceso “ el frasco i- ésimo

queda libre ”, la probabilidad deseada es P (⋃ni=1Ai), pero los sucesos Ai no son

disjuntos por lo que tenemos que utilizar la vieja fórmula:

P

(n⋃i=1

Ai

)=

n∑k=1

(−1)k+1∑

1≤i1


probabilidad. Es decir:

P

(n⋃i=1

Ai

)=

n∑k=1

(−1)k+1Cnk(n− k)m

nm

Hasta ahora hemos calculado la probabilidad de que al menos un frasco quede

libre, utilizando el complemento tenemos la probabilidad de que ningún frasco

quede libre, es decir

P (“ninguno de los n frasco queda libre”) = 1−n∑k=1


nm

Observemos que si queremos hallar la probabilidad de que el frasco i sea el

único que quede libre, podŕıamos tratar de usar la probabilidad anterior pero

evaluada en n− 1, es decir el frasco i queda libre y ninguno de los n− 1 frascos

restantes queda libre. La idea es buena pero no es tan directo.

Al evaluar en n−1 estaŕıamos también cambiando por n−1 los casos posibles

sobre los que se puede colocar cada bolilla y esto no es correcto, por lo tanto

tratemos de extraer los casos favorables al suceso “ninguno de los n frasco queda

libre”. Por ser P (“ninguno de los n frasco queda libre”) = casos favorablescasos posibles

y los

casos posibles son nm como ya hab́ıamos calculado, los casos favorables al suceso

“ninguno de los n frasco queda libre” son

nm·P (“ninguno de los n frasco queda libre”) = nm·

(1−

n∑k=1


nm

)

Para reducir la escritura, llamemos fav(m,n) = nm ·(

1−∑n

k=1(−1)k+1Cnk(n−k)mnm

),

por lo tanto los casos favorables a que ninguno de los n− 1 frascos queden libres

es fav(m,n − 1) y de aqúı que la probabilidad de que el frasco i-ésimo sea el

único que quede libre es P (Bi) =fav(m,n−1)

nm.



Recordemos que los sucesos Bi con i = 1, . . . , n son disjuntos y su probabilidad

no depende que i, es decir, no depende del frasco que se haya elegido para quedar

libre. Por lo tanto:

P

(n⋃i=1

Bi

)=

n∑i=1

P (Bi)︸︷︷︸fav(m,n−1)

nm

= n · fav(m,n− 1)nm

=fav(m,n− 1)

nm−1

Hemos obtenido la probabilidad de que exactamente un frasco quede libre. /

Los ejemplos anteriores son una pequeña muestra de lo dif́ıcil que puede ser

calcular probabilidades, sin duda que en el práctico se resolverán problemas más

sencillos.

Una propiedad muy importante, la cual nos servirá en variadas ocasiones, es

la llamada continuidad de la probabilidad.

Teorema 5 (Continuidad de la probabilidad)

1. Sean A1, A2, . . . , An, . . . sucesos crecientes, es decir

A1 ⊂ A2 ⊂ · · · ⊂ An ⊂ . . ..

Entonces, la sucesión (P (An))n∈N∗ es convergente y

P (+∞⋃n=1

An) = ĺımn→+∞

P (An)

2. Sean A1, A2, . . . , An, . . . sucesos decrecientes, es decir

A1 ⊃ A2 ⊃ · · · ⊃ An ⊃ . . .

Entonces, la sucesión (P (An))n∈N∗ es convergente y

P (+∞⋂n=1

An) = ĺımn→+∞

P (An)

Demostración: 1. Al ser los sucesos An crecientes, tenemos que P (An) ≤

P (An+1) y de aqúı que la sucesión (P (An))n∈N∗ es monótona creciente y



acotada superiormente por 1 por ser probabilidades, por ende es conver-

gente.

Consideremos los conjuntos E1 = A1, E2 = A2 − A1, E3 = A3 − A2,

. . . , En = An − An−1 y aśı sucesivamente para todo natural.

El lector podrá verificar fácilmente que ∪ni=1Ai = An = ∪ni=1Ei y que

∪+∞n=1An = ∪+∞n=1En, donde los En son disjuntos dos a dos por construcción.

Luego

P

(+∞⋃n=1

An

)= P

(+∞⋃n=1

En

)disjuntos

=+∞∑n=1

P (En) = ĺımk→+∞

k∑n=1

P (En)disjuntos

=

ĺımk→+∞

P (k⋃

n=1

En) = ĺımk→+∞

P (Ak)

Por último, observemos que tomamos el ĺımite sobre k, tras un cambio de

variable, evidentemente obtenemos lo deseado.

2. Al ser los sucesos An decrecientes, tenemos que P (An) ≥ P (An+1) y de

aqúı que la sucesión (P (An))n∈N∗ es monótona decreciente y acotada infe-

riormente por 0 por ser probabilidades, por ende es convergente.

Observemos que por ser A1, A2, . . . , An, . . . sucesos decrecientes, sus com-

plementos Ac1, Ac2, . . . , A

cn, . . . son sucesos crecientes.

Luego:

P (+∞⋂n=1

An) = 1− P (

(+∞⋂n=1

An

)c) = 1− P (

+∞⋃n=1

Acn)por 1= 1− ĺım

n→+∞P (Acn)︸︷︷︸1−P (An)

= ĺımn→+∞

P (An)

�

Observación: Cuando la sucesión de sucesos es creciente, es común anotar+∞⋃n=1

An = ĺımn→+∞

An, de aqúı que P (ĺımn→+∞An) = ĺımn→+∞ P (An) y por eso el



nombre de continuidad de la probabilidad. De forma análoga, cuando la suce-

sión de sucesos es decreciente, es común anotar+∞⋂n=1

An = ĺımn→+∞

An, de aqúı que

P (ĺımn→+∞An) = ĺımn→+∞ P (An).

Observación: Sobre una sucesión de sucesos no siempre está bien definido

el ĺımite, en términos generales es un error hablar de ĺımite de una sucesión de

conjuntos pues puede no existir tal ĺımite.

Al igual que lo estudiado en sucesiones numéricas, el tema de la existencia de

ĺımite es tratado mediante ĺımite superior e inferior de la sucesión, en este caso

sucesión de conjuntos.

Si bien la continuidad de la probabilidad para cualquier sucesión de sucesos

excede los alcances de este curso y puede ser estudiado en un curso de medida,

a los efectos informativos, el ĺımite superior e inferior de una sucesión de sucesos

lo definimos:

ĺım supn→+∞

An =+∞⋂n=1

+∞⋃m=n

Am

ĺım infn→+∞

An =+∞⋃n=1

+∞⋂m=n

Am

En caso de que ambos coincidan, decimos que el ĺımite existe. En el caso que la

sucesión sea monótona, efectivamente coinciden, cosa que se verá en el práctico.

1.4. Probabilidad condicional

Supongamos que tiramos un dado y queremos hallar la probabilidad de que

la cantidad de puntos que queden para arriba sea menor o igual a tres. No ten-

dŕıamos mayor dificultad para calcular tal probabilidad, pero, ¿qué tal si nos


1.4 Probabilidad condicional 29

Figura 1.1: Probabilidad condicional

pasan la información de que el uno no fue el que salió?, ¿cómo altera esto el

resultado de nuestra probabilidad?. Problemas como éste son los que motivan a

introducir la probabilidad condicional.

Definición 8 (Probabilidad condicional)

Dado un espacio de probabilidad (Ω,A, P ) y un suceso B con probabilidad pos-

itiva, definimos la probabilidad de un suceso A condicionado a B, como

P (A|B) = P (A ∩B)P (B)

La noción intuitiva de la probabilidad condicional puede verse usando diagra-

mas de Venn, en la figura 1.1 se observa que una vez que se conoce la ocurrencia

del suceso B, la probabilidad del suceso A se reduce a la proporción entre la prob-

abilidad de la parte de A que se encuentra en B, con respecto a la probabilidad

de B.

Ejemplo 15

Resolvamos el problema del inicio de la sección. Se tira un dado y se quiere

calcular la probabilidad de obtener tres o menos puntos, dado que se sabe que

no salió un punto. Sea el suceso A = {1, 2, 3} que representa nuestros casos



favorables a priori y el suceso B = {2, 3, 4, 5, 6} que representa la información

que obtuvimos. Luego P (A|B) = P (A∩B)P (B)

= P ({2,3})P ({2,3,4,5,6}) =

2/65/6

= 25.

Aqúı puede observarse que la probabilidad condicional respeta la idea intuitiva

de restringir nuestro espacio muestral al conjunto B, es decir, los casos favorables

que hay en B contra los casos posibles que hay en B. /

La noción intuitiva manejada anteriormente puede formalizarse con la sigu-

iente proposición.

Proposición 6

Dado un espacio de probabilidades (Ω,A, P ) y un suceso B tal que P (B) > 0,

entonces (B,AB, P ∗) es un nuevo espacio de probabilidad, donde AB = {A∩B :

A ∈ A} y P ∗ : AB → R tal que P ∗(A) = P (A|B).

Demostración: Probemos que AB es una σ-álgebra de subconjuntos de B.

i. Es claro que B ∈ AB y por tanto AB 6= ∅.

ii. Sea E ∈ AB entonces E = A ∩B con A ∈ A, luego

Ec = B − E = B − (A ∩B) = B − A = B ∩ Ac︸︷︷︸∈A

y por lo tanto Ec es la intersección entre B y un elemento de A , de donde

Ec ∈ AB.

iii. Sean E1, E2, . . . En, . . . ∈ AB, entonces existen A1, A2, . . . , An, . . . ∈ A tales

que En = An ∩B ∀ n ∈ N∗, luego

+∞⋃n=1

En =+∞⋃n=1

(An ∩B) =

(+∞⋃n=1

An

)︸︷︷︸

∈A

∩B ∈ AB



Siendo (B,AB) un espacio probabilizable, probemos que P ∗ es una probabilidad

sobre este espacio.

i. P ∗(A) =

≥0︷︸︸︷P (A ∩B)P (B)︸︷︷︸>0

≥ 0 para todo suceso A

ii. P ∗(B) = P (B|B) = P (B∩B)P (B)

= 1

iii. Dados los sucesos disjuntos A1, A2, . . . An, . . ., entonces

P ∗(⋃+∞

n=1An)

= P(⋃+∞

n=1An∣∣B) = P

S+∞n=1(An∩B)︷︸︸︷

((∪+∞n=1 An

)∩B)

P (B)disjuntos

=

=P+∞n=1 P (An∩B)P (B)

=+∞∑n=1

P (An ∩B)P (B)︸︷︷︸P ∗(An)

=+∞∑n=1

P ∗(An)

�

El espacio (B,AB, P ∗) es de gran importancia porque refleja la idea de con-

siderar un nuevo espacio de resultados posibles, una vez que se conoce nueva

información a través de B.

Se deduce de la propia definición de probabilidad condicional que

P (A ∩B) = P (B)P (A|B). La igualdad anterior puede ser generalizada para más

de dos suceso, es decir

P (A∩B∩C) = P ((A∩B)∩C)) = P (A ∩B)︸︷︷︸P (A)P (B|A)

P (C|A∩B) = P (A)P (B|A)P (C|B∩A))

Lo cual es válido si P (A ∩ B) > 0 (de aqúı se deduce que P (A) > 0 ya que

(A ∩B) ⊂ A)

Generalizando aún más tenemos el siguiente teorema de multiplicación o teo-

rema de la probabilidad compuesta.



Teorema 7 (Probabilidad compuesta)

Dado (Ω,A, P ), un espacio de probabilidades, sean A1, A2, . . . , An sucesos tales

que P (A1 ∩ A2 ∩ . . . ∩ An−1) > 0 donde n ≥ 2, entonces

P (A1 ∩A2 ∩ . . .∩An) = P (A1)P (A2|A1)P (A3|A1 ∩A2) · · ·P (An|A1 ∩ · · · ∩An−1)

Demostración: Por ser A1 ⊃(A1 ∩ A2

)⊃ · · · ⊃

(A1 ∩ . . . ∩ An−1

)y

P (A1 ∩ A2 ∩ . . . ∩ An−1) > 0 tenemos que todas las probabilidades condicionales

están bien definidas.

De la propia definición, la igualdad se cumple si n = 2, es decir P (A1 ∩A2) =

P (A1)P (A2|A1) siendo P (A1) > 0.

Supongamos que la igualdad se cumple para h sucesos y verifiquemos que se

cumple para h+ 1 sucesos h = 2, . . . , n− 1.

Por hipótesis P (⋂hi=1Ai) = P (A1)P (A2|A1) · · ·P (Ah|A1 ∩ · · · ∩ Ah−1), luego

P (⋂h+1i=1 Ai) = P

((A1 ∩ · · · ∩ Ah

)∩ Ah+1

)= P (A1 ∩ · · · ∩ Ah)︸︷︷︸

P (A1)P (A2|A1)···P (Ah|A1∩···∩Ah−1)

P (Ah+1|A1 ∩ · · · ∩ Ah)

= P (A1)P (A2|A1) · · ·P (Ah+1|A1 ∩ · · · ∩ Ah)

�

Ejemplo 16

Se reparten cuatro cartas de una baraja española,¿cuál es la probabilidad que

sean los cuatro reyes?.

Sea el suceso Ai, “la i-ésima carta obtenida es un rey”, entonces queremos

calcular P (A1 ∩ A2 ∩ A3 ∩ A4), utilizando la probabilidad compuesta tenemos



que:

P (A1∩A2∩A3∩A4) = P (A1)︸︷︷︸4/50

P (A2|A1)︸︷︷︸3/49

P (A3|A1 ∩ A2)︸︷︷︸2/48

P (A4|A1 ∩ A2 ∩ A3)︸︷︷︸1/47

=1

C504

En el cálculo de las probabilidades condicionales se utilizó lo probado en la

Proposición 6, tomando al condicionante como un nuevo espacio de resultados

posibles, por ejemplo, si se conoce A1 ∩ A2 es porque ya se han obtenidos dos

reyes, por tanto quedan otros dos reyes entre 48 cartas. /

Consideremos ahora un suceso cualquiera A y su complemento Ac, entonces

A,Ac forman una partición de Ω, es decir A ∪ Ac = Ω y A ∩ Ac = ∅. Dado

cualquier suceso B, tenemos que B = B∩Ω = B∩ (A∩Ac) = (B∩A)∪ (B∩Ac)

donde la unión es disjunta, por lo tanto

P (B) = P (B ∩ A)︸︷︷︸P (A)P (B|A)

+ P (B ∩ Ac)︸︷︷︸P (Ac)P (B|Ac)

= P (A)P (B|A) + P (Ac)P (B|Ac)

Es claro que se está usando que A y Ac son sucesos con probabilidad positiva.

La generalización de este resultado es lo que se conoce como “Probabilidades

totales”.

Teorema 8 (Probabilidades totales)

Dado (Ω,A, P ), sean A1, A2, . . . , An sucesos incompatibles dos a dos, tales que⋃ni=1Ai = Ω y P (Ai) > 0 i = 1, . . . , n (n ≥ 2). Entonces, para cualquier suceso

B, tenemos

P (B) =n∑i=1

P (Ai)P (B|Ai)

Demostración:

P (B) = P (B ∩(∪ni=1Ai︸︷︷︸

Ω

)) = P (∪ni=1(B ∩ Ai︸︷︷︸

⊂Ai

))disjuntos

=∑n

i=1 P (B ∩ Ai)︸︷︷︸P (Ai)P (BAi)

=

=∑n

i=1 P (Ai)P (B|Ai)

�



El lector podrá verificar sin mayor dificultad que este resultado sigue siendo

válido si se considera una partición infinita pero numerable de sucesos An.

Ejemplo 17

Supongamos que en un cierto páıs hay varios partidos poĺıticos, entre ellos, el

90 % del electorado lo tienen los partidos A,B y C con un 50 %, 30 % y 10 %

respectivamente. Se está promulgando una nueva ley y la proporción de individuos

que están a favor de dicha ley depende del partido poĺıtico al que pertenecen.

Suponga que el 70 % de los electores del partido A están a favor de la ley, el 20 %

en contra y al resto le es indiferente. En el partido B hay un 55 % en contra, un

20 % a favor y al resto le es indiferente. Por último, tanto en el partido C como

en el resto de los partidos, el 30 % está a favor, el 50 % en contra y al resto le es

indiferente.

Se selecciona al azar un elector, hallar la probabilidad de que el individuo

seleccionado esté a favor de la ley.

Solución: Sea F el suceso: “el individuo seleccionado está a favor de la ley”.

Observemos que el individuo seleccionado es un elector y por tanto pertenece

al partido A (suceso A) o pertenece al partido B (suceso B) o pertenece a otro

partido (suceso Ot). Supondremos que si un individuo pertenece a un partido no

pertenece a otro y por tanto A, B y Ot forman una partición de nuestro espacio

muestral.

Aplicando la fórmula de las probabilidades totales tenemos

P (F ) = P (A)︸︷︷︸0,5

P (F |A)︸︷︷︸0,7

+P (B)︸︷︷︸0,3

P (F |B)︸︷︷︸0,2

+P (0t)︸︷︷︸0,2

P (F |Ot)︸︷︷︸0,3

= 0, 47

De donde podemos concluir que menos de la mitad de los electores son los

que están a favor de la ley. /



Un resultado inmediato a partir de la fórmula de las probabilidades totales se

conoce con el nombre de fórmula de Bayes y es el siguiente:

Teorema 9 (Fórmula de Bayes)

Dado (Ω,A, P ), sean A1, A2, . . . , An sucesos incompatibles dos a dos, tales que⋃ni=1Ai = Ω y P (Ai) > 0 i = 1, . . . , n (n ≥ 2). Entonces, para cualquier suceso

B con P (B) > 0 tenemos

P (Aj|B) =P (Aj)P (B|Aj)∑ni=1 P (Ai)P (B|Ai)

j = 1, . . . , n

Demostración: P (Aj|B) =P (Aj ∩B)P (B)

(1)=

P (Aj)P (B|Aj)∑ni=1 P (Ai)P (B|Ai)

En el numerador de (1) se usó P (B|Aj) = P (Aj∩B)P (Aj) y en el denominador la

fórmula de las probabilidades totales, ya que los Ai forman una partición de Ω.

Sin mayor dificultad el resultado puede extenderse si se considera una parti-

ción infinita pero numerable de sucesos An. �

La fórmula de Bayes es útil cuando conocemos las probabilidades de los Aj y

las condicionales de B dado Aj, pero no conocemos directamente la probabilidad

de B.

Ejemplo 18

Suponga que una caja tiene dos monedas, dos no cargadas y una de dos caras. Se

deja caer aleatoriamente una moneda al suelo y se observa que salió cara. ¿Cuál

es la probabilidad que la moneda tirada sea la de dos caras?.

Solución: Sean los sucesos A1, la moneda es de dos caras, A2 la moneda es

no cargada y B, el suceso “salió cara”. Nos interesa la probabilidad P (A1|B), el



lector podrá verificar las hipótesis de la fórmula de Bayes, de donde

P (A1|B) =

1/3︷︸︸︷P (A1)

1︷︸︸︷P (B|A1)

P (A1)︸︷︷︸1/3

P (B|A1)︸︷︷︸1

+P (A2)︸︷︷︸2/3

P (B|A2)︸︷︷︸1/2

=1

2

/

Ejemplo 19

La distribución de los grupos sangúıneos en Estados Unidos es: Tipo A, 41 % ;

tipo B, 9 % ; tipo AB, 4 % y tipo O, 46 %. Se estima que, durante la segunda

guerra mundial, el 4 % de las personas pertenecientes al tipo O fuerón clasificadas

como del tipo A; el 88 % de los de tipo A fueron correctamente clasificados; el 4 %

de los de tipo B se clasificaron como de tipo A y el 10 % de los de tipo AB fueron,

igualmente, clasificados como de tipo A. Un soldado fue herido y conducido a la

enfermeŕıa. Se le clasificó como del tipo A. ¿ Cuál es la probabilidad de que tal

grupo sea ciertamente el suyo?.

Solución: Consideremos los sucesos A1: es de tipo A; A2: es de tipo B; A3: es

de tipo AB; A4: es de tipo O; B: Es clasificado como de tipo A.

Luego, A1, A2, A3, A4 forman una partición de nuestro espacio muestral y to-

dos tienen probabilidad positiva. Usando probabilidades totales, veremos que B

también tiene probabilidad positiva (denominador de Bayes). Aplicando la fórmu-

la de Bayes tenemos que

P (A1|B) =

0,41︷︸︸︷P (A1)

0,88︷︸︸︷P (B|A1)

P (A1)︸︷︷︸0,41

P (B|A1)︸︷︷︸0,88

+P (A2)︸︷︷︸0,09

P (B|A2)︸︷︷︸0,04

+P (A3)︸︷︷︸0,04

P (B|A3)︸︷︷︸0,10

+P (A4)︸︷︷︸0,46

P (B|A4)︸︷︷︸0,04

= 0, 93

/


1.5 Independencia 37

Como sugerencia para el estudiante, la fórmula de Bayes es útil cuando cono-

cemos el resultado final y queremos hallar la probabilidad de que se haya pasado

por una determinada etapa intermedia. Las etapas intermedias deben formar una

partición que hay que detectar.

Ejercicio 3

Estamos interesados en saber cuál de dos análisis A y B es mejor para el di-

agnóstico de una determinada enfermedad, de la cual sabemos que la presentan

un 10 % de individuos de la población. El porcentaje de resultados falsos posi-

tivosd) del análisis A es del 15 % y el de B es del 22 %. El porcentaje de falsos

negativose) de A es del 7 % y de B es del 3 %.

¿Cuál es la probabilidad de acertar en el diagnóstico con cada método? �

1.5. Independencia

Un concepto que hemos venido manejando informalmente es el de indepen-

dencia. Por ejemplo, cuando decimos que tiramos dos monedas, el resultado

que obtengamos en una, es “independiente” del que obtengamos en la otra.

Otro ejemplo es cuando tenemos n bolillas para ocupar n lugares sin repetirlos,

aqúı dećıamos que una vez elegida una bolilla para el primer lugar, la cantidad

de bolillas para el segundo lugar disminuye a n − 1, por lo que la elección no

se hace en iguales condiciones que la primer elección y por lo tanto no tenemos

“independencia”. ésta idea de independencia será formalizada desde el punto de

vista probabilista en esta sección.

d)Un resultado es falso positivo cuando el análisis da positivo siendo que el paciente no tiene

la enfermedad.e)Un resuldado es falso negativo cuando el análisis da negativo siendo que el paciente tiene

la enfermedad.



Definición 9 (Independencia)

Dado un espacio de probabilidad (Ω,A, P ), decimos que los sucesos A y B son

independientes si

P (A ∩B) = P (A) · P (B)

Observación: La independencia depende del espacio de probabilidad sobre

el que se trabaja. Veamos el siguiente ejemplo.

Ejemplo 20

Se lanzan dos monedas al aire y se observan sus caras superiores al caer.

En este caso Ω = {(cara,cara), (cara, número), (número,cara), (número,número)},

sea A = P (Ω) y las probabilidades clásicas, es decir P((cara,cara)

)=

P((cara, número)

)= P

((número,cara)

)= P

((número,número)

)= 1/4

Consideremos los sucesos A: “en la primer moneda sale cara” y B: “en la

segundo moneda sale cara”, luego

P (A ∩B) = P (cara,cara) = 1/4

P (A) = P((cara,cara) ∪ (cara,número)

)= 1/4 + 1/4

P (B) = P((cara,cara) ∪ (número,cara)

)= 1/4 + 1/4

.

Por lo tanto P (A ∩B) = 1/4 = P (A)P (B) y los sucesos A y B son indepen-

dientes.

Pero, sobre el mismo espacio probabilizable definamos

P((cara,cara)

)= P

((número, número)

)= 1/3

P((número,cara)

)= P

((cara,número)

)= 1/6

El lector podrá verificar que se trata de una probabilidad ya que

P (Ω) = P((cara,cara) ∪ (cara, número) ∪ (número,cara) ∪ (número,número)

)=

= 1/3 + 1/6 + 1/6 + 1/3 = 1

Aqúı



P (A ∩B) = P (cara,cara) = 1/3

P (A) = P((cara,cara) ∪ (cara,número)

)= 1/3 + 1/6 = 1/2

P (B) = P((cara,cara) ∪ (número,cara)

)= 1/3 + 1/6 = 1/2

Por lo tanto P (A ∩ B) = 1/3 6= 1/2 · 1/2 = P (A)P (B) y los sucesos A y B

no son independientes. /

Sin duda que, bajo el espacio clásico de probabilidades, la noción intuitiva

de independencia se verifica. Pero siempre tenemos que recordar que la indepen-

dencia es definida sobre un espacio de probabilidades y por tanto depende de

éste.

Observación: Si alguno de los sucesos A o B tiene probabilidad no nula,

la independencia puede ser definida por medio de la probabilidad condicional,

es decir, supongamos que P (B) > 0, entonces P (A|B) = P (A∩B)P (B)

, de donde A

y B son independientes si y sólo si P (A|B) = P (A). En efecto, si A y B son

independientes, entonces P (A|B) = P (A∩B)P (B)

indep= P (A)P (B)

P (B)= P (A). Por otro lado,

si P (A|B) = P (A) entonces, de la definición de probabilidad condicional tenemos

que P (B)P (A|B)︸︷︷︸P (A)

= P (A ∩B) y por tanto A y B son independientes.

Proposición 10

Dado un espacio de probabilidad (Ω,A, P ),

1. Si P (A) = 0 o P (A) = 1 entonces A es independiente de B, ∀ B ∈ A.

2. Si A es independiente de A, entonces P (A) = 1 o P (A) = 0.

3. Si A es independiente de B entonces:

a) A es independiente de Bc.

b) Ac es independiente de B.



c) Ac es independiente de Bc.

Demostración: 1. Si P (A) = 0, entonces, por ser (A ∩ B) ⊂ A tenemos

0 ≤ P (A ∩B) ≤ P (A) = 0 y de aqúı que P (A ∩B) = 0 = P (A)︸︷︷︸=0

P (B)︸︷︷︸∈R

.

Si P (A) = 1, recordemos que B = (B ∩ A) ∪ (B ∩ Ac) donde la unión es

disjunta, por lo tanto P (B)(1)= P (A ∩ B) + P (B ∩ Ac). Siendo P (A) = 1,

P (Ac) = 0 y como (B ∩Ac) ⊂ Ac tenemos que P (B ∩Ac) (2)= 0. De (1) y (2)

tenemos que P (A ∩B) = P (B) = P (A)︸︷︷︸=1

P (B).

2. Por ser A independiente de A tenemos que

P (A) = P (A ∩ A) indep= P (A)P (A), y por lo tanto. P (A) = 1 o P (A) = 0

3. a) P (A) = P (A∩B)+P (A∩Bc), entonces P (A∩Bc) = P (A)−P (A∩B)indep= P (A)− P (A)P (B) = P (A)

(1− P (B)︸︷︷︸

P (Bc)

)= P (A)P (Bc)

b) Basta con intercambiar A y B de nombres y aplicar la parte anterior.

c) Por ser los sucesos A y B independientes, por la parte a) los son A y

Bc, apliquemos la parte b) y obtenemos que los son Ac y Bc.

�

Observación: Si A y B son sucesos incompatibles, es decir (A ∩ B) = ∅,

entonces no pueden ser independientes a menos que alguno de ellos tenga prob-

abilidad cero, ya que P (A ∩B︸︷︷︸∅

) = 0 = P (A)P (B)⇔ P (A) = 0 o P (B) = 0.

indaguemos ahora como definiremos la independencia de más de dos sucesos.

Dados tres sucesos A,B y C, podŕıamos querer que el suceso A sea independiente

de B y que A sea independiente de C, pero también que B sea independiente

de C y aśı tenemos la independencia dos a dos entre estos sucesos. Pero también

nos interesa que A sea independiente de B ∩ C y de B ∩ Cc, en otros términos,



queremos que la ocurrencia de B y/o de C no afecten a la probabilidad de A.

Análogamente para B y C, por lo tanto la independencia de más de dos conjuntos

debe ser un poco más general que la independencia dos a dos.

Definición 10 (Independencia dos a dos)

Dado (Ω,A, P ), diremos que los sucesos A1, . . . , An son independientes dos a dos,

si Ai es independiente de Aj para todo i 6= j (i, j ∈ {1, . . . , n}), es decir

P (Ai ∩ Aj) = P (Ai)P (Aj) ∀ i 6= j

Definición 11 (Independencia colectiva)

Dado (Ω,A, P ), diremos que los sucesos A1, . . . , An son colectivamente indepen-

dientes, o simplemente independiente, si

P (Ai1 ∩ · · · ∩ Aik) = P (Ai1) · · ·P (Aik) donde 1 ≤ i1 < · · · < ik ≤ n

Más en general, dada un conjunto de ı́ndices L diremos que los sucesos Aλ

con λ ∈ L son independientes, si toda subfamilia finita de {Aλ : λ ∈ L} es de

sucesos colectivamente independiente.

En algunos textos se le suele llamar independencia estocástica o indepen-

dencia mutua a los sucesos colectivamente independientes. En nuestro curso le

llamaremos simplemente independientes.

Es inmediato verificar que la independencia colectiva implica la independencia

dos a dos, el siguiente ejemplo muestra que la independencia dos a dos no implica

la independencia colectiva.

Ejemplo 21 (La independencia dos a dos no implica la independencia)

Consideremos un espacio de resultados posibles Ω = {1, 2, 3, 4} el cual puede

ser pensado como los cuatro resultados posibles al tirar dos monedas. En efec-



to, Si el 1 representa (cara,cara); el 2, (número, cara); el 3, (cara,número) y el

4, (número,número).

Trabajemos sobre el espacio clásico de probabilidades, es decir P ({i}) = 1/4,

i = 1, 2, 3, 4 y definamos los sucesos A = {1, 4}, B = {2, 4} y C = {3, 4}. El

lector podrá interpretar al suceso A como: “ en las dos monedas sale igual figura”,

análogamente hay una interpretación para los sucesos B y C. Observemos primero

que P (A) = P (B) = P (C) = 1/2 ya que están formados por dos de los cuatro

sucesos elementales.

Verifiquemos que los sucesos A,B y C son independientes dos a dos, en efecto

P (A ∩B) = P ({4}) = 1/4 = P (A)︸︷︷︸1/2

P (B)︸︷︷︸1/2

P (A ∩ C) = P ({4}) = 1/4 = P (A)︸︷︷︸1/2

P (C)︸︷︷︸1/2

P (B ∩ C) = P ({4}) = 1/4 = P (B)︸︷︷︸1/2

P (C)︸︷︷︸1/2

Pero P (A ∩ B ∩ C) = P ({4}) = 1/4 6= 1/8 = P (A)︸︷︷︸1/2

P (B)︸︷︷︸1/2

P (C)︸︷︷︸1/2

, de aqúı que

los sucesos A,B y C no son independientes (colectivamente). /


1.6 Ejercicios 43

1.6. Ejercicios

1. Probar las leyes de Morgan:

a) (⋃∞n=1An)

c =⋂∞n=1(An)

c

b) (⋂∞n=1An)

c =⋃∞n=1(An)

c.

2. Probar que {φ,Ω} es una σ-álgebra.

3. Verificar que la familia 2Ω de todos los subconjuntos de Ω es una σ-álgebra.

4. Sea Ω = {a, b, c, d, e, f}. Construir la mı́nima σ-álgebra generada por

{{a, b}, {c, d}, {e}}.

5. i) Si ε1 está inclúıdo en la σ-álgebra generada por ε2, probar que la σ-

álgebra generada por ε1 está contenida en la σ-álgebra generada por

ε2.

ii) Probar que coinciden las σ-álgebras de subconjuntos de R generadas

por:

Los intervalos abiertos ε1 = {(a, b) : a < b}.

Los intervalos cerrados ε2 = {[a, b] : a < b}.

Los int. semi-abiertos ε3 = {[a, b) : a < b} o ε4 = {(a, b] : a < b}.

Los rayos abiertos ε5 = {(a,∞) : a ∈ R}. o

ε6 = {(−∞, b) : b ∈ R}.

Los rayos cerrados ε7 = {[a,∞) : a ∈ R}. o

ε8 = {(−∞, b] : b ∈ R}.

Observar que B, la σ-álgebra de Borel en R, también es generada por

cualquiera de las familias εi.



6. Sea A1, A2, ... una sucesión de conjuntos. Definimos el ĺımite superior y el

ĺımite inferiór de la suceśıon como sigue:

ĺım inf An =∞⋃n=1

∞⋂r=n

Ar

ĺım supAn =∞⋂n=1

∞⋃r=n

Ar

Probar que ĺım inf An ⊂ ĺım supAn.

En caso de igualdad, se define ĺımAn = ĺım inf An = ĺım supAn.

7. Sea A1, A2, ... una sucesión monótona de conjuntos. Probar que existe el

ĺımite de An.

8. Dada una sucesión creciente de sucesos: φ = E0 ⊂ E1 ⊂ E2 ⊂ ..., probar

que⋃∞n=1En se puede escribir como una unión disjunta en la forma

∞⋃n=1

En =∞⋃n=1

(En − En−1)

9. Un dado está cargado de modo que la probabilidad de cada cara es pro-

porcional al número indicado en la cara. ¿Cuál es la probabilidad de que al

arrojarlo, se obtenga un resultado par?.

10. Si P y Q son dos probabilidades definidas sobre un mismo espacio (Ω,A),

mostrar que aP + bQ también es una probabilidad sobre el mismo espacio,

para cualquier par de números no negativos a y b que satisfagan a+ b = 1.

11. Se tiran dos dados al azar y se quiere hallar la probabilidad de que la suma

de los puntos obtenidos sea igual a 10.

12. Una urna contiene a bolillas blancas y b bolillas negras. Al sacar al azar

r bolillas de una vez (suponiendo r ≤ a), ¿cuál es la probabilidad de que

todas ellas sean blancas?.


1.6 Ejercicios 45

13. Se tiene una baraja de 40 cartas, donde hay 4 ases. Se reparten éstas entre 4

personas, de manera que le toquen 10 cartas a cada una. ¿qué probabilidad

hay de que a cada una le toque un as?.

14. En una urna hay 20 bolillas numeradas de 1 a 20. Si se van sacando al azar

una a una sin reposición, ¿cúal es la probabilidad de que la bolilla número

8 salga precisamente en la octava extracción?.

15. Se distribuyen al azar N bolas numeradas de 1 a N , en N cajas igualmente

numeradas, de modo que se coloca una bola en cada caja.

¿Cuál es la probabilidad de que en las cajas números 1 y 2 se coloquen las

bolas con números 1 y 2 respectivamente?, ? y cuál es la probabilidad de

que en la caja número 4 no esté la bola número 4? (N ≥ 4).

16. Se lanzan dos dados no cargados, uno verde y otro rojo. Calcular las prob-

abilidades de los siguientes eventos:

a) .en el dado rojo sale 4”.

b) .en el dado rojo sale 4 y en el verde también”.

c) ”al menos en un dado sale 4”.

d) .en ningún dado sale 4”.

e) ”la suma de los puntos obtenidos es mayor que 7”.

17. Justificar si es correcto la siguiente afirmación justificando la respuesta:

De una urna que contiene 30 bolillas numeradas del 1 a 30 se extraen si-

multáneamente 7 de ellas. Si un jugador apuesta a 7 números la probabilidad

de acertar 5 o más números es :

C77 + C76 + C

75

C307

18. De un conjunto de 15 lámparas de las cuales 5 son defectuosas, se escogen

al azar tres. Hallar la probabilidad de que:



a) ninguna sea defectuosa.

b) una por lo menos sea defectuosa.

19. En la fabricación de un cierto aparato se utilizan dos piezas del mismo

tipo. Para que el aparato funcione es necesario que por lo menos una de las

piezas no esté defectuosa. La probabilidad de que una pieza esté defectuosa

es 0,05. Calcular, bajo el supuesto de independencia, la probabilidad de que

el aparato funcione.

20. Tres urnas contienen bolillas rojas y azules. La primer urna tiene 3 rojas y

9 azules, la segunda urna tiene 8 rojas y 4 azules y la tercer urna tiene 2

rojas y 10 azules. Las trece cartas de trébol de un mazo de cartas francesas

son {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, J,QK}.

Se realiza el siguiente experimento:

Se extraen al azar del mazo dos cartas (conjuntamente).

Si ambas resultan números, se extrae al azar una bolilla de la primer

urna.

Si ambas resultan figuras, se extrae al azar una bolilla de la segunda

urna.

En los restantes casos se extrae al azar de la tercer urna.

a) Calcular la probabilidad de extraer una bolilla roja de la primer urna.

b) Calcular la probabilidad de extraer una bolilla azul.

c) Calcular la probabilidad de extraer una bolilla roja.

21. Lanzamos tres monedas regulares claramente diferenciadas.

Calcular la probabilidad de los siguientes eventos:

A=“al menos dos son cara”.

B=”sale un número par de caras”.


1.6 Ejercicios 47

C=”sale número en la primer moneda”.

¿Son A, B y C independientes?.

22. a) Se lanzan tres dados no cargados simultáneamente. Calcular la prob-

abilidad de obtener un 6, sabiendo que no hay dos resultados iguales.

Se lanza ahora un dado n veces, sucesiva e independientemente. Cal-

cular las probabilidades de los siguientes sucesos:

b) Obtener al menos dos 5, dado que ocurrió al menos un 5 en los n

lanzamientos.

c) obtener al menos dos 5, dado que ocurrió al menos un cinco en los

primeros m lanzamientos.

23. De un estudio cĺınico se han concluido los siguientes resultados: La prob-

abilidad de que una persona extráıda al azar de la población tenga cierta

afección card́ıaca es 0,002; dado que padece esa afección, la probabilidad de

que fume es 0,40, y dado que no la padece, la probabilidad de que fume es

0,10. ¿ Cúal es laprobabilidad de que un fumador padezca la mencionada

afección card́ıaca?.

24. Repetir el ejercicio anterior con los datos ligeramente modificados: La prob-

abilidad de que una persona extráıda al azar de la población tenga cierta

afección card́ıaca es 0,002; la probabilidad de que fume es 0,10; la proba-

bilidad de que fumedado que padece la enfermedad es 0,40.

25. Una firma de contadores está llevando a cabo una auditoŕıa sobre las prácti-

cas contables de una empresa en la cual hay cuentas de clientes mayoristas

y cuentas de minoristas.

Se sabe que el 70 % de todas las cuentas son de mayoristas, y más aun, se

sabe que el 10 % de las cuentas de mayoristas y el 20 % de las cuentas de

minoristas tienen algún tipo de error contable.



Si los auditores observan un error en una cuenta de clientes ¿cuál es la

probabilidad de que sea de mayorista?.

26. Para las elecciónes de una cierta ciudad se han presentado dos candidatos

a la intendencia A y B. En toda la ciudad se establecieron unicamente tres

circuito de votación y una vez hecho el escrutinio se obtuvo la siguiente

información:

En el circuito 1 votó el 30 % de los electores.

En el circuito 2 votó el 34 % de los electores.

El resto lo hizo en el circuito 3.

No se registraron votos anulados, observados ni en blanco.

En el circuito 1, B obtuvo 165 votos de un total de 300, mientras que en el

circuito 2, obtuvo 136. A obtuvo el 80 % de los votos del circuito 3.

Si entre el total de los electores se elige uno al azar y resulta ser votante de

A, ¿Cuál es la probabilidad de que haya votado en el circuito 2?.

27. A una moneda desconocida le atribúımos una probabilidad p1 de tener dos

caras distintas (cara, cruz). Se lanza la moneda n veces consecutivas y en

todas ellas sale cara. ¿Cuál es la probabilidad, después de estos lances, de

que la moneda tenga dos caras distintas?.

28. Suponga que está participando de un programa televisivo, donde, junto con

otras cuatro personas, deben elegir al azar una llave entre cinco, una de las

llaves abrirá el cofre que esconde un premio importante.

Hay dos opciones para seleccionar la llave:

Opción A, una persona extrae una llave, la prueba, y si no abre la

repone a la bolsa. Luego el siguiente participante procede igual hasta

que pasen los cinco.


1.6 Ejercicios 49

Opción B, cada persona extrae una llave y luego que todos tienen una

llave, las prueban.

a) Si usted es la primer persona en elegir la llave, ¿ qué opción prefiere?.

b) Si usted es la tercer persona en elegir la llave, ¿qué opción prefiere?.

c) Si usted es la úlltima persona en elegir la llave, ¿qué opción prefiere?.

d) ¿Qué conclusión obtiene de la probabilidad de ganar con la reposición

o sin reposición?.

Justificar en base al suceso con mayor probabilidad dde ganar.

29. a) Demostrar que si dos sucesos A y B son independientes y ambos tienen

probabilidad positiva, entonces no pueden ser incompatibles.

b) Demostrar que si A es un suceso arbitrario y B es un suceso tal que

P (B) = 0, entonces A y B son independientes.

c) Sean A y B dos sucesos independiente y tales que A ⊂ B. Demostrar

que si P (A) 6= 0, entonces P (B) = 1.

30. Sean A, B y C tres sucesos independientes. Probar que:

a) A es independiente de (B ∩ C).

b) A es independiente de (Bc ∩ C).

c) A es independiente de (Bc ∩ Cc).

d) A es independiente de (B ∪ C).

e) A es independiente de (Bc ∪ C).

f ) A es independiente de (Bc ∪ Cc).



1.7. Anexo

Demostración de la propiedad 7 de la Proposición 4

Sean A1, A2, . . . , An sucesos cualesquiera, entonces

P

(n⋃i=1

Ai

)=

n∑k=1

(−1)k+1∑

1≤i1

1.7 Anexo 51

P (An+1)− P ((⋃ni=1Ai) ∩ An+1) = P (An+1)− P (

⋃ni=1 (Ai ∩ An+1)) =

P (An+1) −︸︷︷︸(−1)1

∑nk=1(−1)k+1

∑1≤i1


P

(n+1⋃i=1

Ai

)=

n+1∑k=1

(−1)k+1∑

1≤i1

Caṕıtulo 2

Variables Aleatorias

54 2. Variables Aleatorias

2.1. Conceptos iniciales

Comencemos introduciendo el concepto a través de un ejemplo. Se tira un dado

no cargado n veces, y se quiere hallar (bajo el espacio clásico de probabilidades) la

probabilidad de obtener exactamente k veces el seis (suceso A), donde 0 ≤ k ≤ n.

Luego de haber sobrevivido a los ejercicios de conteo, el estudiante puede sin

mayor dificultad calcular esta probabilidad.

Representando los n lugares disponibles, podemos pensar, en principio, que

los k seis, salen en los primeros k lanzamiento, es decir:

6−

6− · · ·

6−︸︷︷︸

k lanzamientos

6=6−6=6− · · ·

6=6−︸︷︷︸

n−k lanzamientos

Para esta situación, llamémosle suceso B, utilizando que hay independencia

en las tiradas, tenemos

P (B) = P (1o = 6) · · ·P (ko = 6)︸︷︷︸k éxitos

P ((k + 1)o 6= 6) · · ·P (no 6= 6)︸︷︷︸n−k fracasos

=

(1

6

)k (1− 1

6

)n−k

Por último, nos sirve que en los primeros k lanzamientos obtengamos los 6’s,

o también en los últimos k o también en cualquier ubicación en la que podamos

ubicar a los k 6’s en los n lugares, en total Cnk posibilidades. Cada ubicación

nos da lugar a un suceso disjunto de otro, pero igualmente tiene probabilidad

(1/6)k(1− 1/6)n−k, por lo tanto

P (A) = Cnk

(1

6

)k (1− 1

6

)n−k

Sobre el mismo esquema, supongamos que ahora queremos la probabilidad de

obtener exactamente k veces el 6 o 4, ahora nuestro “éxito” tiene probabilidad

2/6 = 1/3 y por tanto nuestro fracaso tiene probabilidad 1 − 1/3. Manteniendo


2.1 Conceptos iniciales 55

el mismo esquema, y suponiendo que los lanzamientos se hacen de forma inde-

pendiente, obtenemos que

P (obtener exactamente k veces, 4 o 6) = Cnk

(1

3

)k (1− 1

3

)n−kEs más, si nuestro suceso consta de obtener k éxitos y n− k fracasos, donde

los experimentos se hacen de forma independiente y la probabilidad de éxito, en

cada experimento, es p (por tanto la de fracaso es 1− p = q), tenemos que

P (obtener exactamente k éxitos) = Cnk pk (1− p)n−k

Supongamos ahora que se tiene un grupo de 40 estudiantes del curso de Prob-

abilidad y Estad́ıstica (que supondremos con comportamientos independientes)

donde se estima que la probabilidad que uno salve el examen en diciembre (primer

peŕıodo) es 0, 3. Supongamos que ha pasado tal peŕıodo y no tenemos más infor-

mación, ¿ cuál es la probabilidad de que de los 10 estudiantes que se presentaron,

exactamente la mitad hallan salvado el examen?. Aqúı podŕıamos intentar hacer

todo un nuevo desarrollo, pero... si observamos con detenimiento, no hay mayor

diferencia con el problema de los dados. Tenemos n = 10 realizaciones independi-

entes de un mismo experimento, elegir al azar un estudiante, y la probabilidad de

“éxito” (salvar el examen) es 0, 3, igual para todos los estudiantes. Por lo tanto,

la probabilidad deseada es:

P (exactamente 5 estudiantes salvaron el examen) = C105 (0, 3)5 (1− 0, 3)5 ∼= 0, 154

En el ejemplo anterior se hicieron algunos supuestos:

a. Se repiten n experimentos independiente.

b. La probabilidad de “éxito” en cada experimento es constante e igual a p.


56 2. Variables Aleatorias

Bajo estas hipótesis, la probabilidad de tener exactamente k éxitos

k = 0, . . . , n es Cnk pk (1− p)n−k.

Una primera aproximación al concepto de variable aleatoria puede ser for-

mulado a partir de esta idea, tratamos de construir modelos, de modo que al

verificarse ciertas hipótesis, tengamos el cálculo de probabilidades ya resuelto.

Sin lugar a duda, el concepto de variable aleatoria es mucho más “profundo”,

pero esta idea sirve al estudiante para ir incorporando el concepto.

Retomemos el ejemplo de la tirada del dado pero ahora en un caso más sencillo,

el dado se tira 4 veces, de forma independiente y se quiere hallar la probabilidad

de obtener exactamente 2 veces el seis. La probabilidad de tal evento la podemos

calcular como antes, pero ahora nuestro estudio será dirigido en otro sentido,

veamos primero quién es nuestro espacio muestral:

Ω = {(x1, x2, x3, x4) ∈ {1, 2, 3, 4, 5, 6}4}

Es decir, x1 representa lo que sale en la primer tirada del dado, x2 en la segunda y

aśı sucesivamente. Por lo tanto, algunos elementos de Ω son (1, 4, 5, 2) o (5, 2, 6, 6).

Podemos determinar una función que, para cada elemento de Ω, nos dé la

cantidad de seis, es decir

X : Ω→ R tal que X(ω) = “cantidad de seis en ω′′

Por ejemplo X((1, 4, 5, 2)

)= 0, X

((5, 2, 6, 6)

)= 2. De ésta forma, nos

interesan todos los ω ∈ Ω tal que X(ω) = 2, es decir X−1({2}).

Recordemos que si tenemos una función f : A → B, y un subconjunto del

codominio Y ⊂ B, entonces

f−1(Y ) = {x ∈ A : f(x) ∈ Y }


2.1 Conceptos iniciales 57

Es común que estudiantes principiantes se confundan con la función inversa, pero

aqúı nada se habla de función inversa, de hecho, anotamos f−1(Y ) para indicar

conjunto contra imagen de Y por la función f , de donde el sentido que le damos

aqúı a f−1 es como una función aplicada a conjuntos

f−1 : P(B)→ P(A) tal que f−1(Y ) = {x ∈ A : f(x) ∈ Y }

Algunas propiedades que el lector puede probar son:

1. f−1(B) = A.

2. f−1(Y ∪Z) = f−1(Y )∪ f−1(Z), en general f−1(⋃+∞

n=1 Yn)

=⋃+∞n=1 f

−1(Yn).

3. f−1(Y c) = (f−1(Y ))c.

4. Si Y ⊂ Z ⇒ f−1(Y ) ⊂ f−1(Z).

5. f−1(Y ∩ Z) = f−1(Y ) ∩ f−1(Z).

Sin duda que, pensando más en general, debemos exigir que X−1({2}) sea un

suceso, para poderle calcular su probabilidad, dicha probabilidad es la probabili-

dad de obtener exactamente 2 seis. De querer calcular la probabilidad de obten-

er al menos un seis , podŕıamos pensarlo como P (X−1({1, 2, 3, 4})), de donde

X−1({1, 2, 3, 4}) también debeŕıa ser un suceso.

Más

marclan/pye2010ipa/notas de probabilidad, fdeo.pdf · comentarios y agradecimientos: estas notas...

Documents