marclan/pye2010ipa/notas de probabilidad, fdeo.pdf · comentarios y agradecimientos: estas notas...
TRANSCRIPT
-
Introducción a la
Probabilidad
Nivel Terciario
Federico De Olivera Lamas
-
Comentarios y agradecimientos:
Estas notas fueron realizadas durante el dictado del curso 2007 de probabilidad
y estad́ıstica de IPA. Abarcan los temas correspondientes a probabilidad, no a
estad́ıstica cosa que aún tengo en el debe.
Debo notar que este curso no se ubica en la posición deseada dentro de la
carrera, ya que se dicta conjuntamente con Análisis II (donde se estudia varias
variables) mientras que debeŕıa ser Análisis II previa de Probabilidad y Estad́ısti-
ca, como lo es en todas las carreras que tienen este curso. Lamentablemente, por
motivos ajenos a lo que a mi respecta, en la nueva carrera de profesorado de
matemática este asunto no fue corregido.
Para el lector que recién comienza en estos temas le aclaro un poco más.
Cuando uno estudia lo básico de inferencia estad́ıstica se enfrenta a información
vectorial, por ejemplo si a cada persona se le pregunta edad, peso e ingresos
mensuales, entonces obtenemos un vector (x1, x2, x3) ∈ R3 para cada persona.
Cualquier tipo de modelización que queramos aplicarle a la información obteni-
da para un grupo de personas necesita del conocimiento de funciones de varias
variables.
El problema antes mencionado llevó a que la estructura de estas notas no
es la habitual. Comenzamos con el estudio de espacios de probabilidad y luego
pasamos a variables aleatorias, en este punto no se trabaja con vectores aleatorios
y se pasa al trabajo con esperanzas de variables aleatorias. Luego de estudiados
estos aspectos y con la “esperanza” de que en análisis II ya se hallan estudiado
integrales múltiples, nos introducimos en un rápido recorrido por los vectores
aleatorios y sus esperanzas. Por último nos introducimos en los tipos de conver-
gencias dando lugar a los important́ısimos teoremas: Ley de los Grandes Números
y Teorema del Ĺımite Central.
-
Un último comentario es que estas notas son realizadas apuntando a un nivel
terciario, por ende se requiere de cierta madurez del razonamiento, sin embargo,
hay algunos resultados que el estudiante puede asumir sin entrar en detalles, como
la existencias de conjuntos no medibles (referente a la medida de Lebesgue),
la construcción del proceso de Poisson o la integral de Riemann-Stieltjes (no
estudiada sobre esta carrera).
Mis gracias a Santiago y Marcela por el apoyo y la tolerancia brindados.
5 de mayo de 2008.
Federico De Olivera Lamas
-
Índice general
1. Espacios de Probabilidad 1
1.1. Espacio muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. Necesidad de una σ-álgebra . . . . . . . . . . . . . . . . . . . . . 3
1.3. Axiomas de la Probabilidad . . . . . . . . . . . . . . . . . . . . . 14
1.4. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . 28
1.5. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.7. Anexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2. Variables Aleatorias 53
2.1. Conceptos iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.2. Función de distribución . . . . . . . . . . . . . . . . . . . . . . . . 60
2.3. Tipos de Variables Aleatorias . . . . . . . . . . . . . . . . . . . . 66
2.3.1. Algunos modelos de variables aleatorias discretas . . . . . 77
Federico De Olivera Lamas
-
ii ÍNDICE GENERAL
2.3.2. Algunos modelos de variables aleatorias
absolutamente continuas. . . . . . . . . . . . . . . . . . . . 92
2.4. Transformaciones de variables aleatorias . . . . . . . . . . . . . . 103
2.4.1. Simulación Montecarlo . . . . . . . . . . . . . . . . . . . . 110
2.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3. Esperanza Matemática 127
3.1. Esperanza de una variable aleatoria . . . . . . . . . . . . . . . . . 128
3.2. Esperanza de una transformación de v.a. . . . . . . . . . . . . . . 140
3.3. Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
3.4. Función Generatriz de Momentos . . . . . . . . . . . . . . . . . . 153
3.5. Función caracteŕıstica . . . . . . . . . . . . . . . . . . . . . . . . . 161
3.6. Otras medidas de una variable aleatoria . . . . . . . . . . . . . . . 164
3.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
3.8. Anexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
4. Vectores Aleatorios 175
4.1. Conceptos iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . 176
4.2. Tipos de vectores aleatorios . . . . . . . . . . . . . . . . . . . . . 184
4.3. Independencia de variables aleatorias . . . . . . . . . . . . . . . . 192
4.4. Transformaciones de vectores aleatorios . . . . . . . . . . . . . . . 199
4.5. Esperanza de funciones de vectores aleatorios . . . . . . . . . . . 205
Federico De Olivera Lamas
-
ÍNDICE GENERAL iii
4.5.1. Esperanza de la suma y el producto de v.a. . . . . . . . . . 206
4.5.2. Varianza de la suma de v.a. . . . . . . . . . . . . . . . . . 213
4.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
5. Convergencias 223
5.1. Convergencia en Probabilidad . . . . . . . . . . . . . . . . . . . . 225
5.2. Convergencia casi segura . . . . . . . . . . . . . . . . . . . . . . . 228
5.3. Ley de los grandes números . . . . . . . . . . . . . . . . . . . . . 232
5.4. Convergencia en Ley . . . . . . . . . . . . . . . . . . . . . . . . . 236
5.5. Teorema del Ĺımite Central . . . . . . . . . . . . . . . . . . . . . 240
5.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
Federico De Olivera Lamas
-
Caṕıtulo 1
Espacios de Probabilidad
Ya desde algunos cursos en la educación secundaria se ha introducido la idea de
Probabilidad. En general, en esos cursos se estudia lo que se denomina definición
de Laplace o clásica.
En la definición clásica, las probabilidades se calculan con aquello de “casos
favorables sobre casos posibles”, si bien en aquél momento bastaba con esa idea de
probabilidad, es una versión muy simplificada de lo que significa “Probabilidad”.
En nuestro curso estudiaremos la probabilidad como una medida para nues-
tro grado de incertidumbre, asignándole el valor mı́nimo cero (total incertidum-
bre) y valor máximo uno.
Es claro que nos enfrentaremos con algunos problemas, el primero es: ¿a qué le
calcularemos la probabilidad, en qué condiciones?. estas y otras tantas preguntas
iremos estudiando a lo largo del curso, donde además intentaremos desarrollar
algunos modelos matemáticos que nos faciliten el abordaje del cálculo de proba-
bilidades.
-
2 1. Espacios de Probabilidad
1.1. Espacio muestral
Supongamos que un experimento sea realizado sobre ciertas condiciones fijas.
El conjunto Ω de los resultados elementales e indivisibles será llamado espacio
muestral o espacio de resultados posibles. A los elementos del espacio muestral
los llamaremos sucesos elementales y los notaremos ω.
Ejemplo 1
Se tira un dado y se observa la cantidad de puntos de la cara superior al caer.
Aqúı Ω = {1, 2, 3, 4, 5, 6} y sus elementos son sucesos elementales. Observemos
que el conjunto {1, 2} no es un resultado indivisible, por ende no es un elemento
del espacio muestral y por tanto no es un suceso elemental.
Śı son sucesos elementales ω1 = {1}, . . . , ω6 = {6}. /
En ocasiones no es tan sencillo determinar el espacio muestral, veamos el
siguiente ejemplo.
Ejemplo 2
Se selecciona un individuo de Montevideo y se mide su altura en metros.
¿ Cuál es el espacio muestral?.
Es claro que medir su altura con dos decimales, es una mera aproximación
de la verdadera altura del individuo. Un individuo podŕıa eventualmente medir
1, 70 metros, pero también podŕıa medir π/2 metros, aunque nuestros útiles de
medición no nos permitan saber con exactitud dicha medida.
De aqúı que la altura es un número real, claramente positivo y a priori no
acotado superiormente. En efecto, si suponemos que el individuo más alto mide
2, 10 metros, no hay nada que nos asegure que podamos encontrar en algún
Federico De Olivera Lamas
-
1.2 Necesidad de una σ-álgebra 3
momento alguno que mida 2, 20 metros. Es claro que poner, por ejemplo mil
metros, es una cota más que razonable a los efectos prácticos. En éste ejemplo
nuestro espacio muestral es Ω = (0,+∞). /
En el ejemplo anterior se observa que muchos elementos del espacio mues-
tral son imposibles, es más, podŕıamos haber seleccionado a todos los números
reales como espacio muestral y no cambiaŕıa sustancialmente nuestro concepto de
espacio muestral, sólo que encontraŕıamos muchos sucesos que seŕıan imposibles.
1.2. Necesidad de una σ-álgebra
Manejando el concepto de probabilidad de los cursos de secundaria, si el ex-
perimento consiste en tirar un dado y observar la cantidad de puntos en la cara
superior, podŕıamos calcular la probabilidad de “obtener un 2”, de hecho, si dicho
suceso elemental lo anotamos con A, tenemos que:
P (A) =casos favorables
casos posibles=
1
6
Además podemos calcular la probabilidad de B=“obtener un número par”,
aunque éste no sea un suceso elemental, P (B) = 36. Sin mayor dificultad el lec-
tor podrá observar que en este ejemplo, podemos calcular la probabilidad de
cualquier subconjunto del espacio muestral, es decir, podemos calcular la proba-
bilidad de cualquier elemento de partes de Ω (partes de Ω, el conjunto de todos
los subconjuntos de Ω, lo anotaremos 2Ω o P(Ω)).
Lamentablemente no siempre es posible calcular la probabilidad de cualquier
subconjunto del espacio muestral. La justificación es basada en la medida de
Lebesgue de la que daremos una breve introducción. Comencemos introduciendo
el problema con un ejemplo.
Federico De Olivera Lamas
-
4 1. Espacios de Probabilidad
Ejemplo 3
Tiramos un dardo sobre una pared, la base de la pared la medimos en una cierta
unidad tal que represente al intervalo [0, 1] y observamos la coordenada (horizon-
tal) en la que quedó el dardo. Es claro que Ω = [0, 1].
Haciendo una extensión de la noción de probabilidad anterior a), podŕıamos
tratar de calcular la probabilidad de que el dardo quede en el intervalo [1/3, 1/2].
Es razonable que dicha probabilidad sea calculada como la medida del intervalo
[1/3, 1/2] sobre la medida del intervalo [0, 1], es decir:
P (“dardo quede en [1/3, 1/2]”) =m([1/3, 1/2])
m([0, 1])=
1/2− 1/31− 0
= 1/6
De aqúı deducimos que, en este ejemplo, el cálculo de probabilidades se reduce
a medir conjuntos, por ejemplo, ¿cuál es la probabilidad de que el dardo quede
en una coordenada racional?, como hemos estudiado en Análisis I, la medida de
cualquier conjunto numerable es cero y por ende, tal probabilidad es cero.
¿ Para cualquier subconjunto E del intervalo [0, 1], podemos hallar la prob-
abilidad que el dardo quede en E?. Tal pregunta es equivalente a ¿a cualquier
subconjunto E del intervalo [0, 1] lo podemos medir con las nociones básicas de
medida?.
Como ya se mencionó, para responder tendremos que hacer una breve intro-
ducción a los conceptos de medida. /
La medida que extiende el concepto de longitud es la llamada medida de
Lebesgue, algunas propiedades que ésta debe cumplir son:
1. La medida del intervalo cerrado [0, 1] es uno, es decir, m([0, 1]) = 1.
2. Si trasladamos un conjunto, su medida no cambia, es decir, si E es un
conjunto de reales y x es un número real cualquiera, m(x + E) = m(E),
a)Aún no hemos definido a la probabilidad, pero nos manejamos con conceptos intuitivos.
Federico De Olivera Lamas
-
1.2 Necesidad de una σ-álgebra 5
donde x+ E = {x+ y : y ∈ E}.
Por ejemplo: m(2 + [0, 1]︸ ︷︷ ︸=[2,3]
) = m([2, 3]) = 3− 2 = 1 = m([0, 1]).
3. Si deseamos medir una colección numerable de conjuntos disjuntos (incom-
patibles) E1, E2, . . . , En, . . . ,donde Ei ∩ Ej = ∅ para i 6= j, es razonable
pedir que m(⋃+∞n=1En) =
∑+∞n=1En.
Por ejemplo: m([0, 1] ∪ [2, 3] ∪ [5, 8]) = m([0, 1]) +m([2, 3]) +m([5, 8]).
Veamos a continuación un ejemplo en el cual se muestra un conjunto no
medible:
Ejemplo 4 (Un conjunto no medible)
Consideremos el intervalo [0, 1] y sobre éste definamos la relación:
xRy ⇔ x− y ∈ Q, es decir, dos reales del intervalo [0, 1] se relacionan, si y sólo
si, distan un racional.
El lector podrá verificar que se trata de una relación de equivalencia.
Formemos ahora un conjunto E, tomando uno y sólo un elemento de cada clase
de equivalencia (axioma de elección b)). Por ejemplo: 0, 1/e y 1/π pertenecen a
clases distintas pues no distan un racional, de aqúı que 0, 1/e, 1/π ∈ E, entre
otros.
Tomemos ahora un racional q del intervalo [0, 1], que representa la “distancia”
a la que están los elementos en las clases, y formemos el conjunto Eq como sigue:
Eq = {(x+ q)mod(1) : x ∈ E}
En otras palabras, sin usar módulo, a cada elemento del conjunto E lo
b)Acá estamos usando el axioma de elección que dice, resumidamente, que si uno tiene una
familia de conjuntos y toma un elemento de cada uno, entonces obtiene también un conjunto.
Federico De Olivera Lamas
-
6 1. Espacios de Probabilidad
trasladamos el racional q y los que sobrepasen al 1 lo trasladamos al comien-
zo para aseguramos que queden en [0, 1] , es decir:
Eq = {x+ q : x ∈ E si x+ q ≤ 1} ∪ {x+ q − 1 : x ∈ E si x+ q > 1}
Observemos que si 0 ∈ E entonces 1 6∈ E pues son de la misma clase, por lo
tanto la unión que determina a los Eq es disjunta.
Al hacer variar q sobre todos los racionales de [0, 1] obtenemos todos los
elementos de cada clase. Por ejemplo, como 1/e ∈ E, al sumarle q obtenemos el
elemento que dista el racional q de 1/e, al hacerlo para todos los racionales del
intervalo [0, 1] obtenemos todos los elementos de la clase de 1/e y ésto vale para
todos los elementos de E en donde hay un representante de cada clase.
De lo anterior deducimos que⋃
q∈Q∩[0,1]
Eq(1)=[0, 1].
Además, los conjuntos Eq son disjuntos. En efecto, observemos que si
a ∈ Eq ∩ Er, entonces a es representado por un elemento xα en E tal que
xα+q = a y también es representado por un elemento xβ en E tal que xβ +r = a
c). Pero xα “dista” de xβ el racional r − q 6= 0 y por lo tanto llegamos a que en
E hay dos elementos de una misma clase, en absurdo con la definición de E.
En resumen, los conjuntos Eq son una sucesión numerable de conjuntos dis-
juntos, donde de ser medibles tendŕıamos que
c) estamos suponiendo que xα + q ≤ 1 y xβ + q ≤ 1, es análogo si no fuera aśı.
Federico De Olivera Lamas
-
1.2 Necesidad de una σ-álgebra 7
m(Eq) = m({x+ q : x ∈ E si x+ q ≤ 1} ∪ {x+ q − 1 : x ∈ E si x+ q > 1})disj= m({x+ q : x ∈ E si x+ q ≤ 1}︸ ︷︷ ︸
(q+E)∩[0,1]
) +m({x+ q − 1 : x ∈ E si x+ q > 1}︸ ︷︷ ︸(q−1+E)∩[0,1]
)
= m(E ∩ [q, 1]) +m(E ∩ [0, q))disj= m
((E ∩ [0, q]) ∪ (E ∩ (q, 1])︸ ︷︷ ︸
E
)= m(E) = c
Concluimos que, de ser medible cada Eq, entonces miden todos una constante c.
A los racionales en [0, 1], por ser infinitos y numerables, renombremoslos con
qn, es decir, Q ∩ [0, 1] = ∪+∞n=1{qn}.
Utilizando las propiedades deseadas de medida tenemos que:
1 = m([0, 1])por (1)
= m(⋃
q∈Q∩[0,1]
Eq)︸ ︷︷ ︸m(∪+∞n=1Eqn )
disjuntos= =
+∞∑n=1
m(Eqn) =+∞∑n=1
c
Donde obtenemos un absurdo, pues si c = 0 llegamos a que 1 = 0 y si c > 0
llegamos a que 1 = +∞. El absurdo se genera al pensar que los conjuntos Eq son
medibles.
En resumen, como cada Eq resultaba de una traslación de E, concluimos que
E no es medible y esto responde negativamente la pregunta ¿todo subconjunto
de R es medible ?. /
Como resultado concluimos que no todo subconjunto de R es medible y por
tanto no podemos calcular la probabilidad de que el dardo quede en E para
cualquier subconjunto de [0, 1].
Es importante resaltar que, con lo mostrado arriba, el dominio de la proba-
bilidad no siempre podrá ser P(Ω). Necesitaremos introducir un nuevo concepto,
el de σ- álgebra, ésta será una subfamilia de subconjuntos del espacio muestral
Federico De Olivera Lamas
-
8 1. Espacios de Probabilidad
en donde siempre podemos calcular probabilidades. En el caso de la recta real,
utilizaremos la σ- álgebra de Borel que será introducida más adelante.
Indagando los requisitos de una Probabilidad
Tratemos de indagar sobre los requisitos mı́nimos que deseamos que cumpla
una probabilidad, retomemos el ejemplo de la tirada de un dado, aqúı Ω =
{1, 2, 3, 4, 5, 6}.
Es claro que podemos calcular la probabilidad de A2 =“sale 2” y de A3 =“sale
3”, de donde A2 y A3 deben estar en el dominio de la probabilidad. Pero también
nos interesaŕıa calcular la probabilidad de A2 ∪A3 =“sale 2 o 3”, de donde, si A2y A3 están en el dominio de la probabilidad, entonces A2 ∪ A3 también lo está.
Es evidente que podemos extender este requerimiento para una unión finita, por
ejemplo, “sale 1, o 2, o 3, o 4, o 5, o 6”=A1∪A2∪A3∪A4∪A5∪A6 debe estar en el
dominio de la probabilidad, es más, según los conceptos previos de probabilidad,
dado que los conjuntos son disjuntos, P (∪6i=1Ai) =∑6
i=1 P (Ai)︸ ︷︷ ︸1/6
= 1.
Trabajar con uniones finitas no siempre es suficiente, supongamos que ob-
servamos la cantidad de autos que llegan a un peaje en un lapso de tiempo.
Aqúı Ω = {0, 1, 2, . . . , n, . . .} = N y por tanto, si podemos calcular la probabili-
dad de que hayan llegado n autos, debeŕıamos poder calcular la probabilidad de
que “llagaron 0, o 1, o 2,..., o n, ... autos” (a saber, tal probabilidad debe ser 1) y
por tanto, si A0, A1, . . . , An, . . . están en el dominio de la probabilidad, también
debe estar ∪+∞n=0An
Volviendo al ejemplo de la tirada del dado, si A =“sale 1, o 2” está en el
dominio de la probabilidad, entonces debe estar Ac =“sale 3, o 4, o 5, o 6”.
Hemos introducido el concepto de σ- álgebra, el que nos servirá como dominio
de la probabilidad.
Federico De Olivera Lamas
-
1.2 Necesidad de una σ-álgebra 9
Definición 1 (σ-álgebra)
Dado un conjunto Ω, llamamos σ- álgebra de Ω, o simplemente σ-álgebra, a una
familia A, de subconjuntos de Ω, tal que:
i) A 6= ∅
ii) Si A ∈ A entonces Ac ∈ A
iii) Si A1, A2, . . . , An, . . . ∈ A entonces+∞⋃n=1
An ∈ A
El lector podrá verificar que la definición de σ- álgebra, coincide con lo
deseábamos que cumpliera el dominio de la probabilidad.
Ejemplo 5
Dado un conjunto Ω, P(Ω) es una σ- álgebra, ya que Ω ∈ P(Ω) y por tanto P(Ω)
es no vaćıa. Si A ∈ P(Ω) entonces Ac también es un subconjunto de Ω, de donde
Ac ∈ P(Ω) y lo mismo ocurre para la unión. /
Si bien P(Ω) es una σ- álgebra, como vimos en el ejemplo 3, no siempre nos
servirá como dominio de la probabilidad, en donde debemos trabajar con otra σ-
álgebra.
Ejercicio 1
Dado un conjunto Ω. Probar queA = {∅,Ω} es una σ- álgebra. La σ- álgebra
A = {∅,Ω} es llamada σ- álgebra trivial. �
Ejemplo 6
Sea Ω un conjunto no numerable de números reales, probemos que
A = {A ⊂ Ω : Aes numerable o Ac es numerable}
es una σ- álgebra.
Federico De Olivera Lamas
-
10 1. Espacios de Probabilidad
i) Es claro que ∅ es numerable y por tanto ∅ ∈ A y de aqúı que A no es vaćıa.
ii) Si A ∈ A entonces,
o bien A es numerable y Ac no lo es, pero (Ac)c = A es numerable y por
tanto Ac ∈ A
o bien A no es numerable pero por pertenecer a A, Ac es numerable y de
aqúı que Ac ∈ A.
iii) Si A1, A2, . . . , An, . . . ∈ A puede ocurrir que:
* todos los An son numerables y por tanto, como la unión numerable de
conjuntos numerables es numerable, tenemos que⋃+∞n=1An ∈ A.
* si alguno de los An es no numerable, supongamos que el Aj no lo es, en-
tonces⋃+∞n=1An no es numerable, pero su complemento (
⋃+∞n=1An)
c =⋂+∞n=1(An)
c ⊂ (Aj)c y como Aj ∈ A y Aj no es numerable, entonces
(Aj)c es numerable. De lo anterior concluimos que
⋃+∞n=1An tiene com-
plemento numerable y por tanto⋃+∞n=1An ∈ A.
/
Tratemos de introducir ahora una σ- álgebra que nos sea útil para calcular
probabilidades sobre intervalos de números reales.
Proposición 1
Sea A una σ- álgebra de subconjuntos de Ω, entonces ∅,Ω ∈ A.
Demostración: En efecto, como A es no vaćıa, tenemos que existe algún A tal
que A ∈ A, por la definición de σ- álgebra, Ac ∈ A y por tanto Ω = A∪Ac ∈ A.
Dado que Ω ∈ A, tenemos que ∅ = Ωc ∈ A. �
Federico De Olivera Lamas
-
1.2 Necesidad de una σ-álgebra 11
Proposición 2
Sea A una σ- álgebra de subconjuntos de Ω, si A1, A2, . . . , An, . . . ∈ A entonces⋂+∞n=1An ∈ A
Demostración: Como A1, A2, . . . , An, . . . ∈ A tenemos que Ac1, Ac2, . . . , Acn, . . . ∈
A y por lo tanto⋃+∞n=1A
cn ∈ A. Nuevamente,
+∞⋂n=1
An =+∞⋂n=1
(Acn)c︸ ︷︷ ︸
An
DeMorgan=
(+∞⋃n=1
Acn
)c∈ A
�
Proposición 3
Consideremos un conjunto Ω y las σ- álgebras Aλ de subconjuntos de Ω (λ ∈ L,
con L algún conjunto de ı́ndices). Entonces A =⋂λ∈ L
Aλ es también una σ- álgebra
de subconjuntos de Ω.
Demostración: i) Por ser Aλ σ- álgebra, ∅ ∈ Aλ ∀ λ ∈ L, por lo tanto,
∅ ∈⋂λ∈ LAλ y de aqúı que A es no vaćıa.
ii) Si A ∈ A, entonces A ∈ Aλ ∀ λ ∈ L, siendo Aλ σ- álgebra, Ac ∈ Aλ ∀ λ ∈ L
y por lo tanto Ac ∈⋂λ∈ LAλ
iii) Si A1, A2, . . . , An, . . . ∈ A entonces A1, A2, . . . , An, . . . ∈ Aλ ∀ λ ∈ L, siendo
Aλ σ- álgebra,⋃+∞n=1An ∈ Aλ ∀ λ ∈ L y por lo tanto
⋃+∞n=1An ∈
⋂λ∈ LAλ
�
Dada una familia F cualquiera de subconjuntos de Ω, siempre tenemos que
F ⊂ P(Ω) y por lo tanto siempre hay al menos una σ- álgebra que contiene a F .
Este resultado es vital para la siguiente definición.
Federico De Olivera Lamas
-
12 1. Espacios de Probabilidad
Definición 2 (σ-álgebra generada)
Dada una familia F de subconjuntos de Ω, llamamos σ- álgebra generada por F ,
a la σ- álgebra M(F) =⋂Aλ donde la intersección es realizada sobre todas las
σ- álgebras que contienen a F .
Ejemplo 7
Sea Ω = {1, 2, 3} y F = {{1, 2}}. Veamos qué σ-álgebras contienen a F :
P(Ω) = {∅,Ω, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}}
también {∅,Ω, {3}, {1, 2}}
¿hay alguna otra?, el lector podrá verificar que no.
Por lo tanto, M(F) = P(Ω) ∩ {∅,Ω, {3}, {1, 2}} = {∅,Ω, {3}, {1, 2}}. /
Veamos ahora una σ- álgebra muy importante a la hora de avanzar en temas
de probabilidad.
Definición 3 (La σ- álgebra de Borel en R)
Sea R nuestro espacio muestral y consideremos a la familia de intervalos abiertos
de R:
F = {(a, b) : a, b ∈ R, a < b}
llamamos σ- álgebra de Borel a la σ- álgebra generada por F , que anotamos B.
Para aclarar ideas, la σ- álgebra de Borel en R, es la menor σ- álgebra que
contiene a los abiertos de R. Es erróneo pensar que B sólo contiene abiertos ya que
si (a, b) ∈ B entonces (a, b)c ∈ B y por ser el complemento de un abierto, (a, b)c es
cerrado. Además, como ya vimos, las uniones, las intersecciones y complementos
de elementos de B están en B.
Federico De Olivera Lamas
-
1.2 Necesidad de una σ-álgebra 13
Ejemplo 8
Los intervalos cerrados están en B. En efecto, dado un intervalo cerrado [a, b],
sabemos que [a, b] =⋂+∞n=1 (a− 1/n, b+ 1/n)︸ ︷︷ ︸
∈B
∈ B. /
La σ- álgebra de Borel goza de la propiedad que todos sus elementos son
medibles según la medida de Lebesgue, es por este motivo que la utilizaremos
como dominio de la probabilidad en casos como el introducido en el ejemplo
del dardo ( ejemplo 3). Sin lugar a duda, mostrar que los elementos de B son
medibles excede nuestros objetivos y podrá ser estudiado en un curso de Análisis
Real (medida).
Por último, veamos una extensión de la σ- álgebra de Borel a Rn.
Definición 4 (La σ- álgebra de Borel en Rn)
Sea Rn nuestro espacio muestral, la σ- álgebra de Borel en Rn, a la cual anotamos
Bn es la generada por los abiertos de Rn.
Excede también nuestro curso probar que Bn es efectivamente una σ- álgebra.
En el práctico se verán otros ejemplos de σ- álgebra.
A continuación definimos un espacio donde podremos definir una probabili-
dad:
Definición 5 (Espacio probabilizable)
A la pareja (Ω,A), donde Ω representa el espacio muestral y A es una σ- álgebra
de subconjuntos de Ω, la llamaremos espacio probabilizable. A los elementos
de A los llamaremos sucesos.
Federico De Olivera Lamas
-
14 1. Espacios de Probabilidad
1.3. Axiomas de la Probabilidad
La probabilidad tal como la hemos venido introduciendo, es una medida para
nuestro grado de incertidumbre. En 1933, Kolmogórov publicó el libro Los fun-
damentos de la Teoŕıa de la Probabilidad, estableciendo las bases modernas de
la teoŕıa axiomática de la probabilidad.
Definición 6 (Axiomas de Kolmogórov)
Dado un espacio probabilizable (Ω,A), una probabilidad es una función
P : A → R tal que:
P (A) ≥ 0 para todo suceso A (A ∈ A)
P (Ω) = 1
Si A1, A2, . . . , An, . . . son sucesos disjuntos dos a dos (Ai∩Aj = ∅ con i 6= j)
entonces
P
(+∞⋃n=1
An
)=
+∞∑n=1
P (An)
Algunas cosas que son importantes resaltar son las siguientes, sólo podemos
calcularle la probabilidad a los elementos de la σ- álgebra, la probabilidad de
cualquier suceso es siempre mayor o igual a cero (más adelante veremos que
también es menor o igual a uno), la probabilidad de la unión disjunta es la suma
de las probabilidades.
Definición 7 (Espacio de probabilidad)
A la terna (Ω,A, P ) la llamamos espacio de probabilidades
Sólo cuando esté dado un espacio de probabilidades, es cuando se procede a
calcular probabilidades. A continuación veremos algunos ejemplos que nos per-
Federico De Olivera Lamas
-
1.3 Axiomas de la Probabilidad 15
mitirán aclarar ideas.
Ejemplo 9
Se tira una moneda al aire y se observa la cara superior al caer.
Aqúı Ω = {“cara”,“número”}, consideremos la σ- álgebra A =
P(Ω) = {∅,Ω, “cara”, “número”} y supongamos que no tenemos indi-
cios para suponer que la moneda esté cargada, es decir, suponemos que
P (“cara”) = P (“número”) = 1/2.
Tenemos además que P (Ω) = 1 y como veremos más adelante, P (∅) = 0, de
donde tenemos definida la probabilidad para cualquier elemento de la σ- álgebra.
Hemos construido aśı, el espacio de probabilidades (Ω,A, P ).
Pero supongamos ahora que śı tenemos sospechas que la moneda esté cargada,
pues al tirarla 100 veces, se obtuvieron 20 caras y 80 números.
Podŕıamos suponer aqúı que P (“cara”) = 20/100 = 1/5 y
P (“número”) = 80/100 = 4/5.
Sin duda que este cambio altera sustancialmente nuestro concepto previo de
probabilidad, aqúı se refleja en la obtención de un espacio de probabilidades
distinto al anterior.
Por ahora no estudiaremos como “estimar” dichas probabilidades, es un tema
que se estudiará en estad́ıstica, en este ejemplo se trató de hacer notar que siempre
tenemos que trabajar sobre un espacio de probabilidades dado. /
Ejemplo 10 (El espacio de probabilidades clásico o de Laplace)
Supongamos que nuestro espacio muestral es finito, Ω = {ω1, ω2, . . . , ωn} y que
la σ- álgebra es A = P(Ω). Definamos las probabilidades como sigue:
P (ω1) = P (ω2) = · · · = P (ωn) =1
n
Federico De Olivera Lamas
-
16 1. Espacios de Probabilidad
Siendo P una probabilidad, si A es un suceso cualquiera, compuesto por k sucesos
elementales, A = {ωi1 , . . . , ωik} = ∪kj=1{ωij}, entonces
P (A) = P (k⋃j=1
{ωij})(1)=
k∑j=1
P (ωij)︸ ︷︷ ︸1/n
=k
n
En (1) se usó que la unión es disjunta. El cociente k/n es lo que se conoce
habitualmente como “casos favorables (k), sobre casos posibles (n)”. /
El espacio de probabilidades clásico es utilizado cuando el espacio muestral
es finito y no hay indicios de que los sucesos elementales tengan probabilidades
distintas, por ejemplo, cuando tiramos un dado y observamos la cantidad de
puntos en la cara superior. Trabajando sobre el espacio de probabilidades clásico,
calculemos la probabilidad de obtener un número par. Nuestro suceso es A =
{“sale 2, o 4, o 6”}, por lo tanto P (A) = 3/6 = 1/2.
Antes de dar más ejemplos de cálculo de probabilidades pasemos a estudiar
las propiedades que ésta posee.
Proposición 4 (Propiedades de la probabilidad)
Dado un espacio de probabilidades (Ω,A, P )
1. P (A) = 1− P (Ac) para todo suceso A
2. P (∅) = 0
3. Si A y B son sucesos tales que A ⊂ B, entonces P (A) ≤ P (B)
4. P (A) ∈ [0, 1] para todo suceso A
5. Sean A y B dos sucesos cualesquiera, entonces
P (A ∪B) = P (A) + P (B)− P (A ∩B)
Federico De Olivera Lamas
-
1.3 Axiomas de la Probabilidad 17
6. Sean A1, A2, . . . , An, . . . sucesos cualesquiera, entonces
P
(+∞⋃n=1
An
)≤
+∞∑n=1
P (An)
7. Sean A1, A2, . . . , An sucesos cualesquiera, entonces
P
(n⋃i=1
Ai
)=
n∑k=1
(−1)k+1∑
1≤i1
-
18 1. Espacios de Probabilidad
Observemos que los sucesos (B ∩ A) y (B ∩ Ac) son disjuntos y además
B = (B ∩ A) ∪ (B ∩ Ac), entonces
P (B) = P((B ∩ A) ∪ (B ∩ Ac)
) disjuntos= P (B ∩ A) + P (B ∩ Ac)
y si sustituimos este resultado en (1.1) obtenemos lo deseado.
6. Tratemos de escribir la unión⋃+∞n=1An como una unión disjunta. Definamos
E1 = A1, E2 = A2 − A1, E3 = A3 − (A1 ∪ A2), . . . , En = An −(∪n−1i=1 Ai
)y aśı sucesivamente para todo natural.
El lector podrá verificar fácilmente que En ⊂ An, An = ∪ni=1Ei y que
∪+∞n=1An = ∪+∞n=1En, donde los En son disjuntos dos a dos por construcción.
Luego
P
(+∞⋃n=1
An
)= P
(+∞⋃n=1
En
)disjuntos
=+∞∑n=1
P ( En︸︷︷︸⊂An
)
︸ ︷︷ ︸≤P (An)
≤+∞∑n=1
P (An)
7. El estudiante interesado puede ver la demostración por inducción completa
en el Anexo 1.7.
�
Las anteriores propiedades serán muy útiles al momento de calcular probabili-
dades, por ejemplo, en muchas oportunidades es más fácil calcular la probabilidad
del complemento que la del propio suceso.
Veamos ahora algunos ejemplos donde aplicamos las propiedades anteriores:
Ejemplo 11
Un estudiante tiene una probabilidad p de responder una pregunta en un examen
oral. Se le ofrecen dos alternativas: a) Hacerle sólo una pregunta; b) Hacerle tres
preguntas pero para salvar debe responder correctamente al menos dos.
Federico De Olivera Lamas
-
1.3 Axiomas de la Probabilidad 19
¿Cuál alternativa es más favorable?
Según la opción a), la probabilidad de salvar es p. Según la opción b), la
probabilidad de ganar se calcula como sigue:
El estudiante puede:
A=“responder correctamente las dos primeras y mál la última”, este suceso
tiene probabilidad p2(1− p)
B=“responder correctamente la primera y la tercera y mál la segunda”, este
suceso también tiene probabilidad p2(1− p)
C=“responder correctamente las dos últimas y mal la primera”, este suceso
tiene probabilidad p2(1− p)
D=“responder correctamente las tres preguntas”, este suceso tiene proba-
bilidad p3.
Por ende, que el estudiante salve es el suceso A ∪ B ∪ C ∪ B, la cual es una
unión disjunta (¿por qué?) y por lo tanto la probabilidad que el estudiante salve
con la opción b) es 3p2(1− p) + p3.
Ahora analisemos que opción es más conveniente, para ello veamos que opción
tiene mayor probabilidad de salvar. Para que la opción a) sea más conveniente que
la b) debemos tener p > 3p2(1− p) + p3, resolviendo la desigualdad y teniendo en
cuenta que p es una probabilidad, tenemos que si p ∈ (0, 1/2) conviene la opción
a), si p ∈ (1/2, 1) conviene la opción b).
Si p = 1/2 es indiferente, además si p = 0 perdemos con probabilidad uno en
cualquiera de los casos y si p = 1 salvamos con probabilidad uno, ¿por qué?. /
Ejercicio 2
Una determinada traveśıa puede hacerse con aviones bimotores o con cuadrimo-
Federico De Olivera Lamas
-
20 1. Espacios de Probabilidad
tores. Los bimotores pueden volar con un sólo motor y los cuadrimotores sólo con
dos. La probabilidad de que un motor falle en la traveśıa es p. ¿Cuáles aviones
son los más seguros?. �
Ejemplo 12
Tenemos dos urnas con n bolillas cada una, numeradas de 1 a n. Se extrae al azar
una bolilla de la primer urna y otra de la segunda urna, sin reponer las bolillas se
repite el procedimiento hasta agotar las n bolillas. Se desea hallar la probabilidad
de que en alguna extracción se tenga al menos una coincidencia.
Observemos que nuestro experimento termina cuando se extrajeron todas las
bolillas, es por tal motivo que los elementos del espacio muestral son del tipo i1 i2 · · · inj1 j2 · · · jn
donde i1, i2, · · · , in ∈ {1, 2, · · · , n} y j1, j2, · · · , jn ∈ {1, 2, · · · , n} representan
el número de la bolilla extráıda en cada lugar.
Notemos que los casos posibles son (n!)2, ya que cualquier permutación de las
n bolillas de la primer urna es posible y por cada una de éstas, podemos hacer
una permutación de las n bolillas de la segunda urna.
Recordemos que queremos calcular la probabilidad de que al menos haya una
coincidencia, lo que puede pensarse como, hay una coincidencia en el primer
lugar o hay una coincidencia en el segundo lugar, ..., o hay una coincidencia en
el n-ésimo lugar. Sea Ai el suceso “hay una coincidencia en el i-ésimo lugar”, la
probabilidad deseada es P (⋃ni=1Ai). Uno puede verse tentado a calcularla como
la suma de las probabilidades de los sucesos Ai, pero lamentablemente esto no
es posible ya que los sucesos Ai no son incompatibles. Notemos que si hay una
coincidencia en el primer lugar, podŕıa también haber una en el segundo.
Para solucionar el problema anterior uno podŕıa definir los sucesos Bi como “
Federico De Olivera Lamas
-
1.3 Axiomas de la Probabilidad 21
hay exactamente una coincidencia y es en el lugar i-ésimo”, estos sucesos śı son
disjuntos pero se torna muy dif́ıcil contar los casos favorables a cada suceso. El
lector interesado puede tratar de contarlos.
En definitiva, tenemos que calcular P (⋃ni=1 Ai), donde Ai es el suceso “hay una
coincidencia en el i-ésimo lugar”. De las propiedades de la probabilidad tenemos
que
P
(n⋃i=1
Ai
)=
n∑k=1
(−1)k+1∑
1≤i1
-
22 1. Espacios de Probabilidad
Observemos que la probabilidad no depende de quienes son los k lugares donde
queremos las coincidencias, es decir, P (Ai1 ∩· · ·∩Aik) no depende de i1, i2, . . . , iky por tanto la suma
∑1≤i1
-
1.3 Axiomas de la Probabilidad 23
Para calcular la probabilidad de que gane el premio el jugador b) procedemos
como sigue:
La probabilidad de no ganar en el primer sorteo es 1 − 1/N = (N − 1)/N ;
la probabilidad de no ganar en ni en el primer ni en el segundo sorteo es[(N −
1)/N]2
, y la probabilidad de no sacar ninguna vez el premio en los n sorteos es[(N − 1)/N
]n.
Por lo tanto, la probabilidad de que el jugador b) saque el premio por lo menos
una vez es:
Pb = 1−[
(N − 1)N
]nUsando la desigualdad de Bernoulli, (1 + a)δ > 1 + aδ con a ≥ −1 y δ > 1,
tenemos que
[(N − 1)N
]n=
[1− 1
N
]n> 1− n
N
de donde Pa > Pb.
Es decir, el jugador a) tiene mayor probabilidad de sacar el premio, sin em-
bargo, el jugador b) lo puede sacar más veces. /
Ejemplo 14 (Opcional)
Tenemos m bolillas y las queremos colocar aleatoriamente en n frascos, supong-
amos n ≥ 1 y m ≥ n− 1. Puede que más de una bolilla quede en un frasco.
El problema original consiste en hallar la probabilidad de que exactamente
un frasco quede libre.
Sea Bi, el suceso: “el frasco i-ésimo es el único que queda libre”, la probabil-
idad deseada es P (⋃ni=1Bi), aqúı los sucesos Bi son disjuntos, pues si el frasco 1
Federico De Olivera Lamas
-
24 1. Espacios de Probabilidad
es el único que queda libre, no puede ocurrir que el frasco 2 quede libre y aśı suce-
sivamente. Pero... ¿ cómo calculamos P (Bi) ?, dejamos al lector indagar sobre la
dificultad de tratar de contar los casos favorables.
Tratemos de trabajar sobre un caso más sencillo, tratemos de calcular la
probabilidad de que algún frasco quede libre. Sea Ai el suceso “ el frasco i- ésimo
queda libre ”, la probabilidad deseada es P (⋃ni=1Ai), pero los sucesos Ai no son
disjuntos por lo que tenemos que utilizar la vieja fórmula:
P
(n⋃i=1
Ai
)=
n∑k=1
(−1)k+1∑
1≤i1
-
1.3 Axiomas de la Probabilidad 25
probabilidad. Es decir:
P
(n⋃i=1
Ai
)=
n∑k=1
(−1)k+1Cnk(n− k)m
nm
Hasta ahora hemos calculado la probabilidad de que al menos un frasco quede
libre, utilizando el complemento tenemos la probabilidad de que ningún frasco
quede libre, es decir
P (“ninguno de los n frasco queda libre”) = 1−n∑k=1
(−1)k+1Cnk(n− k)m
nm
Observemos que si queremos hallar la probabilidad de que el frasco i sea el
único que quede libre, podŕıamos tratar de usar la probabilidad anterior pero
evaluada en n− 1, es decir el frasco i queda libre y ninguno de los n− 1 frascos
restantes queda libre. La idea es buena pero no es tan directo.
Al evaluar en n−1 estaŕıamos también cambiando por n−1 los casos posibles
sobre los que se puede colocar cada bolilla y esto no es correcto, por lo tanto
tratemos de extraer los casos favorables al suceso “ninguno de los n frasco queda
libre”. Por ser P (“ninguno de los n frasco queda libre”) = casos favorablescasos posibles
y los
casos posibles son nm como ya hab́ıamos calculado, los casos favorables al suceso
“ninguno de los n frasco queda libre” son
nm·P (“ninguno de los n frasco queda libre”) = nm·
(1−
n∑k=1
(−1)k+1Cnk(n− k)m
nm
)
Para reducir la escritura, llamemos fav(m,n) = nm ·(
1−∑n
k=1(−1)k+1Cnk(n−k)mnm
),
por lo tanto los casos favorables a que ninguno de los n− 1 frascos queden libres
es fav(m,n − 1) y de aqúı que la probabilidad de que el frasco i-ésimo sea el
único que quede libre es P (Bi) =fav(m,n−1)
nm.
Federico De Olivera Lamas
-
26 1. Espacios de Probabilidad
Recordemos que los sucesos Bi con i = 1, . . . , n son disjuntos y su probabilidad
no depende que i, es decir, no depende del frasco que se haya elegido para quedar
libre. Por lo tanto:
P
(n⋃i=1
Bi
)=
n∑i=1
P (Bi)︸ ︷︷ ︸fav(m,n−1)
nm
= n · fav(m,n− 1)nm
=fav(m,n− 1)
nm−1
Hemos obtenido la probabilidad de que exactamente un frasco quede libre. /
Los ejemplos anteriores son una pequeña muestra de lo dif́ıcil que puede ser
calcular probabilidades, sin duda que en el práctico se resolverán problemas más
sencillos.
Una propiedad muy importante, la cual nos servirá en variadas ocasiones, es
la llamada continuidad de la probabilidad.
Teorema 5 (Continuidad de la probabilidad)
1. Sean A1, A2, . . . , An, . . . sucesos crecientes, es decir
A1 ⊂ A2 ⊂ · · · ⊂ An ⊂ . . ..
Entonces, la sucesión (P (An))n∈N∗ es convergente y
P (+∞⋃n=1
An) = ĺımn→+∞
P (An)
2. Sean A1, A2, . . . , An, . . . sucesos decrecientes, es decir
A1 ⊃ A2 ⊃ · · · ⊃ An ⊃ . . .
Entonces, la sucesión (P (An))n∈N∗ es convergente y
P (+∞⋂n=1
An) = ĺımn→+∞
P (An)
Demostración: 1. Al ser los sucesos An crecientes, tenemos que P (An) ≤
P (An+1) y de aqúı que la sucesión (P (An))n∈N∗ es monótona creciente y
Federico De Olivera Lamas
-
1.3 Axiomas de la Probabilidad 27
acotada superiormente por 1 por ser probabilidades, por ende es conver-
gente.
Consideremos los conjuntos E1 = A1, E2 = A2 − A1, E3 = A3 − A2,
. . . , En = An − An−1 y aśı sucesivamente para todo natural.
El lector podrá verificar fácilmente que ∪ni=1Ai = An = ∪ni=1Ei y que
∪+∞n=1An = ∪+∞n=1En, donde los En son disjuntos dos a dos por construcción.
Luego
P
(+∞⋃n=1
An
)= P
(+∞⋃n=1
En
)disjuntos
=+∞∑n=1
P (En) = ĺımk→+∞
k∑n=1
P (En)disjuntos
=
ĺımk→+∞
P (k⋃
n=1
En) = ĺımk→+∞
P (Ak)
Por último, observemos que tomamos el ĺımite sobre k, tras un cambio de
variable, evidentemente obtenemos lo deseado.
2. Al ser los sucesos An decrecientes, tenemos que P (An) ≥ P (An+1) y de
aqúı que la sucesión (P (An))n∈N∗ es monótona decreciente y acotada infe-
riormente por 0 por ser probabilidades, por ende es convergente.
Observemos que por ser A1, A2, . . . , An, . . . sucesos decrecientes, sus com-
plementos Ac1, Ac2, . . . , A
cn, . . . son sucesos crecientes.
Luego:
P (+∞⋂n=1
An) = 1− P (
(+∞⋂n=1
An
)c) = 1− P (
+∞⋃n=1
Acn)por 1= 1− ĺım
n→+∞P (Acn)︸ ︷︷ ︸1−P (An)
= ĺımn→+∞
P (An)
�
Observación: Cuando la sucesión de sucesos es creciente, es común anotar+∞⋃n=1
An = ĺımn→+∞
An, de aqúı que P (ĺımn→+∞An) = ĺımn→+∞ P (An) y por eso el
Federico De Olivera Lamas
-
28 1. Espacios de Probabilidad
nombre de continuidad de la probabilidad. De forma análoga, cuando la suce-
sión de sucesos es decreciente, es común anotar+∞⋂n=1
An = ĺımn→+∞
An, de aqúı que
P (ĺımn→+∞An) = ĺımn→+∞ P (An).
Observación: Sobre una sucesión de sucesos no siempre está bien definido
el ĺımite, en términos generales es un error hablar de ĺımite de una sucesión de
conjuntos pues puede no existir tal ĺımite.
Al igual que lo estudiado en sucesiones numéricas, el tema de la existencia de
ĺımite es tratado mediante ĺımite superior e inferior de la sucesión, en este caso
sucesión de conjuntos.
Si bien la continuidad de la probabilidad para cualquier sucesión de sucesos
excede los alcances de este curso y puede ser estudiado en un curso de medida,
a los efectos informativos, el ĺımite superior e inferior de una sucesión de sucesos
lo definimos:
ĺım supn→+∞
An =+∞⋂n=1
+∞⋃m=n
Am
ĺım infn→+∞
An =+∞⋃n=1
+∞⋂m=n
Am
En caso de que ambos coincidan, decimos que el ĺımite existe. En el caso que la
sucesión sea monótona, efectivamente coinciden, cosa que se verá en el práctico.
1.4. Probabilidad condicional
Supongamos que tiramos un dado y queremos hallar la probabilidad de que
la cantidad de puntos que queden para arriba sea menor o igual a tres. No ten-
dŕıamos mayor dificultad para calcular tal probabilidad, pero, ¿qué tal si nos
Federico De Olivera Lamas
-
1.4 Probabilidad condicional 29
Figura 1.1: Probabilidad condicional
pasan la información de que el uno no fue el que salió?, ¿cómo altera esto el
resultado de nuestra probabilidad?. Problemas como éste son los que motivan a
introducir la probabilidad condicional.
Definición 8 (Probabilidad condicional)
Dado un espacio de probabilidad (Ω,A, P ) y un suceso B con probabilidad pos-
itiva, definimos la probabilidad de un suceso A condicionado a B, como
P (A|B) = P (A ∩B)P (B)
La noción intuitiva de la probabilidad condicional puede verse usando diagra-
mas de Venn, en la figura 1.1 se observa que una vez que se conoce la ocurrencia
del suceso B, la probabilidad del suceso A se reduce a la proporción entre la prob-
abilidad de la parte de A que se encuentra en B, con respecto a la probabilidad
de B.
Ejemplo 15
Resolvamos el problema del inicio de la sección. Se tira un dado y se quiere
calcular la probabilidad de obtener tres o menos puntos, dado que se sabe que
no salió un punto. Sea el suceso A = {1, 2, 3} que representa nuestros casos
Federico De Olivera Lamas
-
30 1. Espacios de Probabilidad
favorables a priori y el suceso B = {2, 3, 4, 5, 6} que representa la información
que obtuvimos. Luego P (A|B) = P (A∩B)P (B)
= P ({2,3})P ({2,3,4,5,6}) =
2/65/6
= 25.
Aqúı puede observarse que la probabilidad condicional respeta la idea intuitiva
de restringir nuestro espacio muestral al conjunto B, es decir, los casos favorables
que hay en B contra los casos posibles que hay en B. /
La noción intuitiva manejada anteriormente puede formalizarse con la sigu-
iente proposición.
Proposición 6
Dado un espacio de probabilidades (Ω,A, P ) y un suceso B tal que P (B) > 0,
entonces (B,AB, P ∗) es un nuevo espacio de probabilidad, donde AB = {A∩B :
A ∈ A} y P ∗ : AB → R tal que P ∗(A) = P (A|B).
Demostración: Probemos que AB es una σ-álgebra de subconjuntos de B.
i. Es claro que B ∈ AB y por tanto AB 6= ∅.
ii. Sea E ∈ AB entonces E = A ∩B con A ∈ A, luego
Ec = B − E = B − (A ∩B) = B − A = B ∩ Ac︸︷︷︸∈A
y por lo tanto Ec es la intersección entre B y un elemento de A , de donde
Ec ∈ AB.
iii. Sean E1, E2, . . . En, . . . ∈ AB, entonces existen A1, A2, . . . , An, . . . ∈ A tales
que En = An ∩B ∀ n ∈ N∗, luego
+∞⋃n=1
En =+∞⋃n=1
(An ∩B) =
(+∞⋃n=1
An
)︸ ︷︷ ︸
∈A
∩B ∈ AB
Federico De Olivera Lamas
-
1.4 Probabilidad condicional 31
Siendo (B,AB) un espacio probabilizable, probemos que P ∗ es una probabilidad
sobre este espacio.
i. P ∗(A) =
≥0︷ ︸︸ ︷P (A ∩B)P (B)︸ ︷︷ ︸>0
≥ 0 para todo suceso A
ii. P ∗(B) = P (B|B) = P (B∩B)P (B)
= 1
iii. Dados los sucesos disjuntos A1, A2, . . . An, . . ., entonces
P ∗(⋃+∞
n=1An)
= P(⋃+∞
n=1An∣∣B) = P
S+∞n=1(An∩B)︷ ︸︸ ︷
((∪+∞n=1 An
)∩B)
P (B)disjuntos
=
=P+∞n=1 P (An∩B)P (B)
=+∞∑n=1
P (An ∩B)P (B)︸ ︷︷ ︸P ∗(An)
=+∞∑n=1
P ∗(An)
�
El espacio (B,AB, P ∗) es de gran importancia porque refleja la idea de con-
siderar un nuevo espacio de resultados posibles, una vez que se conoce nueva
información a través de B.
Se deduce de la propia definición de probabilidad condicional que
P (A ∩B) = P (B)P (A|B). La igualdad anterior puede ser generalizada para más
de dos suceso, es decir
P (A∩B∩C) = P ((A∩B)∩C)) = P (A ∩B)︸ ︷︷ ︸P (A)P (B|A)
P (C|A∩B) = P (A)P (B|A)P (C|B∩A))
Lo cual es válido si P (A ∩ B) > 0 (de aqúı se deduce que P (A) > 0 ya que
(A ∩B) ⊂ A)
Generalizando aún más tenemos el siguiente teorema de multiplicación o teo-
rema de la probabilidad compuesta.
Federico De Olivera Lamas
-
32 1. Espacios de Probabilidad
Teorema 7 (Probabilidad compuesta)
Dado (Ω,A, P ), un espacio de probabilidades, sean A1, A2, . . . , An sucesos tales
que P (A1 ∩ A2 ∩ . . . ∩ An−1) > 0 donde n ≥ 2, entonces
P (A1 ∩A2 ∩ . . .∩An) = P (A1)P (A2|A1)P (A3|A1 ∩A2) · · ·P (An|A1 ∩ · · · ∩An−1)
Demostración: Por ser A1 ⊃(A1 ∩ A2
)⊃ · · · ⊃
(A1 ∩ . . . ∩ An−1
)y
P (A1 ∩ A2 ∩ . . . ∩ An−1) > 0 tenemos que todas las probabilidades condicionales
están bien definidas.
De la propia definición, la igualdad se cumple si n = 2, es decir P (A1 ∩A2) =
P (A1)P (A2|A1) siendo P (A1) > 0.
Supongamos que la igualdad se cumple para h sucesos y verifiquemos que se
cumple para h+ 1 sucesos h = 2, . . . , n− 1.
Por hipótesis P (⋂hi=1Ai) = P (A1)P (A2|A1) · · ·P (Ah|A1 ∩ · · · ∩ Ah−1), luego
P (⋂h+1i=1 Ai) = P
((A1 ∩ · · · ∩ Ah
)∩ Ah+1
)= P (A1 ∩ · · · ∩ Ah)︸ ︷︷ ︸
P (A1)P (A2|A1)···P (Ah|A1∩···∩Ah−1)
P (Ah+1|A1 ∩ · · · ∩ Ah)
= P (A1)P (A2|A1) · · ·P (Ah+1|A1 ∩ · · · ∩ Ah)
�
Ejemplo 16
Se reparten cuatro cartas de una baraja española,¿cuál es la probabilidad que
sean los cuatro reyes?.
Sea el suceso Ai, “la i-ésima carta obtenida es un rey”, entonces queremos
calcular P (A1 ∩ A2 ∩ A3 ∩ A4), utilizando la probabilidad compuesta tenemos
Federico De Olivera Lamas
-
1.4 Probabilidad condicional 33
que:
P (A1∩A2∩A3∩A4) = P (A1)︸ ︷︷ ︸4/50
P (A2|A1)︸ ︷︷ ︸3/49
P (A3|A1 ∩ A2)︸ ︷︷ ︸2/48
P (A4|A1 ∩ A2 ∩ A3)︸ ︷︷ ︸1/47
=1
C504
En el cálculo de las probabilidades condicionales se utilizó lo probado en la
Proposición 6, tomando al condicionante como un nuevo espacio de resultados
posibles, por ejemplo, si se conoce A1 ∩ A2 es porque ya se han obtenidos dos
reyes, por tanto quedan otros dos reyes entre 48 cartas. /
Consideremos ahora un suceso cualquiera A y su complemento Ac, entonces
A,Ac forman una partición de Ω, es decir A ∪ Ac = Ω y A ∩ Ac = ∅. Dado
cualquier suceso B, tenemos que B = B∩Ω = B∩ (A∩Ac) = (B∩A)∪ (B∩Ac)
donde la unión es disjunta, por lo tanto
P (B) = P (B ∩ A)︸ ︷︷ ︸P (A)P (B|A)
+ P (B ∩ Ac)︸ ︷︷ ︸P (Ac)P (B|Ac)
= P (A)P (B|A) + P (Ac)P (B|Ac)
Es claro que se está usando que A y Ac son sucesos con probabilidad positiva.
La generalización de este resultado es lo que se conoce como “Probabilidades
totales”.
Teorema 8 (Probabilidades totales)
Dado (Ω,A, P ), sean A1, A2, . . . , An sucesos incompatibles dos a dos, tales que⋃ni=1Ai = Ω y P (Ai) > 0 i = 1, . . . , n (n ≥ 2). Entonces, para cualquier suceso
B, tenemos
P (B) =n∑i=1
P (Ai)P (B|Ai)
Demostración:
P (B) = P (B ∩(∪ni=1Ai︸ ︷︷ ︸
Ω
)) = P (∪ni=1(B ∩ Ai︸ ︷︷ ︸
⊂Ai
))disjuntos
=∑n
i=1 P (B ∩ Ai)︸ ︷︷ ︸P (Ai)P (BAi)
=
=∑n
i=1 P (Ai)P (B|Ai)
�
Federico De Olivera Lamas
-
34 1. Espacios de Probabilidad
El lector podrá verificar sin mayor dificultad que este resultado sigue siendo
válido si se considera una partición infinita pero numerable de sucesos An.
Ejemplo 17
Supongamos que en un cierto páıs hay varios partidos poĺıticos, entre ellos, el
90 % del electorado lo tienen los partidos A,B y C con un 50 %, 30 % y 10 %
respectivamente. Se está promulgando una nueva ley y la proporción de individuos
que están a favor de dicha ley depende del partido poĺıtico al que pertenecen.
Suponga que el 70 % de los electores del partido A están a favor de la ley, el 20 %
en contra y al resto le es indiferente. En el partido B hay un 55 % en contra, un
20 % a favor y al resto le es indiferente. Por último, tanto en el partido C como
en el resto de los partidos, el 30 % está a favor, el 50 % en contra y al resto le es
indiferente.
Se selecciona al azar un elector, hallar la probabilidad de que el individuo
seleccionado esté a favor de la ley.
Solución: Sea F el suceso: “el individuo seleccionado está a favor de la ley”.
Observemos que el individuo seleccionado es un elector y por tanto pertenece
al partido A (suceso A) o pertenece al partido B (suceso B) o pertenece a otro
partido (suceso Ot). Supondremos que si un individuo pertenece a un partido no
pertenece a otro y por tanto A, B y Ot forman una partición de nuestro espacio
muestral.
Aplicando la fórmula de las probabilidades totales tenemos
P (F ) = P (A)︸ ︷︷ ︸0,5
P (F |A)︸ ︷︷ ︸0,7
+P (B)︸ ︷︷ ︸0,3
P (F |B)︸ ︷︷ ︸0,2
+P (0t)︸ ︷︷ ︸0,2
P (F |Ot)︸ ︷︷ ︸0,3
= 0, 47
De donde podemos concluir que menos de la mitad de los electores son los
que están a favor de la ley. /
Federico De Olivera Lamas
-
1.4 Probabilidad condicional 35
Un resultado inmediato a partir de la fórmula de las probabilidades totales se
conoce con el nombre de fórmula de Bayes y es el siguiente:
Teorema 9 (Fórmula de Bayes)
Dado (Ω,A, P ), sean A1, A2, . . . , An sucesos incompatibles dos a dos, tales que⋃ni=1Ai = Ω y P (Ai) > 0 i = 1, . . . , n (n ≥ 2). Entonces, para cualquier suceso
B con P (B) > 0 tenemos
P (Aj|B) =P (Aj)P (B|Aj)∑ni=1 P (Ai)P (B|Ai)
j = 1, . . . , n
Demostración: P (Aj|B) =P (Aj ∩B)P (B)
(1)=
P (Aj)P (B|Aj)∑ni=1 P (Ai)P (B|Ai)
En el numerador de (1) se usó P (B|Aj) = P (Aj∩B)P (Aj) y en el denominador la
fórmula de las probabilidades totales, ya que los Ai forman una partición de Ω.
Sin mayor dificultad el resultado puede extenderse si se considera una parti-
ción infinita pero numerable de sucesos An. �
La fórmula de Bayes es útil cuando conocemos las probabilidades de los Aj y
las condicionales de B dado Aj, pero no conocemos directamente la probabilidad
de B.
Ejemplo 18
Suponga que una caja tiene dos monedas, dos no cargadas y una de dos caras. Se
deja caer aleatoriamente una moneda al suelo y se observa que salió cara. ¿Cuál
es la probabilidad que la moneda tirada sea la de dos caras?.
Solución: Sean los sucesos A1, la moneda es de dos caras, A2 la moneda es
no cargada y B, el suceso “salió cara”. Nos interesa la probabilidad P (A1|B), el
Federico De Olivera Lamas
-
36 1. Espacios de Probabilidad
lector podrá verificar las hipótesis de la fórmula de Bayes, de donde
P (A1|B) =
1/3︷ ︸︸ ︷P (A1)
1︷ ︸︸ ︷P (B|A1)
P (A1)︸ ︷︷ ︸1/3
P (B|A1)︸ ︷︷ ︸1
+P (A2)︸ ︷︷ ︸2/3
P (B|A2)︸ ︷︷ ︸1/2
=1
2
/
Ejemplo 19
La distribución de los grupos sangúıneos en Estados Unidos es: Tipo A, 41 % ;
tipo B, 9 % ; tipo AB, 4 % y tipo O, 46 %. Se estima que, durante la segunda
guerra mundial, el 4 % de las personas pertenecientes al tipo O fuerón clasificadas
como del tipo A; el 88 % de los de tipo A fueron correctamente clasificados; el 4 %
de los de tipo B se clasificaron como de tipo A y el 10 % de los de tipo AB fueron,
igualmente, clasificados como de tipo A. Un soldado fue herido y conducido a la
enfermeŕıa. Se le clasificó como del tipo A. ¿ Cuál es la probabilidad de que tal
grupo sea ciertamente el suyo?.
Solución: Consideremos los sucesos A1: es de tipo A; A2: es de tipo B; A3: es
de tipo AB; A4: es de tipo O; B: Es clasificado como de tipo A.
Luego, A1, A2, A3, A4 forman una partición de nuestro espacio muestral y to-
dos tienen probabilidad positiva. Usando probabilidades totales, veremos que B
también tiene probabilidad positiva (denominador de Bayes). Aplicando la fórmu-
la de Bayes tenemos que
P (A1|B) =
0,41︷ ︸︸ ︷P (A1)
0,88︷ ︸︸ ︷P (B|A1)
P (A1)︸ ︷︷ ︸0,41
P (B|A1)︸ ︷︷ ︸0,88
+P (A2)︸ ︷︷ ︸0,09
P (B|A2)︸ ︷︷ ︸0,04
+P (A3)︸ ︷︷ ︸0,04
P (B|A3)︸ ︷︷ ︸0,10
+P (A4)︸ ︷︷ ︸0,46
P (B|A4)︸ ︷︷ ︸0,04
= 0, 93
/
Federico De Olivera Lamas
-
1.5 Independencia 37
Como sugerencia para el estudiante, la fórmula de Bayes es útil cuando cono-
cemos el resultado final y queremos hallar la probabilidad de que se haya pasado
por una determinada etapa intermedia. Las etapas intermedias deben formar una
partición que hay que detectar.
Ejercicio 3
Estamos interesados en saber cuál de dos análisis A y B es mejor para el di-
agnóstico de una determinada enfermedad, de la cual sabemos que la presentan
un 10 % de individuos de la población. El porcentaje de resultados falsos posi-
tivosd) del análisis A es del 15 % y el de B es del 22 %. El porcentaje de falsos
negativose) de A es del 7 % y de B es del 3 %.
¿Cuál es la probabilidad de acertar en el diagnóstico con cada método? �
1.5. Independencia
Un concepto que hemos venido manejando informalmente es el de indepen-
dencia. Por ejemplo, cuando decimos que tiramos dos monedas, el resultado
que obtengamos en una, es “independiente” del que obtengamos en la otra.
Otro ejemplo es cuando tenemos n bolillas para ocupar n lugares sin repetirlos,
aqúı dećıamos que una vez elegida una bolilla para el primer lugar, la cantidad
de bolillas para el segundo lugar disminuye a n − 1, por lo que la elección no
se hace en iguales condiciones que la primer elección y por lo tanto no tenemos
“independencia”. ésta idea de independencia será formalizada desde el punto de
vista probabilista en esta sección.
d)Un resultado es falso positivo cuando el análisis da positivo siendo que el paciente no tiene
la enfermedad.e)Un resuldado es falso negativo cuando el análisis da negativo siendo que el paciente tiene
la enfermedad.
Federico De Olivera Lamas
-
38 1. Espacios de Probabilidad
Definición 9 (Independencia)
Dado un espacio de probabilidad (Ω,A, P ), decimos que los sucesos A y B son
independientes si
P (A ∩B) = P (A) · P (B)
Observación: La independencia depende del espacio de probabilidad sobre
el que se trabaja. Veamos el siguiente ejemplo.
Ejemplo 20
Se lanzan dos monedas al aire y se observan sus caras superiores al caer.
En este caso Ω = {(cara,cara), (cara, número), (número,cara), (número,número)},
sea A = P (Ω) y las probabilidades clásicas, es decir P((cara,cara)
)=
P((cara, número)
)= P
((número,cara)
)= P
((número,número)
)= 1/4
Consideremos los sucesos A: “en la primer moneda sale cara” y B: “en la
segundo moneda sale cara”, luego
P (A ∩B) = P (cara,cara) = 1/4
P (A) = P((cara,cara) ∪ (cara,número)
)= 1/4 + 1/4
P (B) = P((cara,cara) ∪ (número,cara)
)= 1/4 + 1/4
.
Por lo tanto P (A ∩B) = 1/4 = P (A)P (B) y los sucesos A y B son indepen-
dientes.
Pero, sobre el mismo espacio probabilizable definamos
P((cara,cara)
)= P
((número, número)
)= 1/3
P((número,cara)
)= P
((cara,número)
)= 1/6
El lector podrá verificar que se trata de una probabilidad ya que
P (Ω) = P((cara,cara) ∪ (cara, número) ∪ (número,cara) ∪ (número,número)
)=
= 1/3 + 1/6 + 1/6 + 1/3 = 1
Aqúı
Federico De Olivera Lamas
-
1.5 Independencia 39
P (A ∩B) = P (cara,cara) = 1/3
P (A) = P((cara,cara) ∪ (cara,número)
)= 1/3 + 1/6 = 1/2
P (B) = P((cara,cara) ∪ (número,cara)
)= 1/3 + 1/6 = 1/2
Por lo tanto P (A ∩ B) = 1/3 6= 1/2 · 1/2 = P (A)P (B) y los sucesos A y B
no son independientes. /
Sin duda que, bajo el espacio clásico de probabilidades, la noción intuitiva
de independencia se verifica. Pero siempre tenemos que recordar que la indepen-
dencia es definida sobre un espacio de probabilidades y por tanto depende de
éste.
Observación: Si alguno de los sucesos A o B tiene probabilidad no nula,
la independencia puede ser definida por medio de la probabilidad condicional,
es decir, supongamos que P (B) > 0, entonces P (A|B) = P (A∩B)P (B)
, de donde A
y B son independientes si y sólo si P (A|B) = P (A). En efecto, si A y B son
independientes, entonces P (A|B) = P (A∩B)P (B)
indep= P (A)P (B)
P (B)= P (A). Por otro lado,
si P (A|B) = P (A) entonces, de la definición de probabilidad condicional tenemos
que P (B)P (A|B)︸ ︷︷ ︸P (A)
= P (A ∩B) y por tanto A y B son independientes.
Proposición 10
Dado un espacio de probabilidad (Ω,A, P ),
1. Si P (A) = 0 o P (A) = 1 entonces A es independiente de B, ∀ B ∈ A.
2. Si A es independiente de A, entonces P (A) = 1 o P (A) = 0.
3. Si A es independiente de B entonces:
a) A es independiente de Bc.
b) Ac es independiente de B.
Federico De Olivera Lamas
-
40 1. Espacios de Probabilidad
c) Ac es independiente de Bc.
Demostración: 1. Si P (A) = 0, entonces, por ser (A ∩ B) ⊂ A tenemos
0 ≤ P (A ∩B) ≤ P (A) = 0 y de aqúı que P (A ∩B) = 0 = P (A)︸ ︷︷ ︸=0
P (B)︸ ︷︷ ︸∈R
.
Si P (A) = 1, recordemos que B = (B ∩ A) ∪ (B ∩ Ac) donde la unión es
disjunta, por lo tanto P (B)(1)= P (A ∩ B) + P (B ∩ Ac). Siendo P (A) = 1,
P (Ac) = 0 y como (B ∩Ac) ⊂ Ac tenemos que P (B ∩Ac) (2)= 0. De (1) y (2)
tenemos que P (A ∩B) = P (B) = P (A)︸ ︷︷ ︸=1
P (B).
2. Por ser A independiente de A tenemos que
P (A) = P (A ∩ A) indep= P (A)P (A), y por lo tanto. P (A) = 1 o P (A) = 0
3. a) P (A) = P (A∩B)+P (A∩Bc), entonces P (A∩Bc) = P (A)−P (A∩B)indep= P (A)− P (A)P (B) = P (A)
(1− P (B)︸ ︷︷ ︸
P (Bc)
)= P (A)P (Bc)
b) Basta con intercambiar A y B de nombres y aplicar la parte anterior.
c) Por ser los sucesos A y B independientes, por la parte a) los son A y
Bc, apliquemos la parte b) y obtenemos que los son Ac y Bc.
�
Observación: Si A y B son sucesos incompatibles, es decir (A ∩ B) = ∅,
entonces no pueden ser independientes a menos que alguno de ellos tenga prob-
abilidad cero, ya que P (A ∩B︸ ︷︷ ︸∅
) = 0 = P (A)P (B)⇔ P (A) = 0 o P (B) = 0.
indaguemos ahora como definiremos la independencia de más de dos sucesos.
Dados tres sucesos A,B y C, podŕıamos querer que el suceso A sea independiente
de B y que A sea independiente de C, pero también que B sea independiente
de C y aśı tenemos la independencia dos a dos entre estos sucesos. Pero también
nos interesa que A sea independiente de B ∩ C y de B ∩ Cc, en otros términos,
Federico De Olivera Lamas
-
1.5 Independencia 41
queremos que la ocurrencia de B y/o de C no afecten a la probabilidad de A.
Análogamente para B y C, por lo tanto la independencia de más de dos conjuntos
debe ser un poco más general que la independencia dos a dos.
Definición 10 (Independencia dos a dos)
Dado (Ω,A, P ), diremos que los sucesos A1, . . . , An son independientes dos a dos,
si Ai es independiente de Aj para todo i 6= j (i, j ∈ {1, . . . , n}), es decir
P (Ai ∩ Aj) = P (Ai)P (Aj) ∀ i 6= j
Definición 11 (Independencia colectiva)
Dado (Ω,A, P ), diremos que los sucesos A1, . . . , An son colectivamente indepen-
dientes, o simplemente independiente, si
P (Ai1 ∩ · · · ∩ Aik) = P (Ai1) · · ·P (Aik) donde 1 ≤ i1 < · · · < ik ≤ n
Más en general, dada un conjunto de ı́ndices L diremos que los sucesos Aλ
con λ ∈ L son independientes, si toda subfamilia finita de {Aλ : λ ∈ L} es de
sucesos colectivamente independiente.
En algunos textos se le suele llamar independencia estocástica o indepen-
dencia mutua a los sucesos colectivamente independientes. En nuestro curso le
llamaremos simplemente independientes.
Es inmediato verificar que la independencia colectiva implica la independencia
dos a dos, el siguiente ejemplo muestra que la independencia dos a dos no implica
la independencia colectiva.
Ejemplo 21 (La independencia dos a dos no implica la independencia)
Consideremos un espacio de resultados posibles Ω = {1, 2, 3, 4} el cual puede
ser pensado como los cuatro resultados posibles al tirar dos monedas. En efec-
Federico De Olivera Lamas
-
42 1. Espacios de Probabilidad
to, Si el 1 representa (cara,cara); el 2, (número, cara); el 3, (cara,número) y el
4, (número,número).
Trabajemos sobre el espacio clásico de probabilidades, es decir P ({i}) = 1/4,
i = 1, 2, 3, 4 y definamos los sucesos A = {1, 4}, B = {2, 4} y C = {3, 4}. El
lector podrá interpretar al suceso A como: “ en las dos monedas sale igual figura”,
análogamente hay una interpretación para los sucesos B y C. Observemos primero
que P (A) = P (B) = P (C) = 1/2 ya que están formados por dos de los cuatro
sucesos elementales.
Verifiquemos que los sucesos A,B y C son independientes dos a dos, en efecto
P (A ∩B) = P ({4}) = 1/4 = P (A)︸ ︷︷ ︸1/2
P (B)︸ ︷︷ ︸1/2
P (A ∩ C) = P ({4}) = 1/4 = P (A)︸ ︷︷ ︸1/2
P (C)︸ ︷︷ ︸1/2
P (B ∩ C) = P ({4}) = 1/4 = P (B)︸ ︷︷ ︸1/2
P (C)︸ ︷︷ ︸1/2
Pero P (A ∩ B ∩ C) = P ({4}) = 1/4 6= 1/8 = P (A)︸ ︷︷ ︸1/2
P (B)︸ ︷︷ ︸1/2
P (C)︸ ︷︷ ︸1/2
, de aqúı que
los sucesos A,B y C no son independientes (colectivamente). /
Federico De Olivera Lamas
-
1.6 Ejercicios 43
1.6. Ejercicios
1. Probar las leyes de Morgan:
a) (⋃∞n=1An)
c =⋂∞n=1(An)
c
b) (⋂∞n=1An)
c =⋃∞n=1(An)
c.
2. Probar que {φ,Ω} es una σ-álgebra.
3. Verificar que la familia 2Ω de todos los subconjuntos de Ω es una σ-álgebra.
4. Sea Ω = {a, b, c, d, e, f}. Construir la mı́nima σ-álgebra generada por
{{a, b}, {c, d}, {e}}.
5. i) Si ε1 está inclúıdo en la σ-álgebra generada por ε2, probar que la σ-
álgebra generada por ε1 está contenida en la σ-álgebra generada por
ε2.
ii) Probar que coinciden las σ-álgebras de subconjuntos de R generadas
por:
Los intervalos abiertos ε1 = {(a, b) : a < b}.
Los intervalos cerrados ε2 = {[a, b] : a < b}.
Los int. semi-abiertos ε3 = {[a, b) : a < b} o ε4 = {(a, b] : a < b}.
Los rayos abiertos ε5 = {(a,∞) : a ∈ R}. o
ε6 = {(−∞, b) : b ∈ R}.
Los rayos cerrados ε7 = {[a,∞) : a ∈ R}. o
ε8 = {(−∞, b] : b ∈ R}.
Observar que B, la σ-álgebra de Borel en R, también es generada por
cualquiera de las familias εi.
Federico De Olivera Lamas
-
44 1. Espacios de Probabilidad
6. Sea A1, A2, ... una sucesión de conjuntos. Definimos el ĺımite superior y el
ĺımite inferiór de la suceśıon como sigue:
ĺım inf An =∞⋃n=1
∞⋂r=n
Ar
ĺım supAn =∞⋂n=1
∞⋃r=n
Ar
Probar que ĺım inf An ⊂ ĺım supAn.
En caso de igualdad, se define ĺımAn = ĺım inf An = ĺım supAn.
7. Sea A1, A2, ... una sucesión monótona de conjuntos. Probar que existe el
ĺımite de An.
8. Dada una sucesión creciente de sucesos: φ = E0 ⊂ E1 ⊂ E2 ⊂ ..., probar
que⋃∞n=1En se puede escribir como una unión disjunta en la forma
∞⋃n=1
En =∞⋃n=1
(En − En−1)
9. Un dado está cargado de modo que la probabilidad de cada cara es pro-
porcional al número indicado en la cara. ¿Cuál es la probabilidad de que al
arrojarlo, se obtenga un resultado par?.
10. Si P y Q son dos probabilidades definidas sobre un mismo espacio (Ω,A),
mostrar que aP + bQ también es una probabilidad sobre el mismo espacio,
para cualquier par de números no negativos a y b que satisfagan a+ b = 1.
11. Se tiran dos dados al azar y se quiere hallar la probabilidad de que la suma
de los puntos obtenidos sea igual a 10.
12. Una urna contiene a bolillas blancas y b bolillas negras. Al sacar al azar
r bolillas de una vez (suponiendo r ≤ a), ¿cuál es la probabilidad de que
todas ellas sean blancas?.
Federico De Olivera Lamas
-
1.6 Ejercicios 45
13. Se tiene una baraja de 40 cartas, donde hay 4 ases. Se reparten éstas entre 4
personas, de manera que le toquen 10 cartas a cada una. ¿qué probabilidad
hay de que a cada una le toque un as?.
14. En una urna hay 20 bolillas numeradas de 1 a 20. Si se van sacando al azar
una a una sin reposición, ¿cúal es la probabilidad de que la bolilla número
8 salga precisamente en la octava extracción?.
15. Se distribuyen al azar N bolas numeradas de 1 a N , en N cajas igualmente
numeradas, de modo que se coloca una bola en cada caja.
¿Cuál es la probabilidad de que en las cajas números 1 y 2 se coloquen las
bolas con números 1 y 2 respectivamente?, ? y cuál es la probabilidad de
que en la caja número 4 no esté la bola número 4? (N ≥ 4).
16. Se lanzan dos dados no cargados, uno verde y otro rojo. Calcular las prob-
abilidades de los siguientes eventos:
a) .en el dado rojo sale 4”.
b) .en el dado rojo sale 4 y en el verde también”.
c) ”al menos en un dado sale 4”.
d) .en ningún dado sale 4”.
e) ”la suma de los puntos obtenidos es mayor que 7”.
17. Justificar si es correcto la siguiente afirmación justificando la respuesta:
De una urna que contiene 30 bolillas numeradas del 1 a 30 se extraen si-
multáneamente 7 de ellas. Si un jugador apuesta a 7 números la probabilidad
de acertar 5 o más números es :
C77 + C76 + C
75
C307
18. De un conjunto de 15 lámparas de las cuales 5 son defectuosas, se escogen
al azar tres. Hallar la probabilidad de que:
Federico De Olivera Lamas
-
46 1. Espacios de Probabilidad
a) ninguna sea defectuosa.
b) una por lo menos sea defectuosa.
19. En la fabricación de un cierto aparato se utilizan dos piezas del mismo
tipo. Para que el aparato funcione es necesario que por lo menos una de las
piezas no esté defectuosa. La probabilidad de que una pieza esté defectuosa
es 0,05. Calcular, bajo el supuesto de independencia, la probabilidad de que
el aparato funcione.
20. Tres urnas contienen bolillas rojas y azules. La primer urna tiene 3 rojas y
9 azules, la segunda urna tiene 8 rojas y 4 azules y la tercer urna tiene 2
rojas y 10 azules. Las trece cartas de trébol de un mazo de cartas francesas
son {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, J,QK}.
Se realiza el siguiente experimento:
Se extraen al azar del mazo dos cartas (conjuntamente).
Si ambas resultan números, se extrae al azar una bolilla de la primer
urna.
Si ambas resultan figuras, se extrae al azar una bolilla de la segunda
urna.
En los restantes casos se extrae al azar de la tercer urna.
a) Calcular la probabilidad de extraer una bolilla roja de la primer urna.
b) Calcular la probabilidad de extraer una bolilla azul.
c) Calcular la probabilidad de extraer una bolilla roja.
21. Lanzamos tres monedas regulares claramente diferenciadas.
Calcular la probabilidad de los siguientes eventos:
A=“al menos dos son cara”.
B=”sale un número par de caras”.
Federico De Olivera Lamas
-
1.6 Ejercicios 47
C=”sale número en la primer moneda”.
¿Son A, B y C independientes?.
22. a) Se lanzan tres dados no cargados simultáneamente. Calcular la prob-
abilidad de obtener un 6, sabiendo que no hay dos resultados iguales.
Se lanza ahora un dado n veces, sucesiva e independientemente. Cal-
cular las probabilidades de los siguientes sucesos:
b) Obtener al menos dos 5, dado que ocurrió al menos un 5 en los n
lanzamientos.
c) obtener al menos dos 5, dado que ocurrió al menos un cinco en los
primeros m lanzamientos.
23. De un estudio cĺınico se han concluido los siguientes resultados: La prob-
abilidad de que una persona extráıda al azar de la población tenga cierta
afección card́ıaca es 0,002; dado que padece esa afección, la probabilidad de
que fume es 0,40, y dado que no la padece, la probabilidad de que fume es
0,10. ¿ Cúal es laprobabilidad de que un fumador padezca la mencionada
afección card́ıaca?.
24. Repetir el ejercicio anterior con los datos ligeramente modificados: La prob-
abilidad de que una persona extráıda al azar de la población tenga cierta
afección card́ıaca es 0,002; la probabilidad de que fume es 0,10; la proba-
bilidad de que fumedado que padece la enfermedad es 0,40.
25. Una firma de contadores está llevando a cabo una auditoŕıa sobre las prácti-
cas contables de una empresa en la cual hay cuentas de clientes mayoristas
y cuentas de minoristas.
Se sabe que el 70 % de todas las cuentas son de mayoristas, y más aun, se
sabe que el 10 % de las cuentas de mayoristas y el 20 % de las cuentas de
minoristas tienen algún tipo de error contable.
Federico De Olivera Lamas
-
48 1. Espacios de Probabilidad
Si los auditores observan un error en una cuenta de clientes ¿cuál es la
probabilidad de que sea de mayorista?.
26. Para las elecciónes de una cierta ciudad se han presentado dos candidatos
a la intendencia A y B. En toda la ciudad se establecieron unicamente tres
circuito de votación y una vez hecho el escrutinio se obtuvo la siguiente
información:
En el circuito 1 votó el 30 % de los electores.
En el circuito 2 votó el 34 % de los electores.
El resto lo hizo en el circuito 3.
No se registraron votos anulados, observados ni en blanco.
En el circuito 1, B obtuvo 165 votos de un total de 300, mientras que en el
circuito 2, obtuvo 136. A obtuvo el 80 % de los votos del circuito 3.
Si entre el total de los electores se elige uno al azar y resulta ser votante de
A, ¿Cuál es la probabilidad de que haya votado en el circuito 2?.
27. A una moneda desconocida le atribúımos una probabilidad p1 de tener dos
caras distintas (cara, cruz). Se lanza la moneda n veces consecutivas y en
todas ellas sale cara. ¿Cuál es la probabilidad, después de estos lances, de
que la moneda tenga dos caras distintas?.
28. Suponga que está participando de un programa televisivo, donde, junto con
otras cuatro personas, deben elegir al azar una llave entre cinco, una de las
llaves abrirá el cofre que esconde un premio importante.
Hay dos opciones para seleccionar la llave:
Opción A, una persona extrae una llave, la prueba, y si no abre la
repone a la bolsa. Luego el siguiente participante procede igual hasta
que pasen los cinco.
Federico De Olivera Lamas
-
1.6 Ejercicios 49
Opción B, cada persona extrae una llave y luego que todos tienen una
llave, las prueban.
a) Si usted es la primer persona en elegir la llave, ¿ qué opción prefiere?.
b) Si usted es la tercer persona en elegir la llave, ¿qué opción prefiere?.
c) Si usted es la úlltima persona en elegir la llave, ¿qué opción prefiere?.
d) ¿Qué conclusión obtiene de la probabilidad de ganar con la reposición
o sin reposición?.
Justificar en base al suceso con mayor probabilidad dde ganar.
29. a) Demostrar que si dos sucesos A y B son independientes y ambos tienen
probabilidad positiva, entonces no pueden ser incompatibles.
b) Demostrar que si A es un suceso arbitrario y B es un suceso tal que
P (B) = 0, entonces A y B son independientes.
c) Sean A y B dos sucesos independiente y tales que A ⊂ B. Demostrar
que si P (A) 6= 0, entonces P (B) = 1.
30. Sean A, B y C tres sucesos independientes. Probar que:
a) A es independiente de (B ∩ C).
b) A es independiente de (Bc ∩ C).
c) A es independiente de (Bc ∩ Cc).
d) A es independiente de (B ∪ C).
e) A es independiente de (Bc ∪ C).
f ) A es independiente de (Bc ∪ Cc).
Federico De Olivera Lamas
-
50 1. Espacios de Probabilidad
1.7. Anexo
Demostración de la propiedad 7 de la Proposición 4
Sean A1, A2, . . . , An sucesos cualesquiera, entonces
P
(n⋃i=1
Ai
)=
n∑k=1
(−1)k+1∑
1≤i1
-
1.7 Anexo 51
P (An+1)− P ((⋃ni=1Ai) ∩ An+1) = P (An+1)− P (
⋃ni=1 (Ai ∩ An+1)) =
P (An+1) −︸︷︷︸(−1)1
∑nk=1(−1)k+1
∑1≤i1
-
52 1. Espacios de Probabilidad
P
(n+1⋃i=1
Ai
)=
n+1∑k=1
(−1)k+1∑
1≤i1
-
Caṕıtulo 2
Variables Aleatorias
-
54 2. Variables Aleatorias
2.1. Conceptos iniciales
Comencemos introduciendo el concepto a través de un ejemplo. Se tira un dado
no cargado n veces, y se quiere hallar (bajo el espacio clásico de probabilidades) la
probabilidad de obtener exactamente k veces el seis (suceso A), donde 0 ≤ k ≤ n.
Luego de haber sobrevivido a los ejercicios de conteo, el estudiante puede sin
mayor dificultad calcular esta probabilidad.
Representando los n lugares disponibles, podemos pensar, en principio, que
los k seis, salen en los primeros k lanzamiento, es decir:
6−
6− · · ·
6−︸ ︷︷ ︸
k lanzamientos
6=6−6=6− · · ·
6=6−︸ ︷︷ ︸
n−k lanzamientos
Para esta situación, llamémosle suceso B, utilizando que hay independencia
en las tiradas, tenemos
P (B) = P (1o = 6) · · ·P (ko = 6)︸ ︷︷ ︸k éxitos
P ((k + 1)o 6= 6) · · ·P (no 6= 6)︸ ︷︷ ︸n−k fracasos
=
(1
6
)k (1− 1
6
)n−k
Por último, nos sirve que en los primeros k lanzamientos obtengamos los 6’s,
o también en los últimos k o también en cualquier ubicación en la que podamos
ubicar a los k 6’s en los n lugares, en total Cnk posibilidades. Cada ubicación
nos da lugar a un suceso disjunto de otro, pero igualmente tiene probabilidad
(1/6)k(1− 1/6)n−k, por lo tanto
P (A) = Cnk
(1
6
)k (1− 1
6
)n−k
Sobre el mismo esquema, supongamos que ahora queremos la probabilidad de
obtener exactamente k veces el 6 o 4, ahora nuestro “éxito” tiene probabilidad
2/6 = 1/3 y por tanto nuestro fracaso tiene probabilidad 1 − 1/3. Manteniendo
Federico De Olivera Lamas
-
2.1 Conceptos iniciales 55
el mismo esquema, y suponiendo que los lanzamientos se hacen de forma inde-
pendiente, obtenemos que
P (obtener exactamente k veces, 4 o 6) = Cnk
(1
3
)k (1− 1
3
)n−kEs más, si nuestro suceso consta de obtener k éxitos y n− k fracasos, donde
los experimentos se hacen de forma independiente y la probabilidad de éxito, en
cada experimento, es p (por tanto la de fracaso es 1− p = q), tenemos que
P (obtener exactamente k éxitos) = Cnk pk (1− p)n−k
Supongamos ahora que se tiene un grupo de 40 estudiantes del curso de Prob-
abilidad y Estad́ıstica (que supondremos con comportamientos independientes)
donde se estima que la probabilidad que uno salve el examen en diciembre (primer
peŕıodo) es 0, 3. Supongamos que ha pasado tal peŕıodo y no tenemos más infor-
mación, ¿ cuál es la probabilidad de que de los 10 estudiantes que se presentaron,
exactamente la mitad hallan salvado el examen?. Aqúı podŕıamos intentar hacer
todo un nuevo desarrollo, pero... si observamos con detenimiento, no hay mayor
diferencia con el problema de los dados. Tenemos n = 10 realizaciones independi-
entes de un mismo experimento, elegir al azar un estudiante, y la probabilidad de
“éxito” (salvar el examen) es 0, 3, igual para todos los estudiantes. Por lo tanto,
la probabilidad deseada es:
P (exactamente 5 estudiantes salvaron el examen) = C105 (0, 3)5 (1− 0, 3)5 ∼= 0, 154
En el ejemplo anterior se hicieron algunos supuestos:
a. Se repiten n experimentos independiente.
b. La probabilidad de “éxito” en cada experimento es constante e igual a p.
Federico De Olivera Lamas
-
56 2. Variables Aleatorias
Bajo estas hipótesis, la probabilidad de tener exactamente k éxitos
k = 0, . . . , n es Cnk pk (1− p)n−k.
Una primera aproximación al concepto de variable aleatoria puede ser for-
mulado a partir de esta idea, tratamos de construir modelos, de modo que al
verificarse ciertas hipótesis, tengamos el cálculo de probabilidades ya resuelto.
Sin lugar a duda, el concepto de variable aleatoria es mucho más “profundo”,
pero esta idea sirve al estudiante para ir incorporando el concepto.
Retomemos el ejemplo de la tirada del dado pero ahora en un caso más sencillo,
el dado se tira 4 veces, de forma independiente y se quiere hallar la probabilidad
de obtener exactamente 2 veces el seis. La probabilidad de tal evento la podemos
calcular como antes, pero ahora nuestro estudio será dirigido en otro sentido,
veamos primero quién es nuestro espacio muestral:
Ω = {(x1, x2, x3, x4) ∈ {1, 2, 3, 4, 5, 6}4}
Es decir, x1 representa lo que sale en la primer tirada del dado, x2 en la segunda y
aśı sucesivamente. Por lo tanto, algunos elementos de Ω son (1, 4, 5, 2) o (5, 2, 6, 6).
Podemos determinar una función que, para cada elemento de Ω, nos dé la
cantidad de seis, es decir
X : Ω→ R tal que X(ω) = “cantidad de seis en ω′′
Por ejemplo X((1, 4, 5, 2)
)= 0, X
((5, 2, 6, 6)
)= 2. De ésta forma, nos
interesan todos los ω ∈ Ω tal que X(ω) = 2, es decir X−1({2}).
Recordemos que si tenemos una función f : A → B, y un subconjunto del
codominio Y ⊂ B, entonces
f−1(Y ) = {x ∈ A : f(x) ∈ Y }
Federico De Olivera Lamas
-
2.1 Conceptos iniciales 57
Es común que estudiantes principiantes se confundan con la función inversa, pero
aqúı nada se habla de función inversa, de hecho, anotamos f−1(Y ) para indicar
conjunto contra imagen de Y por la función f , de donde el sentido que le damos
aqúı a f−1 es como una función aplicada a conjuntos
f−1 : P(B)→ P(A) tal que f−1(Y ) = {x ∈ A : f(x) ∈ Y }
Algunas propiedades que el lector puede probar son:
1. f−1(B) = A.
2. f−1(Y ∪Z) = f−1(Y )∪ f−1(Z), en general f−1(⋃+∞
n=1 Yn)
=⋃+∞n=1 f
−1(Yn).
3. f−1(Y c) = (f−1(Y ))c.
4. Si Y ⊂ Z ⇒ f−1(Y ) ⊂ f−1(Z).
5. f−1(Y ∩ Z) = f−1(Y ) ∩ f−1(Z).
Sin duda que, pensando más en general, debemos exigir que X−1({2}) sea un
suceso, para poderle calcular su probabilidad, dicha probabilidad es la probabili-
dad de obtener exactamente 2 seis. De querer calcular la probabilidad de obten-
er al menos un seis , podŕıamos pensarlo como P (X−1({1, 2, 3, 4})), de donde
X−1({1, 2, 3, 4}) también debeŕıa ser un suceso.
Más