marclan/pye2010ipa/notas de probabilidad, fdeo.pdf · comentarios y agradecimientos: estas notas...

257
Introducci ´ on a la Probabilidad Nivel Terciario Federico De Olivera Lamas

Upload: others

Post on 25-Jan-2021

6 views

Category:

Documents


0 download

TRANSCRIPT

  • Introducción a la

    Probabilidad

    Nivel Terciario

    Federico De Olivera Lamas

  • Comentarios y agradecimientos:

    Estas notas fueron realizadas durante el dictado del curso 2007 de probabilidad

    y estad́ıstica de IPA. Abarcan los temas correspondientes a probabilidad, no a

    estad́ıstica cosa que aún tengo en el debe.

    Debo notar que este curso no se ubica en la posición deseada dentro de la

    carrera, ya que se dicta conjuntamente con Análisis II (donde se estudia varias

    variables) mientras que debeŕıa ser Análisis II previa de Probabilidad y Estad́ısti-

    ca, como lo es en todas las carreras que tienen este curso. Lamentablemente, por

    motivos ajenos a lo que a mi respecta, en la nueva carrera de profesorado de

    matemática este asunto no fue corregido.

    Para el lector que recién comienza en estos temas le aclaro un poco más.

    Cuando uno estudia lo básico de inferencia estad́ıstica se enfrenta a información

    vectorial, por ejemplo si a cada persona se le pregunta edad, peso e ingresos

    mensuales, entonces obtenemos un vector (x1, x2, x3) ∈ R3 para cada persona.

    Cualquier tipo de modelización que queramos aplicarle a la información obteni-

    da para un grupo de personas necesita del conocimiento de funciones de varias

    variables.

    El problema antes mencionado llevó a que la estructura de estas notas no

    es la habitual. Comenzamos con el estudio de espacios de probabilidad y luego

    pasamos a variables aleatorias, en este punto no se trabaja con vectores aleatorios

    y se pasa al trabajo con esperanzas de variables aleatorias. Luego de estudiados

    estos aspectos y con la “esperanza” de que en análisis II ya se hallan estudiado

    integrales múltiples, nos introducimos en un rápido recorrido por los vectores

    aleatorios y sus esperanzas. Por último nos introducimos en los tipos de conver-

    gencias dando lugar a los important́ısimos teoremas: Ley de los Grandes Números

    y Teorema del Ĺımite Central.

  • Un último comentario es que estas notas son realizadas apuntando a un nivel

    terciario, por ende se requiere de cierta madurez del razonamiento, sin embargo,

    hay algunos resultados que el estudiante puede asumir sin entrar en detalles, como

    la existencias de conjuntos no medibles (referente a la medida de Lebesgue),

    la construcción del proceso de Poisson o la integral de Riemann-Stieltjes (no

    estudiada sobre esta carrera).

    Mis gracias a Santiago y Marcela por el apoyo y la tolerancia brindados.

    5 de mayo de 2008.

    Federico De Olivera Lamas

  • Índice general

    1. Espacios de Probabilidad 1

    1.1. Espacio muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

    1.2. Necesidad de una σ-álgebra . . . . . . . . . . . . . . . . . . . . . 3

    1.3. Axiomas de la Probabilidad . . . . . . . . . . . . . . . . . . . . . 14

    1.4. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . 28

    1.5. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    1.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

    1.7. Anexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

    2. Variables Aleatorias 53

    2.1. Conceptos iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . 54

    2.2. Función de distribución . . . . . . . . . . . . . . . . . . . . . . . . 60

    2.3. Tipos de Variables Aleatorias . . . . . . . . . . . . . . . . . . . . 66

    2.3.1. Algunos modelos de variables aleatorias discretas . . . . . 77

    Federico De Olivera Lamas

  • ii ÍNDICE GENERAL

    2.3.2. Algunos modelos de variables aleatorias

    absolutamente continuas. . . . . . . . . . . . . . . . . . . . 92

    2.4. Transformaciones de variables aleatorias . . . . . . . . . . . . . . 103

    2.4.1. Simulación Montecarlo . . . . . . . . . . . . . . . . . . . . 110

    2.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

    3. Esperanza Matemática 127

    3.1. Esperanza de una variable aleatoria . . . . . . . . . . . . . . . . . 128

    3.2. Esperanza de una transformación de v.a. . . . . . . . . . . . . . . 140

    3.3. Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

    3.4. Función Generatriz de Momentos . . . . . . . . . . . . . . . . . . 153

    3.5. Función caracteŕıstica . . . . . . . . . . . . . . . . . . . . . . . . . 161

    3.6. Otras medidas de una variable aleatoria . . . . . . . . . . . . . . . 164

    3.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

    3.8. Anexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

    4. Vectores Aleatorios 175

    4.1. Conceptos iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . 176

    4.2. Tipos de vectores aleatorios . . . . . . . . . . . . . . . . . . . . . 184

    4.3. Independencia de variables aleatorias . . . . . . . . . . . . . . . . 192

    4.4. Transformaciones de vectores aleatorios . . . . . . . . . . . . . . . 199

    4.5. Esperanza de funciones de vectores aleatorios . . . . . . . . . . . 205

    Federico De Olivera Lamas

  • ÍNDICE GENERAL iii

    4.5.1. Esperanza de la suma y el producto de v.a. . . . . . . . . . 206

    4.5.2. Varianza de la suma de v.a. . . . . . . . . . . . . . . . . . 213

    4.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216

    5. Convergencias 223

    5.1. Convergencia en Probabilidad . . . . . . . . . . . . . . . . . . . . 225

    5.2. Convergencia casi segura . . . . . . . . . . . . . . . . . . . . . . . 228

    5.3. Ley de los grandes números . . . . . . . . . . . . . . . . . . . . . 232

    5.4. Convergencia en Ley . . . . . . . . . . . . . . . . . . . . . . . . . 236

    5.5. Teorema del Ĺımite Central . . . . . . . . . . . . . . . . . . . . . 240

    5.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246

    Federico De Olivera Lamas

  • Caṕıtulo 1

    Espacios de Probabilidad

    Ya desde algunos cursos en la educación secundaria se ha introducido la idea de

    Probabilidad. En general, en esos cursos se estudia lo que se denomina definición

    de Laplace o clásica.

    En la definición clásica, las probabilidades se calculan con aquello de “casos

    favorables sobre casos posibles”, si bien en aquél momento bastaba con esa idea de

    probabilidad, es una versión muy simplificada de lo que significa “Probabilidad”.

    En nuestro curso estudiaremos la probabilidad como una medida para nues-

    tro grado de incertidumbre, asignándole el valor mı́nimo cero (total incertidum-

    bre) y valor máximo uno.

    Es claro que nos enfrentaremos con algunos problemas, el primero es: ¿a qué le

    calcularemos la probabilidad, en qué condiciones?. estas y otras tantas preguntas

    iremos estudiando a lo largo del curso, donde además intentaremos desarrollar

    algunos modelos matemáticos que nos faciliten el abordaje del cálculo de proba-

    bilidades.

  • 2 1. Espacios de Probabilidad

    1.1. Espacio muestral

    Supongamos que un experimento sea realizado sobre ciertas condiciones fijas.

    El conjunto Ω de los resultados elementales e indivisibles será llamado espacio

    muestral o espacio de resultados posibles. A los elementos del espacio muestral

    los llamaremos sucesos elementales y los notaremos ω.

    Ejemplo 1

    Se tira un dado y se observa la cantidad de puntos de la cara superior al caer.

    Aqúı Ω = {1, 2, 3, 4, 5, 6} y sus elementos son sucesos elementales. Observemos

    que el conjunto {1, 2} no es un resultado indivisible, por ende no es un elemento

    del espacio muestral y por tanto no es un suceso elemental.

    Śı son sucesos elementales ω1 = {1}, . . . , ω6 = {6}. /

    En ocasiones no es tan sencillo determinar el espacio muestral, veamos el

    siguiente ejemplo.

    Ejemplo 2

    Se selecciona un individuo de Montevideo y se mide su altura en metros.

    ¿ Cuál es el espacio muestral?.

    Es claro que medir su altura con dos decimales, es una mera aproximación

    de la verdadera altura del individuo. Un individuo podŕıa eventualmente medir

    1, 70 metros, pero también podŕıa medir π/2 metros, aunque nuestros útiles de

    medición no nos permitan saber con exactitud dicha medida.

    De aqúı que la altura es un número real, claramente positivo y a priori no

    acotado superiormente. En efecto, si suponemos que el individuo más alto mide

    2, 10 metros, no hay nada que nos asegure que podamos encontrar en algún

    Federico De Olivera Lamas

  • 1.2 Necesidad de una σ-álgebra 3

    momento alguno que mida 2, 20 metros. Es claro que poner, por ejemplo mil

    metros, es una cota más que razonable a los efectos prácticos. En éste ejemplo

    nuestro espacio muestral es Ω = (0,+∞). /

    En el ejemplo anterior se observa que muchos elementos del espacio mues-

    tral son imposibles, es más, podŕıamos haber seleccionado a todos los números

    reales como espacio muestral y no cambiaŕıa sustancialmente nuestro concepto de

    espacio muestral, sólo que encontraŕıamos muchos sucesos que seŕıan imposibles.

    1.2. Necesidad de una σ-álgebra

    Manejando el concepto de probabilidad de los cursos de secundaria, si el ex-

    perimento consiste en tirar un dado y observar la cantidad de puntos en la cara

    superior, podŕıamos calcular la probabilidad de “obtener un 2”, de hecho, si dicho

    suceso elemental lo anotamos con A, tenemos que:

    P (A) =casos favorables

    casos posibles=

    1

    6

    Además podemos calcular la probabilidad de B=“obtener un número par”,

    aunque éste no sea un suceso elemental, P (B) = 36. Sin mayor dificultad el lec-

    tor podrá observar que en este ejemplo, podemos calcular la probabilidad de

    cualquier subconjunto del espacio muestral, es decir, podemos calcular la proba-

    bilidad de cualquier elemento de partes de Ω (partes de Ω, el conjunto de todos

    los subconjuntos de Ω, lo anotaremos 2Ω o P(Ω)).

    Lamentablemente no siempre es posible calcular la probabilidad de cualquier

    subconjunto del espacio muestral. La justificación es basada en la medida de

    Lebesgue de la que daremos una breve introducción. Comencemos introduciendo

    el problema con un ejemplo.

    Federico De Olivera Lamas

  • 4 1. Espacios de Probabilidad

    Ejemplo 3

    Tiramos un dardo sobre una pared, la base de la pared la medimos en una cierta

    unidad tal que represente al intervalo [0, 1] y observamos la coordenada (horizon-

    tal) en la que quedó el dardo. Es claro que Ω = [0, 1].

    Haciendo una extensión de la noción de probabilidad anterior a), podŕıamos

    tratar de calcular la probabilidad de que el dardo quede en el intervalo [1/3, 1/2].

    Es razonable que dicha probabilidad sea calculada como la medida del intervalo

    [1/3, 1/2] sobre la medida del intervalo [0, 1], es decir:

    P (“dardo quede en [1/3, 1/2]”) =m([1/3, 1/2])

    m([0, 1])=

    1/2− 1/31− 0

    = 1/6

    De aqúı deducimos que, en este ejemplo, el cálculo de probabilidades se reduce

    a medir conjuntos, por ejemplo, ¿cuál es la probabilidad de que el dardo quede

    en una coordenada racional?, como hemos estudiado en Análisis I, la medida de

    cualquier conjunto numerable es cero y por ende, tal probabilidad es cero.

    ¿ Para cualquier subconjunto E del intervalo [0, 1], podemos hallar la prob-

    abilidad que el dardo quede en E?. Tal pregunta es equivalente a ¿a cualquier

    subconjunto E del intervalo [0, 1] lo podemos medir con las nociones básicas de

    medida?.

    Como ya se mencionó, para responder tendremos que hacer una breve intro-

    ducción a los conceptos de medida. /

    La medida que extiende el concepto de longitud es la llamada medida de

    Lebesgue, algunas propiedades que ésta debe cumplir son:

    1. La medida del intervalo cerrado [0, 1] es uno, es decir, m([0, 1]) = 1.

    2. Si trasladamos un conjunto, su medida no cambia, es decir, si E es un

    conjunto de reales y x es un número real cualquiera, m(x + E) = m(E),

    a)Aún no hemos definido a la probabilidad, pero nos manejamos con conceptos intuitivos.

    Federico De Olivera Lamas

  • 1.2 Necesidad de una σ-álgebra 5

    donde x+ E = {x+ y : y ∈ E}.

    Por ejemplo: m(2 + [0, 1]︸ ︷︷ ︸=[2,3]

    ) = m([2, 3]) = 3− 2 = 1 = m([0, 1]).

    3. Si deseamos medir una colección numerable de conjuntos disjuntos (incom-

    patibles) E1, E2, . . . , En, . . . ,donde Ei ∩ Ej = ∅ para i 6= j, es razonable

    pedir que m(⋃+∞n=1En) =

    ∑+∞n=1En.

    Por ejemplo: m([0, 1] ∪ [2, 3] ∪ [5, 8]) = m([0, 1]) +m([2, 3]) +m([5, 8]).

    Veamos a continuación un ejemplo en el cual se muestra un conjunto no

    medible:

    Ejemplo 4 (Un conjunto no medible)

    Consideremos el intervalo [0, 1] y sobre éste definamos la relación:

    xRy ⇔ x− y ∈ Q, es decir, dos reales del intervalo [0, 1] se relacionan, si y sólo

    si, distan un racional.

    El lector podrá verificar que se trata de una relación de equivalencia.

    Formemos ahora un conjunto E, tomando uno y sólo un elemento de cada clase

    de equivalencia (axioma de elección b)). Por ejemplo: 0, 1/e y 1/π pertenecen a

    clases distintas pues no distan un racional, de aqúı que 0, 1/e, 1/π ∈ E, entre

    otros.

    Tomemos ahora un racional q del intervalo [0, 1], que representa la “distancia”

    a la que están los elementos en las clases, y formemos el conjunto Eq como sigue:

    Eq = {(x+ q)mod(1) : x ∈ E}

    En otras palabras, sin usar módulo, a cada elemento del conjunto E lo

    b)Acá estamos usando el axioma de elección que dice, resumidamente, que si uno tiene una

    familia de conjuntos y toma un elemento de cada uno, entonces obtiene también un conjunto.

    Federico De Olivera Lamas

  • 6 1. Espacios de Probabilidad

    trasladamos el racional q y los que sobrepasen al 1 lo trasladamos al comien-

    zo para aseguramos que queden en [0, 1] , es decir:

    Eq = {x+ q : x ∈ E si x+ q ≤ 1} ∪ {x+ q − 1 : x ∈ E si x+ q > 1}

    Observemos que si 0 ∈ E entonces 1 6∈ E pues son de la misma clase, por lo

    tanto la unión que determina a los Eq es disjunta.

    Al hacer variar q sobre todos los racionales de [0, 1] obtenemos todos los

    elementos de cada clase. Por ejemplo, como 1/e ∈ E, al sumarle q obtenemos el

    elemento que dista el racional q de 1/e, al hacerlo para todos los racionales del

    intervalo [0, 1] obtenemos todos los elementos de la clase de 1/e y ésto vale para

    todos los elementos de E en donde hay un representante de cada clase.

    De lo anterior deducimos que⋃

    q∈Q∩[0,1]

    Eq(1)=[0, 1].

    Además, los conjuntos Eq son disjuntos. En efecto, observemos que si

    a ∈ Eq ∩ Er, entonces a es representado por un elemento xα en E tal que

    xα+q = a y también es representado por un elemento xβ en E tal que xβ +r = a

    c). Pero xα “dista” de xβ el racional r − q 6= 0 y por lo tanto llegamos a que en

    E hay dos elementos de una misma clase, en absurdo con la definición de E.

    En resumen, los conjuntos Eq son una sucesión numerable de conjuntos dis-

    juntos, donde de ser medibles tendŕıamos que

    c) estamos suponiendo que xα + q ≤ 1 y xβ + q ≤ 1, es análogo si no fuera aśı.

    Federico De Olivera Lamas

  • 1.2 Necesidad de una σ-álgebra 7

    m(Eq) = m({x+ q : x ∈ E si x+ q ≤ 1} ∪ {x+ q − 1 : x ∈ E si x+ q > 1})disj= m({x+ q : x ∈ E si x+ q ≤ 1}︸ ︷︷ ︸

    (q+E)∩[0,1]

    ) +m({x+ q − 1 : x ∈ E si x+ q > 1}︸ ︷︷ ︸(q−1+E)∩[0,1]

    )

    = m(E ∩ [q, 1]) +m(E ∩ [0, q))disj= m

    ((E ∩ [0, q]) ∪ (E ∩ (q, 1])︸ ︷︷ ︸

    E

    )= m(E) = c

    Concluimos que, de ser medible cada Eq, entonces miden todos una constante c.

    A los racionales en [0, 1], por ser infinitos y numerables, renombremoslos con

    qn, es decir, Q ∩ [0, 1] = ∪+∞n=1{qn}.

    Utilizando las propiedades deseadas de medida tenemos que:

    1 = m([0, 1])por (1)

    = m(⋃

    q∈Q∩[0,1]

    Eq)︸ ︷︷ ︸m(∪+∞n=1Eqn )

    disjuntos= =

    +∞∑n=1

    m(Eqn) =+∞∑n=1

    c

    Donde obtenemos un absurdo, pues si c = 0 llegamos a que 1 = 0 y si c > 0

    llegamos a que 1 = +∞. El absurdo se genera al pensar que los conjuntos Eq son

    medibles.

    En resumen, como cada Eq resultaba de una traslación de E, concluimos que

    E no es medible y esto responde negativamente la pregunta ¿todo subconjunto

    de R es medible ?. /

    Como resultado concluimos que no todo subconjunto de R es medible y por

    tanto no podemos calcular la probabilidad de que el dardo quede en E para

    cualquier subconjunto de [0, 1].

    Es importante resaltar que, con lo mostrado arriba, el dominio de la proba-

    bilidad no siempre podrá ser P(Ω). Necesitaremos introducir un nuevo concepto,

    el de σ- álgebra, ésta será una subfamilia de subconjuntos del espacio muestral

    Federico De Olivera Lamas

  • 8 1. Espacios de Probabilidad

    en donde siempre podemos calcular probabilidades. En el caso de la recta real,

    utilizaremos la σ- álgebra de Borel que será introducida más adelante.

    Indagando los requisitos de una Probabilidad

    Tratemos de indagar sobre los requisitos mı́nimos que deseamos que cumpla

    una probabilidad, retomemos el ejemplo de la tirada de un dado, aqúı Ω =

    {1, 2, 3, 4, 5, 6}.

    Es claro que podemos calcular la probabilidad de A2 =“sale 2” y de A3 =“sale

    3”, de donde A2 y A3 deben estar en el dominio de la probabilidad. Pero también

    nos interesaŕıa calcular la probabilidad de A2 ∪A3 =“sale 2 o 3”, de donde, si A2y A3 están en el dominio de la probabilidad, entonces A2 ∪ A3 también lo está.

    Es evidente que podemos extender este requerimiento para una unión finita, por

    ejemplo, “sale 1, o 2, o 3, o 4, o 5, o 6”=A1∪A2∪A3∪A4∪A5∪A6 debe estar en el

    dominio de la probabilidad, es más, según los conceptos previos de probabilidad,

    dado que los conjuntos son disjuntos, P (∪6i=1Ai) =∑6

    i=1 P (Ai)︸ ︷︷ ︸1/6

    = 1.

    Trabajar con uniones finitas no siempre es suficiente, supongamos que ob-

    servamos la cantidad de autos que llegan a un peaje en un lapso de tiempo.

    Aqúı Ω = {0, 1, 2, . . . , n, . . .} = N y por tanto, si podemos calcular la probabili-

    dad de que hayan llegado n autos, debeŕıamos poder calcular la probabilidad de

    que “llagaron 0, o 1, o 2,..., o n, ... autos” (a saber, tal probabilidad debe ser 1) y

    por tanto, si A0, A1, . . . , An, . . . están en el dominio de la probabilidad, también

    debe estar ∪+∞n=0An

    Volviendo al ejemplo de la tirada del dado, si A =“sale 1, o 2” está en el

    dominio de la probabilidad, entonces debe estar Ac =“sale 3, o 4, o 5, o 6”.

    Hemos introducido el concepto de σ- álgebra, el que nos servirá como dominio

    de la probabilidad.

    Federico De Olivera Lamas

  • 1.2 Necesidad de una σ-álgebra 9

    Definición 1 (σ-álgebra)

    Dado un conjunto Ω, llamamos σ- álgebra de Ω, o simplemente σ-álgebra, a una

    familia A, de subconjuntos de Ω, tal que:

    i) A 6= ∅

    ii) Si A ∈ A entonces Ac ∈ A

    iii) Si A1, A2, . . . , An, . . . ∈ A entonces+∞⋃n=1

    An ∈ A

    El lector podrá verificar que la definición de σ- álgebra, coincide con lo

    deseábamos que cumpliera el dominio de la probabilidad.

    Ejemplo 5

    Dado un conjunto Ω, P(Ω) es una σ- álgebra, ya que Ω ∈ P(Ω) y por tanto P(Ω)

    es no vaćıa. Si A ∈ P(Ω) entonces Ac también es un subconjunto de Ω, de donde

    Ac ∈ P(Ω) y lo mismo ocurre para la unión. /

    Si bien P(Ω) es una σ- álgebra, como vimos en el ejemplo 3, no siempre nos

    servirá como dominio de la probabilidad, en donde debemos trabajar con otra σ-

    álgebra.

    Ejercicio 1

    Dado un conjunto Ω. Probar queA = {∅,Ω} es una σ- álgebra. La σ- álgebra

    A = {∅,Ω} es llamada σ- álgebra trivial. �

    Ejemplo 6

    Sea Ω un conjunto no numerable de números reales, probemos que

    A = {A ⊂ Ω : Aes numerable o Ac es numerable}

    es una σ- álgebra.

    Federico De Olivera Lamas

  • 10 1. Espacios de Probabilidad

    i) Es claro que ∅ es numerable y por tanto ∅ ∈ A y de aqúı que A no es vaćıa.

    ii) Si A ∈ A entonces,

    o bien A es numerable y Ac no lo es, pero (Ac)c = A es numerable y por

    tanto Ac ∈ A

    o bien A no es numerable pero por pertenecer a A, Ac es numerable y de

    aqúı que Ac ∈ A.

    iii) Si A1, A2, . . . , An, . . . ∈ A puede ocurrir que:

    * todos los An son numerables y por tanto, como la unión numerable de

    conjuntos numerables es numerable, tenemos que⋃+∞n=1An ∈ A.

    * si alguno de los An es no numerable, supongamos que el Aj no lo es, en-

    tonces⋃+∞n=1An no es numerable, pero su complemento (

    ⋃+∞n=1An)

    c =⋂+∞n=1(An)

    c ⊂ (Aj)c y como Aj ∈ A y Aj no es numerable, entonces

    (Aj)c es numerable. De lo anterior concluimos que

    ⋃+∞n=1An tiene com-

    plemento numerable y por tanto⋃+∞n=1An ∈ A.

    /

    Tratemos de introducir ahora una σ- álgebra que nos sea útil para calcular

    probabilidades sobre intervalos de números reales.

    Proposición 1

    Sea A una σ- álgebra de subconjuntos de Ω, entonces ∅,Ω ∈ A.

    Demostración: En efecto, como A es no vaćıa, tenemos que existe algún A tal

    que A ∈ A, por la definición de σ- álgebra, Ac ∈ A y por tanto Ω = A∪Ac ∈ A.

    Dado que Ω ∈ A, tenemos que ∅ = Ωc ∈ A. �

    Federico De Olivera Lamas

  • 1.2 Necesidad de una σ-álgebra 11

    Proposición 2

    Sea A una σ- álgebra de subconjuntos de Ω, si A1, A2, . . . , An, . . . ∈ A entonces⋂+∞n=1An ∈ A

    Demostración: Como A1, A2, . . . , An, . . . ∈ A tenemos que Ac1, Ac2, . . . , Acn, . . . ∈

    A y por lo tanto⋃+∞n=1A

    cn ∈ A. Nuevamente,

    +∞⋂n=1

    An =+∞⋂n=1

    (Acn)c︸ ︷︷ ︸

    An

    DeMorgan=

    (+∞⋃n=1

    Acn

    )c∈ A

    Proposición 3

    Consideremos un conjunto Ω y las σ- álgebras Aλ de subconjuntos de Ω (λ ∈ L,

    con L algún conjunto de ı́ndices). Entonces A =⋂λ∈ L

    Aλ es también una σ- álgebra

    de subconjuntos de Ω.

    Demostración: i) Por ser Aλ σ- álgebra, ∅ ∈ Aλ ∀ λ ∈ L, por lo tanto,

    ∅ ∈⋂λ∈ LAλ y de aqúı que A es no vaćıa.

    ii) Si A ∈ A, entonces A ∈ Aλ ∀ λ ∈ L, siendo Aλ σ- álgebra, Ac ∈ Aλ ∀ λ ∈ L

    y por lo tanto Ac ∈⋂λ∈ LAλ

    iii) Si A1, A2, . . . , An, . . . ∈ A entonces A1, A2, . . . , An, . . . ∈ Aλ ∀ λ ∈ L, siendo

    Aλ σ- álgebra,⋃+∞n=1An ∈ Aλ ∀ λ ∈ L y por lo tanto

    ⋃+∞n=1An ∈

    ⋂λ∈ LAλ

    Dada una familia F cualquiera de subconjuntos de Ω, siempre tenemos que

    F ⊂ P(Ω) y por lo tanto siempre hay al menos una σ- álgebra que contiene a F .

    Este resultado es vital para la siguiente definición.

    Federico De Olivera Lamas

  • 12 1. Espacios de Probabilidad

    Definición 2 (σ-álgebra generada)

    Dada una familia F de subconjuntos de Ω, llamamos σ- álgebra generada por F ,

    a la σ- álgebra M(F) =⋂Aλ donde la intersección es realizada sobre todas las

    σ- álgebras que contienen a F .

    Ejemplo 7

    Sea Ω = {1, 2, 3} y F = {{1, 2}}. Veamos qué σ-álgebras contienen a F :

    P(Ω) = {∅,Ω, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}}

    también {∅,Ω, {3}, {1, 2}}

    ¿hay alguna otra?, el lector podrá verificar que no.

    Por lo tanto, M(F) = P(Ω) ∩ {∅,Ω, {3}, {1, 2}} = {∅,Ω, {3}, {1, 2}}. /

    Veamos ahora una σ- álgebra muy importante a la hora de avanzar en temas

    de probabilidad.

    Definición 3 (La σ- álgebra de Borel en R)

    Sea R nuestro espacio muestral y consideremos a la familia de intervalos abiertos

    de R:

    F = {(a, b) : a, b ∈ R, a < b}

    llamamos σ- álgebra de Borel a la σ- álgebra generada por F , que anotamos B.

    Para aclarar ideas, la σ- álgebra de Borel en R, es la menor σ- álgebra que

    contiene a los abiertos de R. Es erróneo pensar que B sólo contiene abiertos ya que

    si (a, b) ∈ B entonces (a, b)c ∈ B y por ser el complemento de un abierto, (a, b)c es

    cerrado. Además, como ya vimos, las uniones, las intersecciones y complementos

    de elementos de B están en B.

    Federico De Olivera Lamas

  • 1.2 Necesidad de una σ-álgebra 13

    Ejemplo 8

    Los intervalos cerrados están en B. En efecto, dado un intervalo cerrado [a, b],

    sabemos que [a, b] =⋂+∞n=1 (a− 1/n, b+ 1/n)︸ ︷︷ ︸

    ∈B

    ∈ B. /

    La σ- álgebra de Borel goza de la propiedad que todos sus elementos son

    medibles según la medida de Lebesgue, es por este motivo que la utilizaremos

    como dominio de la probabilidad en casos como el introducido en el ejemplo

    del dardo ( ejemplo 3). Sin lugar a duda, mostrar que los elementos de B son

    medibles excede nuestros objetivos y podrá ser estudiado en un curso de Análisis

    Real (medida).

    Por último, veamos una extensión de la σ- álgebra de Borel a Rn.

    Definición 4 (La σ- álgebra de Borel en Rn)

    Sea Rn nuestro espacio muestral, la σ- álgebra de Borel en Rn, a la cual anotamos

    Bn es la generada por los abiertos de Rn.

    Excede también nuestro curso probar que Bn es efectivamente una σ- álgebra.

    En el práctico se verán otros ejemplos de σ- álgebra.

    A continuación definimos un espacio donde podremos definir una probabili-

    dad:

    Definición 5 (Espacio probabilizable)

    A la pareja (Ω,A), donde Ω representa el espacio muestral y A es una σ- álgebra

    de subconjuntos de Ω, la llamaremos espacio probabilizable. A los elementos

    de A los llamaremos sucesos.

    Federico De Olivera Lamas

  • 14 1. Espacios de Probabilidad

    1.3. Axiomas de la Probabilidad

    La probabilidad tal como la hemos venido introduciendo, es una medida para

    nuestro grado de incertidumbre. En 1933, Kolmogórov publicó el libro Los fun-

    damentos de la Teoŕıa de la Probabilidad, estableciendo las bases modernas de

    la teoŕıa axiomática de la probabilidad.

    Definición 6 (Axiomas de Kolmogórov)

    Dado un espacio probabilizable (Ω,A), una probabilidad es una función

    P : A → R tal que:

    P (A) ≥ 0 para todo suceso A (A ∈ A)

    P (Ω) = 1

    Si A1, A2, . . . , An, . . . son sucesos disjuntos dos a dos (Ai∩Aj = ∅ con i 6= j)

    entonces

    P

    (+∞⋃n=1

    An

    )=

    +∞∑n=1

    P (An)

    Algunas cosas que son importantes resaltar son las siguientes, sólo podemos

    calcularle la probabilidad a los elementos de la σ- álgebra, la probabilidad de

    cualquier suceso es siempre mayor o igual a cero (más adelante veremos que

    también es menor o igual a uno), la probabilidad de la unión disjunta es la suma

    de las probabilidades.

    Definición 7 (Espacio de probabilidad)

    A la terna (Ω,A, P ) la llamamos espacio de probabilidades

    Sólo cuando esté dado un espacio de probabilidades, es cuando se procede a

    calcular probabilidades. A continuación veremos algunos ejemplos que nos per-

    Federico De Olivera Lamas

  • 1.3 Axiomas de la Probabilidad 15

    mitirán aclarar ideas.

    Ejemplo 9

    Se tira una moneda al aire y se observa la cara superior al caer.

    Aqúı Ω = {“cara”,“número”}, consideremos la σ- álgebra A =

    P(Ω) = {∅,Ω, “cara”, “número”} y supongamos que no tenemos indi-

    cios para suponer que la moneda esté cargada, es decir, suponemos que

    P (“cara”) = P (“número”) = 1/2.

    Tenemos además que P (Ω) = 1 y como veremos más adelante, P (∅) = 0, de

    donde tenemos definida la probabilidad para cualquier elemento de la σ- álgebra.

    Hemos construido aśı, el espacio de probabilidades (Ω,A, P ).

    Pero supongamos ahora que śı tenemos sospechas que la moneda esté cargada,

    pues al tirarla 100 veces, se obtuvieron 20 caras y 80 números.

    Podŕıamos suponer aqúı que P (“cara”) = 20/100 = 1/5 y

    P (“número”) = 80/100 = 4/5.

    Sin duda que este cambio altera sustancialmente nuestro concepto previo de

    probabilidad, aqúı se refleja en la obtención de un espacio de probabilidades

    distinto al anterior.

    Por ahora no estudiaremos como “estimar” dichas probabilidades, es un tema

    que se estudiará en estad́ıstica, en este ejemplo se trató de hacer notar que siempre

    tenemos que trabajar sobre un espacio de probabilidades dado. /

    Ejemplo 10 (El espacio de probabilidades clásico o de Laplace)

    Supongamos que nuestro espacio muestral es finito, Ω = {ω1, ω2, . . . , ωn} y que

    la σ- álgebra es A = P(Ω). Definamos las probabilidades como sigue:

    P (ω1) = P (ω2) = · · · = P (ωn) =1

    n

    Federico De Olivera Lamas

  • 16 1. Espacios de Probabilidad

    Siendo P una probabilidad, si A es un suceso cualquiera, compuesto por k sucesos

    elementales, A = {ωi1 , . . . , ωik} = ∪kj=1{ωij}, entonces

    P (A) = P (k⋃j=1

    {ωij})(1)=

    k∑j=1

    P (ωij)︸ ︷︷ ︸1/n

    =k

    n

    En (1) se usó que la unión es disjunta. El cociente k/n es lo que se conoce

    habitualmente como “casos favorables (k), sobre casos posibles (n)”. /

    El espacio de probabilidades clásico es utilizado cuando el espacio muestral

    es finito y no hay indicios de que los sucesos elementales tengan probabilidades

    distintas, por ejemplo, cuando tiramos un dado y observamos la cantidad de

    puntos en la cara superior. Trabajando sobre el espacio de probabilidades clásico,

    calculemos la probabilidad de obtener un número par. Nuestro suceso es A =

    {“sale 2, o 4, o 6”}, por lo tanto P (A) = 3/6 = 1/2.

    Antes de dar más ejemplos de cálculo de probabilidades pasemos a estudiar

    las propiedades que ésta posee.

    Proposición 4 (Propiedades de la probabilidad)

    Dado un espacio de probabilidades (Ω,A, P )

    1. P (A) = 1− P (Ac) para todo suceso A

    2. P (∅) = 0

    3. Si A y B son sucesos tales que A ⊂ B, entonces P (A) ≤ P (B)

    4. P (A) ∈ [0, 1] para todo suceso A

    5. Sean A y B dos sucesos cualesquiera, entonces

    P (A ∪B) = P (A) + P (B)− P (A ∩B)

    Federico De Olivera Lamas

  • 1.3 Axiomas de la Probabilidad 17

    6. Sean A1, A2, . . . , An, . . . sucesos cualesquiera, entonces

    P

    (+∞⋃n=1

    An

    )≤

    +∞∑n=1

    P (An)

    7. Sean A1, A2, . . . , An sucesos cualesquiera, entonces

    P

    (n⋃i=1

    Ai

    )=

    n∑k=1

    (−1)k+1∑

    1≤i1

  • 18 1. Espacios de Probabilidad

    Observemos que los sucesos (B ∩ A) y (B ∩ Ac) son disjuntos y además

    B = (B ∩ A) ∪ (B ∩ Ac), entonces

    P (B) = P((B ∩ A) ∪ (B ∩ Ac)

    ) disjuntos= P (B ∩ A) + P (B ∩ Ac)

    y si sustituimos este resultado en (1.1) obtenemos lo deseado.

    6. Tratemos de escribir la unión⋃+∞n=1An como una unión disjunta. Definamos

    E1 = A1, E2 = A2 − A1, E3 = A3 − (A1 ∪ A2), . . . , En = An −(∪n−1i=1 Ai

    )y aśı sucesivamente para todo natural.

    El lector podrá verificar fácilmente que En ⊂ An, An = ∪ni=1Ei y que

    ∪+∞n=1An = ∪+∞n=1En, donde los En son disjuntos dos a dos por construcción.

    Luego

    P

    (+∞⋃n=1

    An

    )= P

    (+∞⋃n=1

    En

    )disjuntos

    =+∞∑n=1

    P ( En︸︷︷︸⊂An

    )

    ︸ ︷︷ ︸≤P (An)

    ≤+∞∑n=1

    P (An)

    7. El estudiante interesado puede ver la demostración por inducción completa

    en el Anexo 1.7.

    Las anteriores propiedades serán muy útiles al momento de calcular probabili-

    dades, por ejemplo, en muchas oportunidades es más fácil calcular la probabilidad

    del complemento que la del propio suceso.

    Veamos ahora algunos ejemplos donde aplicamos las propiedades anteriores:

    Ejemplo 11

    Un estudiante tiene una probabilidad p de responder una pregunta en un examen

    oral. Se le ofrecen dos alternativas: a) Hacerle sólo una pregunta; b) Hacerle tres

    preguntas pero para salvar debe responder correctamente al menos dos.

    Federico De Olivera Lamas

  • 1.3 Axiomas de la Probabilidad 19

    ¿Cuál alternativa es más favorable?

    Según la opción a), la probabilidad de salvar es p. Según la opción b), la

    probabilidad de ganar se calcula como sigue:

    El estudiante puede:

    A=“responder correctamente las dos primeras y mál la última”, este suceso

    tiene probabilidad p2(1− p)

    B=“responder correctamente la primera y la tercera y mál la segunda”, este

    suceso también tiene probabilidad p2(1− p)

    C=“responder correctamente las dos últimas y mal la primera”, este suceso

    tiene probabilidad p2(1− p)

    D=“responder correctamente las tres preguntas”, este suceso tiene proba-

    bilidad p3.

    Por ende, que el estudiante salve es el suceso A ∪ B ∪ C ∪ B, la cual es una

    unión disjunta (¿por qué?) y por lo tanto la probabilidad que el estudiante salve

    con la opción b) es 3p2(1− p) + p3.

    Ahora analisemos que opción es más conveniente, para ello veamos que opción

    tiene mayor probabilidad de salvar. Para que la opción a) sea más conveniente que

    la b) debemos tener p > 3p2(1− p) + p3, resolviendo la desigualdad y teniendo en

    cuenta que p es una probabilidad, tenemos que si p ∈ (0, 1/2) conviene la opción

    a), si p ∈ (1/2, 1) conviene la opción b).

    Si p = 1/2 es indiferente, además si p = 0 perdemos con probabilidad uno en

    cualquiera de los casos y si p = 1 salvamos con probabilidad uno, ¿por qué?. /

    Ejercicio 2

    Una determinada traveśıa puede hacerse con aviones bimotores o con cuadrimo-

    Federico De Olivera Lamas

  • 20 1. Espacios de Probabilidad

    tores. Los bimotores pueden volar con un sólo motor y los cuadrimotores sólo con

    dos. La probabilidad de que un motor falle en la traveśıa es p. ¿Cuáles aviones

    son los más seguros?. �

    Ejemplo 12

    Tenemos dos urnas con n bolillas cada una, numeradas de 1 a n. Se extrae al azar

    una bolilla de la primer urna y otra de la segunda urna, sin reponer las bolillas se

    repite el procedimiento hasta agotar las n bolillas. Se desea hallar la probabilidad

    de que en alguna extracción se tenga al menos una coincidencia.

    Observemos que nuestro experimento termina cuando se extrajeron todas las

    bolillas, es por tal motivo que los elementos del espacio muestral son del tipo i1 i2 · · · inj1 j2 · · · jn

    donde i1, i2, · · · , in ∈ {1, 2, · · · , n} y j1, j2, · · · , jn ∈ {1, 2, · · · , n} representan

    el número de la bolilla extráıda en cada lugar.

    Notemos que los casos posibles son (n!)2, ya que cualquier permutación de las

    n bolillas de la primer urna es posible y por cada una de éstas, podemos hacer

    una permutación de las n bolillas de la segunda urna.

    Recordemos que queremos calcular la probabilidad de que al menos haya una

    coincidencia, lo que puede pensarse como, hay una coincidencia en el primer

    lugar o hay una coincidencia en el segundo lugar, ..., o hay una coincidencia en

    el n-ésimo lugar. Sea Ai el suceso “hay una coincidencia en el i-ésimo lugar”, la

    probabilidad deseada es P (⋃ni=1Ai). Uno puede verse tentado a calcularla como

    la suma de las probabilidades de los sucesos Ai, pero lamentablemente esto no

    es posible ya que los sucesos Ai no son incompatibles. Notemos que si hay una

    coincidencia en el primer lugar, podŕıa también haber una en el segundo.

    Para solucionar el problema anterior uno podŕıa definir los sucesos Bi como “

    Federico De Olivera Lamas

  • 1.3 Axiomas de la Probabilidad 21

    hay exactamente una coincidencia y es en el lugar i-ésimo”, estos sucesos śı son

    disjuntos pero se torna muy dif́ıcil contar los casos favorables a cada suceso. El

    lector interesado puede tratar de contarlos.

    En definitiva, tenemos que calcular P (⋃ni=1 Ai), donde Ai es el suceso “hay una

    coincidencia en el i-ésimo lugar”. De las propiedades de la probabilidad tenemos

    que

    P

    (n⋃i=1

    Ai

    )=

    n∑k=1

    (−1)k+1∑

    1≤i1

  • 22 1. Espacios de Probabilidad

    Observemos que la probabilidad no depende de quienes son los k lugares donde

    queremos las coincidencias, es decir, P (Ai1 ∩· · ·∩Aik) no depende de i1, i2, . . . , iky por tanto la suma

    ∑1≤i1

  • 1.3 Axiomas de la Probabilidad 23

    Para calcular la probabilidad de que gane el premio el jugador b) procedemos

    como sigue:

    La probabilidad de no ganar en el primer sorteo es 1 − 1/N = (N − 1)/N ;

    la probabilidad de no ganar en ni en el primer ni en el segundo sorteo es[(N −

    1)/N]2

    , y la probabilidad de no sacar ninguna vez el premio en los n sorteos es[(N − 1)/N

    ]n.

    Por lo tanto, la probabilidad de que el jugador b) saque el premio por lo menos

    una vez es:

    Pb = 1−[

    (N − 1)N

    ]nUsando la desigualdad de Bernoulli, (1 + a)δ > 1 + aδ con a ≥ −1 y δ > 1,

    tenemos que

    [(N − 1)N

    ]n=

    [1− 1

    N

    ]n> 1− n

    N

    de donde Pa > Pb.

    Es decir, el jugador a) tiene mayor probabilidad de sacar el premio, sin em-

    bargo, el jugador b) lo puede sacar más veces. /

    Ejemplo 14 (Opcional)

    Tenemos m bolillas y las queremos colocar aleatoriamente en n frascos, supong-

    amos n ≥ 1 y m ≥ n− 1. Puede que más de una bolilla quede en un frasco.

    El problema original consiste en hallar la probabilidad de que exactamente

    un frasco quede libre.

    Sea Bi, el suceso: “el frasco i-ésimo es el único que queda libre”, la probabil-

    idad deseada es P (⋃ni=1Bi), aqúı los sucesos Bi son disjuntos, pues si el frasco 1

    Federico De Olivera Lamas

  • 24 1. Espacios de Probabilidad

    es el único que queda libre, no puede ocurrir que el frasco 2 quede libre y aśı suce-

    sivamente. Pero... ¿ cómo calculamos P (Bi) ?, dejamos al lector indagar sobre la

    dificultad de tratar de contar los casos favorables.

    Tratemos de trabajar sobre un caso más sencillo, tratemos de calcular la

    probabilidad de que algún frasco quede libre. Sea Ai el suceso “ el frasco i- ésimo

    queda libre ”, la probabilidad deseada es P (⋃ni=1Ai), pero los sucesos Ai no son

    disjuntos por lo que tenemos que utilizar la vieja fórmula:

    P

    (n⋃i=1

    Ai

    )=

    n∑k=1

    (−1)k+1∑

    1≤i1

  • 1.3 Axiomas de la Probabilidad 25

    probabilidad. Es decir:

    P

    (n⋃i=1

    Ai

    )=

    n∑k=1

    (−1)k+1Cnk(n− k)m

    nm

    Hasta ahora hemos calculado la probabilidad de que al menos un frasco quede

    libre, utilizando el complemento tenemos la probabilidad de que ningún frasco

    quede libre, es decir

    P (“ninguno de los n frasco queda libre”) = 1−n∑k=1

    (−1)k+1Cnk(n− k)m

    nm

    Observemos que si queremos hallar la probabilidad de que el frasco i sea el

    único que quede libre, podŕıamos tratar de usar la probabilidad anterior pero

    evaluada en n− 1, es decir el frasco i queda libre y ninguno de los n− 1 frascos

    restantes queda libre. La idea es buena pero no es tan directo.

    Al evaluar en n−1 estaŕıamos también cambiando por n−1 los casos posibles

    sobre los que se puede colocar cada bolilla y esto no es correcto, por lo tanto

    tratemos de extraer los casos favorables al suceso “ninguno de los n frasco queda

    libre”. Por ser P (“ninguno de los n frasco queda libre”) = casos favorablescasos posibles

    y los

    casos posibles son nm como ya hab́ıamos calculado, los casos favorables al suceso

    “ninguno de los n frasco queda libre” son

    nm·P (“ninguno de los n frasco queda libre”) = nm·

    (1−

    n∑k=1

    (−1)k+1Cnk(n− k)m

    nm

    )

    Para reducir la escritura, llamemos fav(m,n) = nm ·(

    1−∑n

    k=1(−1)k+1Cnk(n−k)mnm

    ),

    por lo tanto los casos favorables a que ninguno de los n− 1 frascos queden libres

    es fav(m,n − 1) y de aqúı que la probabilidad de que el frasco i-ésimo sea el

    único que quede libre es P (Bi) =fav(m,n−1)

    nm.

    Federico De Olivera Lamas

  • 26 1. Espacios de Probabilidad

    Recordemos que los sucesos Bi con i = 1, . . . , n son disjuntos y su probabilidad

    no depende que i, es decir, no depende del frasco que se haya elegido para quedar

    libre. Por lo tanto:

    P

    (n⋃i=1

    Bi

    )=

    n∑i=1

    P (Bi)︸ ︷︷ ︸fav(m,n−1)

    nm

    = n · fav(m,n− 1)nm

    =fav(m,n− 1)

    nm−1

    Hemos obtenido la probabilidad de que exactamente un frasco quede libre. /

    Los ejemplos anteriores son una pequeña muestra de lo dif́ıcil que puede ser

    calcular probabilidades, sin duda que en el práctico se resolverán problemas más

    sencillos.

    Una propiedad muy importante, la cual nos servirá en variadas ocasiones, es

    la llamada continuidad de la probabilidad.

    Teorema 5 (Continuidad de la probabilidad)

    1. Sean A1, A2, . . . , An, . . . sucesos crecientes, es decir

    A1 ⊂ A2 ⊂ · · · ⊂ An ⊂ . . ..

    Entonces, la sucesión (P (An))n∈N∗ es convergente y

    P (+∞⋃n=1

    An) = ĺımn→+∞

    P (An)

    2. Sean A1, A2, . . . , An, . . . sucesos decrecientes, es decir

    A1 ⊃ A2 ⊃ · · · ⊃ An ⊃ . . .

    Entonces, la sucesión (P (An))n∈N∗ es convergente y

    P (+∞⋂n=1

    An) = ĺımn→+∞

    P (An)

    Demostración: 1. Al ser los sucesos An crecientes, tenemos que P (An) ≤

    P (An+1) y de aqúı que la sucesión (P (An))n∈N∗ es monótona creciente y

    Federico De Olivera Lamas

  • 1.3 Axiomas de la Probabilidad 27

    acotada superiormente por 1 por ser probabilidades, por ende es conver-

    gente.

    Consideremos los conjuntos E1 = A1, E2 = A2 − A1, E3 = A3 − A2,

    . . . , En = An − An−1 y aśı sucesivamente para todo natural.

    El lector podrá verificar fácilmente que ∪ni=1Ai = An = ∪ni=1Ei y que

    ∪+∞n=1An = ∪+∞n=1En, donde los En son disjuntos dos a dos por construcción.

    Luego

    P

    (+∞⋃n=1

    An

    )= P

    (+∞⋃n=1

    En

    )disjuntos

    =+∞∑n=1

    P (En) = ĺımk→+∞

    k∑n=1

    P (En)disjuntos

    =

    ĺımk→+∞

    P (k⋃

    n=1

    En) = ĺımk→+∞

    P (Ak)

    Por último, observemos que tomamos el ĺımite sobre k, tras un cambio de

    variable, evidentemente obtenemos lo deseado.

    2. Al ser los sucesos An decrecientes, tenemos que P (An) ≥ P (An+1) y de

    aqúı que la sucesión (P (An))n∈N∗ es monótona decreciente y acotada infe-

    riormente por 0 por ser probabilidades, por ende es convergente.

    Observemos que por ser A1, A2, . . . , An, . . . sucesos decrecientes, sus com-

    plementos Ac1, Ac2, . . . , A

    cn, . . . son sucesos crecientes.

    Luego:

    P (+∞⋂n=1

    An) = 1− P (

    (+∞⋂n=1

    An

    )c) = 1− P (

    +∞⋃n=1

    Acn)por 1= 1− ĺım

    n→+∞P (Acn)︸ ︷︷ ︸1−P (An)

    = ĺımn→+∞

    P (An)

    Observación: Cuando la sucesión de sucesos es creciente, es común anotar+∞⋃n=1

    An = ĺımn→+∞

    An, de aqúı que P (ĺımn→+∞An) = ĺımn→+∞ P (An) y por eso el

    Federico De Olivera Lamas

  • 28 1. Espacios de Probabilidad

    nombre de continuidad de la probabilidad. De forma análoga, cuando la suce-

    sión de sucesos es decreciente, es común anotar+∞⋂n=1

    An = ĺımn→+∞

    An, de aqúı que

    P (ĺımn→+∞An) = ĺımn→+∞ P (An).

    Observación: Sobre una sucesión de sucesos no siempre está bien definido

    el ĺımite, en términos generales es un error hablar de ĺımite de una sucesión de

    conjuntos pues puede no existir tal ĺımite.

    Al igual que lo estudiado en sucesiones numéricas, el tema de la existencia de

    ĺımite es tratado mediante ĺımite superior e inferior de la sucesión, en este caso

    sucesión de conjuntos.

    Si bien la continuidad de la probabilidad para cualquier sucesión de sucesos

    excede los alcances de este curso y puede ser estudiado en un curso de medida,

    a los efectos informativos, el ĺımite superior e inferior de una sucesión de sucesos

    lo definimos:

    ĺım supn→+∞

    An =+∞⋂n=1

    +∞⋃m=n

    Am

    ĺım infn→+∞

    An =+∞⋃n=1

    +∞⋂m=n

    Am

    En caso de que ambos coincidan, decimos que el ĺımite existe. En el caso que la

    sucesión sea monótona, efectivamente coinciden, cosa que se verá en el práctico.

    1.4. Probabilidad condicional

    Supongamos que tiramos un dado y queremos hallar la probabilidad de que

    la cantidad de puntos que queden para arriba sea menor o igual a tres. No ten-

    dŕıamos mayor dificultad para calcular tal probabilidad, pero, ¿qué tal si nos

    Federico De Olivera Lamas

  • 1.4 Probabilidad condicional 29

    Figura 1.1: Probabilidad condicional

    pasan la información de que el uno no fue el que salió?, ¿cómo altera esto el

    resultado de nuestra probabilidad?. Problemas como éste son los que motivan a

    introducir la probabilidad condicional.

    Definición 8 (Probabilidad condicional)

    Dado un espacio de probabilidad (Ω,A, P ) y un suceso B con probabilidad pos-

    itiva, definimos la probabilidad de un suceso A condicionado a B, como

    P (A|B) = P (A ∩B)P (B)

    La noción intuitiva de la probabilidad condicional puede verse usando diagra-

    mas de Venn, en la figura 1.1 se observa que una vez que se conoce la ocurrencia

    del suceso B, la probabilidad del suceso A se reduce a la proporción entre la prob-

    abilidad de la parte de A que se encuentra en B, con respecto a la probabilidad

    de B.

    Ejemplo 15

    Resolvamos el problema del inicio de la sección. Se tira un dado y se quiere

    calcular la probabilidad de obtener tres o menos puntos, dado que se sabe que

    no salió un punto. Sea el suceso A = {1, 2, 3} que representa nuestros casos

    Federico De Olivera Lamas

  • 30 1. Espacios de Probabilidad

    favorables a priori y el suceso B = {2, 3, 4, 5, 6} que representa la información

    que obtuvimos. Luego P (A|B) = P (A∩B)P (B)

    = P ({2,3})P ({2,3,4,5,6}) =

    2/65/6

    = 25.

    Aqúı puede observarse que la probabilidad condicional respeta la idea intuitiva

    de restringir nuestro espacio muestral al conjunto B, es decir, los casos favorables

    que hay en B contra los casos posibles que hay en B. /

    La noción intuitiva manejada anteriormente puede formalizarse con la sigu-

    iente proposición.

    Proposición 6

    Dado un espacio de probabilidades (Ω,A, P ) y un suceso B tal que P (B) > 0,

    entonces (B,AB, P ∗) es un nuevo espacio de probabilidad, donde AB = {A∩B :

    A ∈ A} y P ∗ : AB → R tal que P ∗(A) = P (A|B).

    Demostración: Probemos que AB es una σ-álgebra de subconjuntos de B.

    i. Es claro que B ∈ AB y por tanto AB 6= ∅.

    ii. Sea E ∈ AB entonces E = A ∩B con A ∈ A, luego

    Ec = B − E = B − (A ∩B) = B − A = B ∩ Ac︸︷︷︸∈A

    y por lo tanto Ec es la intersección entre B y un elemento de A , de donde

    Ec ∈ AB.

    iii. Sean E1, E2, . . . En, . . . ∈ AB, entonces existen A1, A2, . . . , An, . . . ∈ A tales

    que En = An ∩B ∀ n ∈ N∗, luego

    +∞⋃n=1

    En =+∞⋃n=1

    (An ∩B) =

    (+∞⋃n=1

    An

    )︸ ︷︷ ︸

    ∈A

    ∩B ∈ AB

    Federico De Olivera Lamas

  • 1.4 Probabilidad condicional 31

    Siendo (B,AB) un espacio probabilizable, probemos que P ∗ es una probabilidad

    sobre este espacio.

    i. P ∗(A) =

    ≥0︷ ︸︸ ︷P (A ∩B)P (B)︸ ︷︷ ︸>0

    ≥ 0 para todo suceso A

    ii. P ∗(B) = P (B|B) = P (B∩B)P (B)

    = 1

    iii. Dados los sucesos disjuntos A1, A2, . . . An, . . ., entonces

    P ∗(⋃+∞

    n=1An)

    = P(⋃+∞

    n=1An∣∣B) = P

    S+∞n=1(An∩B)︷ ︸︸ ︷

    ((∪+∞n=1 An

    )∩B)

    P (B)disjuntos

    =

    =P+∞n=1 P (An∩B)P (B)

    =+∞∑n=1

    P (An ∩B)P (B)︸ ︷︷ ︸P ∗(An)

    =+∞∑n=1

    P ∗(An)

    El espacio (B,AB, P ∗) es de gran importancia porque refleja la idea de con-

    siderar un nuevo espacio de resultados posibles, una vez que se conoce nueva

    información a través de B.

    Se deduce de la propia definición de probabilidad condicional que

    P (A ∩B) = P (B)P (A|B). La igualdad anterior puede ser generalizada para más

    de dos suceso, es decir

    P (A∩B∩C) = P ((A∩B)∩C)) = P (A ∩B)︸ ︷︷ ︸P (A)P (B|A)

    P (C|A∩B) = P (A)P (B|A)P (C|B∩A))

    Lo cual es válido si P (A ∩ B) > 0 (de aqúı se deduce que P (A) > 0 ya que

    (A ∩B) ⊂ A)

    Generalizando aún más tenemos el siguiente teorema de multiplicación o teo-

    rema de la probabilidad compuesta.

    Federico De Olivera Lamas

  • 32 1. Espacios de Probabilidad

    Teorema 7 (Probabilidad compuesta)

    Dado (Ω,A, P ), un espacio de probabilidades, sean A1, A2, . . . , An sucesos tales

    que P (A1 ∩ A2 ∩ . . . ∩ An−1) > 0 donde n ≥ 2, entonces

    P (A1 ∩A2 ∩ . . .∩An) = P (A1)P (A2|A1)P (A3|A1 ∩A2) · · ·P (An|A1 ∩ · · · ∩An−1)

    Demostración: Por ser A1 ⊃(A1 ∩ A2

    )⊃ · · · ⊃

    (A1 ∩ . . . ∩ An−1

    )y

    P (A1 ∩ A2 ∩ . . . ∩ An−1) > 0 tenemos que todas las probabilidades condicionales

    están bien definidas.

    De la propia definición, la igualdad se cumple si n = 2, es decir P (A1 ∩A2) =

    P (A1)P (A2|A1) siendo P (A1) > 0.

    Supongamos que la igualdad se cumple para h sucesos y verifiquemos que se

    cumple para h+ 1 sucesos h = 2, . . . , n− 1.

    Por hipótesis P (⋂hi=1Ai) = P (A1)P (A2|A1) · · ·P (Ah|A1 ∩ · · · ∩ Ah−1), luego

    P (⋂h+1i=1 Ai) = P

    ((A1 ∩ · · · ∩ Ah

    )∩ Ah+1

    )= P (A1 ∩ · · · ∩ Ah)︸ ︷︷ ︸

    P (A1)P (A2|A1)···P (Ah|A1∩···∩Ah−1)

    P (Ah+1|A1 ∩ · · · ∩ Ah)

    = P (A1)P (A2|A1) · · ·P (Ah+1|A1 ∩ · · · ∩ Ah)

    Ejemplo 16

    Se reparten cuatro cartas de una baraja española,¿cuál es la probabilidad que

    sean los cuatro reyes?.

    Sea el suceso Ai, “la i-ésima carta obtenida es un rey”, entonces queremos

    calcular P (A1 ∩ A2 ∩ A3 ∩ A4), utilizando la probabilidad compuesta tenemos

    Federico De Olivera Lamas

  • 1.4 Probabilidad condicional 33

    que:

    P (A1∩A2∩A3∩A4) = P (A1)︸ ︷︷ ︸4/50

    P (A2|A1)︸ ︷︷ ︸3/49

    P (A3|A1 ∩ A2)︸ ︷︷ ︸2/48

    P (A4|A1 ∩ A2 ∩ A3)︸ ︷︷ ︸1/47

    =1

    C504

    En el cálculo de las probabilidades condicionales se utilizó lo probado en la

    Proposición 6, tomando al condicionante como un nuevo espacio de resultados

    posibles, por ejemplo, si se conoce A1 ∩ A2 es porque ya se han obtenidos dos

    reyes, por tanto quedan otros dos reyes entre 48 cartas. /

    Consideremos ahora un suceso cualquiera A y su complemento Ac, entonces

    A,Ac forman una partición de Ω, es decir A ∪ Ac = Ω y A ∩ Ac = ∅. Dado

    cualquier suceso B, tenemos que B = B∩Ω = B∩ (A∩Ac) = (B∩A)∪ (B∩Ac)

    donde la unión es disjunta, por lo tanto

    P (B) = P (B ∩ A)︸ ︷︷ ︸P (A)P (B|A)

    + P (B ∩ Ac)︸ ︷︷ ︸P (Ac)P (B|Ac)

    = P (A)P (B|A) + P (Ac)P (B|Ac)

    Es claro que se está usando que A y Ac son sucesos con probabilidad positiva.

    La generalización de este resultado es lo que se conoce como “Probabilidades

    totales”.

    Teorema 8 (Probabilidades totales)

    Dado (Ω,A, P ), sean A1, A2, . . . , An sucesos incompatibles dos a dos, tales que⋃ni=1Ai = Ω y P (Ai) > 0 i = 1, . . . , n (n ≥ 2). Entonces, para cualquier suceso

    B, tenemos

    P (B) =n∑i=1

    P (Ai)P (B|Ai)

    Demostración:

    P (B) = P (B ∩(∪ni=1Ai︸ ︷︷ ︸

    )) = P (∪ni=1(B ∩ Ai︸ ︷︷ ︸

    ⊂Ai

    ))disjuntos

    =∑n

    i=1 P (B ∩ Ai)︸ ︷︷ ︸P (Ai)P (BAi)

    =

    =∑n

    i=1 P (Ai)P (B|Ai)

    Federico De Olivera Lamas

  • 34 1. Espacios de Probabilidad

    El lector podrá verificar sin mayor dificultad que este resultado sigue siendo

    válido si se considera una partición infinita pero numerable de sucesos An.

    Ejemplo 17

    Supongamos que en un cierto páıs hay varios partidos poĺıticos, entre ellos, el

    90 % del electorado lo tienen los partidos A,B y C con un 50 %, 30 % y 10 %

    respectivamente. Se está promulgando una nueva ley y la proporción de individuos

    que están a favor de dicha ley depende del partido poĺıtico al que pertenecen.

    Suponga que el 70 % de los electores del partido A están a favor de la ley, el 20 %

    en contra y al resto le es indiferente. En el partido B hay un 55 % en contra, un

    20 % a favor y al resto le es indiferente. Por último, tanto en el partido C como

    en el resto de los partidos, el 30 % está a favor, el 50 % en contra y al resto le es

    indiferente.

    Se selecciona al azar un elector, hallar la probabilidad de que el individuo

    seleccionado esté a favor de la ley.

    Solución: Sea F el suceso: “el individuo seleccionado está a favor de la ley”.

    Observemos que el individuo seleccionado es un elector y por tanto pertenece

    al partido A (suceso A) o pertenece al partido B (suceso B) o pertenece a otro

    partido (suceso Ot). Supondremos que si un individuo pertenece a un partido no

    pertenece a otro y por tanto A, B y Ot forman una partición de nuestro espacio

    muestral.

    Aplicando la fórmula de las probabilidades totales tenemos

    P (F ) = P (A)︸ ︷︷ ︸0,5

    P (F |A)︸ ︷︷ ︸0,7

    +P (B)︸ ︷︷ ︸0,3

    P (F |B)︸ ︷︷ ︸0,2

    +P (0t)︸ ︷︷ ︸0,2

    P (F |Ot)︸ ︷︷ ︸0,3

    = 0, 47

    De donde podemos concluir que menos de la mitad de los electores son los

    que están a favor de la ley. /

    Federico De Olivera Lamas

  • 1.4 Probabilidad condicional 35

    Un resultado inmediato a partir de la fórmula de las probabilidades totales se

    conoce con el nombre de fórmula de Bayes y es el siguiente:

    Teorema 9 (Fórmula de Bayes)

    Dado (Ω,A, P ), sean A1, A2, . . . , An sucesos incompatibles dos a dos, tales que⋃ni=1Ai = Ω y P (Ai) > 0 i = 1, . . . , n (n ≥ 2). Entonces, para cualquier suceso

    B con P (B) > 0 tenemos

    P (Aj|B) =P (Aj)P (B|Aj)∑ni=1 P (Ai)P (B|Ai)

    j = 1, . . . , n

    Demostración: P (Aj|B) =P (Aj ∩B)P (B)

    (1)=

    P (Aj)P (B|Aj)∑ni=1 P (Ai)P (B|Ai)

    En el numerador de (1) se usó P (B|Aj) = P (Aj∩B)P (Aj) y en el denominador la

    fórmula de las probabilidades totales, ya que los Ai forman una partición de Ω.

    Sin mayor dificultad el resultado puede extenderse si se considera una parti-

    ción infinita pero numerable de sucesos An. �

    La fórmula de Bayes es útil cuando conocemos las probabilidades de los Aj y

    las condicionales de B dado Aj, pero no conocemos directamente la probabilidad

    de B.

    Ejemplo 18

    Suponga que una caja tiene dos monedas, dos no cargadas y una de dos caras. Se

    deja caer aleatoriamente una moneda al suelo y se observa que salió cara. ¿Cuál

    es la probabilidad que la moneda tirada sea la de dos caras?.

    Solución: Sean los sucesos A1, la moneda es de dos caras, A2 la moneda es

    no cargada y B, el suceso “salió cara”. Nos interesa la probabilidad P (A1|B), el

    Federico De Olivera Lamas

  • 36 1. Espacios de Probabilidad

    lector podrá verificar las hipótesis de la fórmula de Bayes, de donde

    P (A1|B) =

    1/3︷ ︸︸ ︷P (A1)

    1︷ ︸︸ ︷P (B|A1)

    P (A1)︸ ︷︷ ︸1/3

    P (B|A1)︸ ︷︷ ︸1

    +P (A2)︸ ︷︷ ︸2/3

    P (B|A2)︸ ︷︷ ︸1/2

    =1

    2

    /

    Ejemplo 19

    La distribución de los grupos sangúıneos en Estados Unidos es: Tipo A, 41 % ;

    tipo B, 9 % ; tipo AB, 4 % y tipo O, 46 %. Se estima que, durante la segunda

    guerra mundial, el 4 % de las personas pertenecientes al tipo O fuerón clasificadas

    como del tipo A; el 88 % de los de tipo A fueron correctamente clasificados; el 4 %

    de los de tipo B se clasificaron como de tipo A y el 10 % de los de tipo AB fueron,

    igualmente, clasificados como de tipo A. Un soldado fue herido y conducido a la

    enfermeŕıa. Se le clasificó como del tipo A. ¿ Cuál es la probabilidad de que tal

    grupo sea ciertamente el suyo?.

    Solución: Consideremos los sucesos A1: es de tipo A; A2: es de tipo B; A3: es

    de tipo AB; A4: es de tipo O; B: Es clasificado como de tipo A.

    Luego, A1, A2, A3, A4 forman una partición de nuestro espacio muestral y to-

    dos tienen probabilidad positiva. Usando probabilidades totales, veremos que B

    también tiene probabilidad positiva (denominador de Bayes). Aplicando la fórmu-

    la de Bayes tenemos que

    P (A1|B) =

    0,41︷ ︸︸ ︷P (A1)

    0,88︷ ︸︸ ︷P (B|A1)

    P (A1)︸ ︷︷ ︸0,41

    P (B|A1)︸ ︷︷ ︸0,88

    +P (A2)︸ ︷︷ ︸0,09

    P (B|A2)︸ ︷︷ ︸0,04

    +P (A3)︸ ︷︷ ︸0,04

    P (B|A3)︸ ︷︷ ︸0,10

    +P (A4)︸ ︷︷ ︸0,46

    P (B|A4)︸ ︷︷ ︸0,04

    = 0, 93

    /

    Federico De Olivera Lamas

  • 1.5 Independencia 37

    Como sugerencia para el estudiante, la fórmula de Bayes es útil cuando cono-

    cemos el resultado final y queremos hallar la probabilidad de que se haya pasado

    por una determinada etapa intermedia. Las etapas intermedias deben formar una

    partición que hay que detectar.

    Ejercicio 3

    Estamos interesados en saber cuál de dos análisis A y B es mejor para el di-

    agnóstico de una determinada enfermedad, de la cual sabemos que la presentan

    un 10 % de individuos de la población. El porcentaje de resultados falsos posi-

    tivosd) del análisis A es del 15 % y el de B es del 22 %. El porcentaje de falsos

    negativose) de A es del 7 % y de B es del 3 %.

    ¿Cuál es la probabilidad de acertar en el diagnóstico con cada método? �

    1.5. Independencia

    Un concepto que hemos venido manejando informalmente es el de indepen-

    dencia. Por ejemplo, cuando decimos que tiramos dos monedas, el resultado

    que obtengamos en una, es “independiente” del que obtengamos en la otra.

    Otro ejemplo es cuando tenemos n bolillas para ocupar n lugares sin repetirlos,

    aqúı dećıamos que una vez elegida una bolilla para el primer lugar, la cantidad

    de bolillas para el segundo lugar disminuye a n − 1, por lo que la elección no

    se hace en iguales condiciones que la primer elección y por lo tanto no tenemos

    “independencia”. ésta idea de independencia será formalizada desde el punto de

    vista probabilista en esta sección.

    d)Un resultado es falso positivo cuando el análisis da positivo siendo que el paciente no tiene

    la enfermedad.e)Un resuldado es falso negativo cuando el análisis da negativo siendo que el paciente tiene

    la enfermedad.

    Federico De Olivera Lamas

  • 38 1. Espacios de Probabilidad

    Definición 9 (Independencia)

    Dado un espacio de probabilidad (Ω,A, P ), decimos que los sucesos A y B son

    independientes si

    P (A ∩B) = P (A) · P (B)

    Observación: La independencia depende del espacio de probabilidad sobre

    el que se trabaja. Veamos el siguiente ejemplo.

    Ejemplo 20

    Se lanzan dos monedas al aire y se observan sus caras superiores al caer.

    En este caso Ω = {(cara,cara), (cara, número), (número,cara), (número,número)},

    sea A = P (Ω) y las probabilidades clásicas, es decir P((cara,cara)

    )=

    P((cara, número)

    )= P

    ((número,cara)

    )= P

    ((número,número)

    )= 1/4

    Consideremos los sucesos A: “en la primer moneda sale cara” y B: “en la

    segundo moneda sale cara”, luego

    P (A ∩B) = P (cara,cara) = 1/4

    P (A) = P((cara,cara) ∪ (cara,número)

    )= 1/4 + 1/4

    P (B) = P((cara,cara) ∪ (número,cara)

    )= 1/4 + 1/4

    .

    Por lo tanto P (A ∩B) = 1/4 = P (A)P (B) y los sucesos A y B son indepen-

    dientes.

    Pero, sobre el mismo espacio probabilizable definamos

    P((cara,cara)

    )= P

    ((número, número)

    )= 1/3

    P((número,cara)

    )= P

    ((cara,número)

    )= 1/6

    El lector podrá verificar que se trata de una probabilidad ya que

    P (Ω) = P((cara,cara) ∪ (cara, número) ∪ (número,cara) ∪ (número,número)

    )=

    = 1/3 + 1/6 + 1/6 + 1/3 = 1

    Aqúı

    Federico De Olivera Lamas

  • 1.5 Independencia 39

    P (A ∩B) = P (cara,cara) = 1/3

    P (A) = P((cara,cara) ∪ (cara,número)

    )= 1/3 + 1/6 = 1/2

    P (B) = P((cara,cara) ∪ (número,cara)

    )= 1/3 + 1/6 = 1/2

    Por lo tanto P (A ∩ B) = 1/3 6= 1/2 · 1/2 = P (A)P (B) y los sucesos A y B

    no son independientes. /

    Sin duda que, bajo el espacio clásico de probabilidades, la noción intuitiva

    de independencia se verifica. Pero siempre tenemos que recordar que la indepen-

    dencia es definida sobre un espacio de probabilidades y por tanto depende de

    éste.

    Observación: Si alguno de los sucesos A o B tiene probabilidad no nula,

    la independencia puede ser definida por medio de la probabilidad condicional,

    es decir, supongamos que P (B) > 0, entonces P (A|B) = P (A∩B)P (B)

    , de donde A

    y B son independientes si y sólo si P (A|B) = P (A). En efecto, si A y B son

    independientes, entonces P (A|B) = P (A∩B)P (B)

    indep= P (A)P (B)

    P (B)= P (A). Por otro lado,

    si P (A|B) = P (A) entonces, de la definición de probabilidad condicional tenemos

    que P (B)P (A|B)︸ ︷︷ ︸P (A)

    = P (A ∩B) y por tanto A y B son independientes.

    Proposición 10

    Dado un espacio de probabilidad (Ω,A, P ),

    1. Si P (A) = 0 o P (A) = 1 entonces A es independiente de B, ∀ B ∈ A.

    2. Si A es independiente de A, entonces P (A) = 1 o P (A) = 0.

    3. Si A es independiente de B entonces:

    a) A es independiente de Bc.

    b) Ac es independiente de B.

    Federico De Olivera Lamas

  • 40 1. Espacios de Probabilidad

    c) Ac es independiente de Bc.

    Demostración: 1. Si P (A) = 0, entonces, por ser (A ∩ B) ⊂ A tenemos

    0 ≤ P (A ∩B) ≤ P (A) = 0 y de aqúı que P (A ∩B) = 0 = P (A)︸ ︷︷ ︸=0

    P (B)︸ ︷︷ ︸∈R

    .

    Si P (A) = 1, recordemos que B = (B ∩ A) ∪ (B ∩ Ac) donde la unión es

    disjunta, por lo tanto P (B)(1)= P (A ∩ B) + P (B ∩ Ac). Siendo P (A) = 1,

    P (Ac) = 0 y como (B ∩Ac) ⊂ Ac tenemos que P (B ∩Ac) (2)= 0. De (1) y (2)

    tenemos que P (A ∩B) = P (B) = P (A)︸ ︷︷ ︸=1

    P (B).

    2. Por ser A independiente de A tenemos que

    P (A) = P (A ∩ A) indep= P (A)P (A), y por lo tanto. P (A) = 1 o P (A) = 0

    3. a) P (A) = P (A∩B)+P (A∩Bc), entonces P (A∩Bc) = P (A)−P (A∩B)indep= P (A)− P (A)P (B) = P (A)

    (1− P (B)︸ ︷︷ ︸

    P (Bc)

    )= P (A)P (Bc)

    b) Basta con intercambiar A y B de nombres y aplicar la parte anterior.

    c) Por ser los sucesos A y B independientes, por la parte a) los son A y

    Bc, apliquemos la parte b) y obtenemos que los son Ac y Bc.

    Observación: Si A y B son sucesos incompatibles, es decir (A ∩ B) = ∅,

    entonces no pueden ser independientes a menos que alguno de ellos tenga prob-

    abilidad cero, ya que P (A ∩B︸ ︷︷ ︸∅

    ) = 0 = P (A)P (B)⇔ P (A) = 0 o P (B) = 0.

    indaguemos ahora como definiremos la independencia de más de dos sucesos.

    Dados tres sucesos A,B y C, podŕıamos querer que el suceso A sea independiente

    de B y que A sea independiente de C, pero también que B sea independiente

    de C y aśı tenemos la independencia dos a dos entre estos sucesos. Pero también

    nos interesa que A sea independiente de B ∩ C y de B ∩ Cc, en otros términos,

    Federico De Olivera Lamas

  • 1.5 Independencia 41

    queremos que la ocurrencia de B y/o de C no afecten a la probabilidad de A.

    Análogamente para B y C, por lo tanto la independencia de más de dos conjuntos

    debe ser un poco más general que la independencia dos a dos.

    Definición 10 (Independencia dos a dos)

    Dado (Ω,A, P ), diremos que los sucesos A1, . . . , An son independientes dos a dos,

    si Ai es independiente de Aj para todo i 6= j (i, j ∈ {1, . . . , n}), es decir

    P (Ai ∩ Aj) = P (Ai)P (Aj) ∀ i 6= j

    Definición 11 (Independencia colectiva)

    Dado (Ω,A, P ), diremos que los sucesos A1, . . . , An son colectivamente indepen-

    dientes, o simplemente independiente, si

    P (Ai1 ∩ · · · ∩ Aik) = P (Ai1) · · ·P (Aik) donde 1 ≤ i1 < · · · < ik ≤ n

    Más en general, dada un conjunto de ı́ndices L diremos que los sucesos Aλ

    con λ ∈ L son independientes, si toda subfamilia finita de {Aλ : λ ∈ L} es de

    sucesos colectivamente independiente.

    En algunos textos se le suele llamar independencia estocástica o indepen-

    dencia mutua a los sucesos colectivamente independientes. En nuestro curso le

    llamaremos simplemente independientes.

    Es inmediato verificar que la independencia colectiva implica la independencia

    dos a dos, el siguiente ejemplo muestra que la independencia dos a dos no implica

    la independencia colectiva.

    Ejemplo 21 (La independencia dos a dos no implica la independencia)

    Consideremos un espacio de resultados posibles Ω = {1, 2, 3, 4} el cual puede

    ser pensado como los cuatro resultados posibles al tirar dos monedas. En efec-

    Federico De Olivera Lamas

  • 42 1. Espacios de Probabilidad

    to, Si el 1 representa (cara,cara); el 2, (número, cara); el 3, (cara,número) y el

    4, (número,número).

    Trabajemos sobre el espacio clásico de probabilidades, es decir P ({i}) = 1/4,

    i = 1, 2, 3, 4 y definamos los sucesos A = {1, 4}, B = {2, 4} y C = {3, 4}. El

    lector podrá interpretar al suceso A como: “ en las dos monedas sale igual figura”,

    análogamente hay una interpretación para los sucesos B y C. Observemos primero

    que P (A) = P (B) = P (C) = 1/2 ya que están formados por dos de los cuatro

    sucesos elementales.

    Verifiquemos que los sucesos A,B y C son independientes dos a dos, en efecto

    P (A ∩B) = P ({4}) = 1/4 = P (A)︸ ︷︷ ︸1/2

    P (B)︸ ︷︷ ︸1/2

    P (A ∩ C) = P ({4}) = 1/4 = P (A)︸ ︷︷ ︸1/2

    P (C)︸ ︷︷ ︸1/2

    P (B ∩ C) = P ({4}) = 1/4 = P (B)︸ ︷︷ ︸1/2

    P (C)︸ ︷︷ ︸1/2

    Pero P (A ∩ B ∩ C) = P ({4}) = 1/4 6= 1/8 = P (A)︸ ︷︷ ︸1/2

    P (B)︸ ︷︷ ︸1/2

    P (C)︸ ︷︷ ︸1/2

    , de aqúı que

    los sucesos A,B y C no son independientes (colectivamente). /

    Federico De Olivera Lamas

  • 1.6 Ejercicios 43

    1.6. Ejercicios

    1. Probar las leyes de Morgan:

    a) (⋃∞n=1An)

    c =⋂∞n=1(An)

    c

    b) (⋂∞n=1An)

    c =⋃∞n=1(An)

    c.

    2. Probar que {φ,Ω} es una σ-álgebra.

    3. Verificar que la familia 2Ω de todos los subconjuntos de Ω es una σ-álgebra.

    4. Sea Ω = {a, b, c, d, e, f}. Construir la mı́nima σ-álgebra generada por

    {{a, b}, {c, d}, {e}}.

    5. i) Si ε1 está inclúıdo en la σ-álgebra generada por ε2, probar que la σ-

    álgebra generada por ε1 está contenida en la σ-álgebra generada por

    ε2.

    ii) Probar que coinciden las σ-álgebras de subconjuntos de R generadas

    por:

    Los intervalos abiertos ε1 = {(a, b) : a < b}.

    Los intervalos cerrados ε2 = {[a, b] : a < b}.

    Los int. semi-abiertos ε3 = {[a, b) : a < b} o ε4 = {(a, b] : a < b}.

    Los rayos abiertos ε5 = {(a,∞) : a ∈ R}. o

    ε6 = {(−∞, b) : b ∈ R}.

    Los rayos cerrados ε7 = {[a,∞) : a ∈ R}. o

    ε8 = {(−∞, b] : b ∈ R}.

    Observar que B, la σ-álgebra de Borel en R, también es generada por

    cualquiera de las familias εi.

    Federico De Olivera Lamas

  • 44 1. Espacios de Probabilidad

    6. Sea A1, A2, ... una sucesión de conjuntos. Definimos el ĺımite superior y el

    ĺımite inferiór de la suceśıon como sigue:

    ĺım inf An =∞⋃n=1

    ∞⋂r=n

    Ar

    ĺım supAn =∞⋂n=1

    ∞⋃r=n

    Ar

    Probar que ĺım inf An ⊂ ĺım supAn.

    En caso de igualdad, se define ĺımAn = ĺım inf An = ĺım supAn.

    7. Sea A1, A2, ... una sucesión monótona de conjuntos. Probar que existe el

    ĺımite de An.

    8. Dada una sucesión creciente de sucesos: φ = E0 ⊂ E1 ⊂ E2 ⊂ ..., probar

    que⋃∞n=1En se puede escribir como una unión disjunta en la forma

    ∞⋃n=1

    En =∞⋃n=1

    (En − En−1)

    9. Un dado está cargado de modo que la probabilidad de cada cara es pro-

    porcional al número indicado en la cara. ¿Cuál es la probabilidad de que al

    arrojarlo, se obtenga un resultado par?.

    10. Si P y Q son dos probabilidades definidas sobre un mismo espacio (Ω,A),

    mostrar que aP + bQ también es una probabilidad sobre el mismo espacio,

    para cualquier par de números no negativos a y b que satisfagan a+ b = 1.

    11. Se tiran dos dados al azar y se quiere hallar la probabilidad de que la suma

    de los puntos obtenidos sea igual a 10.

    12. Una urna contiene a bolillas blancas y b bolillas negras. Al sacar al azar

    r bolillas de una vez (suponiendo r ≤ a), ¿cuál es la probabilidad de que

    todas ellas sean blancas?.

    Federico De Olivera Lamas

  • 1.6 Ejercicios 45

    13. Se tiene una baraja de 40 cartas, donde hay 4 ases. Se reparten éstas entre 4

    personas, de manera que le toquen 10 cartas a cada una. ¿qué probabilidad

    hay de que a cada una le toque un as?.

    14. En una urna hay 20 bolillas numeradas de 1 a 20. Si se van sacando al azar

    una a una sin reposición, ¿cúal es la probabilidad de que la bolilla número

    8 salga precisamente en la octava extracción?.

    15. Se distribuyen al azar N bolas numeradas de 1 a N , en N cajas igualmente

    numeradas, de modo que se coloca una bola en cada caja.

    ¿Cuál es la probabilidad de que en las cajas números 1 y 2 se coloquen las

    bolas con números 1 y 2 respectivamente?, ? y cuál es la probabilidad de

    que en la caja número 4 no esté la bola número 4? (N ≥ 4).

    16. Se lanzan dos dados no cargados, uno verde y otro rojo. Calcular las prob-

    abilidades de los siguientes eventos:

    a) .en el dado rojo sale 4”.

    b) .en el dado rojo sale 4 y en el verde también”.

    c) ”al menos en un dado sale 4”.

    d) .en ningún dado sale 4”.

    e) ”la suma de los puntos obtenidos es mayor que 7”.

    17. Justificar si es correcto la siguiente afirmación justificando la respuesta:

    De una urna que contiene 30 bolillas numeradas del 1 a 30 se extraen si-

    multáneamente 7 de ellas. Si un jugador apuesta a 7 números la probabilidad

    de acertar 5 o más números es :

    C77 + C76 + C

    75

    C307

    18. De un conjunto de 15 lámparas de las cuales 5 son defectuosas, se escogen

    al azar tres. Hallar la probabilidad de que:

    Federico De Olivera Lamas

  • 46 1. Espacios de Probabilidad

    a) ninguna sea defectuosa.

    b) una por lo menos sea defectuosa.

    19. En la fabricación de un cierto aparato se utilizan dos piezas del mismo

    tipo. Para que el aparato funcione es necesario que por lo menos una de las

    piezas no esté defectuosa. La probabilidad de que una pieza esté defectuosa

    es 0,05. Calcular, bajo el supuesto de independencia, la probabilidad de que

    el aparato funcione.

    20. Tres urnas contienen bolillas rojas y azules. La primer urna tiene 3 rojas y

    9 azules, la segunda urna tiene 8 rojas y 4 azules y la tercer urna tiene 2

    rojas y 10 azules. Las trece cartas de trébol de un mazo de cartas francesas

    son {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, J,QK}.

    Se realiza el siguiente experimento:

    Se extraen al azar del mazo dos cartas (conjuntamente).

    Si ambas resultan números, se extrae al azar una bolilla de la primer

    urna.

    Si ambas resultan figuras, se extrae al azar una bolilla de la segunda

    urna.

    En los restantes casos se extrae al azar de la tercer urna.

    a) Calcular la probabilidad de extraer una bolilla roja de la primer urna.

    b) Calcular la probabilidad de extraer una bolilla azul.

    c) Calcular la probabilidad de extraer una bolilla roja.

    21. Lanzamos tres monedas regulares claramente diferenciadas.

    Calcular la probabilidad de los siguientes eventos:

    A=“al menos dos son cara”.

    B=”sale un número par de caras”.

    Federico De Olivera Lamas

  • 1.6 Ejercicios 47

    C=”sale número en la primer moneda”.

    ¿Son A, B y C independientes?.

    22. a) Se lanzan tres dados no cargados simultáneamente. Calcular la prob-

    abilidad de obtener un 6, sabiendo que no hay dos resultados iguales.

    Se lanza ahora un dado n veces, sucesiva e independientemente. Cal-

    cular las probabilidades de los siguientes sucesos:

    b) Obtener al menos dos 5, dado que ocurrió al menos un 5 en los n

    lanzamientos.

    c) obtener al menos dos 5, dado que ocurrió al menos un cinco en los

    primeros m lanzamientos.

    23. De un estudio cĺınico se han concluido los siguientes resultados: La prob-

    abilidad de que una persona extráıda al azar de la población tenga cierta

    afección card́ıaca es 0,002; dado que padece esa afección, la probabilidad de

    que fume es 0,40, y dado que no la padece, la probabilidad de que fume es

    0,10. ¿ Cúal es laprobabilidad de que un fumador padezca la mencionada

    afección card́ıaca?.

    24. Repetir el ejercicio anterior con los datos ligeramente modificados: La prob-

    abilidad de que una persona extráıda al azar de la población tenga cierta

    afección card́ıaca es 0,002; la probabilidad de que fume es 0,10; la proba-

    bilidad de que fumedado que padece la enfermedad es 0,40.

    25. Una firma de contadores está llevando a cabo una auditoŕıa sobre las prácti-

    cas contables de una empresa en la cual hay cuentas de clientes mayoristas

    y cuentas de minoristas.

    Se sabe que el 70 % de todas las cuentas son de mayoristas, y más aun, se

    sabe que el 10 % de las cuentas de mayoristas y el 20 % de las cuentas de

    minoristas tienen algún tipo de error contable.

    Federico De Olivera Lamas

  • 48 1. Espacios de Probabilidad

    Si los auditores observan un error en una cuenta de clientes ¿cuál es la

    probabilidad de que sea de mayorista?.

    26. Para las elecciónes de una cierta ciudad se han presentado dos candidatos

    a la intendencia A y B. En toda la ciudad se establecieron unicamente tres

    circuito de votación y una vez hecho el escrutinio se obtuvo la siguiente

    información:

    En el circuito 1 votó el 30 % de los electores.

    En el circuito 2 votó el 34 % de los electores.

    El resto lo hizo en el circuito 3.

    No se registraron votos anulados, observados ni en blanco.

    En el circuito 1, B obtuvo 165 votos de un total de 300, mientras que en el

    circuito 2, obtuvo 136. A obtuvo el 80 % de los votos del circuito 3.

    Si entre el total de los electores se elige uno al azar y resulta ser votante de

    A, ¿Cuál es la probabilidad de que haya votado en el circuito 2?.

    27. A una moneda desconocida le atribúımos una probabilidad p1 de tener dos

    caras distintas (cara, cruz). Se lanza la moneda n veces consecutivas y en

    todas ellas sale cara. ¿Cuál es la probabilidad, después de estos lances, de

    que la moneda tenga dos caras distintas?.

    28. Suponga que está participando de un programa televisivo, donde, junto con

    otras cuatro personas, deben elegir al azar una llave entre cinco, una de las

    llaves abrirá el cofre que esconde un premio importante.

    Hay dos opciones para seleccionar la llave:

    Opción A, una persona extrae una llave, la prueba, y si no abre la

    repone a la bolsa. Luego el siguiente participante procede igual hasta

    que pasen los cinco.

    Federico De Olivera Lamas

  • 1.6 Ejercicios 49

    Opción B, cada persona extrae una llave y luego que todos tienen una

    llave, las prueban.

    a) Si usted es la primer persona en elegir la llave, ¿ qué opción prefiere?.

    b) Si usted es la tercer persona en elegir la llave, ¿qué opción prefiere?.

    c) Si usted es la úlltima persona en elegir la llave, ¿qué opción prefiere?.

    d) ¿Qué conclusión obtiene de la probabilidad de ganar con la reposición

    o sin reposición?.

    Justificar en base al suceso con mayor probabilidad dde ganar.

    29. a) Demostrar que si dos sucesos A y B son independientes y ambos tienen

    probabilidad positiva, entonces no pueden ser incompatibles.

    b) Demostrar que si A es un suceso arbitrario y B es un suceso tal que

    P (B) = 0, entonces A y B son independientes.

    c) Sean A y B dos sucesos independiente y tales que A ⊂ B. Demostrar

    que si P (A) 6= 0, entonces P (B) = 1.

    30. Sean A, B y C tres sucesos independientes. Probar que:

    a) A es independiente de (B ∩ C).

    b) A es independiente de (Bc ∩ C).

    c) A es independiente de (Bc ∩ Cc).

    d) A es independiente de (B ∪ C).

    e) A es independiente de (Bc ∪ C).

    f ) A es independiente de (Bc ∪ Cc).

    Federico De Olivera Lamas

  • 50 1. Espacios de Probabilidad

    1.7. Anexo

    Demostración de la propiedad 7 de la Proposición 4

    Sean A1, A2, . . . , An sucesos cualesquiera, entonces

    P

    (n⋃i=1

    Ai

    )=

    n∑k=1

    (−1)k+1∑

    1≤i1

  • 1.7 Anexo 51

    P (An+1)− P ((⋃ni=1Ai) ∩ An+1) = P (An+1)− P (

    ⋃ni=1 (Ai ∩ An+1)) =

    P (An+1) −︸︷︷︸(−1)1

    ∑nk=1(−1)k+1

    ∑1≤i1

  • 52 1. Espacios de Probabilidad

    P

    (n+1⋃i=1

    Ai

    )=

    n+1∑k=1

    (−1)k+1∑

    1≤i1

  • Caṕıtulo 2

    Variables Aleatorias

  • 54 2. Variables Aleatorias

    2.1. Conceptos iniciales

    Comencemos introduciendo el concepto a través de un ejemplo. Se tira un dado

    no cargado n veces, y se quiere hallar (bajo el espacio clásico de probabilidades) la

    probabilidad de obtener exactamente k veces el seis (suceso A), donde 0 ≤ k ≤ n.

    Luego de haber sobrevivido a los ejercicios de conteo, el estudiante puede sin

    mayor dificultad calcular esta probabilidad.

    Representando los n lugares disponibles, podemos pensar, en principio, que

    los k seis, salen en los primeros k lanzamiento, es decir:

    6−

    6− · · ·

    6−︸ ︷︷ ︸

    k lanzamientos

    6=6−6=6− · · ·

    6=6−︸ ︷︷ ︸

    n−k lanzamientos

    Para esta situación, llamémosle suceso B, utilizando que hay independencia

    en las tiradas, tenemos

    P (B) = P (1o = 6) · · ·P (ko = 6)︸ ︷︷ ︸k éxitos

    P ((k + 1)o 6= 6) · · ·P (no 6= 6)︸ ︷︷ ︸n−k fracasos

    =

    (1

    6

    )k (1− 1

    6

    )n−k

    Por último, nos sirve que en los primeros k lanzamientos obtengamos los 6’s,

    o también en los últimos k o también en cualquier ubicación en la que podamos

    ubicar a los k 6’s en los n lugares, en total Cnk posibilidades. Cada ubicación

    nos da lugar a un suceso disjunto de otro, pero igualmente tiene probabilidad

    (1/6)k(1− 1/6)n−k, por lo tanto

    P (A) = Cnk

    (1

    6

    )k (1− 1

    6

    )n−k

    Sobre el mismo esquema, supongamos que ahora queremos la probabilidad de

    obtener exactamente k veces el 6 o 4, ahora nuestro “éxito” tiene probabilidad

    2/6 = 1/3 y por tanto nuestro fracaso tiene probabilidad 1 − 1/3. Manteniendo

    Federico De Olivera Lamas

  • 2.1 Conceptos iniciales 55

    el mismo esquema, y suponiendo que los lanzamientos se hacen de forma inde-

    pendiente, obtenemos que

    P (obtener exactamente k veces, 4 o 6) = Cnk

    (1

    3

    )k (1− 1

    3

    )n−kEs más, si nuestro suceso consta de obtener k éxitos y n− k fracasos, donde

    los experimentos se hacen de forma independiente y la probabilidad de éxito, en

    cada experimento, es p (por tanto la de fracaso es 1− p = q), tenemos que

    P (obtener exactamente k éxitos) = Cnk pk (1− p)n−k

    Supongamos ahora que se tiene un grupo de 40 estudiantes del curso de Prob-

    abilidad y Estad́ıstica (que supondremos con comportamientos independientes)

    donde se estima que la probabilidad que uno salve el examen en diciembre (primer

    peŕıodo) es 0, 3. Supongamos que ha pasado tal peŕıodo y no tenemos más infor-

    mación, ¿ cuál es la probabilidad de que de los 10 estudiantes que se presentaron,

    exactamente la mitad hallan salvado el examen?. Aqúı podŕıamos intentar hacer

    todo un nuevo desarrollo, pero... si observamos con detenimiento, no hay mayor

    diferencia con el problema de los dados. Tenemos n = 10 realizaciones independi-

    entes de un mismo experimento, elegir al azar un estudiante, y la probabilidad de

    “éxito” (salvar el examen) es 0, 3, igual para todos los estudiantes. Por lo tanto,

    la probabilidad deseada es:

    P (exactamente 5 estudiantes salvaron el examen) = C105 (0, 3)5 (1− 0, 3)5 ∼= 0, 154

    En el ejemplo anterior se hicieron algunos supuestos:

    a. Se repiten n experimentos independiente.

    b. La probabilidad de “éxito” en cada experimento es constante e igual a p.

    Federico De Olivera Lamas

  • 56 2. Variables Aleatorias

    Bajo estas hipótesis, la probabilidad de tener exactamente k éxitos

    k = 0, . . . , n es Cnk pk (1− p)n−k.

    Una primera aproximación al concepto de variable aleatoria puede ser for-

    mulado a partir de esta idea, tratamos de construir modelos, de modo que al

    verificarse ciertas hipótesis, tengamos el cálculo de probabilidades ya resuelto.

    Sin lugar a duda, el concepto de variable aleatoria es mucho más “profundo”,

    pero esta idea sirve al estudiante para ir incorporando el concepto.

    Retomemos el ejemplo de la tirada del dado pero ahora en un caso más sencillo,

    el dado se tira 4 veces, de forma independiente y se quiere hallar la probabilidad

    de obtener exactamente 2 veces el seis. La probabilidad de tal evento la podemos

    calcular como antes, pero ahora nuestro estudio será dirigido en otro sentido,

    veamos primero quién es nuestro espacio muestral:

    Ω = {(x1, x2, x3, x4) ∈ {1, 2, 3, 4, 5, 6}4}

    Es decir, x1 representa lo que sale en la primer tirada del dado, x2 en la segunda y

    aśı sucesivamente. Por lo tanto, algunos elementos de Ω son (1, 4, 5, 2) o (5, 2, 6, 6).

    Podemos determinar una función que, para cada elemento de Ω, nos dé la

    cantidad de seis, es decir

    X : Ω→ R tal que X(ω) = “cantidad de seis en ω′′

    Por ejemplo X((1, 4, 5, 2)

    )= 0, X

    ((5, 2, 6, 6)

    )= 2. De ésta forma, nos

    interesan todos los ω ∈ Ω tal que X(ω) = 2, es decir X−1({2}).

    Recordemos que si tenemos una función f : A → B, y un subconjunto del

    codominio Y ⊂ B, entonces

    f−1(Y ) = {x ∈ A : f(x) ∈ Y }

    Federico De Olivera Lamas

  • 2.1 Conceptos iniciales 57

    Es común que estudiantes principiantes se confundan con la función inversa, pero

    aqúı nada se habla de función inversa, de hecho, anotamos f−1(Y ) para indicar

    conjunto contra imagen de Y por la función f , de donde el sentido que le damos

    aqúı a f−1 es como una función aplicada a conjuntos

    f−1 : P(B)→ P(A) tal que f−1(Y ) = {x ∈ A : f(x) ∈ Y }

    Algunas propiedades que el lector puede probar son:

    1. f−1(B) = A.

    2. f−1(Y ∪Z) = f−1(Y )∪ f−1(Z), en general f−1(⋃+∞

    n=1 Yn)

    =⋃+∞n=1 f

    −1(Yn).

    3. f−1(Y c) = (f−1(Y ))c.

    4. Si Y ⊂ Z ⇒ f−1(Y ) ⊂ f−1(Z).

    5. f−1(Y ∩ Z) = f−1(Y ) ∩ f−1(Z).

    Sin duda que, pensando más en general, debemos exigir que X−1({2}) sea un

    suceso, para poderle calcular su probabilidad, dicha probabilidad es la probabili-

    dad de obtener exactamente 2 seis. De querer calcular la probabilidad de obten-

    er al menos un seis , podŕıamos pensarlo como P (X−1({1, 2, 3, 4})), de donde

    X−1({1, 2, 3, 4}) también debeŕıa ser un suceso.

    Más