notas breves para un curso de probabilidad y estad stica · conan doyle, arthur: estudio en...

60
Notas breves para un curso de Probabilidad y Estad´ ıstica Carlos H. Mendoza Mart´ ın A. Moreno Nicanor Garc´ ıa 1 de mayo de 2014

Upload: lamphuc

Post on 28-Sep-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

Notas breves para un curso de Probabilidad yEstadıstica

Carlos H. MendozaMartın A. Moreno

Nicanor Garcıa

1 de mayo de 2014

Page 2: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

2

Page 3: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

Introduccion

Estas notas breves tienen como proposito guiar al estudiante a traves de este curso, alponer de forma ordenada los conceptos y temas que se daran en cada sesion de clase,no pretenden ser un texto de referencia, por lo que se recomienda al estudiante tenera mano un libro o texto con el cual apoyar el estudio independiente de esta materia.El mas recomendado para este proposito es el texto guıa del curso Introduction toProbability de D. Bertsekas y J. Tsitsiklis, aunque tambien se abordaran temas del libroIntroduccion a los Sistemas de Comunicacion de F. Stremler. Aunque cada estudiantetiene y es libre de seguir su metodo de estudio y auto-ensenanza los autores recomiendala lectura el dıa anterior a la clase de las notas correspondientes a la misma, paraası llegar con ideas y, en especial, con dudas que permitan al docente una mejor laborde ensenanza al permitirle saber los temas donde el estudiante tiene mas dificultades.

Por experiencia de los autores, una de las mayores dificultades que presentan los estu-diantes que abordan este curso es la correcta lectura e interpretacion de los enunciadosy ejercicios propuestos en clase y en las evaluaciones. Para aliviar este problema, serecomienda encarecidamente al estudiante la lectura de otro tipo de textos a la par queestudia la materia. Algunas recomendaciones para este proposito son:

Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes

Poe, Edgar Allan: Los crımenes de la Calle Morgue, El escarabajo de Oro, cuentos

Borges, Jorge Luis y Casares, Adolfo Bioy: Seis problemas para don Isidro Parodi.

Cuentos policiales en general

Carroll, Lewis: El juego de la logica, Alicia en el Paıs de las Maravillas, A travesdel espejo

Asimov, Isaac: Los Robots del Amanecer, Fundacion, cuentos

Stephenson, Neal: Criptonomicon

Dick, Philip K. Cuentos y novelas

Lovecraft, H. P.: Los suenos de la casa de la bruja

3

Page 4: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

4

Page 5: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

Capıtulo 1

Introduccion a la Probabilidad yEstadıstica

Este primer capıtulo tiene como proposito introducir los conceptos basicos de proba-bilidad y estadıstica que se manejaran durante todo el curso, por lo que es importanteprestar gran cuidado a los conceptos aquı presentados.

En las secciones 1.1, 1.2 y 1.3 presentaremos la definicion de algunos terminos basicosen estadıstica, y algunas herramientas de la estadıstica descriptiva para organizar,representar graficamente y resumir un conjunto de datos.

A partir de la seccion 1.4 presentaremos los conceptos mas fundamentales de la teorıade la probabilidad sobre los cuales se contruyen el resto de la teorıa de probabilidadque presentaremos en los siguientes capıtulos.

1.1. Introduccion a la estadıstica

La estadıstica es el arte de aprender de los datos. Esta definicion es bastante general,depues de todo, ¿que son los datos? Los datos son los valores que toma una variable.En estadıstica una variable es una caracterıstica que describe a un individuo que esobjeto de estudio y que puede variar. El individuo puede ser cualquier cosa que intereseestudiar, como por ejemplo una persona, un animal, un circuito electronico, el clima,etc.

La poblacion es la coleccion total de individuos a ser estudiados, por ejemplo, todoslos habitantes de un paıs, todos los circuitos integrados producidos por una companıa,etc. En algunas situaciones, sin embargo, no es posible o practico estudiar todos loselementos que conforman la poblacion, y cuando eso ocurre tomamos un subconjuntode la poblacion que recibe el nombre de muestra. La muestra debe ser representativade la poblacion, esto es, debe ser posible inferir algunas propiedades sobre la poblacion,como la media y la varianza, a partir de la misma propiedad observada en la muestra.

5

Page 6: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

6 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

Para que la muestra sea representativa debe escogerse de la poblacion de manera queno exista un sesgo inherente al momento de estudiar la variable de interes. Por ejemplo,si lo que quiero estudiar es la preferencia por un equipo de futbol profesional en Colom-bia, entonces serıa inadecuado consultar solo a personas en Barranquilla, pues habrıaun sesgo inherente por el equipo de la ciudad. Lo adecuado serıa consultar en variasciudades del paıs. Una forma muy usada de evitar tal sesgo es tomando la muestra deforma aleatoria. Existen otros metodos de muestreo como el muestreo estratificado oel sistematico, pero internamente todos ellos utilizan un metodo aleatorio para escogerlos elementos que conformaran las muestra.

Las variables pueden clasificarse en cuantitativas y cualitativas. Las variables cuanti-tativas son aquellas que toman valores numericos sobre los cuales tiene sentido realizaroperaciones aritmeticas, o sobre los cuales es posible establecer una relacion de orden,es decir, determinar si un valor es mayor o menor que otro. Ejemplos de este tipo devariables son edad, temperatura y velocidad. Por otro lado, las variables cualitativastoman valores que conforman una categorıa y sobre los cuales no tiene sentido realizaroperaciones aritmeticas o establecer una relacion de orden. Ejemplos de este tipo devariables son color de ojos, tipo de sangre y estado civil. En la figura 1.1 ilustramosesta clasificacion.

Adicionalmente, las variables cuantitativas pueden ser clasificadas en discretas y con-tinuas. Cuando una variable puede tomar cualquier valor en un intervalo dado, esconsiderada una variable continua, de otra forma es una variable discreta. Las varia-bles continuas se presentan cuando, por ejemplo, queremos medir una propiedad comola temperatura de un lugar, la altura de una persona, o el peso de un carro. Aunque enla practica las medidas que hacemos tienen una precision finita, para efectos de analizaresa variable desde el punto de vista matematico puede ser conveniente tratarla comouna variable continua. Por otro lado, los valores que toma una variable discreta notienen que ser necesariamente enteros. Un ejemplo de esto es la nota de un estudiantede la Universidad de Antioquia, que por convencion de la Universidad esta entre 0.00y 5.00, con una precision de dos digitos decimales.

Figura 1.1: Clasificacion de las variables en estadıstica

El proceso a traves del cual aprendemos de los datos, retomando la definicion de es-

Page 7: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.2. ORGANIZACION Y REPRESENTACION GRAFICA DE DATOS 7

tadıstica, involucra varias etapas, entre ellas la recoleccion, descripcion, analisis e infe-rencia. En la figura 1.2 ilustramos este proceso.

Datos

Recoleccion Generacion

Descripcion

Estadıstica descriptiva

Organizacion,representacion grafica

y resumen

Analisis e inferencia

Estadıstica inferencial

Conclusionesusando modelosde probabilidad

Figura 1.2: La estadıstica

Debemos empezar por recolectar los datos si ya estan disponibles, como los que recogepor ejemplo el Estado acerca del numero de nacimientos, o de bachilleres graduados porano. Si los datos no estan disponibles entonces debemos generarlos. Esto lo podemoshacer a traves del diseno de un experimento que permita medir u observar la variablede interes, o de un estudio observacional, como por ejemplo una encuesta para estimarla intencion de voto por los candidatos en una eleccion particular.

Una vez tenemos disponibles los datos es necesario representarlos de una forma or-denada, a traves de una tabla o una grafica, para poder ver con mas facilidad algunpatron en los datos que quiza no sea invisible a una mirada directa al conjunto de datosoriginal, sobre todo si este conjunto es muy grande. En la seccion 1.2 veremos algunasherramientas que permiten hacer esto. Adicionalmente es posible resumir el conjuntode datos a traves de un numero que lo describa, y esto es el tema de la seccion 1.3. To-das estas herramientas para organizar, representar graficamente y resumir un conjuntode datos son el tema de estudio de una de las ramas de la estadıstica, la estadısticadescriptiva.

La otra rama de la estadıstica es la estadıstica inferencial, en la cual se utiliza lateorıa de la probabilidad para sacar conclusiones acerca de la poblacion a partir de lasobservaciones de una muestra.

1.2. Organizacion y representacion grafica de datos

Una vez tenemos los datos que queremos analizar, es necesario representarlos de unamanera ordenada que nos permite encontrar patrones o visualizar algunas de sus pro-piedades. Una forma muy comun de representar los datos es a traves de una tabla dedistribucion de frecuencia.

Una distribucion de frecuencia es una organizacion tabular de los datos mediante clases(intervalos) y frecuencias. Hay dos tipos de distribucion de frecuencia que vamos aconsiderar, agrupada y no agrupada.

Page 8: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

8 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

Agrupada: Se obtiene construyendo intervalos para los datos y listando el numerode valores (frecuencias) que hay en cada intervalo.

No agrupada: Lista los datos distintos junto con el numero de veces (frecuencia)que cada uno ocurre.

Frecuencia: Es el numero de veces que los valores de un intervalo aparecen dentro delconjunto de datos.

Frecuencia relativa: Es la frecuencia dividida por el numero total de datos.

Frecuencia acumulativa: Para un valor especifico en una tabla de frecuencias, es lasuma de las frecuencias para todos los valores iguales o menores al valor dado.

Frecuencia relativa acumulativa: Para un valor especifico en una tabla de frecuen-cias, es la suma de las frecuencia relativas de todos los valores iguales o menores alvalor dado.

Histograma: Es una representacion grafica de una distribucion de frecuencia (o fre-cuencia relativa), que usa intervalos y barras verticales para representar las frecuencias.

Ojiva: Es una grafica que muestra una distribucion de frecuencia acumulativa.

1.3. Resumen de Datos

Cualquier conjunto de datos tiene dos propiedades importantes: el valor central o tıpicoy la dispersion alrededor de ese valor. Se puede visualizar la idea en los hipoteticoshistogramas de la figura 1.4.

Figura 1.3: Histogramas que ilustran el centro y la dispersion de los datos

Hay varias formas de medir el centro de un conjunto de datos. Una de ellas es la mediao promedio aritmetico. Hay dos tipos de media, de acuerdo al conjunto que se utilicepara obtenerla:

Page 9: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.3. RESUMEN DE DATOS 9

Poblacional: se utiliza cuando se tiene acceso a toda la poblacion, lo cual no espractico en muchos casos. Se define como

µ =1

N

N∑i=1

xi

donde N es el tamano de la poblacion y xi es el i-esimo dato.

Muestral: Cuando la poblacion es muy grande se toma una muestra que larepresente. Esta definida como

x =1

n

n∑i=1

xi

donde n es el tamano de la muestra.

Pregunta: ¿Por que usamos la media como una medida del centro del conjunto devalores?

Mediana: Es un valor que esta en la mitad del conjunto de datos cuando este esta or-denado.

Ejemplo 1.6. ¿Cual es la mediana del siguiente conjunto de muestras? 3, 8, 6, 14, 0, -4,2, 12, -7, -1, -10.

Ejemplo 1.7. Encuentre la mediana para el siguiente conjunto de datos: 23, 19, 32, 25,26, 22, 24, 20.

Pregunta: ¿Por que la mediana es una medida de tendencia central?

Moda: es el valor que mas se repite en un conjunto de datos.

1.3.1. Medidas de dispersion

Ademas de conocer el punto central de los datos, tambien es importante describir sudispersion, o cuan lejos estan del centro. Veamos algunas formas de medir la dispersion.

Rango: Es la diferencia entre el valor mas grande y el mas pequeno de los datos. Enun conjunto ordenado, serıa la diferencia entre el valor del primer y el ultimo elemento.

Rango intercuartil: No es afectado por valores extremos atıpicos y aun presenta laidea de rango. Mide la dispersion del 50 % de los datos ubicados en el centro de unconjunto ordenado.

Varianza muestral: Es un promedio aproximado del cuadrado de las desviacionesrespecto a la media muestral, ası

S2 =1

n− 1

n∑i=1

(xi − x)2

Page 10: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

10 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

donde n es el tamano de la muestra y x la media muestral.

Desviacion estandar muestral: Se define como la raız cuadrada de la varianzamuestral, asi

S =√S2

Varianza poblacional: En este caso se toma el promedio del cuadrado de las desvia-ciones respecto a la media poblacional, ası

σ2 =1

N

N∑i=1

(xi − µ)2

donde N es el tamano de la poblacion y µ es la media poblacional. Desviacionestandar: Se define como la raız cuadrada de la varianza poblacional, asi

σ =√σ2

1.3.2. Ejercicios propuestos

1.3.1. Los siguientes datos representan el numero de productos defectuosos observadoscada dıa durante 25 dıas en un proceso de manufactura. Resumir la informacioncon una distribucion de frecuencias no agrupada.

Dıa 1 2 3 4 5 6 7 8 9 10 11 12 13Defectos 10 10 6 12 6 9 16 20 11 10 11 11 9

Dıa 14 15 16 17 18 19 20 21 22 23 24 25Defectos 12 11 7 10 11 14 21 12 6 10 11 6

1.3.2. A continuacion se presentan los pesos de 30 estudiantes de Biologıa. Resumir lainformacion usando una distribucion de frecuencia agrupada con 7 intervalos.

143 151 136 127 132 126 132 138 119 104113 90 126 123 121 133 104 99 112 129107 139 122 137 112 121 140 134 133 123

1.4. Introduccion a la probabilidad

“La teorıa de la probabilidad no es mas que sentido comun reducido acalculo”- Pierre-Simon Laplace.

Page 11: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.5. CONJUNTOS 11

Como bien dice la frase al inicio del seccion, el proposito de la probabilidad es asig-nar numeros, en otras palabras codigos, a la ocurrencia de fenomenos aleatorios ysituaciones inciertas en la naturaleza y ası poderlos interpretar de una mejor manera,a pesar de que contemos solo con conocimientos reducidos sobre sus condiciones. Esposible interpretar la probabilidad como la frecuencia de ocurrencia de cierto resultado.

Aleatoriedad → Impredecibilidad

Incertidumbre → Duda

El concepto de probabilidad es usado para cuantificar la incertidumbre. Los modelosprobabilisticos que se usan para cuantificar la incertidumbre asignan probabilidadesa colecciones (conjuntos) de posibles resultados. Es por esto que debemos hacer unacorta revision de la teorıa de conjuntos.

1.5. Conjuntos

El concepto de conjunto es muy importante a traves de todo este curso, en este primercapıtulo nos permitira agrupar resultados de cierto experimento o actividad dentro deun “evento”, pero cuando en capıtulos posteriores se asignen numeros a estos resultados,el concepto de conjunto tomara todo su significado matematico.

Un conjunto es una coleccion de objetos, los cuales se denominan elementos. Si Ses un conjunto y x es un elemento de S, escribimos x ∈ S. Si x no es un elemento deS, escribimos x /∈ S. Un conjunto que no tiene elementos, en cuyo caso es llamado elconjunto vacıo, es denotado por ∅.

Los conjuntos pueden clasificarse por el numero y naturaleza de sus elementos, porejemplo, su numero puede ser finito o infinito, y en este ultimo caso, puede ser unnumero infinito contable o no contable. Un conjunto se puede especificar entre otraspor las siguientes formas:

1. Si un conjunto S tiene un numero finito de elementos, se puede listar cada uno,ası S = x1, x2, . . . , xn. Esta forma se denomina por enumeracion.

2. Si un conjunto S tiene un numero infinito contable de elementos se puede espe-cificar como S = x1, x2, . . . . Esta forma se denomina por extension.

3. Si todos los elementos de S satisfacen cierta propiedad P , el conjunto se puedeespecificar como S = x|x satisface P. Esta forma se denomina por compren-sion.

Se pueden definir las siguientes relaciones entre conjuntos: si cada elemento de unconjunto S es tambien un elemento de un conjunto T , se dice que S es un subconjuntode T , y escribimos S ⊂ T o T ⊃ S. Si S ⊂ T y T ⊂ S, los dos conjuntos son iguales y

Page 12: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

12 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

escribimos S = T . Tambien es apropiado introducir un conjunto universal, denotadopor Ω.

1.5.1. Operaciones entre conjuntos

Estan definidas las siguientes operaciones entre conjuntos:

El complemento de un conjunto S con respecto al universo Ω, es el conjuntox ∈ Ω|x /∈ S de todos los elementos de Ω que no pertenecen a S, y se denotapor Sc. Se nota que Ωc = ∅, es decir que todos los elementos deben pertenecer aΩ.

La union de dos conjuntos S y T es el conjunto de todos los elementos quepertenecen a S o a T (o a ambos), y se denota por S ∪ T , asi S ∪ T = x|x ∈S o x ∈ T Este concepto se puede ampliar a un numero mayor, incluso infinito,de conjuntos.

La interseccion de dos conjuntos S y T es el conjunto de todos elementos quepertenecen a ambos S y T y se denota por S ∩ T . La interseccion implica formarel conjunto S ∩ T = x|x ∈ S y x ∈ T. Tambien se puede extender la operaciona un numero mayor de conjuntos. Se dice que varios conjuntos son disjuntos sisu interseccion es ∅, el conjunto vacıo .

Estas operaciones son faciles de visualizar por medio de diagramas de Venn.

(a) S ∩ T (b) S ∪ T (c) S ∩ T c

Figura 1.4: Operaciones de conjuntos

1.6. Modelos probabilısticos

Un modelo es una descripcion de un fenomeno, como puede ser el movimiento deun cuerpo, un sistema de comunicaciones, la ocurrencia de una enfermedad, etc. Unfenomeno puede ser descrito por distintos modelos, que pueden tener diferente gradode detalle. Un ejemplo de esto, se puede observar en los modelos de partıcula y decuerpo rıgido utilizados para modelar el movimiento de un cuerpo.

Page 13: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.6. MODELOS PROBABILISTICOS 13

Un modelo probabilıstico es una descripcion matematica de una situacion incierta ofenomeno aleatorio y debe cumplir ciertas propiedades. Se compone de:

El experimento genera uno de varios posibles resultados. El conjunto de todoslos posibles resultados es llamado espacio muestral del experimento, y es denotadopor Ω. Un subconjunto del espacio muestral es llamado un evento.

El espacio muestral Ω, o universo, el cual es el conjunto de todos los posiblesresultados de un experimento.

La ley de probabilidad, la cual asigna a un conjunto de posibles resultados unnumero no negativo P (A) llamado la probabilidad de A.

Figura 1.5: Los elementos principales de un modelo probabilıstico

En otras palabras, cada modelo probabilıstico contiene un proceso, el experimento,que producira exactamente uno de varios posibles resultados. El conjunto de todoslos posibles resultados es llamado el espacio muestral del experimento, denotado porΩ. No hay restricciones acerca de que constituye un experimento, por ejemplo podrıatratarse del lanzamiento de una moneda, o cinco lanzamientos o una secuencia infi-nita de lanzamientos. Sin embargo, es importante notar que en esta definicion de unmodelo probabilıstico, solo hay un experimento, de esta manera, si fueran cinco loslanzamientos propuestos de la moneda, estos constituyen un solo experimento y nocinco experimentos.

El espacio muestral de un experimento puede consistir en un numero finito o infinitode posibles resultados. Los espacios muestrales finitos son mas simples conceptual ymatematicamente. Sin embargo, espacios muestrales con un numero infinito de resul-tados son bastante comunes. Por ejemplo, considere el lanzamiento de un dardo a unblanco cuadrado y determinar la posicion (x, y) en la que impacta como el resultadodel experimento. Sin embargo, lo podrıamos simplificar, si es conveniente y no se pierdeexactitud, al delimitar areas del blanco.

Page 14: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

14 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

1.6.1. Escogiendo un espacio muestral apropiado

En primer lugar, a pesar de su numero, los elementos del espacio muestral deben serdistintos y mutuamente excluyentes, de tal forma que cuando se realice el experimentohaya un resultado unico. El espacio muestral debe ser exclusivo colectivamente, es decirque cuando se realice el experimento se debe obtener un resultado que este dentro delespacio muestral. Adicionalmente, el espacio muestral debe ser lo suficientemente deta-llado para distinguir entre los posibles resultados del experimento, pero debe descartarlos datos irrelevantes.

En resumen, los tres elementos principales de un espacio muestral son:

Elementos mutuamente excluyentes: son elementos o eventos que no puedenocurrir a la vez en una misma realizacion del experimento, pues la ocurrencia dealguno de ellos excluye la ocurrencia de los otros. Esto permite utilizar facilmenteel axioma de aditividad.

Elementos colectivamente exhaustivos (C.E.): esto implica tener presentetodos los resultados posibles de un evento. Es decir, si A1, A2, . . . , An son eventosde Ω, estos son C.E. si A1 ∪ A2 ∪ · · · ∪ An = Ω.

Finest-grain (precision): Se refiere a que tanto se especifican o detallan losresultados de los eventos.

1.6.2. Modelos secuenciales

Muchos experimentos tienen un caracter secuencial inherente, por ejemplo, tirar unamoneda tres veces o recibir ocho dıgitos sucesivos en un receptor de comunicaciones.Una forma util de describir el experimento es mediante un diagrama de arbol. Porejemplo, el espacio muestral de un experimento que involucra dos lanzamientos de undado de cuatro caras puede ser descrito como se observa en el diagrama de arbol lafigura 1.7.

Page 15: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.6. MODELOS PROBABILISTICOS 15

Figura 1.6: Diagrama de arbol de probabilidad

Tenga muy en cuenta este tipo de representacion, pues le sera muy util para la elabo-racion de modelos probabilısticos y el calculo de las probabilidades a ellos asociadas.

1.6.3. Leyes de probabilidad

Suponga que ya hemos definido el espacio muestral Ω asociado con un experimento.Para completar el modelo probabilıstico debemos ahora introducir una ley de probabi-lidad. Esta ley asigna a cada evento A un numero P (A), llamado probabilidad de A,que satisface los siguientes axiomas:

1. No negatividad: P (A) ≥ 0 para todo evento A

2. Aditividad: Si A y B son dos eventos disjuntos (si ocurre uno no ocurre el otro),la probabilidad de la union satisface:

P (A ∪B) = P (A) + P (B)

3. Normalizacion: La probabilidad del espacio muestral es 1, es decir P (Ω) = 1

1.6.4. Modelos discretos

Cuando los resultados de un experimento se pueden separar en conjuntos discretosclaramente diferenciables, es posible aplicar un modelo probabilıstico discreto. Estetipo de modelos tienen como posible ventaja ser mas sencillos de analizar, aunque esteno es el caso si el numero de resultados es muy grande. En este caso, conviene mas

Page 16: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

16 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

utilizar un modelo continuo, que sera descrito en la proxima seccion, para aprovecharlas herramientas matematicas que este ofrece.

A continuacion se ilustra un ejemplo de como construir una ley de probabilidad conalgunas suposiciones de sentido comun acerca del modelo.

Ejemplo. Considere un experimento que involucra un lanzamiento de una moneda.Hay dos posibles resultados, cara (C) y sello (S), el espacio muestral es Ω = C, S, ylos eventos son

C, S, C, S∅

Si la moneda es justa deberıamos asignar probabilidades iguales a los dos posiblesresultados y especificar que P (C) = P (S).

El axioma de aditividad implica que

P (C, S) = P (C) + P (S) = 1

y de la condicion de normalizacion se obtiene P (C) = P (S) = 0,5, lo cual es consistentecon el axioma de normalizacion. Ası, la ley de probabilidad esta dada por

P (C, S) = P (C) + P (S) = 1 P (C) = 0,5 P (S) = 0,5 P (∅) = 0

Pregunta: ¿Satisface esta ley los tres axiomas?

1.6.5. Ley de probabilidad discreta

Si el espacio muestral consiste de un numero finito de posibles resultados, entonces laley de probabilidad se especifica por la probabilidad de los eventos que contienen unsolo elemento. En particular, la probabilidad de cualquier evento s1, s2, . . . , sn es lasuma de las probabilidades de sus elementos:

P (s1, s2, . . . , sn) = P (s1) + P (s2) + · · ·+ P (sn)

1.6.6. Ley de probabilidad uniforme discreta – (Probabilidadclasica)

Si el espacio muestra consiste de n posibles resultados que son igualmente probables,la probabilidad de cualquier evento A esta dada por

P (A) =#de elementos en A

n

Se debe no todos los modelos discretos son uniformes, en cuyo se debe proceder de otramanera para calcular la probabilidad de cada evento.

Page 17: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.6. MODELOS PROBABILISTICOS 17

1.6.7. Modelos continuos

Los modelos probabilısticos con espacios muestrales continuos difieren de su contrapartediscreta en que las probabilidades de los eventos con un solo elemento pueden no sersuficientes para caracterizar la ley de probabilidad.

Ejemplo: Una ruleta esta calibrada de forma continua entre 0 a 1, de esta forma losposibles resultados de un experimento que consiste en hacer girar una vez la ruleta sonlos infinitos numeros en el intervalo [0,1], es decir que el espacio muestral es Ω = [0, 1].Asumiendo una ruleta justa, es apropiado considerar que todos los posibles resultadosigualmente probables; pero, ¿cual es la probabilidad de un evento que consiste de unsolo elemento (un unico valor)?

Esta debe tender a cero, es decir, un infinitesimo porque si fuera mayor, y de acuerdoal axioma de aditividad, se seguirıa que eventos con un numero suficientemente grandede elementos, tendrıan una probabilidad mayor a 1 (recuerdese que se tienen infinitoselementos para sumar). De esta manera, la probabilidad de un evento que consiste enun solo elemento debe tender cero.

Otra forma de ver esta situacion es empezando por dividir esta ruleta justa en dosmitades, ası la probabilidad de que el resultado caiga en cualquiera de las mitadeses la misma, es decir p = 1/2, en cuyo caso tememos dos eventos, uno el intervalo[0; 0,5) y otro en el intervalo [0,5; 1]. Si ahora dividimos de nuevo la ruleta, dividiendoen 2 cada mitad, ahora tendremos cuatro partes con igual probabilidad, es decir quela probabilidad de cada evento p = 1/4. Si se sigue dividiendo las partes de la mismaforma, reiteradamente, se observa que se obtendran valores cada vez mas pequenos dep, es decir que tiende a cero a medida que el numero de partes es muy grandes y sustamanos tienden a un valor especifico del intervalo [0, 1].

En este ejemplo tiene sentido asignar la probabilidad b−a a cualquier subintervalo [a, b]de [0, 1], y calcular la probabilidad de cualquier conjunto mas complicado evaluandoesta “longitud”. Esta asignacion cumple los tres axiomas de la probabilidad y ası calificacomo una ley de probabilidad legitima.

1.6.8. Propiedades de las leyes de probabilidad

Las propiedades de las leyes de probabilidad se pueden deducir a partir de los axiomasantes dados. Algunas de estas se listan a continuacion.

Considere una ley de probabilidad y sean A, B y C eventos.

(a) Si A ⊂ B, entonces P (A) ≤ P (B).

(b) P (A ∪B) = P (A) + P (B)−P (A ∩B)

(c) P (A ∪B) ≤ P (A) + P (B)

Page 18: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

18 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

(d) P (A ∪B ∪ C) = P (A) + P(AC ∩B

)+ P (Ac ∩Bc ∩ C)

1.6.9. Probabilidad de frecuencia relativa o empırica

Si lanzamos una moneda justa una sola vez, decimos que la probabilidad de obtener caraes P (C) = 0,5. Esto es porque tenemos dos posibles resultados igualmente probables:una cara o un sello. Esta probabilidad de 0,5 es la probabilidad teorica (clasica) deobservar una cara en un solo lanzamiento de la moneda.

En un experimento, sin embargo, si lanzamos 10 veces una moneda y observamos 4caras, basados en ea misma informacion decimos que la posibilidad de observar caraserıa 0,4, que no es igual a 0,5. Sin embargo, si lanzamos la moneda un gran numerode veces observaremos que el numero de veces en las que el resultado es cara se acercaa la mitad del numero total de lanzamientos, confirmando el resultado predicho por elmodelo clasico.

Ası, la probabilidad de que un evento ocurra puede ser medida por la proporcion deveces que el evento ocurre si el proceso es repetido un numero grande de veces. Estoconduce a la ley de los grandes numeros.

1.6.10. Ejercicios propuestos

1.6.1. De los estudiantes de una clase, 60 % son genios, 70 % adoran el chocolate y 40 %caen dentro de ambas categorıas. ¿Cual es la probabilidad de que si escogemosun estudiante al azar, no sea ni genio ni adora el chocolate?

1.6.2. Un dado de seis caras esta cargado de forma que la probabilidad de que caigauna cara par es el doble de que caiga una cara impar. Todas las caras paresson igualmente probables, y todas las caras impares tambien son igualmenteprobables. Construya un modelo probabilıstico para el lanzamiento de este dado.Calcule la probabilidad de que el resultado del lanzamiento sea menor que 4.

1.6.3. Un dado justo de cuatro caras es lanzado continuamente, y sus resultados ano-tados, hasta la primera vez (si ocurre) que un numero par se obtiene.

(a) ¿Cual es el espacio muestral de este experimento?

(b) Se cuenta el numero de veces que se lanzo el dado, ¿ Cual es el espaciomuestral de este experimento?

(c) Se suman los resultados de los lanzamientos del dado del anterior experi-mento, ¿ Cual es el espacio muestral de este nuevo experimento?

1.6.4. Usted entra a un peculiar torneo de ajedrez en el que juega un juego contra tresoponentes, pero puede escoger el orden en el que va a enfrentarlos, conociendola probabilidad de ganarle a cada uno. Usted gana el torneo si gana dos juegos

Page 19: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.7. PROBABILIDAD CONDICIONAL 19

consecutivos, y quiere maximizar la probabilidad de ganar. Muestre que es opti-mo jugar contra el oponente mas debil en el segundo juego, y que el orden dejugar contra los otros oponentes no importa.

1.7. Probabilidad condicional

La probabilidad condicional permite analizar el resultado de un experimento basa-do en informacion parcial. Para la probabilidad condicional se cumplen los axiomasexpresados anteriormente, constituyendola en una ley de probabilidad.

La probabilidad condicional se puede describir de la siguiente manera: dado un expe-rimento, con su correspondiente espacio muestral y ley de probabilidad, suponga quese conoce que el resultado esta dentro de un evento B, y ahora queremos cuantificarla probabilidad de que el resultado tambien este dentro de otro evento A. Entonces,se busca construir una nueva ley de probabilidad que tome en cuenta el conocimien-to disponible (B ha ocurrido): una ley de probabilidad que para cualquier evento Aespecifique la probabilidad condicional de A dada la ocurrencia de B, denotada porP (A|B).

1.7.1. Propiedades de la probabilidad condicional

La probabilidad condicional de un evento A dado un evento B, con P (B) > 0,se define como

P (A|B) =P (A ∩B)

P (B)

y especifica una nueva ley de probabilidad en el mismo espacio muestral Ω (losresultados siguen estando en Ω). En particular, todas las propiedades de las leyes yaxiomas de probabilidad (no negatividad, normalizacion y aditividad) son todaviavalidos.

La probabilidad condicional tambien puede ser vista como una ley de probabilidaden un nuevo universo o espacio muestral B, debido a que toda la probabilidadcondicional esta concentrada en B.

Si los posibles resultados del experimento son finitos e igualmente probables en-tonces se cumple,

P (A|B) =# de elementos en A ∩B

# de elementos en B

Page 20: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

20 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

1.7.2. Regla de multiplicacion

Es de interes modelar experimentos que consisten en una serie de eventos Ai bien defi-nidos y que consisten en etapas del experimento. Experimentos que se pueden modelarde esta forma son, por ejemplo, una serie de lanzamientos de una moneda, o una seriede resultados en una ruleta. Ası, el resultado de un experimento esta constituido poruna serie de eventos; es decir, el resultado total del experimento dado por el conjuntode los resultados parciales en cada etapa.

Es posible encontrar la probabilidad de una serie de eventos como la probabilidad desus intersecciones, utilizando la regla de la multiplicacion. Ası, asumiendo que todoslos eventos condicionantes tienen una probabilidad positiva, se tiene que

P (∩ni=1Ai) = P (A1) P (A2|A1) P (A3|A1 ∩ A2) ...P(An| ∩n−1i=1 Ai

)

Figura 1.7

1.7.3. Ejercicios propuestos

1.7.1. En una universidad 52 % de los alumnos son mujeres, 5 % de los estudiantesestan estudiando ciencias de la computacion, 2 % de los estudiantes son mujeresestudiando ciencias de la computacion.Si un estudiante se selecciona al azar, halle la probabilidad condicional de que:

(a) Es una mujer, dado que esta estudiando ciencias de la computacion

(b) Esta estudiando ciencias de la computacion, dado que es mujer.

1.7.2. Se lanzan dos dados justos de seis caras. Se asume que cada uno de los 36 posiblesresultados es igualmente probable.

(a) Encuentre la probabilidad de que se lance par (los dos dados igual numero).

(b) Dado que el lanzamiento resulta en una suma de 4 o menos, encuentre laprobabilidad condicional de que se obtenga par.

(c) Encuentre la probabilidad de que al menos uno de los dados lanzados cae en6.

Page 21: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.8. TEOREMA DE LA PROBABILIDAD TOTAL Y REGLA DE BAYES 21

(d) Dado que ambos dados caen en numeros diferentes, encuentre la probabilidadcondicional de que al menos uno de los dados lanzados cae en 6.

1.7.3. Se nos dan tres monedas: una con Cara en ambos lados, una con Sello en amboslado y una moneda justa. Se escoge una moneda al azar y se lanza, dando comoresultado Cara. ¿Cual es la probabilidad de que el otro lado sea Sello?

1.7.4. Un embarque de cien artıculos es inspeccionado seleccionando y probando cua-tro artıculos seleccionados aleatoriamente. Si alguno de los cuatro se encuentradefectuoso, el embarque es rechazado. Si hay cinco artıculos defectuosos en elembarque, ¿cual es la probabilidad de que el embarque sea rechazado?

1.8. Teorema de la probabilidad total y regla de

Bayes

En esta seccion se observan algunas aplicaciones de la probabilidad condicional. Estasseran especialmente utiles para realizar la inferencia de la ocurrencia de diferenteseventos conocida la ocurrencia de otro evento. Es decir, para inferir causas conocidoslos efectos. Por ejemplo, se podrıa inferir si un paciente tiene cierta enfermedad dadoque presenta algun sıntoma.

1.8.1. Teorema de la probabilidad total

Este teorema sirve para calcular la probabilidad de un evento utilizando el plantea-miento “divide y venceras”.

Sean A1, ..., An eventos disjuntos que forman una particion del espacio muestral (esdecir que cada posible resultado del experimento esta incluido en exactamente uno delos eventos A1, ..., An) y asumiendo que P (Ai) > 0, para todo i, entonces se tiene quepara cualquier evento B:

P (B) = P (A1 ∩B) + ...+ P (An ∩B)= P (A1) P (B|A1) + ...+ P (An) P (B|An)

Este teorema se visualiza en los diagramas de Venn en la figura 1.9.

Este teorema indica que la probabilidad de B es el promedio ponderado de su proba-bilidad bajo la condicion de que ocurra cada uno de los eventos Ai.

Este teorema puede ser utilizado para averiguar la probabilidad de eventos para loscuales la probabilidad condicional de una particion del espacio muestral es conocida ofacilmente derivable.

Page 22: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

22 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

Figura 1.8

1.8.2. Inferencia y regla de Bayes

El teorema de la probabilidad total se utiliza frecuentemente de manera conjunta conel siguiente teorema, que relaciona probabilidades condicionales de la forma P (A|B)con otras de la forma P (B|A).

Sean A1, A2, ..., An eventos disjuntos que forman una particion del espacio muestral yasuma que P (Ai) > 0 para todo i. Entonces, para cualquier evento B tal que P (B) > 0se tiene que:

P (Ai|B) =P (Ai) P (B|Ai)

P (B)=

P (Ai) P (B|Ai)P (A1) P (B|A1) + ...+ P (An) P (B|An)

1.8.3. Ejercicios propuestos

1.8.1. Se realizan pruebas en las que grupos de clientes evaluan un producto antesde ser lanzado al mercado. En pruebas anteriores, el 95 % de productos muyexitosos, el 60 % de productos exitosos y el 10 % de los productos que fracasaronrecibieron buena calificacion. Tambien se sabe que, el 40 % de los productos hansido muy exitosos, el 35 % han sido exitosos y el 25 % han fracasado.

(a) ¿Cual es la probabilidad de que un producto obtenga una buena calificacion?

(b) Si un nuevo diseno obtiene una buena calificacion, ¿cual es la probabilidadde que sea un producto muy exitoso?

(c) Si un producto no obtiene una buena calificacion, ¿cual es la probabilidadde que sea altamente exitoso?

1.8.2. Usted le pide a su vecino regar una planta enferma mientras que usted esta devacaciones. Si no se la riega, la planta morira con probabilidad de 0.8; si se lariega morira con probabilidad 0.15; usted esta un 90 % seguro de que su vecinorecordara regarla.

(a) ¿Cual es la probabilidad de que la planta este viva cuando usted vuelva?

Page 23: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.9. INDEPENDENCIA 23

(b) Si la planta esta muerta a su regreso, ¿cual es la probabilidad de que suvecino olvido regarla?

1.8.3. Considere dos recipientes, el primero contiene 2 esferas blancas y 7 esferas negras,el segundo contiene 5 esferas blancas y 6 esferas negras. Se lanza una monedajusta y sacamos una esfera del primer recipiente si la moneda cae Cara o delsegundo si la moneda cae Sello.¿Cual es la probabilidad de que haya caıdo cara dado que se tomo una bolablanca?

1.8.4. En cierta etapa de una investigacion criminal, el detective a cargo de la mismaesta convencido en un 60 % de la culpabilidad de cierto sospechoso. Supongaahora que ahora se descubre una nueva evidencia que muestra que el criminaltiene cierta caracterıstica (como ser zurdo, calvo o rubio). Si el 20 % de la po-blacion posee esta caracterıstica, y el sospechoso en cuestion la posee, ¿que tanseguro deberıa estar el detective de la culpabilidad de este sospechoso?

1.8.5. El 48 % de las mujeres y el 37 % de los hombres que tomaron un curso para dejarde fumar lograron permanecer como no-fumadores por al menos un ano despuesde completar la clase. Estos celebraron con una fiesta de exito al final del ano.Si el 62 % de los participantes en la clase eran hombres,

(a) ¿Que porcentaje de los que asisten a la fiesta son mujeres?

(b) ¿Que porcentaje de la clase asiste a la fiesta?

1.9. Independencia

En la seccion anterior se definio la probabilidad condicional como una forma paraobtener informacion adicional acerca de la probabilidad de ocurrencia de un eventoA basados en la ocurrencia de otro evento B; sin embargo, hay situaciones en lasque la ocurrencia del evento condicionante no ofrece esta informacion, y no altera laprobabilidad de ocurrencia de A, es decir:

P (A|B) = P (A)

Cuando la anterior igualdad se cumple, se dice que A es independiente de B. Seobserva que de la definicion P (A|B) = P (A ∩B) /P (B), esto es equivalente a decirque para eventos independientes:

P (A ∩B) = P (A) P (B)

Se adopta esta ultima relacion como la definicion de independencia, pues se puedeutilizar incluso cuando P (B) = 0, en cuyo caso P (A|B) no esta definida. La simetrıade esta relacion tambien implica que la independencia es una propiedad simetrica, esdecir, que si A es independiente de B, entonces B es independiente de A, y se puededecir, sin lugar a ambiguedad, que A y B son eventos independientes.

Page 24: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

24 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

1.9.1. Independencia condicional (opcional)

Se habıa observado anteriormente que las probabilidades condicionales de eventos sonuna ley de probabilidad legıtima, de esta manera es posible hablar de independencia devarios eventos con respecto a esta ley de probabilidad. En particular, dado un eventoC, los eventos A y B son condicionalmente independientes si

P (A ∩B|C) = P (A|C) P (B|C)

esto indica que A y B son independientes bajo el nuevo espacio muestral condicionalC.

Derivando una caracterizacion alternativa de la independencia condicional, se utilizanla definicion de probabilidad condicional y la regla de la multiplicacion, ası

P (A ∩B|C) = P(A∩B∩C)P(C)

= P(C)P(B|C)P(A|B∩C)P(C)

= P (B|C) P (A|B ∩ C)

Comparando las expresiones anteriores, y eliminando el factor P (B|C), que se asumediferente de cero, se observa que la independencia condicional se puede expresar por lacondicion

P (A|B ∩ C) = P (A|C)

Esta relacion indica que si se conoce que C ocurrio, el conocimiento adicional de queB tambien ocurrio, no cambia la probabilidad de A condicionada a C.

De forma curiosa, la independencia de dos eventos con respecto a una ley de pro-babilidad no condicional (con respecto a Ω), no implica independencia condicional yviceversa.

1.9.2. Independencia de una coleccion de eventos

La definicion de independencia se puede extender a multiples eventos. Se dice que loseventos A1, A2, . . . , An son independientes si

P

(⋂i∈S

Ai

)=∏i∈S

P (Ai)

1.9.3. Confiabilidad

En modelos probabilisticos de sistemas complejos que involucran varios componen-tes, es a menudo conveniente asumir que el comportamiento de los componentes noesta acoplado (es independiente). Esto tıpicamente simplifica el calculo y el analisis.

Page 25: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.9. INDEPENDENCIA 25

Un sistema puede a menudo ser dividido en subsistemas, donde cada subsistema con-siste a su vez de varios componentes que pueden ser conectados en serie o en paralelo.

Se considera un subsistema de componentes 1, 2, . . . ,m; y sea pi la probabilidad deque el componente i este activo (funciona). Entonces, un subsistema serial funciona sitodos sus componentes estan activos, de modo que su probabilidad de funcionar es elproducto de las probabilidades de estar activos de los componentes correspondientes

P (Subsistema serial funciona) = p1p2 . . . pm

Un subsistema paralelo funciona si al menos uno de sus componentes funciona, de modoque su probabilidad de fallo es la probabilidad de que fallen todos los componentes, esdecir, el producto de las probabilidades de fallo de sus elementos correspondientes. Porlo tanto

P (Subsistema en paralelo funciona) = 1−P (Subsistema en paralelo falla)= 1− (1− p1)(1− p2) . . . (1− pm)

donde (1− pi) es la probabilidad de fallo del componentes i-esimo.

1.9.4. Pruebas independientes y probabilidades binomiales

Si un experimento involucra una secuencia de etapas independientes e identicas, deci-mos que tenemos una secuencia de pruebas independientes. En el caso especial dondesolo hay dos posibles resultados en cada etapa, decimos que tenemos una secuencia depruebas de Bernoulli independientes.

Por ejemplo, considere un experimento que consiste de n lanzamientos independientesde una moneda, en el que la probabilidad de caras es p, donde p es un numero entre0 y 1. En este contexto, independencia significa que los eventos A1, A2, . . . , An sonindependientes, donde Ai = el i-esimo lanzamiento es cara.

1.9.5. Ejercicios propuestos

1.9.1. Jorge y Enrique practican tiro al blanco. Las probabilidades independientes deque Jorge y Enrique acierten el blanco en un lanzamiento dado son respectiva-mente 0.4 y 0.7.

(a) Dado que los dos lanzan simultaneamente a su blanco y solo uno de losblancos fue impactado, ¿Cual es la probabilidad de que Jorge haya sidoquien acerto?

(b) Si al menos uno de los blancos fue impactado, ¿Cual es la probabilidad deque Jorge haya acertado?

Page 26: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

26 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

1.9.2. Un cazador tiene dos perros. Un dıa, tras la pista de un animal, el cazador llegaa una bifurcacion del camino. El sabe que cada perro, independiente del otro,escogera el camino correcto con probabilidad p. El cazador decide dejar a cadaperro escoger un camino, y si los dos coinciden, tomar ese, si no, escoge uno alazar.¿Es su estrategia mejor que dejar que solo uno de los perros escoja el camino?

1.9.3. Una empresa de servicios publicos provee energıa electrica para una ciudad atraves de n plantas generadoras. La i-esima planta falla con probabilidad pi,independiente de las otras.

a) Si la empresa puede alimentar la ciudad con solo una planta funcionando,¿cual es la probabilidad de un apagon?

b) Si se necesitan dos plantas para mantener la energıa de la ciudad, ¿cual esla probabilidad de que un apagon ocurra?

1.9.4. Conectividad de red. Una red de computadoras correcta dos nodos A y B atraves de nodos intermedios C, D, E, F, como se muestra en la figura. Para cadapar de nodos conectadas directamentey, hay una probabilidadde que el enlacedeaeste activo. Asuma que las fallas de enlace son independientes entre sı. ¿Cuales la probabilidad de que exista un trayecto que conecte A y a B en el cual todoslos enlaces esten activos?

Figura 1.9: El numero cerca a cada enlace es la probabilidad de que este activo.

1.9.5. Grado de servicio. Un proveedor de servicio de Internet ha instalado C mo-dems para servir las necesidades de una poblacion de n clientes de Internet con-mutado. Esta estimado que para un tiempo dado, cada cliente necesitara unaconexion con probabilidad p, independiente de los otros.¿Cual es la probabilidad de que hayan clientes que necesiten una conexion quemodems disponibles?

Page 27: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.10. CONTEO 27

Figura 1.10: Diagrama de un canal ruidoso

1.9.6. Un paquete de Internet viaja desde su fuente al enrutador 1, del enrutador 1 alenrutador 2, y del enrutador 2 a su destino. Si los enrutadores descartan paquetesde forma independiente con probabilidad p = 10−5.¿Cual es la probabilidad de que un paquete sea exitosamente transmitido desdesu fuente a su destino?

1.9.7. Una fuente transmite un mensaje (una cadena de sımbolos) a traves de un ca-nal de comunicacion ruidoso. Cada sımbolo es 0 o 1 con probabilidad p y 1-p,respectivamente, y es recibido incorrectamente con probabilidad ε0 y ε1, respec-tivamente. Los errores en las transmisiones de un sımbolo son independientes.

a) Cual es la probabilidad de que el k-esimo sımbolo sea recibido correctamente?

b) Cual es la probabilidad de que la secuencia de sımbolos 1011 sea recibidacorrectamente?

c) En un esfuerzo por mejorar la confiabilidad, cada sımbolo es transmitidotres veces y la cadena recibida es decodificada de acuerdo al sımbolo que esmayorıa. En otras palabras, un 0 (o un 1) es transmitido como 000 (o 111,respectivamente), y es decodificado en el receptor como 0 (o 1) si y solo sila cadena recibida tiene al menos dos 0’s (o 1’s, respectivamente). Cual es laprobabilidad de que un 0 sea correctamente decodificado?

d) Para que valores de ε0 hay un incremento en la probabilidad de decodificarcorrectamente un 0 cuando el esquema de la parte c) es usado.

e) Suponga que el esquema de la parte c) es usado. Cual es la probabilidad deque el sımbolo sea 0 dado que la cadena recibida es 101?

1.10. Conteo

El calculo de probabilidades normalmente involucra el conteo del numero de resultadosde varios eventos. Entre estos se distinguen dos casos:

a) Cuando el espacio muestral Ω tiene un numero finito de resultados posibles y equi-probables, de tal forma que una ley de probabilidad discreta puede ser aplicada,

Page 28: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

28 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

entonces, la probabilidad de cualquier evento A esta dada por:

P (A) =# de elementos de A

# de elementos de Ω

e involucra contar los elementos de A y Ω.

b) Cuando se quiere calcular la probabilidad de un evento A con un numero finito deresultados igualmente posibles (dentro de A), cada uno con probabilidad conocidap, entonces, la probabilidad de A dada por:

P (A) = p · (# de elementos de A)

e involucra contar el numero de elementos de A.

1.10.1. El principio del conteo

Este principio se basa en un enfoque de “divide y venceras”, donde el conteo se divideen etapas a traves del uso de un diagrama de arbol.

Figura 1.11: El conteo es realizado en r etapas. La primera etapa tiene n1 resultadosposibles. Para cada posible resultado en la etapa i− 1 hay ni posibles resultados en lai-esima etapa. El numero de hojas es n1n2 . . . , nr. Esta es la cuenta deseada, es decir,el numero total de resultados posibles del experimento.

Considere un proceso que consiste de r etapas y suponga que:

Page 29: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.10. CONTEO 29

a) Hay n1 posibles resultados en la primera etapa.

b) Por cada posible resultado de la primera etapa, hay n2 posibles resultados en lasegunda etapa.

c) Para mayor generalidad, para cualquier posible secuencia de posibles resultados enlas primeras i − 1 etapas, hay ni posibles resultados en la i-esima etapa, entonces,el numero total de posibles resultados del proceso de r etapas es:

n1n2 . . . nr

El principio permanece valido incluso si cada resultado de una primera etapa llevaa conjuntos diferentes de resultados de una segunda etapa, el unico requerimiento esque el numero posible de resultados de la segunda etapa sea el mismo para todos losconjuntos sin importar el resultado de la primera etapa.

1.10.2. Permutaciones

Se utiliza el conteo por permutaciones cuando se tienen n objetos diferentes y queremoscontar el numero de posibles formas en que se pueden escoger k de esos objetos (conk ≤ n) y organizarlos en una secuencia, es decir, el numero de secuencias de k objetos.Las combinaciones tienen en cuenta el orden o secuencia.

Se utilizara el principio de conteo y una division en etapas para hallar este numero desecuencias. Se pueden escoger n objetos en la primera etapa, pero habiendo escogido elprimero, ahora solo hay n−1 posibles objetos para escoger en la segunda etapa; una vezescogidos los dos primeros, ahora solo se tienen n−2 objetos para escoger en la terceraetapa; y ası sucesivamente. Cuando se escoge el k-esimo objeto se tendran n− (k − 1)posiblidades. De acuerdo al princpio de conteo, el numero de posibles secuencias sera:

n(n− 1) . . . (n− k + 1)

Multiplicando y dividiendo por (n− k) . . . 2 · 1 se obtiene:

n(n− 1) . . . (n− k + 1)(n− k) . . . 2 · 1(n− k) . . . 2 · 1

=n!

(n− k)!

1.10.3. Combinaciones

Las combinaciones tambien sirven para contar el numero sub-conjuntos de k, de unconjunto de n elementos, pero en este caso no se tiene en cuenta el orden o secuenciaen que estos sean escogidos. Procediendo de manera similar a como se procedio paralas permutaciones, se obtiene que el numero de combinaciones es el numero de permu-taciones dividido por el numero de combinaciones “replicadas”, ası:

n!

k!(n− k)!

Page 30: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

30 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

donde k! es el numero de combinaciones replicadas.

Para ilustrar lo anterior, calculemos el numero de combinaciones de k = 2 de las n = 4letras A, B, C y D. Mientras se tienen las siguientes permutaciones:

AB, BA, AC, CA, AD, DA, BC, CB, BD, DB, CD, DC

Pero como en este caso no se esta observando el orden, por lo que se deben agrupar ABy BA en la misma combinacion; y de manera similar para otros casos, ası se obtienelas combinaciones:

AB, AC, AD, BC, BD, CD

Se observa que hay 2 permutaciones “duplicadas” por cada combinacion, por lo quepara obtener el numero de combinaciones dividimos por 2!, de donde se obtiene laformula anterior.

1.10.4. Ejercicios propuestos

1.10.1. Encuentre el numero de palabras que consisten de 4 letras.

1.10.2. Encuentre el numero de palabras de cuatro letras diferentes. Las palabras debendiferir en al menos una letra.

1.10.3. Una ruleta esta dividida en cuatro areas iguales de diferentes colores: amarillo,verde, rojo y azul. Se hace girar diez veces anotando los resultados.¿Cual es la probabilidad de que la ruleta caiga al menos 3 veces en el azul?

1.10.4. Un dado de seis caras es lanzado tres veces de forma independiente y los resul-tados de estos lanzamientos sumados.¿Que es mas probable una suma de 11 o una suma de 12?

1.10.5. Un cierto mensaje en Internet consiste de cuatro paquetes cabecera seguidospor 96 paquetes de datos. Desafortunadamente, un enrutador defectuoso alea-toriamente reordena todos los paquetes.¿Cual es la probabilidad de que el primer paquete tipo cabecera en ser recibidosea el decimo paquete en llegar?

1.10.6. Tomamos 7 cartas de la parte de arriba de una baraja normal bien mezclada.Encuentre la probabilidad de:

a) En las 7 cartas hay exactamente 3 ases.

b) En las 7 cartas hay exactamente 2 reyes.

c) En las 7 cartas haya exactamente 3 ases o exactamente 2 reyes, o ambos.

1.10.7. Una clase que consiste de 4 estudiantes de posgrado y 12 estudiantes de pre-grado es dividida aleatoriamente en 4 grupos de 4.

Page 31: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

1.10. CONTEO 31

¿Cual es la probabilidad de que cada grupo incluya a un estudiante de posgra-do?

Page 32: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

32 CAPITULO 1. INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA

Page 33: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

Capıtulo 2

Variable aleatoria discreta

En muchos experimentos los posibles resultados son valores numericos, mientras queen otros es posible asignarles un valor numerico de forma arbitraria o bajo algunalogica. Una variable aleatoria asocia un numero real con cada posible resultado delexperimento. Este numero se conoce como el valor de la variable aleatoria. Aunque sepuede asociar con el valor de la medicion de cierta propiedad o dimension, recordemosque una medicion se realiza con una unidad y un punto de referencia seleccionadosarbitrariamente.

Ejemplos de variables aleatorias:

El numero de caras en n lanzamientos de una moneda.

El producto de los numeros que aparece en el lanzamiento de los dados.

El voltaje en la bobina de un parlante.

Una variable aleatoria es llamada discreta si su rango (el conjunto de valores que puedeella puede tomar) es finito o infinito contable.

Una variable aleatoria es continua si su rango es infinito no contable.

Advertencia: Se debe poner especial cuidado en no confundir los valores que puedetomar la variable aleatoria con la probabilidad asociada a un valor o rango de valores.Por ejemplo una variable aleatoria discreta puede tomar valores enteros negativos muygrandes en magnitud, mientras que las probabilidades de cada uno de esos valoresdeben cumplir que deben tomar un valor positivo no superior a 1.

33

Page 34: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

34 CAPITULO 2. VARIABLE ALEATORIA DISCRETA

2.1. Conceptos basicos, PMF y algunas distribucio-

nes

La funcion de masa de probabilidad (Probability Mass Function, PMF) de unavariable aleatoria X, denotada por PX(x), es la probabilidad del evento X = x dondex es cualquier posible valor de X.

PX(x) = P (X = x)

Se debe cumplir la propiedad de normalizacion, es decir que:∑x

PX(x) = 1

lo cual indica que se realiza la suma sobre todos los posibles valores que toma X de losvalores que toma la PMF.

Y si S es un evento del espacio muestral

P (X ∈ S)) =∑x∈S

PX(x)

es decir que se realiza la suma sobre todos los valores de X que estan en S.

2.1.1. Variable aleatoria de Bernoulli

Considere un experimento aleatorio cuyos resultados pueden ser clasificados como exitoo falla,. Si hacemos a X = 1 cuando el resultado es un exito y X = 0 cuando el resultadoes una falla, entonces la funcion de masa de probabilidad de X esta dada por:

PX(x) =

p si X = 1

1− p si X = 0

donde 0 ≤ p ≤ 1 es la probabilidad de exito.

Ejemplos de experimentos que se pueden modelar con esta variable son: cae cara en ellanzamiento de una moneda, un cierto artıculo esta defectuoso, un paciente tiene o nouna enfermedad, etc.

2.1.2. Variable aleatoria Binomial

Suponga que se ejecutan n pruebas independientes de Bernoulli, cada una de las cualesresulta en un exito con probabilidad p o una falla con probabilidad 1−p. Si X representael numero de exitos que ocurren en las n pruebas, entonces decimos que X es unavariable aleatoria binomial con parametros (n,p).

Page 35: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

2.1. CONCEPTOS BASICOS, PMF Y ALGUNAS DISTRIBUCIONES 35

PX(k) = P (X = k) =

(nk

)pk(1− p)n−k; k = 0, 1, 2, ...., n

En la anterior expresion, el factor pk corresponde a la probabilidad de que ocurran kexitos, mientras que el termino (1 − p)n−k corresponde a la probabilidad que el restode las pruebas sean fracasos.

Muchas veces es posible simplificar algunos problemas por medio de procesos de Ber-noulli y una variable aleatoria Binomial.

2.1.3. Variable aleatoria de Poisson

Una variable aleatoria X que toma valores 0,1,2,... se conoce una variable aleatoria dePoisson con parametro λ, para algun λ > 0.

PX(k) = e−λλk

k!; k = 0, 1, 2, ...

La variable aleatoria de Poisson es utilizada para modelar una situacion en la que unevento ocurre aleatoriamente en el tiempo y estamos interesados en encontrar el numerode ocurrencias del evento en un intervalo de tiempo dado. En este caso λ representa elnumero promedio de ocurrencias del evento en dicho intervalo.

La PMF de Poisson con parametro λ es una buena aproximacion para una PMF bino-mial con parametros (n, p) si n es muy grande y p muy pequeno, es decir:

PX(k) =

(nk

)pk(1− p)n−k ≈ e−λ

λk

k!k = 0, 1, 2, . . . , n

con λ = np.

2.1.4. Ejercicios propuestos

2.1.1. Se escogen dos bolas al azar de una urna que contiene 8 esferas blancas, 4 esferasnegras y 2 esferas naranjadas. Suponga que usted gana U$2 por cada bola negraque se escoja y pierde U$1 por cada bola blanca que se escoja. Se denotan porX las ganancias de un juego. ¿Cuales son los posibles valores que puede tomarX? ¿Cual es la probabilidad asociada con cada valor?

2.1.2. Se denota por X la diferencia entre el numero de caras y el numero de sellosobtenidos cuando una moneda es lanzada n veces.

(a)) ¿Cuales son los posibles valores de X?

Page 36: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

36 CAPITULO 2. VARIABLE ALEATORIA DISCRETA

(b)) Si se asume que la moneda es justa, y se hace n = 3, ¿cuales son lasprobabilidades asociadas con los valores que X puede tomar en este caso?

2.1.3. Suponga que un dado se lanza dos veces. ¿Cuales son los posibles valores quelas siguientes variables aleatorias pueden tomar?

(a)) El maximo valor que aparezca en los dos lanzamientos.

(b)) El mınimo valor que aparezca en los dos lanzamientos.

(c)) La suma de los dos lanzamientos.

(d)) El valor del primer lanzamiento menos el valor del segundo.

Suponiendo que el dado es justo, calcule las probabilidades asociadas a cada unade las variables aleatorias descritas.

2.1.4. El equipo de futbol de la U. de A. va a jugar dos juegos este fin de semana. Tieneuna probabilidad de 0.4 de no perder el primer juego y una probabilidad de 0.7de no perder el segundo, independientemente del primero. Si no pierde un juego,el equipo tiene iguales probabilidades de ganar o empatar, con independencia delo que pase en el otro juego. El equipo recibira 2 puntos por una victoria, 1 porun empate y 0 si pierde el juego.

Encuentre la PMF del numero de puntos que el equipo podrıa ganar durante finde semana.

2.1.5. Una persona asegura tener poderes extrasensoriales (ESP). Para probar esto,se lanza una moneda justa diez veces, y se le pide a esta persona que predigael resultado. La persona predice correctamente siete de los diez lanzamientos.¿Cual es la probabilidad de que lo hubiera hecho igual de bien si no tuvieraESP? (Consejo: Explique por que la probabilidad relevante en este ejercicio esP (X ≥ 7) y no P (X = 7).)

2.1.6. Un ISP usa 50 modems para servir las necesidades de 1000 clientes. Se estima queen cualquier momento, cada cliente necesitara conectarse con una probabilidadde 0.01, independientemente de los otros clientes.

(a) ¿Cual es la PMF del numero de modems en uso en un instante en particular?

(b) Repita la parte a) aproximando la PMF del numero de clientes que necesitanconexion con una PMF de Poisson.

(c) ¿Cual es la probabilidad de que haya mas clientes que necesitan una conexionque modems disponibles? Hagalo de forma exacta y con una aproximacionpor Poisson.

Page 37: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

2.2. FUNCIONES DE VARIABLES ALEATORIAS 37

2.2. Funciones de variables aleatorias

Dada una variable aleatoria X, uno puede generar otras variables aleatorias aplicandovarias transformaciones sobre X. Como ejemplo, considere que X es la temperaturaen grados Celsius de un lugar, y que Y = 1,8X + 32, donde Y es la transformacionque convierte a la temperatura en grados Farenheit. En este ejemplo Y es una funcionlineal de X, de la forma:

Y = aX + b

donde a y b son escalares.

Se pueden considerar tambien funciones no lineales, por lo que de forma general setiene:

Y = g(X)

Observe que se utilizan las variables aleatorias, en mayusculas (X, Y ), y no un valorarbitrario que pueda tomar la variable aleatoria, en minusculas (x, y).

Si y = g(X) es una funcion de una variable aleatoria X, entonces Y es tambien unavariable aleatoria. Si X es discreta con PMF PX(x), Y tambien es discreta y su PMFpuede ser calculada usando la PMF de X:

PY (y) =∑

x|g(x)=y

PX(x)

2.2.1. Ejercicios propuestos

2.2.1. Una familia tiene 5 hijos naturales y ha adoptado a 2 ninas. Es igualmenteprobable que cada uno de los hijos naturales sea nino o nina, independientementede los otros. Encuentre la PMF de numero de ninas entre los 7 infantes.

2.2.2. Sea X una variable aleatoria que toma valores enteros entre 0 y 9 con igualprobabilidad (p = 1/10).

(a) Encuentre la PMF de la variable aleatoria Y = Xmod(3).

(b) Encuentre la PMF de la variable aleatoria Y = 5mod(X + 1).

2.3. Valor esperado, media y varianza

Aunque la PMF de una variable aleatoria discreta X asocia cada valor que pueda tomarcon la probabilidad de que este ocurra, muchas veces es deseable poder resumir estainformacion por medio de un solo numero. En esta seccion se definen varios numeros

Page 38: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

38 CAPITULO 2. VARIABLE ALEATORIA DISCRETA

que se asocian con las variables aleatorias y que permiten observar de manera resumidael comportamiento de las mismas.

2.3.1. Valor esperado

Se define el valor esperado (tambien llamado esperanza matematica o media) de unavariable aleatoria X con PMF PX(x), como:

E [X] =∑x

xPX(x)

El cual puede ser interpretado como un promedio ponderado (en proporcion a lasprobabilidades) de los posibles valores de X.

2.3.2. Varianza y momentos

Ademas de la media hay otras cantidades que podemos asociar con una variable alea-toria y su PMF. Por ejemplo, se define el segundo momento de la variable aleatoria Xcomo el valor esperado de variable aleatoria X2. De forma general se define el n-esimomomento de X como E [Xn], es decir el valor esperado de Xn.

La cantidad mas importante asociada a una variable aleatoria X, ademas de su media,es su varianza, que es denotada por var (X) y es definida como el valor esperado de lavariable aleatoria (X − E [X])2, es decir:

var (X) = E[(X − E [X])2

]La varianza ofrece una medida de dispersion de X alrededor de su media. Otra medidade dispersion es la desviacion estandar de X, definida como:

σX =√

var (X)

Observe que mientras la desviacion estandar tiene las mismas unidades que tiene lavariable aleatoria, en caso de que las tenga, la varianza tiene las mismas unidades alcuadrado.

2.3.3. Regla del valor esperado para funciones de variablesaleatorias

Sea X una variable aleatoria con una PMF PX(x) y sea g(X) una funcion de X. Elvalor esperado de la variable aleatoria g(x) esta dado por:

E [g(X)] =∑x

g(x)PX(x)

Page 39: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

2.3. VALOR ESPERADO, MEDIA Y VARIANZA 39

Usando la regla del valor esperado se puede escribir la varianza de X como:

var (X) = E[(X − E [X])2

]=∑x

(x− E [X])2PX(x)

De forma similar el n-esimo momento estara dado por:

E [Xn] =∑x

xnPX(x)

2.3.4. Propiedades de la media y la varianza

Se deja como tarea al lector demostrar las siguientes propiedades mediante el uso dela regla de valor esperado:

a) Si X es una variable aleatoria y se define a Y como Y = aX + b entonces:

E [Y ] = aE [X] +B y var (Y ) = a2var (X) con a y b reales

b) var (X) = E [X] − (E [X])2, la cual es una formula alternativa para la varianza dela variable aleatoria X.

2.3.5. Media y Varianza de algunas variables aleatorias comu-nes

Se deja como tarea al lector demostrar las siguientes formulas de media y varianza paraalgunas variables aleatorias importantes:

a) Si X es una variable aleatoria de Bernoulli entonces:

E [X] = p y var (X) = p(1− p)

b) Si X es una variable aleatoria uniforme con PMF:

PX(x) =

1

b−a+1si x = a, a+ 1, . . . , b

0 para otro valor

donde a y b son numeros enteros con b > a, entonces

E [X] =a+ b

2y var (X) =

(b− a+ 1)2 − 1

12

c) Si X es una variable aleatoria de Poisson con parametro λ entonces:

E [X] = λ y var (X) = λ

Page 40: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

40 CAPITULO 2. VARIABLE ALEATORIA DISCRETA

2.3.6. Conclusiones

Identificar la variable aleatoria de interes:

• Identificar los valores que puede tomar

• Hallar su PMF, ya sea directamente o a traves de una distribucion apropiada.

• Identificar y comprender el significado en el problema de conceptos comovalor esperado, media y varianza.

No confundir la variable aleatoria con su PMF.

2.3.7. Ejercicios propuestos

2.3.1. Como una estrategia de publicidad, una fabrica de chocolates pone tiquetesdorados en algunas de sus barras de chocolate, con la promesa de que un tiquetedorado vale por un tour por la fabrica de chocolate y todo el chocolate quepuedas comer en tu vida. Si la probabilidad de encontrar un tiquete dorado es p,encuentra la media y la varianza del numero de barras de chocolate que necesitascomer para encontrar un tiquete dorado.

2.3.2. Dos monedas se lanzan simultaneamente hasta que una de ellas cae Cara y laotra Sello. La primera moneda cae Cara con probabilidad p y la segunda caecara con probabilidad q. Todos los lanzamientos se asumen independientes.

a) Encuentre la PMF, el valor esperado y la varianza del numero de lanzamien-tos.

b) ¿Cual es la probabilidad de que en el ultimo lanzamiento la primera monedafue la que cayo cara?

2.3.3. Un libro sobre juegos de azar recomienda la siguente “estrategıa ganadora” parael juego de la ruleta. En esta se recomienda que un jugador apueste U$1 al rojo.Si el rojo gana (lo cual se da con probabilidad de 18/38), entonces el jugadordeberıa tomar su ganancia de U$1 y retirarse. Si el jugador pierde esta apuesta(lo cual tiene una probabilidad de 20/38 de ocurrir), deberıa realizar apuestasadicionales de U$1 al rojo en los siguientes dos lanzamientos de la ruleta y luegoretirarse. Se denota por X las ganancias del jugador al retirarse.

a) Encuentre P (X > 0).

b) ¿Esta usted convencido de que esta es una “estrategıa ganadora”? Expliquesu respuesta.

c) Encuentre E [X].

2.3.4. Se lanza, con independencia en los lanzamientos, una moneda justa y se cuentael numero, n, de lanzamientos hasta que cae por primera vez Sello. Al final del

Page 41: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

2.4. PMF CONJUNTA 41

juego se reciben 2n dolares. ¿Cual es la cantidad de dinero que esperarıas ganar?¿Cuanto estarıas dispuesto a pagar por jugar este juego?

2.3.5. Una companıa de seguros define una polıtica para una cantidad de dinero A quedebe ser pagada al cliente si un evento E ocurre en un periodo de un ano. Si lacompanıa estima que el evento E ocurrira en el periodo de un ano probabilidadp.¿Cual deberıa ser la cuota que se le debe cobrar al cliente para que la gananciaesperada sea el 10 % de A?

2.4. PMF Conjunta

Considere dos variables aleatorias discretas X y Y asociadas con el mismo experimento.Las probabilidades de los valores que X y Y pueden tomar son capturadas por laPMF conjunta de X y Y , denotada por PX,Y . En particular, si (x, y) es un par deposibles valores de X y Y , la probabilidad de (x,y) es la probabilidad del eventoX = x ∩ Y = y, lo cual se escribe de forma abreviada como X = x, Y = y.Escribimos entonces:

PX,Y = P (X = x, Y = y)

La PMF conjunta determina la probabilidad de cualquier evento que pueda ser especi-ficado en terminos de las variables aleatorias X y Y . Por ejemplo, si A es el conjuntode los pares (x, y) que cumplen cierta propiedad, entonces:

P ((X, Y ) ∈ A) =∑

(x,y)∈A

PX,Y (x, y)

Podemos calcular ademas las PMFs de X y Y , llamadas PMFs marginales para dis-tinguirlas de la conjunta, usando las formulas:

PX(x) =∑y

PX,Y (x, y) y PY (y) =∑x

PX,Y (x, y)

2.4.1. Funciones de multiples variables aleatorias

Una funcion Z = g(X, Y ) de las variables aleatorias de X y Y define otra variablealeatoria. Su PMF puede ser calculada de acuerdo a:

PZ(z) =∑

(x,y)|g(x,y)=z

PX,Y (x, y)

Ademas, la regla de valor esperado toma la forma:

E [g(X, Y )] =∑x

∑y

g(x, y)PX,Y (x, y)

Page 42: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

42 CAPITULO 2. VARIABLE ALEATORIA DISCRETA

En el caso especial donde g es lineal y de la forma g(X, Y ) = aX + bY + c, donde a, by c son escalares, se tiene:

E [aX + bY + c] = aE [X] + bE [Y ] + c

Estos resultados pueden ser generalizados para cualquier numero de variables. Por ejem-plo, para cualquier conjunto de variables aleatorias X1, X2, X3, . . . , Xn y para cualquierconjunto de escalares a1, a2, a3, . . . , an tenemos:

2.4.2. Ejercicios propuestos

2.4.1. Suponga que n personas dejan su sombrero en una caja y luego cada personaselecciona uno al azar. Asuma que despues de coger el sombrero la persona lovuelve a dejar en la caja.¿Cual es el numero esperado de personas que escogen su propio sombrero?

2.4.2. Un dıa dado, sus puntajes en el golf toman valores en el intervalo entre 101y 110 con probabilidad 0.1 (uniforme), independientemente de otros dıas. Paramejorar su puntaje, decide jugar tres dıas y declarar su puntaje (X) como esmınimo de los tres dıas (X1, X2, X3)

(a) Calcule la PMF de X

(b) ¿Por cuanto ha mejorado su puntaje esperado al usar esta forma de calcularel puntaje?

2.4.3. Una clase de n estudiantes toma un examen en el cual se les entregan m hojascada una con 1 pregunta que deben responder en orden, al final del examen elestudiante i entrega las mi hojas con las respuestas a las preguntas que alcanzo aresponder.

(a) El calificador escoge una hoja aleatoriamente, denomınela (I, J), donde Ies la ID del estudiante (tomando valores entre 1 y n) y J es el numero dela pregunta (tomando valores entre 1 y m). Asuma que el calificador puedeescoger con igual probabilidad cualquier respuesta entre todas. Calcule lasPMFs conjunta y marginal de I y J .

(b) Asuma que el estudiante i responde acertadamente la pregunta j con pro-babilidad pij. Cada respuesta correcta otorga a puntos mientras que unarespuesta incorrecta otorga b puntos. Calcule el valor esperado del puntajedel estudiante i.

Page 43: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

2.5. CONDICIONAMIENTO 43

2.5. Condicionamiento

De manera similar a como era posible extraer informacion acerca de la probabilidad deocurrencia de un evento a partir del conocimiento de la ocurrencia de otro, es posibleobtener informacion adicional sobre la ocurrencia de cualquier posible valor de unavariable aleatoria .

2.5.1. Condicionamiento de una variable aleatoria sobre unevento

La PMF condicional de una variable aleatoria X, condicionada sobre un evento parti-cular A con P (A) > 0 esta definida por:

PX|A(x) = P (X = x|A) =P (X = x ∩ A)

P (A)

2.5.2. Condicionamiento de una variable aleatoria sobre otra

Sena X y Y dos variables aleatorias asociadas a un mismo experimento. Si sabemos queel valor de Y es alguna “y” en particular, con PY (y) > 0, esto ofrece un conocimientoparcial acerca del valor de X. Este conocimiento es capturado por la PMF condicionalPX|Y de X dado Y, que se define como:

PX|Y (x|y) = P (X = x|Y = y) =P (X = x, Y = y)

P (Y = y)=PX,Y (x, y)

PY (y)

La PMF condicional puede ser usada tambien para calcular las PMFs marginales, esdecir la PMF de cada variable aleatoria. En particular tenemos:

PX(x) =∑y

PX,Y (x, y) =∑y

PX|Y (x|y)PY (y)

Esta formula es en esencia identica al teorema de probabilidad total, pero con unanotacion distinta.

2.5.3. Ejercicios propuestos

2.5.1. Considere cuatro lanzamientos de un dado de seis caras. Sea X el numero de 1sy Y el numero de 2s obtenido en los mismos.¿Cual es la PMF conjunta de X y Y ?

Page 44: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

44 CAPITULO 2. VARIABLE ALEATORIA DISCRETA

2.5.2. El numero de veces que una persona se contagia de resfriado en un ano dadoes una variable aleatoria de Poisson con parametro λ = 5. Suponga que unanueva droga milagrosa (basada en grandes cantidades de vitamina C) ha sidopublicitada indicando que reduce el parametro a λ = 3 para el 75 % de la po-blacion, mientras que para el 25 % restante no tiene efectos considerables en losresfriados. Si un individuo toma la droga por un ano y tiene 2 resfriados duranteese tiempo, ¿que tan probable es que la droga es benefica para esta persona?

2.6. Independencia

En esta seccion se analizara la independencia entre variables aleatorias y eventos.

2.6.1. Independencia de una variable aleatoria de un evento

La independencia de una variable aleatoria de un evento es similar a la independenciade dos eventos. La idea es que conociendo la ocurrencia del evento condicionante no setiene nueva informacion acerca del valor de la variable aleatoria. Mas formalmente sedice que la variable aleatoria X es independiente del evento A si:

P (X = x ∩ A) = P (X = x) P (A) = PX(x)P (A) ∀x

2.6.2. Independencia de dos variables aleatorias

Se dice que dos variables aleatorias X y Y son independientes si:

PX,Y (x, y) = PX(x)PY (y) ∀ x, yEsto es equivalente a la condicion:

PX|Y (x|y) = PX(x) para todo y tal que PY (y) > 0 y todo x

Intuitivamente, la independencia significa que el valor de Y no ofrece ninguna informa-cion acerca del valor de X.

Si X y Y son independientes entonces se cumple que:

E [XY ] = E [X] E [Y ]

Se deja como ejercicio al lector demostrar esto.

De forma similar de puede demostrar que si X y Y son independientes entonces:

E [g(X)h(Y )] = E [g(X)] E [h(Y )]

Ademas:var (X + Y ) = var (X) + var (Y )

Page 45: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

2.6. INDEPENDENCIA 45

2.6.3. Independencia de multiples variables aleatorias

La discusion anterior se puede exterde al caso de mas de dos variables aleatorias. Porejemplo, las variables aleatorias X, Y y Z son independientes si:

PX,Y,Z(x, y, z) = PX(x)PY (y)PZ(z); ∀ x, y, z

2.6.4. Varianza de la suma de variables aleatorias indepen-dientes

Si X1, X2, X3, . . . , Xn son variables aleatorias independientes, entonces:

var (X1 +X2 +X3 + · · ·+Xn) = var (X1) + var (X2) + var (X3) + · · ·+ var (Xn)

2.6.5. Ejercicios propuestos

2.6.1. Alicia pasa por cuatro semaforos en su camino al trabajo, y es igualmente pro-bable que cada semaforo este en rojo o verde, independientemente de los otros.

(a) ¿Cual es la PMF, la media y la varianza del numero de semaforos en rojoque Alicia encuentra en su camino?

(b) Suponga que por cada semaforo en rojo, Alicia se demora 2 minutos mas enllegar al trabajo. ¿Cual es la varianza del tiempo que se demora ella en ir altrabajo?

2.6.2. Cada manana Humberto el Hambriento se come algunos huevos. Cualquier mananadada el numero de huevos que se come es igualmente probable de ser 1,2,3,4,5 o6 independientemente de lo que haya hecho en dıas anteriores. Sea X el numerode huevos que Humberto se come en 10 dıas.Encuentre la media y la varianza de X.

2.6.3. La companıa aerea economica Hurra Colombia permite hacer reservacion a 125personas para un vuelo que tiene capacidad para 120 pasajeros. La probabilidadde que un pasajero se arrepienta de viajar es 0.1 independientemente de de losotros pasajeros.

(a) ¿Cual es la probabilidad de que no viaje ningun pasajero?

(b) ¿Cual es la probabilidad de que el vuelo salga lleno?

(c) ¿Cual es la probabilidad de que 5 pasajeros se queden en tierra?

Page 46: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

46 CAPITULO 2. VARIABLE ALEATORIA DISCRETA

2.6.4. Un consumidor de transistores los compra en embarques de 20. Es su polıticainspeccionar 4 componentes de cada embarque y aceptar ese determinado lotesolo si los 4 funcionan adecuadamente. Si cada componente en un embarquees defectuoso con una probabilidad de 0,1, independientemente de los demas,¿que proporcion de los embarques es rechazada?

2.6.5. Una familia cualquiera tiene n hijos con probabilidad PN(n) = αpn, con n ≥ 1y α ≤ (1− p)/p.

(a) ¿Que proporcion de familias no tienen hijos?

(b) Si es igualmente probable que cada infante que nace sea nino o nina (in-dependientemente de los demas), ¿que proporcion de familias consiste de kninos (y cualquier numero de ninas)?

Page 47: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

Capıtulo 3

Variable aleatoria continua

Mientras las variables aleatorias discretas han permitido un acercamiento a los concep-tos a ellas asociados, y son utiles para el analisis de situaciones con cantidades discretasasociadas, las variables aleatorias continuas ofrecen mayor generalidad, ademas de per-mitir el uso de herramientas del calculo que facilitan los calculos.

Aunque, se debe tener en cuenta que en la actualidad la mayorıa de las senales deinteres para la ingenierıa se encuentran en formato digital, por lo que se trata desenales discretas de valores discretos, pero con una adecuada resolucion es posibletratar estas senales como si fueran contınuas, por lo que los conceptos vistos en estecapıtulo constituyen los pilares para buena parte de la ingenierıa moderna y como talesdeben ser estudiados cuidadosamente.

3.1. Funciones de densidad de probabilidad (PDF)

Una variable aleatoria X es llamada continua si existe una funcion no-negativa fX ,llamada la funcion densidad de probabilidad de X, o PDF de manera abreviada, talque

P (X ∈ B) =

∫B

fX(x)dx

para cada subconjunto B de la recta real. En particular, la probabilidad de que el valorde X caiga dentro de un intervalo es

P (a ≤ X ≤ b) =

∫ b

a

fX(x)dx

y puede ser interpretada como el area bajo la grafica de la PDF. La siguiente figurailustra este concepto

47

Page 48: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

48 CAPITULO 3. VARIABLE ALEATORIA CONTINUA

Figura 3.1: Ilustracion de una PDF. La probabilidad de que el valor de X este en elintervalo [a, b] es el area bajo la curva de la PDF en ese intervalo.

Para un valor particular, tenemos que

P (X = a) =

∫ a

a

fX(x)dx = 0

Debe observarse que para calificar como una PDF, una funcion fX(x) debe ser nonegativa, es decir fX(x) ≥ 0 para todo x, y tambien debe cumplir la propiedad denormalizacion: ∫ ∞

−∞fX(x)dx = P (−∞ < X <∞) = 1

Es importante tener en cuenta que aunque una PDF es usada para calcular proba-bilidades de eventos,no es la probabilidad de un evento. En particular una PDF noesta restringida a ser menor o igual a 1.

3.1.1. Propiedades de la PDF

Sea X una variable aleatoria continua con PDF fX

fX(x) ≥ 0 para todo x∫ ∞−∞

fX(x)dx = 1

Si δ es un numero muy pequeno, entonces P ([x, x+ δ]) ≈ fX(x) · δ

Para cualquier sub-conjunto B de la recta real,

P (X ∈ B) =

∫B

fX(x)dx

Page 49: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

3.1. FUNCIONES DE DENSIDAD DE PROBABILIDAD (PDF) 49

3.1.2. Esperanza matematica

La esperanza matematica, valor esperado o media de una variable aleatoria continuaX esta definida por

E [X] =

∫ ∞−∞

xfX(x)dx

Si X es una variable aleatoria continua con PDF dada, cualquier funcion de valor realY = g(X) de X es tambien una variable aleatoria que puede ser continua o discreta.La media de g(X) satisface la regla del valor esperado:

E [g(X)] =

∫ ∞−∞

g(x)fX(x)dx

De manera similar que para variables aleatorias discretas ,el n-esimo momento de unavariable aleatoria continua X esta definida como E[Xn], es decir, el valor esperado dela variable aleatoria Xn. La varianza, denotada por var(X), esta definida como el valoresperado de la variable aleatoria (X − E[X])2.

3.1.3. Propiedades del valor esperado

Sea X una variable aleatoria continua con PDF fX

La esperanza o valor esperado de X esta definido por

E [X] =

∫ ∞−∞

xfX(x)dx

La regla del valor esperado para una funcion g(X) tiene la forma

E [g(X)] =

∫ ∞−∞

g(x)fX(x)dx

La varianza de X se define como

var (x) = E[(X − E [X])2

]=

∫ ∞−∞

(X − E [X])2fX(x)dx

Se tiene

0 ≤ var (X) = E[X2]− (E [X])2

Si Y = aX + b, donde a y b son escalares dados, entonces

E [Y ] = aE [X] + b, var (Y ) = a2var (X)

Page 50: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

50 CAPITULO 3. VARIABLE ALEATORIA CONTINUA

3.1.4. Variable aleatoria Exponencial

Una variable aleatoria exponencial tiene una PDF de la forma

fX(x) =

λe−λx, six ≥ 0

0, en otro caso

donde λ es un parametro positivo que caracteriza la PDF.

Una variable aleatoria exponencial puede ser un buen modelo para la cantidad detiempo que transcurre hasta que un evento de interes ocurre, como la llegada de unmensaje a un computador, la falla de un equipo, etc.. El parametro λ es la tasa dellegada u ocurrencia del evento. Esta ligada a la variable aleatoria de Poisson, de lasiguiente manera: Mientras que la PMF de Poisson describe el numero de ocurrencias enun intervalo de tiempo fijo t, la funcion densidad de probabilidad exponencial describeel tiempo de espera T para la ocurrencia del siguiente evento.

3.1.5. Propiedad de no memoria de la v. a. exponencial

La variable aleatoria exponencial satisface la propiedad de no memoria, es decir quecumple

P (X > t+ h,X > t) = P (X > h)

3.1.6. Ejercicios propuestos

3.1.1. Usted llega al paradero de buses a las 10 en punto, sabiendo que el bus llegara conigual probabilidad en algun momento entre las 10 y las 10:30.

(a) ¿Cual es la probabilidad de que tenga que esperar mas de 10 minutos?

(b) Si a las 10:15 el bus no ha llegado, cual es la probabilidad de que tenga queesperar al menos otros 10 minutos?

3.1.2. Una estacion de gasolina es reabastecida una vez por semana. Su volumen deventas en miles de galones es una variable aleatoria X con la siguiente PDF

fX(x) =

5(1− x)4, si 0 < x < 1

0, en otro caso

¿Cual deberıa ser la capacidad del tanque de la estacion para que la probabilidadde quedarse sin gasolina sea 0.01?

3.1.3. El tiempo, en anos, que un radio funciona es una variable aleatoria exponen-cial con parametro lambda=1/8. Si Juan compra un radio usado, ¿cual es laprobabilidad de que este aun funcionando ocho anos despues de comprado?

Page 51: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

3.2. FUNCION DE DISTRIBUCION ACUMULATIVA 51

3.1.4. Una popular marca de ropa recibe ordenes de compra por internet a travesde dos sistemas de ruteo diferentes. Se sabe que el tiempo entre la llegada deordenes para cada sistema esta exponencialmente distribuido con una media de3.2 minutos en un dıa normal. Ambos sistemas operan independientemente.

(a) ¿Cual es la probabilidad de que no se reciban ordenes en un periodo de 5minutos? ¿Y en un periodo de 10 minutos?

(b) ¿Cual es la probabilidad de que ambos sistemas reciban dos ordenes cadauno entre los 10 y los 15 minutos despues de que el sitio abre su operacion?

3.2. Funcion de distribucion acumulativa

La funcion de distribucion acumulativa (Cumulative Distribution Function, CDF) per-mite tratar variables aleatorias discretas y continuas bajo un unico concepto ma-tematico. La CDF de una variable aleatoria X, denotada por FX , da la probabilidadP (X ≤ x). En, particular, para cualquier x se tiene

FX(x) = P (X ≤ x) =

∑k≤x pX(k), si X es discreta

∫ x−∞ fX(t)dt, si X es continua

En otras palabras, la CDF FX(x) “acumula” la probabilidad hasta el valor x.

Se puede definir la CDF para cualquier variable aleatoria debido a que el evento X ≤x siempre es un evento y por lo tanto tiene una probabilidad apropiadamente definida.

3.2.1. Propiedades de una CDF

La CDF FX de una variable aleatoria X se define por

FX(x) = P (X ≤ x) , para todo x

y tiene las siguientes propiedades

FX es monotonamente no decreciente:

sia ≤ b, entonces FX(a) ≤ FX(b)

FX tiende a 0 cuando x→ −∞, y tiende a 1 cuando x→∞.

Si X es discreta, entonces FX(x) es una funcion de x constante por tramos.

Si X es continua, entonces FX(x) es una funcion continua de x.

Page 52: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

52 CAPITULO 3. VARIABLE ALEATORIA CONTINUA

Si X es discreta y toma valores enteros, la PMF y la CDF pueden obtenerse unade la otra sumando o restando:

FX(k) =k∑

i=−∞

pX(i),

pX(k) = P (X ≤ k)−P (X ≤ k − 1) = FX(k)− FX(k − 1)

para cualquier entero k.

Si X es continua, PDF y la CDF pueden ser obtenidas la una de la otra porintegracion o diferenciacion:

FX(x) =

∫ x

−∞fX(t)dt

fX(x) =dFXdx

(x)

(La segunda igualdad es valida para aquellos x para los cuales la PDF es contınua.)

3.2.2. Ejercicios propuestos

3.2.1. Considere un triangulo y un punto dentro de ese triangulo ubicado de acuerdoa una ley de probabilidad uniforme. Sea X la distancia entre el punto y la basedel triangulo.Dada la altura h del triangulo, encuentre la CDF y la PDF de X.

3.3. Variable aleatoria Normal o Gaussiana

Una variable aleatoria continua X es llamada Gaussiana o normal si tiene una PDF dela forma

fX(x) =1√2πσ

e−(x−µ)2/2σ2

donde µ y σ2 son parametros de la distribucion y representan la media y la varianzade X, respectivamente.

3.3.1. La normalidad es preservada por transformaciones li-neales

Si X es una variable aleatoria Gaussiana con media µ y varianza σ2, y si a 6= 0 y b yson escalares, entonces la variable aleatoria

Y = aX + b

Page 53: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

3.3. VARIABLE ALEATORIA NORMAL O GAUSSIANA 53

es tambien Gaussiana con media y varianza

E [Y ] = aµ+ b, var (y) = a2σ2

3.3.2. La Variable aleatoria Normal Estandar

Una variable aleatoria Gaussiana Z con media cero y varianza unitaria se conoce comouna variable aleatoria normal o Gaussiana estandar. Para esta variable tenemos que suCDF, denotada por Φ(z) es

Φ(z) = P (Z ≤ z) = P (Z < z) =1√2π

∫ z

−∞e−t

2/2dt

Esta integral no se puede evaluar de forma cerrada, por lo que requiere una evaluacionnumerica. Por esta razon existen tablas de la funcion Φ para varios valores de z.

El procedimiento para calcular una probabilidad de la forma

P (X < x) =1√2πσ

∫ x

−∞e−(x−µ)

2/2σ2

para una variable aleatoria Gaussiana X con media µ y varianza σ2 es estandarizar lavariable mediante el cambio de variable

Z =X − µσ

y luego usar tablas de la funcion Q:

P (X < x) = P

(X − µσ

<x− µσ

)= P

(Z <

x− µσ

)= Φ

(x− µσ

)

La variables aleatorias Gaussianas se emplean en el procesamiento de senales e in-genierıa de comunicaciones, para modelar el modelar el ruido y la distorsion de lassenales.

Las variables aleatorias Gaussianas juegan un papel importante en un rango ampliode modelos probabilısticos, la razon principal es que modelan bien el efecto de muchosfactores independientes en una variedad de contextos estadısticos de fısica e ingenierıa.

3.3.3. Ejercicios propuestos

3.3.1. La temperatura de una ciudad es modelada como una variable aleatoria normalcon media igual a 10 oC y desviacion estandar igual a 10 oC.¿Cual es la probabilidad de que la temperatura en un tiempo escogido al azarsea menor o igual a 59 oF? (Dato: F=1.8C+32)

Page 54: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

54 CAPITULO 3. VARIABLE ALEATORIA CONTINUA

3.3.2. Un mensaje binario es transmitido como una senal s, que puede tomar los valores+1 o -1. El canal de comunicacion degrada la transmision con ruido aditivogaussiano con media µ = 0 y varianza σ2. El receptor concluye que la senal -1(o +1) fue transmitida si el valor recibido es menor a 0 (o mayor o igual a 0,respectivamente).¿Cual es la probabilidad de error?

3.3.3. El peso de ciertos ladrillos usados para la construccion esta distribuido de formaGaussiana con media de µ = 3,75 libras y desviacion estandar de σ = 0,25libras. Asuma que los pesos de los ladrillos son independientes y que una muestraaleatoria de 20 ladrillos es seleccionada.

(a) ¿Cual es la probabilidad de que todos los ladrillos en la muestra tengan unpeso mayor a 2.75 libras?

(b) ¿Cual es la probabilidad de que el ladrillo mas pesado de la muestra tengaun peso mayor a 3.75 libras?

3.4. PDF conjunta de multiples variables aleatorias

Decimos que dos variables aleatorias continuas asociadas con el mismo experimentoson conjuntamente continuas y pueden ser descritas en terminos de una PDF conjunta,fx,y, si fx,y es una funcion no negativa que satisface

P ((X, Y ) ∈ B) =

∫∫(x,y)∈B

fX,Y (x, y)dxdy

para cualquier subconjunto B del plano bidimensional. En el caso particular donde Bes un rectangulo de la forma B = (x, y)|a ≤ x ≤ b, c ≤ y ≤ d, se tiene

P (a ≤ X ≤ b, c ≤ Y ≤ d) =

∫ d

c

∫ b

a

fX,Y (x, y)dxdy

Ademas, se cumple que si B es todo el plano bidimensional, se obtiene la propiedad denormalizacion ∫ ∞

−∞

∫ ∞−∞

fX,Y (x, y)dxdy = 1

La PDF marginal de X, fX(x), puede ser calculada en terminos de la PDF conjuntafX,Y (x, y)

fX(x) =

∫ ∞−∞

fX,Y (x, y)dy

y de forma se puede calcular la PDF marginal de Y

fY (y) =

∫ ∞−∞

fX,Y (x, y)dx

Page 55: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

3.5. CONDICIONAMIENTO 55

3.4.1. Ejercicios propuestos

3.4.1. Una ambulancia esta dispuesta para atender accidentes en un tramo de carre-tera de largo L, y para ello lo recorre continuamente. En un cierto instante unaccidente ocurre en algun punto aleatorio de la carretera. Asumiendo que la po-sicion de la ambulancia en la carretera en ese instante tambien es aleatoria yes independiente del lugar del accidente, calcule la PDF de la distancia de laambulancia al accidente.

3.4.2.

3.5. Condicionamiento

3.5.1. Condicionamiento de una variable aleatoria sobre unevento

La PDF condicional de una variable aleatoria continua X, dado un evento A conP (A) > 0, es definida como una funcion no negativa fX|A que satisface

P (X ∈ B|A) =

∫B

fX|A(x)dx

para cualquier subconjunto B de la recta real. En el importante caso especial dondecondicionamos sobre un evento de la forma X ∈ A, con P (X ∈ A) > 0, la definicionde probabilidades condicionales produce

P (X ∈ B|X ∈ A) =P (X ∈ B,X ∈ A)

P (X ∈ A)=

∫A∩B fX(x)

P (X ∈ A)

De lo que se puede concluir que

fX|X∈A(x) =

fX(x)

P(X∈A) , si x ∈ A0, para otro valor

Cuando multiples variables aleatorias son involucradas, hay una nocion similar de unaPDF conjunta condicional. Suponga, por ejemplo, que X y Y son conjuntamente va-riables aleatorias continuas, con PDF conjunta fX,Y . Si se condiciona sobre un eventode probabilidad positiva de la forma C = (X, Y ) ∈ A, se tiene

fX,Y |C(x, y) =

fX,Y (x,y)

P(C), si (x, y) ∈ A

0, para otro valor

Page 56: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

56 CAPITULO 3. VARIABLE ALEATORIA CONTINUA

Se observa finalmente que hay una version del teorema de probabilidad total que in-volucra PDFs condicionales: Si los eventos A1, A2, . . . , An forman una particion delespacio muestral, entonces

fX =n∑i=1

P (Ai) fX|Ai(x)

3.5.2. Condicionando una variable aleatoria sobre otra

Sean X y Y variables aleatorias continuas con PDF conjunta fX,Y . Para cualquier ycon fY (y) > 0, la PDF condicional de X dado que Y = y, esta definida por

fX|Y (x|y) =fX,Y (x, y)

fY (y)

Para interpretar la PDF condicional, se definen dos numeros pequenos y positivos δ1y δ2, y se condiciona sobre el evento B = y ≤ Y ≤ y + δ2. Se tiene

P (x ≤ X ≤ x+ δ1|y ≤ Y ≤ y + δ2) = P(x≤X≤x+δ1 y y≤Y≤y+δ2)P(y≤Y≤y+δ2)

≈ fX,Y (x,y)δ1δ2fY (y)δ2

= fX|Y (x|y)δ1

En palabras, fX|Y (x|y)δ1 representa la probabilidad de que X pertenezca a un pequenointervalo [x, x + δ1], dado que Y pertenece a un pequeno intervalo [y, y + δ2]. Ya quefX|Y (x|y)δ1no depende de δ2, podemos pensar en el caso lımite donde δ2 decrece a ceroy escribir

P (x ≤ X ≤ x+ δ1|Y = y) ≈ fX|Y (x|y)δ1 (δ1pequeno)

y, de forma general

P (X ∈ A|Y = y) =

∫A

fX|Y (x|y)dx

3.5.3. Esperanza Condicional

Sean X y Y variables aleatorias continuas conjuntamente, y sea A un evento conP (A) > 0, la esperanza condicional de X dado A esta definida por:

E [X|A] =

∫ ∞−∞

xfX|A(x)dx

La esperanza condicional de X dado que Y = y esta definida por

E [X|Y = y] =

∫ ∞−∞

xfX|Y (x|y)dx

Page 57: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

3.5. CONDICIONAMIENTO 57

La regla del valor esperado toma la siguiente forma para una funcion g(X)

E [g(X)|A] =

∫ ∞−∞

g(X)fX|A(x)dx

y

E [g(X)|Y = y] =

∫ ∞−∞

g(X)fX|Y (x|y)dx

El teorema de la esperanza total toma la siguiente forma, sean A1, A2, . . . , An eventosdisjuntos que forman una particion del espacio muestral, y asuma que P (Ai) > 0 paratoda i, entonces

E [X] =n∑i=1

P (Ai) E [X|Ai]

De forma similar

E [X] =

∫ ∞−∞

E [E|Y = y] fY (y)dy

3.5.4. Independencia

En completa analogıa con el caso discreto, decimos que dos variables aleatorias con-tinuas X y Y son independientes si su PDF conjunta es el producto de las PDFsmarginales:

fX,Y (x, y) = fX(x)fY (y) para todo x, y

lo cual es equivalente a la condicion

fX|Y (x|y) = fX(x) para todo y con fY (y) > 0 y todo x

Si X y Y son independientes se cumple que

E [XY ]) = E [X] E [Y ]

ademas, para cualquier funcion g y h, las variables aleatorias g(X) y h(Y ) son inde-pendientes y se cumple

E [g(X)h(Y )]) = E [g(X)] E [h(Y )]

Tambien se cumplevar (X + Y ) = var (X) + var (Y )

3.5.5. Ejercicios propuestos

3.5.1. Un profesor descuidado cita a dos de sus estudiantes a la misma hora. Las dura-cion de las reuniones es independiente una de la otra y tienen una distribucionexponencial con media de 30 minutos. El primer estudiante llega a tiempo, peroel segundo llega cinco minutos tarde.¿Cual es el valor esperado del tiempo entre la llegada del primer estudiante y lapartida del segundo estudiante?

Page 58: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

58 CAPITULO 3. VARIABLE ALEATORIA CONTINUA

3.6. La regla de Bayes continua

En muchas situaciones se representa un fenomeno no observado por una variable alea-toria X con PDF fX y se realiza una medida ruidosa Y , que es modelada en terminosde una PDF condicional fY |X . Una vez el valor de Y es medido, ¿que informacion ofrecesobre el valor desconocido de X? Este es un escenario similar al planteado en el modulo1 para introducir la regla de Bayes y usarla para solucionar problemas de inferencia,la unica diferencia es que ahora se esta tratando con variables aleatorias continuas.

fX|Y (x|y) =fX(x)fY |X(y|x)

fY (y)

Y, basado en la propiedad de normalizacion, esto es equivalente a

fX|Y (x|y) =fX(x)fY |X(y|x)∫∞

−∞ fX(t)fY |X(y|t)dt

3.6.1. Inferencia acerca de una variable aleatoria discreta

En algunos casos el fenomeno no observado es inherentemente discreto. Por ejemplo,considere una senal binaria que es observada en presencia de ruido Gaussiano, o undiagnostico medico que es hecho sobre la base de mediciones continuas tales comotemperaturas o presion sanguınea. En tales casos una version un poco diferente de laregla de Bayes aplica. Consideremos primero el caso donde el fenomeno no observado esdescrito por un evento A cuya ocurrencia es desconocida. Sea P (A) la probabilidad delevento A. Sea Y una variable aleatoria continua y asuma que las PDFs condicionalesfY |A(y) y fY |A′(y) son conocidas. Estamos interesados en la probabilidad condicionalP (A|Y = y) del evento A dado que Y toma el valor y.

Esta probabilidad esta dada por

P (A|Y = y) =P (A) fY |A(y)

fY (y)

El denominador puede ser evaluado usando la siguiente version del teorema de proba-bilidad total

fY (y) = P (A) fY |A(y) + P (Ac) fY |Ac(y)

de este modo resulta

P (A|Y = y) =P (A) fY |A(y)

P (A) fY |A(y) + P (Ac) fY |Ac(y)

En una variante de esta formula consideramos el evento N = n donde N es unavariable aleatoria discreta que representa las diferentes posibilidades discretas para elfenomeno no observado de interes. Sea PN la PMF de N. Sea Y una variable aleatoria

Page 59: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

3.6. LA REGLA DE BAYES CONTINUA 59

continua que, para cualquier valor dado n de N, esta descrita por una PDF condicionalfY |N(y|n). La formula anterior se convierte en

P (N = n|Y = y) =PN(n)fY |N(y|n)

fY (y)

donde el denominador puede ser evaluado usando la siguiente version del teorema deprobabilidad total

fY (y) =∑i

PN(i)fY |N(y|i)

3.6.2. Inferencia basada en observaciones discretas

Se observa que la formula que exrpesa P (A|Y = y) en terminos de fY |A(y) se puedeintercambiar para obtener

fY |A(y) =fY (y)P (A|Y = y)

P (A)

Y con base en la propiedad de normalizacion∫∞−∞ fY |A(y)dy = 1, se obtiene la expresion

equivalente

fY |A(y) =fY (y)P (A|Y = y)∫∞−∞ fY (t)P (A|Y = t)

Esta formula se puede usar para hacer inferencia de la variable aleatoria Y cuando seha observado un evento A. Existe una formula similar para el caso en que el el eventoA es de la forma N = n, siendo N una variable aleatoria discreta observada, quedepende de Y en la manera descrita por la PMF condicional PN |Y (y).

3.6.3. Ejercicios propuestos

3.6.1. Una maquina acunadora defectuosa produce monedas cuya probabilidad de caercara es una variable aleatoria P con PDF

fP (p) =

pep, si 0 <= p <= 1

0, enotrocaso

Se selecciona una moneda producida por la maquina y se lanza repetidamente,y los lanzamientos consecutivos se consideran independientes.

(a) Encuentre la probabilidad de que un lanzamiento resulte en cara.

(b) Dado que un lanzamiento resulto en cara

(c) Dado que el un lanzamiento resulto en cara, encuentre la probabilidad con-dicional de que el siguiente resulte en cara.

Page 60: Notas breves para un curso de Probabilidad y Estad stica · Conan Doyle, Arthur: Estudio en escarlata, Las aventuras de Sherlock Holmes Poe, Edgar Allan: Los cr menes de la Calle

60 CAPITULO 3. VARIABLE ALEATORIA CONTINUA

3.6.2. Deteccion de senales en presencia de ruido. Se transmite una senal binaria S yse sabe que P (S = 1) = p, y el otro valor posible es -1. La senal recibida esY = N + S, siendo N ruido Gaussiano estandar independiente de S.¿Cual es la probabilidad de S = 1 en funcion del valor observado Y ?