probabilidad - dma.etsisi.upm.es€¦ · esto permiti´o que la probabilidad, ahora con el soporte...

29
Tema 2 Probabilidad 2.1 ¿Por qu´ e estudiar Probabilidad en Computaci´ on? El ser humano ha convivido desde siempre con la incertidumbre. Estamos tan acostumbrados a aceptar hechos que conocemos de manera fragmentaria, a razonar a partir de premisas incompletas, a tomar decisiones basadas en creencias subjetivas, que la presencia de la incertidumbre nos resulta natural. Si salimos a la calle, lo m´ as probable es que, antes de decidir qu´ e ropa ponernos, consideremos las posibilidades de lluvia, quiz´ as s´ olo observando el trozo de cielo que nos deja ver la ventana, quiz´ as recordando la estaci´ on del a˜ no y el tiempo que hizo en los ´ ultimos d´ ıas. En todo caso, lo ´ unico que hemos hecho es decidir en base a un razonamiento aproximado y cargado de incertidumbre. La causa de esa presencia ubicua de la incertidumbre es la extraordinaria complejidad de la realidad, la multitud de causas que se esconden detr´as de hechos simples y que nos resulta dif´ ıcil de comprender. Sin embargo, sobrevivimos en medio de esa sopa de incertidumbre que nos rodea: tomamos decisiones, creamos modelos para explicar la realidad, nos esforzamos por comprender esa aleatoriedad, por tratarla y sacar provecho de ella, razonamos en su presencia e incluso acumulamos conocimiento a su pesar. Hay muchos fen´ omenos f´ ısicos gobernados por la incertidumbre, como por ejemplo los fen´ omenos microsc´ opicos. Pensemos en el comportamiento de los gases, formados por much´ ısimas part´ ıculas cuyo comportamiento se describe teniendo en cuenta las interacciones aleatorias entre ellas. A pesar de esto, hay una teor´ ıa de los gases que predice con bastante exactitud el comportamiento macrosc´ opico, lo cual no deja de sorprendernos. Sin duda, donde reina la incertidumbre por sus fueros es en la Mec´anica Cu´antica, entronizada por el principio de Heisenberg enunciado en el a˜ no 1927. Este principio afirma que cuanto m´ as precisa es la medida de la posici´ on de un electr´ on, m´ as imprecisa es la medida de su velocidad, de modo que no es posible conocer ambos con precisi´ on absoluta. ¿Hay una afirmaci´on m´as rotunda de la incertidumbre? Las consecuencias de este principio son profund´ ısimas y alcanzan a la ciencia y la t´ ecnica de nuestros d´ ıas, pues termina con una manera determinista de concebir el conocimiento. No s´ olo en los fen´omenos cu´anticos aparece la incertidumbre; quiz´ as en este campo es as patente a causa del principio de incertidumbre, pero a medida que el progreso cient´ ıfico exigi´ o un conocimiento en profundidad de los fen´ omenos, con m´ as capacidad de predicci´on, la incertidumbre empieza a aparecer de modo natural. Antes del desarrollo de la probabilidad y 21

Upload: others

Post on 13-Apr-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

Tema 2

Probabilidad

2.1 ¿Por que estudiar Probabilidad en

Computacion?

El ser humano ha convivido desde siempre con la incertidumbre. Estamos tan acostumbradosa aceptar hechos que conocemos de manera fragmentaria, a razonar a partir de premisasincompletas, a tomar decisiones basadas en creencias subjetivas, que la presencia de laincertidumbre nos resulta natural. Si salimos a la calle, lo mas probable es que, antes de decidirque ropa ponernos, consideremos las posibilidades de lluvia, quizas solo observando el trozo decielo que nos deja ver la ventana, quizas recordando la estacion del ano y el tiempo que hizo enlos ultimos dıas. En todo caso, lo unico que hemos hecho es decidir en base a un razonamientoaproximado y cargado de incertidumbre. La causa de esa presencia ubicua de la incertidumbrees la extraordinaria complejidad de la realidad, la multitud de causas que se esconden detras dehechos simples y que nos resulta difıcil de comprender. Sin embargo, sobrevivimos en medio deesa sopa de incertidumbre que nos rodea: tomamos decisiones, creamos modelos para explicarla realidad, nos esforzamos por comprender esa aleatoriedad, por tratarla y sacar provecho deella, razonamos en su presencia e incluso acumulamos conocimiento a su pesar.

Hay muchos fenomenos fısicos gobernados por la incertidumbre, como por ejemplo losfenomenos microscopicos. Pensemos en el comportamiento de los gases, formados pormuchısimas partıculas cuyo comportamiento se describe teniendo en cuenta las interaccionesaleatorias entre ellas. A pesar de esto, hay una teorıa de los gases que predice con bastanteexactitud el comportamiento macroscopico, lo cual no deja de sorprendernos. Sin duda, dondereina la incertidumbre por sus fueros es en la Mecanica Cuantica, entronizada por el principiode Heisenberg enunciado en el ano 1927. Este principio afirma que cuanto mas precisa es lamedida de la posicion de un electron, mas imprecisa es la medida de su velocidad, de modoque no es posible conocer ambos con precision absoluta. ¿Hay una afirmacion mas rotundade la incertidumbre? Las consecuencias de este principio son profundısimas y alcanzan a laciencia y la tecnica de nuestros dıas, pues termina con una manera determinista de concebir elconocimiento.

No solo en los fenomenos cuanticos aparece la incertidumbre; quizas en este campo esmas patente a causa del principio de incertidumbre, pero a medida que el progreso cientıficoexigio un conocimiento en profundidad de los fenomenos, con mas capacidad de prediccion, laincertidumbre empieza a aparecer de modo natural. Antes del desarrollo de la probabilidad y

21

Page 2: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

22 Probabilidad

la estadıstica los analisis de los problemas eran deterministas, y sus conclusiones, limitadas. Laincertidumbre, entre otros muchos campos, aparece en:

• Economıa y Ciencias Sociales: comportamiento de mercados, ındices bursatiles,tendencias sociales, resultados de elecciones, etc.

• Ingenierıa: procesos de fabricacion, control de calidad, planificacion de tareas, medicionesde caracterısticas, etc.

• Informatica y Computacion: trafico en redes de comunicaciones, tiempo de ejecucion deprogramas, accesos a paginas web, comportamiento de estructuras de datos, gestion derecursos, etc.

Esa incertidumbre es consecuencia de que los fenomenos que estudiamos vienen dados porun alto numero de causas, muchas de ellas de pequeno efecto, interdependientes de un mododesconocido, y de comportamiento difıcil de explicar o modelizar. De esto se sigue la necesidadde incorporar la incertidumbre al razonamiento, a la deduccion, en suma, al metodo cientıfico. Sipretendemos tener modelos que expliquen la realidad, entonces no podemos ignorar ese aspecto.La Teorıa de la Probabilidad es la rama de las Matematicas que materializa tal incorporacion.Podrıamos decir que la probabilidad es la logica de la incertidumbre.

Feller (1906 - 1970), uno de los grandes probabilistas del siglo XX, resaltaba de laprobabilidad tres caracterısticas, que a su juicio, le proporcionan su utilidad y belleza1:

• Intuicion. La probabilidad es intuitiva porque la usamos en el razonamiento cotidiano.Nos sirve para cuantificar el conocimiento subjetivo que tenemos de un hecho y tomardecisiones.

• Formalismo logico. La probabilidad es de suma importancia para el metodo cientıfico. Apartir de Kolmogorov, que introduce la definicion axiomatica de probabilidad, esta se unecon la logica, esto es, con las leyes del pensamiento. Esto permitio que la probabilidad,ahora con el soporte de la logica, se desarrollase como una rama del conocimientoplenamente independiente. Esta union de la logica y la intuicion parece que es lo quedesconcierta al estudiante en un primer momento.

• Aplicaciones. Son muchas y en los ambitos mas diversos. Nombrar todas sus aplicacionesserıa largo, pero, dado que este material esta dirigido a alumnos de Informatica, merecela pena nombrar algunas de las mas relevantes. Sin embargo, dejamos al alumno que lasbusque el por su cuenta; vease el problema mas abajo 2.1.1.

Problema 2.1.1 Buscad en internet aplicaciones de la probabilidad a la Computacion. Almenos deberıais encontrar cinco grandes aplicaciones, de relevancia. No traigais a clase nadaque no entendais.

1Cita tomada de su famoso libro An Introduction to Probability Theory and Its Applications, cuya primeraedicion es de 1963.

Page 3: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.2. Razonamiento probabilıstico 23

2.2 Razonamiento probabilıstico

El razonamiento probabilıstico debe estar presente en la formacion de un cientıfico o un tecnicopor la sencilla razon de que es parte del metodo cientıfico. ¿Justifica esto que haya que incluirel estudio de la probabilidad? Para contestar a esto querrıamos examinar el informe TheJoint Task Force for Computing Curricula 2005, publicado en 2005 por la ACM americana, laasociacion mas importante de Informatica2. En dicho informe daba la siguiente definicion decomputacion (nuestra traduccion):

De modo general, podemos dar el significado de computacion a toda actividadque especıficamente requiera ordenadores, se beneficie de ellos o los cree. Asıpues, la computacion incluye: el diseno de sistemas hardware y software para unamplio rango de objetivos; procesamiento, estructuracion y gestion de varios tiposde informacion; la realizacion de estudios cientıficos; hacer que los ordenadoresse comporten inteligentemente; crear y usar comunicaciones y entretenimientomultimedia; buscar y recopilar informacion relevante para cualquier objetivoparticular, entre otros. La lista es virtualmente interminable y las posibilidadesson infinitas. Computacion tiene otros significados que son mas especıficos, basadosen el contexto en que se usa el termino. Por ejemplo, un especialista en sistemasde informacion vera el termino computacion de modo diferente al de un ingenierode software. Con independencia del contexto, hacer computacion de calidadpuede ser complicada difıcil y complicado. Porque la sociedad necesita gente quehaga computacion de calidad, concebimos la computacion no solamente como unaprofesion sino como una disciplina cientıfica.

Dentro de esta definicion se encuentran varios conceptos importantes. Resaltarıamosdos: la concepcion de la computacion como una disciplina cientıfica, la cual, como todadisciplina, requiere de capacidad de abstraccion y rigor; y la definicion de computacion comoprocesamiento de la informacion en contextos muy generales y dispares. La definicion dedisciplina cientıfica incluye el uso del metodo cientıfico, y dentro de este se encuentra elrazonamiento probabilıstico y estadıstico. Respecto al procesamiento, este a su vez descansaen otros dos conceptos relevantes: el de algoritmo o procedimiento finito de resolucion de unproblema y las estructuras de datos u organizacion eficiente de la informacion implicada endicho problema (en los proximos temas se ampliaran estos conceptos).

Vamos a desarrollar un ejemplo (informatico) que mostrara la utilidad y, a la vez, el caracterdel razonamiento probabilıstico. Consideremos un problema muy frecuente en informatica: laordenacion. Supongamos que tenemos una matriz de n numeros distintos M = {a1, · · · , an}.Un algoritmo muy conocido para ordenar es el llamado quicksort. Es este un algoritmo recursivoque funciona del siguiente modo: toma a1, que llamaremos el pivote, y subdivide la matriz Men dos submatrices I1 = {ai, · · · , ak} y D1 = {ak+1, · · · , aj} de tal manera que a1 es menorque cualquier elemento de I1 y mayor que cualquiera de los de D1. El algoritmo, despues deesta primera operacion, se llama a sı mismo sobre las submatrices I1 y D1. Si alguna submatriztiene tamano uno o cero, la recursion se para. Es claro que tras la particion de M en I1 y D1, elelemento a1 esta ordenado correctamente; vease la figura 2.4 para ver ilustrada esta explicacion.

2ACM Computing Curricula. The Joint Task Force for Computing Curricula 2005. http://www.acm.org/education/curricvols/CC2005-March06Final.pdf,2005.

Page 4: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

24 Probabilidad

!"#"$"%"&"'"(")"*

#"$"%"' &"(")"*!$"%"' "

%"' #

$%&

' (")"*

)"*

(%)

*

Figura 2.1: Ejecucion del algoritmo quicksort

Cabe preguntarse por la velocidad de este algoritmo. La velocidad o tiempo de ejecucionde un algoritmo es una de las principales variables a la hora de compararlo con otro algoritmoque resuelva el mismo problema. Otras variables que influyen son la cantidad de memoria, lasencillez conceptual del algoritmo, el uso de estructuras de datos simples, etc. Y aquı aparecela incertidumbre: la velocidad depende del numero de datos y del orden en que aparezcan.Ciertamente, la expresion exacta de la velocidad del algoritmo sera compleja. Tendra quellevar la cuenta del numero de comparaciones, de intercambios, del paso de parametros en lasllamadas recursivas, etc., y todas estas cantidades varıan de una entrada de datos a otra. Porsimplificar el analisis, nos detendremos solo en el numero de comparaciones. Llamemos T (n) aese numero, donde n es el numero de datos de entrada.

¿Que ocurre si los numeros de M estan ordenados? En ese caso, la submatriz I1 esta vacıade elementos, ya que no existen elementos menores que el pivote, y D1 tiene n� 1 elementos.Queda entonces la siguiente ecuacion recursiva:

T (n) = O(n� 1) + T (n� 1),

cuya solucion es T (n) cn2 (c > 0 es una constante que no tiene importancia en este momento.)En este caso, tenemos un algoritmo cuadratico. Demonos cuenta de que este analisis haconsiderado solo la peor situacion posible, que los datos vengan ordenados, sin hacer otrasconsideraciones. Por ejemplo, no revela la frecuencia con que aparece ese caso mas desfavorablee ignora la incertidumbre del problema. Este tipo de analisis se llama del peor caso y es detipo determinista.

Cambiemos el enfoque e introduzcamos la incertidumbre y, detras de ella, el razonamientoprobabilıstico. El comportamiento del algoritmo dependera de como se hagan las particionessucesivas de las matrices. Si el pivote deja dos submatrices de aproximadamente el mismotamano, el algoritmo ira rapido; si deja una submatriz con muchos elementos y la otra conpocos, el algoritmo sera lento. Ahora tendremos en cuenta la eleccion del pivote y el tiempo deejecucion que resulta de ese pivote. Calculamos como medida de la velocidad del algoritmo elpromedio de todos esos tiempos. Este analisis se llama analisis en media y es mas difıcil queel analisis en el peor de los casos visto antes. La ecuacion de recurrencia que sale en el analisisen media es (su obtencion no es relevante en este momento):

T (n) =1

n

T (1) + T (n� 1) +

n�1X

i=1

(T (i) + T (n� i))

!+O(n),

cuya solucion es T (n) = n log n, c > 0. Es sorprendente que la velocidad en media sea mucho

Page 5: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.3. Problemas preliminares 25

menor que la velocidad en el peor de los casos.

¿Que conclusiones podemos sacar de los dos analisis anteriores? En primer lugar, espreferible usar un algoritmo O(n log n) para ordenar que uno O(n2) porque es mucho masrapido. En segundo, lugar, podrıamos pensar en modificar el algoritmo para que las llamadasrecursivas se produjesen sobre matrices del mismo tamano aproximadamente. Esto, claro, harıamas complicado el algoritmo; esta idea ya se ha puesto en practica a traves de los arboles AVL oarboles equilibrados. Pero siendo mas finos en el analisis, nos damos cuenta de que el algoritmoen media ya corre en tiempo O(n log n). En la practica este algoritmo es de los mas usados yse implementa tal cual esta descrito arriba. Por ejemplo, compiladores de C o C++ lo traenimplementado entre sus funciones basicas.

Este ejemplo muestra como funciona el razonamiento probabilıstico: un analisisdeterminista, el del peor de los casos, arrojo unos resultados mas bien conservadores, pesimistasdirıamos; el analisis probabilıstico dio resultados mas precisos, si bien fueron mas difıciles deobtener.

2.3 Problemas preliminares

Problema 2.3.1 El nombre de la paradoja viene por el nombre del presentador del concursoLet’s make a deal. En el concurso se presenta al concursante con tres puertas donde detras deuna ellas hay un coche y detras de las otras dos una cabra. El concursante elige una puerta y enese momento Monty Hall, el presentador, abre otra que siempre corresponde a la de una cabra.En este momento el presentador ofrece al concursante la posibilidad de cambiar su eleccion.¿Debe el concursante mantener su eleccion original o escoger la otra puerta? ¿Supone algunadiferencia?

Solucion: A falta de mas informacion, supondremos que las elecciones de las puertas esaleatoria. Antes de que Monty Hall muestre la puerta con la cabra, la probabilidad de eleccionde cada puerta es 1/3. Y una vez que el presentador muestra la puerta, la probabilidad decambiar de puerta o quedarse con la actual es 1/2. Veamos si conviene que el jugador cambiede puerta o no.

Dada la naturaleza del juego, las cabras son indistinguibles y entonces las tres unicasconfiguraciones de interes para las puertas son: cabra-cabra-coche, cabra-coche-cabra, coche-cabra-cabra, donde el orden de estas sucesiones indica la puerta numerada del 1 al 3. En elarbol de abajo tenemos todas las posibilidades que tiene el concursante. Los nodos terminalesmuestran la ganancia del concursante si cambia de puerta. De las nueve posibilidades que hay,en seis de ellas el concursante gana al cambiar su eleccion. Por tanto, el cambio le favorece conprobabilidad 2/3.

Page 6: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

26 Probabilidad

Concursante

Configuracion 1

Cabra

Coche

Cabra

Coche

Coche

Cabra

Configuracion 2

Cabra

Coche

Coche

Cabra

Cabra

Coche

Configuracion 3

Coche

Cabra

Cabra

Coche

Cabra

Coche

Hay que tener en cuenta que este problema hay que interpretarlo de manera frecuentista,esto es, que si se repite el juego muchas veces, el concursante gana en 2/3 de las veces. Esposible que en una instancia particular del juego el concursante pierda.

Ejercicio 2.3.2 De una urna que contiene 10 bolas distintas, se extraen 3 al azar conreemplazamiento. Determinar la probabilidad de que aparezcan:

(a) Las tres iguales;

(b) Dos iguales;

(c) Las tres distintas.

Solucion: El hecho de extraer con reemplazamiento se puede pensar como tres urnas identicasde las que se extrae una bola cada vez.

(a) Los casos favorables son�101

�porque se escoge la bola que se va a repetir. Los casos

posibles son 103 por el reemplazamiento. La probabilidad pedida es 101000 = 1

100 .

(b) Se pide la probabilidad de una sucesion del tipo (B1, B1, B2) donde B1 y B2 son dos bolasdistintas y donde las bolas pueden estar en cualquier posicion en la sucesion. Hay 10posibilidades para la bola B1, 9 para la bola B2 y 3 posibles posiciones para colocar las

bolas. Por tanto, la probabilidad es10 · 9 · 3

103.

(c) Para tres bolas distintas, tenemos que los casos posibles son 10 · 9 · 8; este producto yatiene en cuenta las posibles ordenaciones de las bolas en la seleccion. La probabilidad

pedida es10 · 9 · 8

103

Ejercicio 2.3.3 De una urna que contiene 10 bolas, 6 son rojas y 4 negras. Se extraen 3 bolassin reemplazamiento. Determinar la probabilidad de que aparezcan: (a) las tres del mismocolor; (b) al menos una de cada color.

Solucion:

Page 7: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.3. Problemas preliminares 27

(a) Las tres bolas del mismo color pueden ser o bien rojas o bien negras y estos sucesos sondisjuntos entre sı. Por tanto, se aplica el principio de la suma, que conduce a una sumade probabilidades. Por otro lado, en la eleccion de las bolas no cuenta el orden sino soloel atributo del color. Se trata, pues, de combinaciones sin repeticion. La probabilidadpedida es: �

63

�+�43

��103

� =20 + 4

120=

1

5

(b) El suceso al menos una de cada color es o bien RRN o bien RNN . Aquı las selecciones delas bolas rojas son independientes de las selecciones de las bolas negras. La probabilidadpedida es:

�62

�·�41

�+�42

�·�61

��103

� =60 + 36

120=

96

120=

8

10=

4

5

En clase hubo otra solucion sin usar combinatoria. Tratamos los dos casos RRN o bienRNN , como antes. Las selecciones de las bolas son independientes unas de otras. Vamosa calcular la probabilidad de RRN para cada paso del proceso. Primero, coger dos bolasrojas sin reemplazamiento tiene probabilidad 6

10 ·59 ·

12 . El

12 sale del hecho de que estamos

contando dos veces las rojas, ya que el suceso de interes es el atributo rojo, para el que noinfluye el orden. De modo similar, la probabilidad de una bola negra tras haber sacadodos rojas es 6

10 ·59 ·

12 ·

48 . Pero esta cuenta supone que se sacan primero las dos rojas y luego

al final la negra cuando en realidad cualquier permutacion de RRN es valida. Por tanto,hay que multiplicar lo anterior por 3!. Tenemos que tal probabilidad es 6

10 ·59 ·

12 ·

48 ·6 = 1

2 .

Aplicando el mismo razonamiento al caso RNN , llegamos a la probabilidad 410 ·

39 ·

12 ·

68 ·3! =

310 . Como ambos casos son disjuntos, tenemos que la probabilidad pedida es

6

10· 59· 12· 48· 6 + 4

10· 39· 12· 68· 6 =

1

2+

3

10=

8

10=

4

5

Problema 2.3.4 Dos jugadores tiran una moneda no cargada. El que saque cara la primeravez sera el ganador. ¿Cual es la probabilidad de que el primer jugador gane?

Solucion: Del problema se desprende que los jugadores tiran a la vez y entonces se miran losresultados. Las probabilidades de ganar o perder de cada jugador son independientes del otro.Dado que la moneda no esta cargada, la probabilidad de cara y cruz es la misma e igual a 1/2.Llamemos C a cara y X a cruz. El jugador 1 jugara si y solo si el jugador 2 no ha sacado cara.El suceso de interes se puede describir en terminos de sucesiones de cara y cruz. LlamemosAn, n 2 N al suceso que el jugador 1 gana en la tirada n. Si las posiciones impares correspondenal jugador 1 y las pares al jugador 2, dichas sucesiones son:

A1 = C,A2 = (X,X,C), A3 = (X,X,X,X,C), . . . , An(X, 2n. . ., X, C)

Como el resultado de una tirada no influye en las demas, se tiene que

P (An) =

✓1

2

◆2n

· 12=

✓1

2

◆2n+1

, n 2 N

donde el termino del producto se refiere a las cruces y el segundo a la ultima cara.

Page 8: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

28 Probabilidad

Por ultimo, falta sumar todas estas probabilidades:

1X

i=0

P (An) =1X

i=0

✓1

2

◆2n+1

=1

2

1X

i=0

✓1

2

◆2n

=1

2

1X

i=0

✓1

4

◆n

=1

2· 1

1� 1/4=

1

2· 1

3/4=

1

2· 43=

2

3

2.4 Espacios de probabilidad

Definicion 2.4.1 Experimento aleatorio. Un experimento aleatorio es cualquier operacionque cumple las condiciones:

(1) Antes de realizar el experimento no se sabe cual va a ser el resultado del mismo.

(2) El conjunto de los resultados posibles sı es conocido a priori.

(3) El experimento debera ser repetible en identicas condiciones.

Ejemplo 2.4.2 Por ejemplo, tirar un dado no cargado es un experimento aleatorio. En efecto,conocemos sus posibles resultados, los elementos del conjunto {1, . . . , 6}, pero no conocemos elresultado particular de una tirada antes de hacerla; y ademas podemos tirarlo cuantas vecesqueramos.

Definicion 2.4.3 Espacio muestral. El conjunto de los posibles resultados de unexperimento aleatorio se llama espacio muestral. Lo designaremos por E. Los elementos de Ereciben el nombre de sucesos elementales.

Ejemplo 2.4.4 En el caso del dado de mas arriba, el espacio muestral es E = {1, . . . , 6}. Cadaelemento de E es un suceso elemental.

Definicion 2.4.5 Espacio de sucesos. El espacio de sucesos es una coleccion de subconjuntosdel espacio muestral. Lo designaremos por ⌦.

Cuando el espacio muestral sea finito elegiremos P(E) como espacio de sucesos. En general,querremos que el espacio muestral sea cerrado con respecto a la union, interseccion y tomade complementarios de sucesos. Cuando el espacio muestral es infinito la eleccion del espaciomuestral es mas delicada y lo estudiaremos mas adelante.

Definicion 2.4.6 Sucesos compuestos. Llamaremos suceso compuesto a los sucesos noelementales, esto es, a los subconjuntos de dos o mas elementos del espacio muestral.

Definicion 2.4.7 Suceso seguro y suceso imposible El suceso E se llama suceso seguro yel suceso ; se llama suceso imposible.

Ejercicio 2.4.8 Siguiendo con el experimento aleatorio de tirar un dado, dad ejemplos desucesos elementales, sucesos compuestos. Describidlos por enumeracion y comprension.

Page 9: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.4. Espacios de probabilidad 29

Solucion: Son sucesos elementales sacar 1 en el dado; sacar 2; en general, sacar i en el dado,donde i es un numero natural entre 1 y 6.

Sacar numero par es un suceso descrito por comprension (se da la propiedad que locaracteriza). Corresponde al conjunto {2, 4, 6}, que esta descrito por enumeracion. Otroejemplo serıa el suceso el resultado es menor o igual que 3, el cual es un conjunto que porenumeracion se describe como {1, 2, 3}.

Problema 2.4.9 Dado que los sucesos son subconjuntos de un conjunto (del espacio muestralE), aplicad la teorıa de conjuntos para obtener propiedades de los sucesos.

Solucion: El hecho de describir los sucesos mediante conjuntos permite usar toda la potenciade la teorıa de conjuntos. Las operaciones de conjuntos son operaciones cerradas, estoes, vuelven a dar conjuntos. Si se interpreta un suceso como un conjunto, entonces lasintersecciones, las uniones y el complementario de sucesos vuelven a ser sucesos. Esta es unanecesidad conceptual en la teorıa de la probabilidad.

Definicion 2.4.10 Sucesos incompatibles. Dos sucesos A,B ✓ E se dicen que son sucesosincompatibles si A \ B = ;, o dicho de otro modo, no pueden ocurrir a la vez.

Definicion 2.4.11 Espacio de probabilidad. Definicion axiomatica de Kolmogorov.Sea una aplicacion P : ⌦ :�! R tal que cumple los siguientes tres axiomas:

Axioma 1: Para todo suceso A ✓ E, se tiene que P (A) � 0.

Axioma 2: P (E) = 1.

Axioma 3: Sea {Ai | i 2 I} un conjunto de sucesos disjuntos, esto es, tales que Ai \ Aj = ;si i 6= j. Entonces se tiene que:

P

[

i2I

Ai

!=X

i2I

P (Ai)

A la terna (E,⌦, P ) se le llama espacio de probabilidad.

Ejercicio 2.4.12 En los problemas de la seccion 2.3 identifica el espacio muestral, el espaciode sucesos y la funcion de probabilidad.

Solucion:

(1) Problema de Monty Hall. El espacio muestral son los componentes de las sucesiones delongitud 3 formadas por dos cabras y un coche; vease el arbol del problema. En estassucesiones cada componente designa una puerta, que se consideran numeradas del 1 al 3.En cuanto al espacio de sucesos, se trata de las partes del espacio muestral. La funcionde probabilidad asigna a cada una de las posibles sucesiones 1/9. El suceso de interes enel problema son las elecciones de un componente (una puerta) de entre esas sucesiones.

Page 10: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

30 Probabilidad

(2) Ejercicio 2.3.3. Se trata de una urna que contiene 10 bolas, 6 son rojas y 4 negras dela que se extraen tres bolas sin reemplazamiento. El espacio muestral esta formado porlas posibles extracciones de tres bolas sin reemplazamiento. El espacio de sucesos son

las partes del espacio muestral y la funcion de probabilidad es1�103

� ya que el orden de

extraccion de las bolas no importa.

(3) El espacio muestral es el conjunto de las sucesiones formadas por 2n cruces consecutivasy una ultima cara, donde n puede ser cualquier numero natural mayor o igual que 1.El espacio de sucesos son las partes del espacio muestral. La funcion de probabilidad esP (An) =

�12

�2n+1, como se prueba en el problema.

Teorema 2.4.13 Sea (E,⌦, P ) un espacio de probabilidad.

(1) Si A,B son dos sucesos cualesquiera y A ✓ B, entonces P (A) P (B).

(2) La probabilidad es un numero entre 0 y 1.

(3) Para todo A 2 ⌦, se tiene que P (A) = 1� P (A).

(4) Si A,B son dos sucesos cualesquiera, entonces

P (A [ B) = P (A) + P (B)� P (A \B)

Prueba:

(1) Si A ✓ B, entonces se puede escribir B como B = A[ (B�A). Los conjuntos A y B�Ason disjuntos por su propia definicion. Entonces se puede aplicar el axioma 3:

P (B) = P (A) + P (B � A)

Por el axioma 1 aplicado al suceso B � A, se tiene que P (B � A) � 0. De aquı se sigueque P (B) � P (A).

(2) Si A es un suceso, entonces es un subconjunto de E y en consecuencia A ✓ E. Por lapropiedad anterior P (A) P (E). Por el axioma 2, P (E) = 1, y por el axioma 1 aplicadoa A, P (A) � 0. Combinando todo obtenemos que 0 P (A) 1.

(3) Dado cualquier suceso A ✓ E, E se puede escribir como E = A [ A, donde obviamenteA y A son disjuntos. Por el axioma 3, P (E) = P (A) + P (A). Usando el axioma 2,concluimos que P (A) = 1� P (A).

(4) Sean A,B son dos sucesos cualesquiera. La union A [B se puede escribir como sigue:

A [ B = (A� B) [ (B � A) [ (A \B)

Los conjuntos de la izquierda son disjuntos entre sı por su propia definicion. Aplicandoel axioma 3, tenemos:

P (A [B) = P (A� B) + P (B � A) + P (A \B)

Page 11: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.4. Espacios de probabilidad 31

Por otro lado, el suceso A se puede descomponer como la union disjunta de A � B yA\B. De nuevo, por el axioma 3, P (A) = P (A�B)+P (A\B). Por tanto, P (A�B) =P (A) � P (A \ B). Un argumento analogo prueba que P (B � A) = P (B) � P (A \ B).Finalmente, tenemos:

P (A [ B) =P (A� B) + P (B � A) + P (A \B)

=P (A)� P (A \ B) + P (B)� P (A \ B) + P (A \B)

P (A) + P (B)� P (A \ B)

como querıamos probar.

Nota 2.4.14 La propiedad (4) del teorema anterior se puede generalizar a mas sucesos y esuna consecuencia inmediata del principio de inclusion-exclusion.

Ejemplo 2.4.15 He aquı varios ejemplos de espacios de probabilidad donde se detalla la ternade un espacio de probabilidad.

(1) Tirar una moneda una vez. Llamaremos E = {C,X} al conjunto de resultados posiblesde tirar una moneda, donde C es cruz y X cara. El espacio de sucesos es, como fijamosmas arriba, P(E). Si la moneda no esta cargada, entonces P (C) = P (X) = 1

2 .

(2) Tirar una moneda dos veces. Ahora el espacio muestral sera E1 = E ⇥ E, donde E ={C,X}. Al usar el producto cartesiano distinguimos el orden en que se tiran las monedas.Un posible espacio de probabilidad podrıa ser el que asigna estas probabilidades a lossucesos elementales:

P ((C,C)) = P ((C,X)) = P ((X,C)) = P ((X,X)) =1

4

Otro espacio distinto del anterior podrıa asignar las probabilidades como sigue:

P ((C,C)) =1

5, P ((C,X)) = P ((X,C)) =

3

10, P ((X,X)) =

1

5

(3) Tirada de dos dados. Se tiran dos dados y se observa la suma de los valores. Es unexperimento aleatorio, suponiendo que el dado no esta cargado. El espacio muestrales E = {2, . . . , 12}. En este ejemplo, en realidad, tenemos la concatenacion de dosexperimentos aleatorios, donde el segundo experimento, observar la suma de los puntos,depende de los resultados del primer experimento, que es tirar los dados. Para el primerexperimento aleatorio su espacio muestral es E1 = {(1, 1), (1, 2), . . . , (6, 6)}. A cada unode estos sucesos elementales les asignamos 1

36 (hay otras maneras posibles de hacerlo; estaes la que mejor refleja la idea de que los dados no estan cargados). Las probabilidadespara el segundo espacio son estas:

Page 12: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

32 Probabilidad

P (2) =1

36P (6) =

5

36P (10) =

3

36

P (3) =2

36P (7) =

6

36P (11) =

2

36

P (4) =3

36P (8) =

5

36P (12) =

1

36

P (5) =4

36P (9) =

4

36

Nota 2.4.16 Para comprobar que son espacios de probabilidad, hay que verificar que cumplenlos axiomas 1-3 dados mas arriba. En estos casos basta con observar que las probabilidades sonno negativas y que la suma de las probabilidades de los sucesos elementales es uno.

2.4.1 Regla de Laplace

En las aplicaciones de la probabilidad a la computacion, hay un caso que aparece con muchısimafrecuencia y es de la probabilidad discreta. Aquı por discreta queremos decir que el espaciomuestral es o bien finito o bien infinito numerable (el infinito de N). Vamos a estudiar ese casoen detalle.

Supongamos que tenemos un espacio muestral finito E = {a1, . . . , an}. Si A es un suceso,entonces A es la union finita de k sucesos elementales, pongamos A = {ai1} [ . . . [ {aik}. Lossucesos elementales son disjuntos y entonces en virtud del axioma 3 de la probabilidad, tenemosque

P (A) = P ({ai1} [ . . . [ {aik}) =kX

j=1

P ({aij})

En el caso de que todos los sucesos sean equiprobables, es decir, que tengan todos la mismaprobabilidad, la formula anterior se transforma en esta:

P (A) =kX

j=1

P ({aij}) =kX

j=1

1

n=

k

n=

|A||E|

Esta formula se llama regla de Laplace y se enuncia con frecuencia, en las condicionesque hemos expuesto aquı, diciendo que la probabilidad de A es el numero de casos favorablespartido por el numero de casos posibles. Los casos favorables se reducen al recuento de loselementos de A, en suma, al calculo de su cardinal. Aquı es donde entra la combinatoria enjuego, como herramienta para conseguir ese calculo.

2.5 Problemas de probabilidad - I

Ejercicio 2.5.1 Se escoge un entero entre 0 y 100. ¿Cual es la probabilidad de que no sea nidivisible por 2 ni por 5?

Page 13: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.5. Problemas de probabilidad - I 33

Solucion: Llamemos A a ser divisible por 2 y B a ser divisible por 5. El problema pide laprobabilidad del suceso A \ B (aquı vemos como se traslada el lenguaje natural en la teorıade conjuntos). El espacio muestral son los naturales entre 0 y 100 y el espacio de sucesos laspartes de dicho conjunto. Como no disponemos de informacion adicional, se supondra que losnumeros se escogen al azar. Como hay 101 numeros, la probabilidad de cada uno es 1/101.Estamos ante una aplicacion de la regla de Laplace

Por las leyes de De Morgan, sabemos que A \B = A [ B. Por tanto:

P (A \ B) =P (A [ B) = 1� P (A [B) = 1� (P (A) + P (B)� P (A \ B))

=1� P (A)� P (B) + P (A \B)

Como la division consiste en hacer grupos de igual tamano y ademas 0 es divisible por cualquiernumero positivo, se tienen las siguientes probabilidades (bxc denota la parte entera de x):

P (A) =b100/2c+ 1

101=

51

101, P (B) =

b100/5c+ 1

101=

21

101,

P (A \ B) =b100/10c+ 1

101=

11

101

La probabilidad pedida es 1� 61

101=

40

101.

Ejercicio 2.5.2 Un dado esta cargado de modo que la probabilidad de que una cara salgaarriba es proporcional al numero de puntos que tiene. ¿Cual es la probabilidad de obtener unnumero par en una tirada?

Solucion: Sea E = {1, . . . , 6} el espacio muestral y ⌦ = P(E) el espacio de sucesos. Si laprobabilidad de sacar i es proporcional a dicho i, entonces tenemos que P (i) = k · i, donde kes una constante desconocida. Como sabemos que estamos en un espacio de probabilidad, porel axioma 2, es cierto que P (E) = 1. Por tanto:

1 = P (1) + . . .+ P (6) = k + 2k + 3k + 4k + 5k + 6k = k(1 + 2 + 3 + 4 + 5 + 6) = 21k

Se sigue que k = 1/21. El suceso de interes, A, que es sacar par se reduce a

P (sacar par) = P ({2, 4, 6}) = P (2) + P (4) + P (6) =2

21+

4

21+

6

21=

12

21

Problema 2.5.3 ¿Cual eso mınimo numero de personas que tiene que haber en una habitacionde modo que la probabilidad de que dos cumplan anos el mismo dıa sea superior a 1/2?

Solucion: Como premisas previas, se va a suponer que cada ano tiene 365 dıas y que no haygemelos. Resulta mas facil calcular el complementario del suceso A dos personas cumplenanos el mismo dıa. Supongamos que formamos el grupo metiendo las personas una a una. Laprimera puede cumplir anos en cualquier dıa; la segunda solo en 364; la tercera solo en 363; yası sucesivamente.

P (A) =365

365· 364365

· . . . 365� n+ 1

365=

365!

365n · (365� n)!

La probabilidad pedida es

P (A) = 1� 365!

365n · (365� n)!

Esta formula no es resoluble para n, pero dando valores se puede encontrar la solucion alproblema. La siguiente tabla muestra unos cuantos valores relevantes.

Page 14: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

34 Probabilidad

n Probabilidad

5 0.027

15 0.253

23 0.507

30 0.706

40 0.891

50 0.97

60 0.9951

Problema 2.5.4 Se tiene un experimento aleatorio que solo puede dar dos resultados, digamosA y B. La probabilidad de sacar A es p, con 0 < p < 1. Se realiza el experimento n veces.Calculad la probabilidad de que A ocurra k veces. Comprobad que con esas probabilidadestenemos un espacio de probabilidad.

Solucion: El espacio muestral son las sucesiones de longitud n formadas por los resultados Ay B del experimento original. El espacio de sucesos son las partes de este espacio muestral. Sino se dice nada, se supone que el resultado de un experimento no influye en el siguiente. Portanto, la probabilidad de que A ocurra k veces es

✓n

k

◆· pk · (1� p)n�k

donde:

• el numero combinatorio�nk

�corresponde a las posiciones en que A saldra como resultado;

• pk es la probabilidad de las k ocurrencias de A en la sucesion;

• (1� p)n�k es la probabilidad de las n� k ocurrencias de B en la sucesion.

Por ultimo, sumemos estas probabilidades para ver que da uno. En esta cuenta usaremosel binomio de Newton.

nX

k=0

✓n

k

◆· pk · (1� p)n�k = (p+ 1� p)n = 1n = 1

Ejercicio 2.5.5 A veces se oye preguntarse a los jugadores de poquer por que una mano depoquer tiene mas valor que un full. Una mano de poquer consta de 5 cartas tomadas de unabaraja francesa (52 cartas). Una mano es un poquer si tiene 4 cartas del mismo valor y un fullson tres cartas del mismo valor seguidas de una pareja. ¿Podrıas justificar por que esto es ası?¿O habrıa que cambiar las reglas del poquer?

Solucion: Un poker es una mano de la forma AAAAB, donde A y B son cartas distintas.Cada carta de la baraja se determina por la seleccion independiente de su valor y su palo. Enuna mano de poker el orden no importa. Ademas, se trata de un espacio equiprobable que serige por la regla de Laplace. Por tanto, la probabilidad de poker es

�131

�·�44

�·�121

�·�41

��525

� = 0.00024

Page 15: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.6. Probabilidad condicionada 35

Los dos primeros terminos del numerador cuenta las posibilidades para las cuatro cartas igualesy los otros para la quinta carta distinta.

Para el full, tenemos la secuencia AAABB, de nuevo con A 6= B. La probabilidad pedidaes �

131

�·�43

�·�121

�·�42

��525

� = 0.001441

2.6 Probabilidad condicionada

El concepto de probabilidad condicionada formaliza la idea de como afecta a la probabilidadde un suceso tener informacion extra. Si esta informacion no es relevante para el suceso,nada deberıa cambiar. Si, en cambio, esa informacion modifica el conocimiento del suceso, laprobabilidad deberıa cambiar. Pero ¿como? El concepto de probabilidad condicionada es unode los mas importantes en teorıa de la probabilidad, pero tambien es un concepto resbaladizoy delicado, el cual requiere a menudo una cuidadosa interpretacion.

Pongamos un ejemplo para introducir este concepto. Consideremos el experimentoconsistente en tirar un dado no cargado una vez; sea su espacio muestral D = {1, 2, . . . , 6}.Nos interesa el suceso A sacar un 6. Como el dado es equiprobable, entonces P (A) = 1/6.Supongamos que se tira el dado y antes de decirnos el resultado nos informan de que numeroobtenido es mayor o igual que cuatro (llamemos B a este suceso). ¿Modifica el conocimientode B la probabilidad asignada al suceso A? Parece que sı. De pronto, el espacio de resultadosse ha restringido a {4, 5, 6} y, manteniendo las probabilidades iniciales, todas iguales, ahorala probabilidad de A sabiendo B es 1/3. La siguiente definicion formaliza el concepto deprobabilidad condicionada.

Definicion 2.6.1 Probabilidad condicionada. Sea E una espacio muestral y A,B dossucesos tal que P (B) > 0. La probabilidad de A condicionada a B, escrito P (A|B), se definepor

P (A|B) =P (A \ B)

P (B)

Problema 2.6.2 Consideremos un espacio muestral finito E. Justifica la formula de ladefinicion anterior. En particular, describe que hipotesis se han hecho para llegar a esa formula.

Solucion: La idea de la probabilidad condicionada es incorporar el conocimiento de un sucesoprevio B a la probabilidad de otro suceso A que no ha ocurrido todavıa. El numerador expresala incorporacion de B a la estimacion de A, pero si dejasemos solo P (A \B), el nuevo espaciode la probabilidad condicionada a B no cumplirıa los axiomas de Kolmogorov de mas arriba.Para ello, dividimos por P (B) para que los cumpla. Esto obliga a que P (B) > 0, como poneen la hipotesis. Se puede probar que la probabilidad condicionada cumple los axiomas:

(1) Axioma 1: P (A|B) =P (A \ B)

P (B)es siempre positivo o cero porque la probabilidad P (A\

B) lo es.

Page 16: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

36 Probabilidad

(2) Axioma 2: La probabilidad del espacio muestral condicionado, que es B, es 1. En efecto,

P (B|B) =P (B \ B)

P (B)= 1.

(3) Axioma 3: Sea Ai, con i 2 I, un conjunto de subconjuntos de B tales que Ai\Aj si i 6= j.

P

[

i2I

Ai|B!

=P (S

i2I(Ai

TB))

P (B)=

Pi2I P (Ai

TB)

P (B)=X

i2I

P (Ai|B)

donde en la segunda igualdad se ha aplicado el axioma 3 porque los conjuntos Ai \B sondisjuntos entre sı.

Teorema 2.6.3 Teorema de la probabilidad total. Sea E un espacio muestral.Supongamos que existen un conjunto de sucesos H1, H2, . . . , Hn tales que:

• La union de los sucesos Hi, i = 1, . . . , n es el espacio muestral;

• Los sucesos de Hi, Hj son disjuntos dos a dos

• Se cumple que P (Hi) > 0.

Entonces se tiene que, para cualquier suceso A:

P (A) =nX

i=1

P (Hi)P (A|Hi)

Prueba: La prueba se basa en el axioma 3 de los espacios de probabilidad. Los conjuntosA \Hi, para i = 1, . . . , n son disjuntos dos a dos. En efecto, si i 6= j, entonces:

(A \Hi) \ (A \Hj) = A \ (Hi \Hj) = A \ ; = ;

Por otro lado, dado que P (Hi) > 0 para todo i, las probabilidades condicionadas estan biendefinidas. Despejamos las intersecciones de la formula de la probabilidad condicionada.

P (A|Hi) =P (A \Hi)

P (Hi); P (A \Hi) = P (A|Hi) · P (Hi)

Ademas, A se puede escribir como una union disjunta de sucesos como sigue:

A = (A \H1) [ (A \H2) [ . . . (A \Hn)

Usando las dos ultimas igualdades, tenemos la formula que buscabamos:

P (A) =nX

i=1

P (A \Hi) =nX

i=1

P (A|Hi) · P (Hi)

Ejercicio 2.6.4 Dad una interpretacion del teorema anterior. Dad tambien una interpretaciongrafica del mismo.

Page 17: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.6. Probabilidad condicionada 37

Figura 2.2: Interpretacion del teorema de la probabilidad total

Solucion: El teorema de la probabilidad total funciona cuando el espacio muestral E se puededescomponer en subconjuntos disjuntos Hi cuya union es el propio espacio muestral. Tiene quecumplirse ademas que cada subconjunto tenga probabilidad positiva. La probabilidad de unsuceso A es la suma de cada trozo en el subconjunto Hi ponderado por la probabilidad de dichoHi. Como se desprende de la figura de abajo, el suceso A no tiene por que intersecar a todoslos Hi.

Nota 2.6.5 El teorema de la probabilidad total es todavıa valido cuando el numero deconjuntos Hi es infinito. El conjunto {H1, . . . , Hn} recibe a veces el nombre de hipotesis

y tambien de particion del espacio muestral.

Ejercicio 2.6.6 Se sabe que el 65% de los accidentes de trafico que se producen durante lanoche de los sabados se deben a la ingesta excesiva de alcohol, el 25% se deben a la imprudenciadel conductor (sobrio) y el resto a otras causas, (fallo mecanico...etc.). En estos accidentes, elresultado es nefasto (herida grave o muerte) el 30% de las veces en el primer caso, el 20% en elsegundo y el 5% en el tercero. Calculad la probabilidad de que uno de estos accidentes tengaresultado nefasto. (Problema de la PAU).

Solucion: Las causas de un accidente se clasifican en tres categorıas mutuamente excluyentes:las debidas a la ingesta del alcohol; las debidas a las imprudencias del conductor; y las debidasa causas varias. Las debidas a las imprudencias del conductor son disjuntas respecto a lasdel alcohol porque el problema advierte de que en este caso el conductor esta sobrio. Lascausas varias se asocian a fallos mecanicos del coche y por tanto son disjuntas respecto a lascausas anteriores. Como hay una particion del espacio muestral, podemos usar el teorema dela probabilidad total.

Llamaremos a las causas C1, C2 y C3, respectivamente. Llamaremos R al suceso resultadonefasto en un accidente. Las probabilidades dadas por el problema son:

P (C1) = 0.65, P (C2) = 0.25P (C3) = 1� (0.65 + 0.25) = 0.1

P (R|C1) = 0.3, P (R|C2) = 0.2, P (R|C3) = 0.05

Aplicando el teorema de la probabilida total, tenemos:

P (R) =3X

i=1

P (Ci)P (R|Ci) = 0.65 · 0.3 + 0.25 · 0.2 + 0.1 · 0.05 = 0.25

Page 18: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

38 Probabilidad

Definicion 2.6.7 Sucesos independientes. Decimos que dos sucesos A,B sonindependientes si P (A|B) = P (A).

Teorema 2.6.8 Dos sucesos A,B son independientes si y solo si

P (A \ B) = P (A)P (B)

Prueba: Dado que es una doble implicacion hay que hacer dos pruebas.

• Si A,B son independientes, entonces P (A \ B) = P (A)P (B). Como A y B sonindependientes, por definicion, P (A|B) = P (A). Entonces:

P (A) = P (A|B) =P (A \B)

P (B)

Despejando P (B) de esta igualdad resulta P (A \ B) = P (A)P (B).

• Si P (A\B) = P (A)P (B), entonces A,B son independientes. Si por hipotesis P (A\B) =P (A)P (B) y dado que P (B) es distinta de cero, despejamos P (A) y obtenemos:

P (A) =P (A \ B)

P (B)

La parte derecha de esta igualdad es la definicion de P (A|B) y, en consecuencia, A y Bson independientes.

Problema 2.6.9 Sea una moneda que tiene probabilidad p, 0 < p < 1 de sacar cara y q = 1�pde sacar cruz. Se tira la moneda dos veces. Se consideran los sucesos A,B consistentes en sacarcruz en la primera tirada y sacar cara en la segunda tirada, respectivamente.

(a) Probad o refutad que A y B son independientes.

(b) ¿Son independientes los sucesos A y sacar el mismo resultado en ambas tiradas? Probado refutad.

(c) Si C es el suceso sacar dos cruces, ¿son A y C independientes?

Solucion: Para uso a lo largo de todo el problema, empezamos definiendo el espacio muestral.Los resultados de una tirada son C oX. Como hay dos tiradas, el espacio muestral esta formadopor las sucesiones de longitud dos formadas por C o X:

E = {(X,X), (X,C), (C,X), (C,C)}

Los sucesos A y B son A = {(X,X), (X,C)} y B = {(X,C), (C,C)}.

(a) Comprobaremos si ocurre que P (A \ B) = P (A)P (B). El suceso A \ B es {(X,C)}.Tenemos las siguientes probabilidades:

P (A) = (1� p)2 + p(1� p), P (B) = p(1� p) + p2, P (A \B) = p(1� p)

Calculamos el producto P (A)P (B):

P (A)P (B) =((1� p)2 + p(1� p)) · (p(1� p) + p2)

=((1� p)(1� p+ p)) · (p(1� p+ p)) = (1� p) · p

Por tanto, los sucesos son independientes.

Page 19: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.6. Probabilidad condicionada 39

(b) Llamemos D al suceso sacar el mismo resultado en ambas tiradas. Se tiene que D ={(X,X), (C,C)} y su probabilidad es P (D) = (1� p)2 + p2. La interseccion de A y D esel suceso (X,X) de probabilidad (1� p)2. Entonces:

P (A)P (D) =((1� p)2 + p(1� p)) · ((1� p)2 + p2)

=(1� p) · (1� p+ p) · ((1� p)2 + p2) = (1� p) · ((1� p)2 + p2)

=(1� p) · (2p2 � 2p+ 1) = 2p2 � 2p+ 1� 2p3 + 2p2 � p

=� 2p3 + 4p2 � 3p+ 1

La pregunta es si esta cantidad es distinta de P (A\D) = (1�p)2. Definamos la siguientefuncion Q(p) = P (A)P (D)� P (A \D). Si la simplificamos, tenemos

Q(p) =� 2p3 + 4p2 � 3p+ 1� (1� p)2 = �2p3 + 4p2 � 3p+ 1� 1 + 2p� p2

=� 2p3 + 3p2 � p

La funcion Q(p) es un polinomio que se puede factorizar como Q(p) = p · (2p�1) · (1�p).Las raıces son, pues, p = 0, 1, 1/2. Las dos primeras estan excluidas por el problema.Solo queda p = 1/2. Abajo esta la grafica de la funcion.

Figura 2.3: La funcion Q(p)

Por tanto, los sucesos son independientes cuando p = 1/2 y no lo son en otro caso.

(c) El suceso sacar dos cruces es C = {(X,X)} con probabilidad (1 � p)2. El productoP (A)P (C) no es igual a P (A\C) = P (C), ya que P (A) < 1 y, por tanto, no son sucesosindependientes.

Problema 2.6.10 Probad que si A y B son dos sucesos independientes, entonces tambien loson A y B, A y B y A y B.

Solucion: Si A y B son independientes, por la condicion necesaria y suficiente, P (A \ B) =P (A)P (B).

Page 20: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

40 Probabilidad

• El conjunto A\B se puede escribir como A\B = A�A\B. Por las propiedades de laprobabilidad y por la hipotesis de independencia, tenemos:

P (A \ B) =P (A� A \B) = P (A)� P (A \B)

=P (A)� P (A)P (B) = P (A) · (1� P (B)) = P (A)P (B)

Esta igualdad prueba la independencia de A y B.

• Este resultado es consecuencia directa de que la probabilidad condicionada es un espaciode probabilidad seguido de la hipotesis de independencia.

P (A|B) = 1� P (A|B) = 1� P (A) = P (A)

• En esta ultima prueba haremos uso de la primera propiedad.

P (A|B) = 1� P (A|B) = 1� P (A) = P (A)

Problema 2.6.11 Dados los sucesos A y B, con P (A) = 1/4, P (B|A) = 1/2 y P (A|B) = 1/2,probad o refutad las siguientes afirmaciones:

(a) A ⇢ B;

(b) A y B son independientes;

(c) A y B son incompatibles;

(d) P (A/B) = 1/2.

Solucion: A partir de los datos del problema calculamos las siguientes probabilidades, que nosseran utiles mas adelante.

• La probabilidad de P (B). Empezamos escribiendo las probabilidades P (A|B) y P (B|A):8>><

>>:

P (A|B) = P (A\B)P (B)

P (B|A) = P (B\A)P (A)

Ahora dividimos ambas probabilidades entre sı y despejamos P (B):

P (A|B)

P (B|A) =P (A \ B)P (A)

P (B \ A)P (B)=

P (A)

P (B)

P (B) =P (A)P (B|A)

P (A|B)=

1/4 · 1/21/2

=1

4

• La probabilidad de P (A \ B):

P (A \ B) = P (A|B) · P (B) =1

2· 14=

1

8

Page 21: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.6. Probabilidad condicionada 41

(a) Sabemos que P (A) = 1/4 es igual a P (B) = 1/4. Esto no implica que A 6✓ B. Veamosun contraejemplo. Sea E = {1, 2, . . . , 8} un espacio muestral en el que extraer un numerode ese conjunto ocurre con la misma probabilidad. Sean A = {1, 2} y B = {1, 3} dossucesos. Se tienen las siguientes probabilidades:

P (A) = P (B) = 2/8 = 1/4; P (A \ B) = P ({1}) = 1/8;

P (A|B) =1/8

1/4= 1/2; P (B|A) = 1/8

1/4= 1/2

Este espacio cumple las condiciones puestas en el problemas, pero se tiene que A no estaincluido en B.

(b) A y B son independientes ya que la igualdad P (A \ B) = P (A)P (B) no se cumple:P (A \ B) = 1/8 y P (A)P (B) = 1

4 ·14 = 1

16 .

(c) A y B no son incompatibles ya que P (A \ B) 6= 0.

(d) La afirmacion es cierta ya que

P (A/B) = 1� P (A|B) = 1� 1/2 = 1/2

.

El concepto de suceso independiente se puede generalizar a mas de dos sucesos. La definicionde abajo no es sencilla y requiere una lectura cuidadosa.

Definicion 2.6.12 Sucesos mutuamente independientes. Sea {A1, . . . , An} un conjuntode sucesos en un espacio de probabilidad. Diremos que son mutuamente independientes si paracualquier subconjunto {Ai, Aj, . . . , Am} se cumple que

P (Ai \ Aj \ . . . \ Am) = P (Ai)P (Aj) . . . P (Am)

Problema 2.6.13 Las probabilidades de que funcionen los nodos 1, 2 y 3 de la red de la figuraadjunta son 0,9, 0,8 y 0,7, respectivamente. Suponiendo que el funcionamiento de los nodoses independiente, hallar la probabilidad de que un mensaje que sale de A llegue a B en lossiguientes casos:

(a) El mensaje intenta llegar por cualquier lado.

(b) El mensaje intenta ir primero por el camino con menos nodos.

(c) La probabilidad anterior (apartado b) suponiendo que cuando el mensaje intenta ir porun camino que no funciona, hay una probabilidad 0.2 de que se pierda.

Solucion: El problema supone que los nodos funcionan de modo independiente. Por claridad,se definen los siguientes sucesos: N1: el nodo 1 funciona; N2: el nodo 2 funciona; N3 el nodo 3funciona; C1: ir por el camino de arriba; y C2 ir por el camino de abajo. Llegado al punto Ael sistema tiene que decidir por que camino lo manda. A falta de mas informacion, se suponeque el mensaje va con igual probabilidad por ambos caminos.

Page 22: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

42 Probabilidad

!Figura 2.4: Red del problema

(a) Sea M el suceso de que el mensaje intente llegar por cualquier lado.

P (M) =1/2 · P (N1) + 1/2 · P (N2 \N3)

=1/2 · 0.9 + 1/2 · 0.8 · 0.7 = 0.73

Este enfoque en que se supone que hay un mecanismo que distribuye los mensajes demanera equiprobable es el del teorema de la probabilidad total, donde aquı los caminosson las hipotesis.

Otra manera de interpretar el problema es sencillamente identificar el suceso llega elmensaje de A a B con el funcionamiento del sistema en su conjunto, esto es, eliminar ladistribucion de los mensajes. En ese caso, la probabilidad pedida es P (C1 [ C2):

P (C1 [ C2) =P (N1) + P (N2 \N3)� P (N1 \N2 \N3)

=0.9 + 0.8 · 0.7� 0.9 · 0.8 · 0.7 = 0.956

(b) En este segundo apartado el mensaje intenta ir primero por el camino con menos nodos.Ahora el problema sı fuerza a elegir el camino por que ira el mensaje. Entonces laprobabilidad de ir al nodo 1 primero es 1. El mensaje ira por el camino de abajo cuandofalle el nodo 1, que lo hace con probabilidad 0.1.

P (C1 [ C2) =1 · P (N1) + 0.1 · P (N2 \N3)

=1 · 0.9 + 0.1 · 0.8 · 0.7 = 0.956

(c) Ahora entra en juego el hecho de que tras fallar el nodo 1 se pierde el mensaje conprobabilidad 0.2. Esto significa que elmensaje ira al camino C2 en el 80% de las vecestras fallar el nodo 1.

P (C1 [ C2) =1 · P (N1) + 0.8 · 0.1 · P (N2 \N3)

=1 · 0.9 + 0.8 · 0.1 · 0.8 · 0.7 = 0.9448

2.7 Teorema de Bayes

El teorema de Bayes es la base de la llamada inferencia bayesiana. Es un metodo de inferenciaestadıstica en el cual se usa el teorema de Bayes para actualizar las probabilidades de ciertashipotesis sobre un suceso en base a la realizacion de mas experimentos que implican dichosuceso.

Page 23: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.7. Teorema de Bayes 43

Conceptualmente, la inferencia bayesiana empieza por considerar un suceso de interes A.A la vez hay una serie de hipotesis sobre el suceso, a las que llamaremos H1, . . . , Hn y cuyasprobabilidades son conocidas. Ademas, por la experiencia previa, se tiene una estimacion decomo se comporta A cuando se asume que una hipotesis Hi es cierta. Esto es equivalente a decirque conocemos las probabilidades condicionadas P (A|H1), . . . , P (A|Hn). Estas probabilidadesse llaman probabilidades a priori y el nombre refleja el hecho de que se estiman antesde realizar el experimento que actualizara nuestro conocimiento sobre A. En este momentose observa el suceso A. La probabilidad de A es una nueva evidencia que deberıa modificarlas probabilidades de las hipotesis. Las nuevas probabilidades son P (H1|A), . . . , P (Hn|A) y sellaman probabilidades a posteriori (el nombre de posteriori viene porque se calculan despuesdel experimento).

En Informatica las aplicaciones de la inferencia bayesiana son ubicuas y numerosas. Quizaslos campos donde mas sobresalgan sean en Inteligencia Artificial y Sistemas Expertos, dondela inferencia bayesiana empezo a usarse a finales de los anos 50 del siglo XX. Los filtros delcorreo basura, por ejemplo, se basan en los clasificadores de Bayes ingenuos.

Teorema 2.7.1 Sea E un espacio muestral en un espacio de probabilidad y sean hipotesisH1, H2, . . . , Hn tales que:

• La union de los sucesos Hi, i = 1, . . . , n es el espacio muestral;

• Los sucesos de Hi, Hj son disjuntos dos a dos.

• Se cumple que P (Hi) > 0.

Si A es un suceso, entonces las probabilidades a posteriori P (Hi|A), para i = 1, . . . , n, son

P (Hi|A) =P (A|Hi)P (Hi)Pnj=1 P (Hj)P (A|Hj)

Prueba: Las hipotesis del teorema de Bayes son las mismas que las del teorema de laprobabilidad total. Por tanto, podemos escribir la probabilidad del suceso A como

P (A) =nX

i=1

P (Hi)P (A|Hi)

Por otro lado, calculamos la probabilidad P (A \ Hi) usando las dos probabilidadescondicionadas P (A|Hi) y P (Hi|A).

P (A|Hi) =P (A \Hi)

P (Hi);P (A \Hi) = P (A|Hi) · P (Hi);

P (Hi|A) =P (Hi \ A)

P (A);P (A \Hi) = P (Hi|A) · P (A);

Page 24: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

44 Probabilidad

Si igualamos las dos expresiones de P (A \Hi) y despejamos P (Hi|A) tenemos:

P (A|Hi) · P (Hi) = P (Hi|A) · P (A); P (A|Hi)P (Hi) =P (Hi|A) · P (A)

P (A);

Sustituyendo P (A) por su expresion arriba, obtenemos la formula buscada:

P (Hi|A) =P (A|Hi)P (Hi)Pnj=1 P (Hj)P (A|Hj)

Problema 2.7.2 Un doctor esta tratando de averiguar si un paciente tiene una de tresenfermedades, E1, E2, E3. Le hara dos tests al paciente, que o bien dan positivo (+) o negativo(-). Los registros de la enfermedad indican en una muestra de 10.000 personas la distribuciony los resultados de los tests son los que aparecen en el cuadro 2.1

Personas Resultados de los tests

Enfermedad enfermas ++ +� �+ ��E1 3215 2110 301 704 100

E2 2125 396 132 1187 410

E3 4660 510 3568 73 509

Tabla 2.1: Datos de las enfermedades

Se pide lo siguiente:

(a) Identificad las probabilidades a priori.

(b) En vista de los datos, ¿cual es la enfermedad mas probable que el paciente puede tener?

(c) Calculad las probabilidades a posteriori e interpretadlas en el contexto del problema.

Solucion: El experimento aleatorio consiste en confirmar si un paciente tiene una de lasenfermedades bajo estudio. Por tanto, la particion del espacio muestral son las enfermedadesE1, E2, E3. Se supone que una persona no puede tener mas de una de estas tres enfermedades.Las probabilidades de las enfermedades son:

P (E1) =3.215

10.000= 0.3215; P (E2) =

2.125

10.000= 0.2125; P (E3) =

4.660

10.000= 0.466;

(a) Las probabilidades a priori son las probabilidades de los sucesos de los resultados de lostests y estas son, para cada enfermedad Ei, i = 1, 2, 3, iguales a

P ((+,+)|Ei), P ((+,�)|Ei), P ((�,+)|Ei), P ((�,�)|Ei)

Puestas en forma de tabla, estas probabilidades son:

Page 25: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.7. Teorema de Bayes 45

Enfer- Personas Probabilidades a priori

medad enfermas ++ +� �+ ��

E1 32152110

3215= 0.6562

301

3215= 0.0936

704

3215= 0.2189

100

3215= 0.0311

E2 2125396

2125= 0.1863

132

2125= 0.0621

1187

2125= 0.5585

410

2125= 0.1929

E3 4660510

4660= 0.1094

3568

4660= 0.7656

73

4660= 0.0156

509

4660= 0.1092

(b) Si aceptamos como que un paciente tiene la enfermedad con alta probabilidad cuando losdos tests dan positivo, entonces basta comparar las probabilidades de la tercera columnade la tabla anterior, esto es, la columna de (+,+).

2110

3215= 0.6562;

396

2125= 0.1836;

510

4660= 0.1094

La enfermedad mas probable es la uno.

Esta es una de las interpretaciones posibles, la de que la enfermedad se detecta condos positivos en los tests, pero es posible interpretar que la enfermedad se confirmaen cuanto hay un positivo. En ese caso habrıa que buscar el maximo en las columnascorrespondientes a (+,+), (+,�) y (�,+). El maximo se alcanza para el test (+,�) enla enfermedad tres, P ((+,�)|E3) = 0.7656.

(c) Las probabilidades a posteriori son, para i = 1, 2, 3,

P (Ei|(+,+)), P (Ei|(+,�)), P (Ei|(�,+)), P (Ei|(�,�))

Estos numeros son las probabilidades de una enfermedad sabiendo que ha salidodeterminado resultado en un test. Por ejemplo, la probabilidad de tener la enfermedad 1sabiendo que ha dado (+,+) el test es:

P (E1|(+,+)) =P ((+,+)|E1)P (E1)P3i=1 P (Ei)P ((+,+)|E1)

=

2110

3215· 3215

10.0002110

3215· 3215

10000+

396

2125· 2125

10000+

510

4660· 4660

10000

=0.211

0.3016= 0.6996

El resto de las probabilidades a posteriori son analogas.

Las probabilidades a posteriori P (Ei|(+,+) nos proporcionan en este caso la probabilidadde que un paciente tenga una enfermedad sabiendo que los resultados de los tests son losdos positivos.

Page 26: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

46 Probabilidad

2.8 Problemas de probabilidad - II

Problema 2.8.1 Mediante un programa de ordenador se generan independientemente tresnumeros de dos dıgitos cada uno. Los dıgitos pueden ser cualquiera de 0 a 9. Calculad:

(a) Probabilidad de que el primer numero generado sea menor que 40.

(b) Probabilidad de que 2 de los numeros generados sean menores que 40.

(c) Sabiendo que alguno de ellos ha sido menor que 40, la probabilidad de que hayan sidoexactamente dos los numeros generados menores que 40.

Problema 2.8.2 Dos companeros de estudios, Pedro y Juan comparten piso. Han decididoque, durante el primer semestre, el primero prepare la comida 3 de los 5 dıas laborables de cadasemana y el resto lo haga el segundo. A Pedro se le olvida hacer la comida el 5% de las veces,mientras que a Juan se le olvida un 8%. Se pide:

(a) Calculad la probabilidad de que un dıa laborable, elegido al azar, no haya comidapreparada.

(b) Si hoy hay preparada comida, calculad la probabilidad de que la haya preparado Pedro.

Problema 2.8.3 Se sacan a la vez dos cartas de una baraja espanola y, a continuacion, selanza un dado por cada carta de oros que haya salido. Calculad la probabilidad de que:

(a) El resultado de que el (los) dado(s) sume 4.

(b) Haber sacado un oro, sabiendo que los dados suman 4.

Problema 2.8.4 Construid el mapa conceptual del tema 2 entero.

Solucion: El mapa conceptual se encuentra en la pagina siguiente.

Page 27: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.8. Problemas de probabilidad - II 47

Prob

abili

dad

¿Por

qué

?

Razo

nam

ient

o en

pre

senc

ia d

e la

in

certi

dum

bre

Aplic

acio

nes

Conc

epto

s bás

icos

Espa

cio

mue

stra

l

Suce

sos e

lem

enta

les

Suce

so im

posib

le y

su

ceso

segu

roSu

ceso

s disj

unto

s

Espa

cio

de su

ceso

s

Suce

sos c

ompu

esto

sCa

so d

iscre

to: l

as p

arte

s de

ECa

so c

ontin

uo

Defi

nici

ón a

xiom

átic

a de

pr

obab

ilida

d

Prop

ieda

des d

e la

pro

babl

idad

Regl

a de

Lap

lace

: es

paci

os m

uest

rale

s fin

itos y

eq

uipr

obab

les

Redu

ce e

l cál

culo

de

prob

abili

dade

s a la

co

mbi

nato

ria

Com

bina

toria

: rec

uent

o de

obj

etos

Prin

cipi

os b

ásic

os

Prin

cipi

o de

la su

ma

Prin

cipi

o de

l pro

duct

oPr

inci

pio

de

incl

usió

n-ex

clus

ión

Perm

utac

ione

s: re

cuen

to d

e lis

tas

Varia

cion

es: r

ecue

nto

de su

blist

as

Com

bina

cion

es:

recu

ento

de

subc

onju

ntos

Expe

rimen

to

alea

torio

Prob

abili

dad

cond

icio

nada

Inco

rpor

ació

n de

co

noci

mie

nto

prev

io a

la

prob

abili

dad

Si P

(B)>

0:

Teor

ema

de la

pro

babi

lidad

tota

l

Suce

sos i

ndep

endi

ente

s

Defi

nici

ón d

e in

depe

nden

cia

Un su

ceso

no

influ

ye e

n la

pro

babi

lidad

de

otro

: P(A

|B)=

P(A)

Cond

ició

n ne

cesa

ria y

sufic

ient

e:

Suce

sos m

utua

men

te in

depe

ndie

ntes

Teor

ema

de B

ayes

Caus

as d

isjun

tas y

resu

ltado

s en

un e

xper

imen

to a

leat

orio

Page 28: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

48 Probabilidad

2.9 Recordatorio de Combinatoria

2.9.1 Principio basicos

Definicion 2.9.1 Principio de la suma. Sean {A1, . . . , Ak} k conjuntos disjuntos dos ados. Supongamos que el primero tiene r1 objetos distintos, el segundo r2 objetos distintos, yası sucesivamente. El numero de maneras de seleccionar un objeto de entre los k conjuntos{A1, . . . , Ak} es r1 + . . .+ rk.

Definicion 2.9.2 Principio del producto. Si un cierto proceso se puede descomponer enn1, . . . , nk tareas independientes, que no se pueden realizar al mismo tiempo, entonces el procesototal se puede realizar de n1 · . . . · nk maneras.

Definicion 2.9.3 Principio de inclusion-exclusion para tres conjuntos. Sean tres conjuntosA1, A2, A3 ✓ U . Probar que

|A1 [ A2 [ A3| =|A1|+ |A2|+ |A3|� |A1 \ A2|� |A2 \ A3|� |A1 \ A3|+ |A1 \ A2 \ A3|

2.9.2 Selecciones sobre conjuntos

Uno de los problemas mas fundamentales y comunes en combinatoria es el de contar seleccionesde elementos de un conjunto. La manera de contar dependera de seleccionar sus elementos. SiA es un conjunto de n elementos, el numero de formas distintas de seleccionar k elementos deA es funcion de los siguientes criterios:

(1) Si el orden de los elementos es importante en la seleccion. Dicho de otro modo, si unareordenacion de la seleccion produce una nueva seleccion.

(2) El tamano de la seleccion, esto es, cuantos elementos del conjunto total se seleccionan.

(3) Si se permiten la repeticion de los elementos.

Definicion 2.9.4 Permutaciones sin repeticion de conjuntos. Se llaman permutacionessin repeticion de conjuntos a las listas ordenadas formadas con los elementos de un conjuntodado, donde se supone que en el conjunto no hay elementos repetidos. Se designaran por Pn.

Definicion 2.9.5 Variaciones sin repeticion. Se llaman variaciones sin repeticion deconjuntos a las listas ordenadas de longitud k formadas con los elementos de un conjuntodado, donde se supone que en el conjunto no hay elementos repetidos. Se designaran por Vn,k.

Definicion 2.9.6 Combinaciones sin repeticion. Se llaman combinaciones sin repeticionde conjuntos a los subconjuntos de tamano k formados con los elementos de un conjunto dado,donde se supone que en el conjunto no hay elementos repetidos. Se designaran por Cn,k o por�nk

�.

Definicion 2.9.7 Permutaciones con repeticion de conjuntos. Se llaman permutacionescon repeticion de conjuntos a las listas ordenadas formadas con los elementos de un conjuntodado en que se permiten elementos repetidos. Se designaran por PRn.

Page 29: Probabilidad - dma.etsisi.upm.es€¦ · Esto permiti´o que la probabilidad, ahora con el soporte de la l´ogica, se desarrollase como una rama del conocimiento plenamente independiente

2.9. Recordatorio de Combinatoria 49

Definicion 2.9.8 Variaciones con repeticion. Se llaman variaciones con repeticion deconjuntos a las listas ordenadas de longitud k formadas con los elementos de un conjuntodado en que se permiten elementos repetidos. Se designaran por V Rn,k.