alicia dickenstein

Post on 06-Feb-2016

38 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Alicia Dickenstein. Probable mente Semana de la Matemática 2005. Por qué los casinos ganan siempre? (sin hacer trampa). Cómo tomar decisiones (favorables) sobre hechos que suceden azarosamente?. Por qué los casinos ganan siempre? (sin hacer trampa) - PowerPoint PPT Presentation

TRANSCRIPT

Alicia DickensteinAlicia Dickenstein

Probable menteSemana de la Semana de la Matemática 2005Matemática 2005

Por qué los casinos ganan siempre?

(sin hacer trampa)

Cómo tomar decisiones (favorables) sobre hechos que

suceden azarosamente?

Por qué los casinos ganan siempre? (sin hacer trampa)

Cómo tomar decisiones (favorables) sobre hechos que suceden azarosamente?

Teoría de probabilidades

Si tiramos una moneda no cargada

p(cara) = p(ceca) = 1/2

Si tiramos una moneda cargada:

p(cara) = 1 - p(ceca)

p(cara) p(ceca) % caras

1/2 1/2 50

1/4 3/4 25

1 0 100

p 1-p 100 p

Si tiramos dos monedas no cargadas:

p(2 caras) = p(2 cecas) = 1/4

p(1 cara y 1 ceca) =

Si tiramos dos monedas no cargadas:

p(2 caras) = p(2 cecas) = 1/4

p(1 cara y 1 ceca) = 1/2

Si hay 3 monedas no cargadas

p(3 caras) = 1/8

p(2 caras y 1 ceca)=

Si hay 3 monedas:

p(3 caras) = 1/8

p(2 caras y 1 ceca)= 3/8

Problema:

• Se tiene una moneda cargada,

con probabilidad p de salir cara y q = 1-

p de salir ceca

• p (y q) son desconocidas

• Cómo usar esta moneda cargada para hacer una apuesta justa

(pareja) entre dos personas?

(Una) respuesta:

• Se tira 2 veces la moneda sucesivamente, esto es considerado 1 tiro..

• Uno de los jugadores elige: primero cara y luego ceca, el otro elige primero ceca y luego cara.

• Se tira la moneda hasta que salgan 2 facetas distintas en un tiro (doble)

Por que es una apuesta justa?

p(cara-cara) = p. p = p2

p(ceca-ceca)= q. q = q2

p(cara-ceca)= p. q

P(ceca-cara)=q. p

• Ambos jugadores tienen probabilidad p.q = q.p de ganar

Notar que: p2 + q2 + 2 pq = (p+q)2 = 12 = 1

Pero…

• Cuál es el número esperado de tiros hasta que salgan dos facetas distintas??

Respuesta:

• En general, el número esperado E de tiradas para que se produzca un suceso con probabilidad u de suceder,

hasta que suceda es igual a 1/u• Porque:

• E = 1. u + (E+1)(1-u),

• y se despeja • E= 1/u.

• Ya que: o sucede en una tirada, o estamos en el punto de partida nuevamente, salvo que ya “pagamos una tirada”

En nuestro caso

• La probabilidad de que salgan dos facetas distintas en un tiro (doble) es:

• u = 2 p (1-p)

• Por lo tanto, el valor esperado del número de tiros hasta que salga cara-ceca o ceca-cara es:

• E = 1/ 2 p (1-p)

Por ejemplo:

p(cara) nro. esperado de tiros

1/2 2

¼ o 3/4 3

1/10 o 9/10 6

1/100 o 99/1000 51

1/1000 o 999/1000 501

1 o 0 (nunca sale ceca o nunca sale cara)

?

Los favoritos en los deportes

• Supongamos que el equipo argentino es tan bueno que tiene probabilidad de ganarle 7 de cada 10 veces a cualquier otro equipo del mundo, o sea la probabilidad p de que gane cualquier partido es

• p = 7/10

• Cuál es la probabilidad de ganar 4 partidos (octavos de final, cuartos de final, semifinal y

final)?

Respuesta:

(7/10)4 = 0, 2401

• O sea, la probabilidad de ganar cualquier partido individual es del 70% , pero la probabilidad de ganar los 4 es de menos del 25% (24,01%)

p1 es la probabilidad de ganar un partidop4 es la corresp. probabilidad de ganar los 4

p1 en % p4 en %

0,5 =1/2 50 0,0625 6,25

0,6 60 0,1296 ~ 13

0,7 70 0,2401 ~ 24

0,8 80 0,40 40

0,9 90 0,6561 ~ 65

~ 0,84 ~ 84 0,5 = 1/2 50

Para favorecer al favorito:

• Como en la NBA por ejemplo…

• Gana el equipo que gane el mayor numero de partidos entre 3, 5 o 7 partidos disputados entre los dos

equipos !

En porcentajes (aproximados):

Prob. de ganar 1 partidoX 100

Prob. de ganar al menos 2 de 3 x

100

Prob. de ganar al menos 3 de 5 x

100

Prob. de ganar al menos 4 de 7 x

100

60 65 68 71

70 78 84 87

50 50 50 50

40 35 32 29

La pregunta indiscreta

• Supongamos que se quiere conocer, por ejemplo, el porcentaje de adolescentes de

menos de 16 años que han probado alguna droga….

La pregunta indiscreta

• Supongamos que se quiere conocer, por ejemplo, el porcentaje de adolescentes de

menos de 16 años que han probado alguna droga….

• Puede estimarse este valor sin violar la privacidad de nadie?

• O sea, puede obtenerse informacion veraz de la población en general sin tener informacion

veraz de ningun individuo en particular?

Se entrega al entrevistado una moneda (no cargada) y el entrevistado se compromete a lanzar la moneda en privado

y de acuerdo al resultado:

• Si al tirar la moneda sale cara, responde

• SI,

• cualquiera sea la respuesta verdadera

• Si al tirar la moneda sale ceca, responde

• SI o NO,

• de acuerdo a la verdad.

Entonces, sin tener ninguna información sobre si un individuo que respondió SI, probó la droga o no, se puede

estimar

% de respuestas SI % de adolescentes que probaron la droga

60 20

65 30

50 0

80 60

La fórmula es:

• p(SI) = p(SI/ salio ceca) . ½ + p(SI/ salio cara). ½ = = p(SI/ salio ceca) ½ + 1. ½

• p(SI) se estima como

• p (SI) = nro. de respuestas SI/ nro total de entrevistados

• De donde:

• p(SI/ salio ceca) = 2. (p(SI) -1/2)• O bien:

• % de verdaderas respuestas SI = 2 (% de respuestas SI obtenidas – 50%).

Imaginemos un dado tetraedral...con caras A,T, C, G

TAGAGACGGGGGTTTCACAATGTTGGCCA

Al lanzarlo, se generan secuencias de ADN

>hg17_dna range=chr17:38464686-38473085 5'pad=0 3'pad=0 revComp=FALSE strand=? repeatMasking=noneATCCAGAAGTCTAGTATACATCTCAAAATTCATGCATCTGGCCGGGCACAGTGGCTCACACCTGCAATCCCAGCACTTTGGGAGGCCGAGGTGGGTGGATTACCTGAGGTCAGGAGTTTAAGACCAGCCTGGCCAACATGGTAAAACCCCATCTCTACTAAAAATACAAGTATTAGCCAGGCATTGTGGCAGGTGCCTGTAATCCCAGCTACTCGGGAGGCTGAGGCAGGAAAATCACTTGAACCGGGAGGCGGAGGTTGGAGTGAGCTGAGATCGTGCTACCGCACTCCATGCACTCTAGCCTGGGCAACAGAACGAGATGCTGTCACAACAACAACAACAACAACAACAACAACAACAACAACAACAACAAATTCTCACATCTAAAACAGAGTTCCTGGTTCCATTCCTGCTTCCTGCCTTTCCCACTCCCCCATATTCCCTACCATGCCTTCTTCATCTAATTTAATATTACTAACAAGATCTATTGTTCAAGCCAAAACCCAAGTGTCACTCCTTCAATTTCTCTTTACCTTATCCTCCAAATTTAATCCATTAGCAAGTCCTCTCTTCAAACCCATCCCAAACCAACCTTGTTTTTAACCATCTCCACACCACCAATTACCACAAGGATAAAATCTGAATTCCTTACCACCAAATACTATGTGATCTGGCCCTCATCTATGACCTTCTCCCATTCCTTGTGTAATCTCTGCCTCCACACATAATTTGCAAATTACTCCAGCTACACTGGCCTATTATTATTATTATTATTATTTTTGAGACGGAGTCTTGCTCTTTCGCCCAGCCTGGAGTGCAGTGGCGCAATCTCAGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCCCAGCCTCCCAAGTAGCTGTGATTACAGGCACATGCCACCATTCCCAGCTAATTTTTTTTTGTTTTTGAGATGGAGTTTCACTCTTGTTGCCCAGGCTGGAGTGCAATGGTGCGATCTCAGCTCACCACAACCTCCACCTCCCGGGTTGATGAAGTGATTCTCTTGTCTCAGCCTCCCGTGTAGCTGGGATTAGAGGCACGCGCCACCACGCTGGGCAAATTTTTGTATTTTTAGTAGAGACAGGGTTTCTACCTCAGTGATCTGTCCGCCTTGACCTCCCAAAGTGCTGGGATTACAGGAATGAGCCACCACACCCAGCCGTGCCCAGCTAATTTTTGCATTTTTTAGTAGAGATGGGGTTTTGCCACGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGGGGATCTGCCTGCCTCGGCCTCCTAGAGTGCTGGAATTACAGGTGTGAGCCACTGTGCCCGAACCTTTTATCATTATTATTTCTTGAGACAGGAGTCTTGCTCTGTCGTTCAGGCTGGAGTGCAGTGATGCGATCTTGGCTCACTGTAACTCCTACCTTTCGGTTCAAGTGATTCTCCTGCCTCAGCCTCTGGAGTAGCTGGGATTACAGGCACTGGGATTACAGGCACACACCACCACACCATGCTAGTTTTTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAAGTGATTTGCCTGCCTTGGCTTCCCAAAGTGCTGGGATTATAGGCACGAGCCACCACACACGACCAACATTGGCCTATCTTTTAAAAAATAAACCAAGCTCTGGCCGGGCACAGTGGCTCACACCTGTGATCCCAGCACTTTGGGAGGTTGAGGTGGTTGGATCACTTGAGTTCAGGAGTTTGAGACCAGCCTGACCAACGTGGTAAAACCCCATCTCTACTAAAAATAAAAACTAGTCGGGTGTGGTAGCACGCGTGCCTGTAATACCAGCTACTCAGGAGGCCAAGGCAGGAGAATTGCTTGAACCCAGGAGACAGAGTTTGCAGTGAGCCAAGATTGTGCCACTGCACTCCAGCCTGGGGGATAGAGGGAGACACCATCTCAAAAAAACCAAAATACAGAAATCAAAAAACCACACTCATTATTACCTCAAGACCTTTATGTTTGCTATTCCTCTGCCTATAAGATGCATTCCCTTCATTTTTCAAGGACAATTATTTCTTGTTATTTAGGTCTCAGCTCAATTTTTTCAGAAAGGCTTTCCCTGGCCTCCTTAAACGAAAGTAATCAACAACCTTTGACAGCTAATACTATTCCACTGTTCTGTATATTTCTCCATAGCATTTATTGTTATCTTAAATTCATCTTTATTGTGTATCTCCCCTCGACAGAACCTGAATCCTACCAGGGACTTAGTTAGTCTTATTTACTGTTGCATTCCTAGTGCCCAGAACACAGTAGGCTCCCAATAAATAGCCACTGAATAAAAGTTAAAACCAACAAAAATAATCATTTAATTAATTATGAATACATCGAATTGTGCACAATAGTTTATAAAATTACTTTTTTTTTTTTTTTAAGACAGGGTCTCATTCTGTCTCACAGGCTGGAGTGCAGTGGTGCAATCTAGGCTCACTGCAACCTCCGCCTCCCGGGTTCAAGTGATTCTCCTGCCTCAGCCTCCCCAGCAGCTAGGATTACAGGCACATGCCACCACGCTCGACTAATTTTTTTGTGTTTTTAGTAGAGACAAGGTTTCACCATGTTGACCAGGCTGGTCTCGAACTCCTGACCTCAAGTGATCCACCTGCCTTGGCCACTCAAAGTGCTGGGATTATAGGCATGAGCCACCACGCCTGGCCTATAAAATTACTTTCACATTTCATTTTGCCTGATCTGTTGTCACAGAAGTTCTCAGATGGCTGTTCTGAAATTATTCCTCCTCCTACACTCTATCTTATTTACTTCTCACTGTTCTCAGTATCATAAAGTGCAACATCTTTTTGAAGCAATCTGAATTATAAACAGATACATTTGCATGTATATATATGTATATATGCATATGCACACACACACTTTTTTTTTTTTAAGAGACAGGGTCTTGCTCTGTGCAAGTGCAAGAGTGCAATGGTATGATCATAGCTCACTGCAGCCTTGAACTCCTGGGCTCAAGTGATTCTTCTGGCTTAGCTTCCTCAGTAGCTAAGACTACAGAAGCACACTGCCATGCCCGGCTAATTAAAAAAAAATTTTGTGGAGACAGAGTCTCACTATGTTGCCCAGGCTGGTTTCAAACTCCTGGCCTCAAGTAATCTTCCTGTCTCAGCCTCCCAAAGGGCTGAGATTATAAGTGTGAGCCACTGCATCTGGACTGCATATTAATATGAAGAGCTTTTCTTCAACAACAGTGAACAGTTTTCTACAAAGGTATATGCAAGTGGGCCCACTTCTTGTTCTTATGAATCTTTTCTTTCCTTTTATAAAACTCCTTTTCCTTTCTCTTTTCCCCAAAGAAAGGACTGTTTCTTTTGAAATCTAGAACAAATGAGAACAGAGGATATCCTGGTTTGCGCTGCAAAATTTTTTTTTTTTTTAAGACGGAGTCTCGCTCTGTTGCCAGGTTGGAGTGCAGTGGCACGATCTTGGCTCATTGCAACCTCCACCTCCCGGGTTCAAGAGATTCTCCTGCCTCAGCCTCCTGAGTAGCTGGAACTAAAGGCGCATGCCACCACGCTGAGTAATTTTTTGTATTTTAGTAGAGACAGGGTTTCACCATGTTGCCCAGGCTGATCTCGAACTCCTGAGCTCAGGCAATCTGCCTGTCTTGGCCTCCCACAGTGTTAGGATTACAGGCATGAGCCACTGCACCCGATTTTTTTTTTCTTTTGATGGAGTTTTGCTCTTGTTGCCCAGGTTAGAGTGCAATGATGCGATCTCAGCTCACTGCAACCCCCGCCTCCCAGGTTCAAGTGATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGAATTACAGGCAAGTGCCACCAAGCCCGGCTAATTTTGTATTTTTAGTAGAAACGGGGTTTCTCCATGTTGGTCAGGCTGGTCTTGAACTCCCGACATCAGGTGATCCAAGCGCCTCAGCCTCCCAAAGCGCTGGGATTATAGGTATGAGCCACAGTGCAGGCCTGCATAATTCTTGATGATCCTCATTATCATGGAAAATTTGTGCATTGTTAAGGAAAGTGGTGCATTGATGGAAGGAAGCAAATACATTTTTAACTATATGACTGAATGAATATCTCTGGTTAGTTTGTAACATCAAGTACTTACCTCATTCAGCATTTTTCTTTCTTTAATAGACTGGGTCACCCCTAAAGAGATCATAGAAAAGACAGGTTACATACAGCAGAAGAACGTGCTCTTTTCACGGAGATAGAGAGGTCAGCGATTCACAAAAGAGCACAGGAAGAATGACAGAGGAGAGGTCCTTCCCTCTAAAGCCACAGCCCTTTAATAAGGCTTGTAGCAGCAGTTTCCTTCTGGAGACAGAGTTGATGTTTAATTTAAACATTATAAGTTTGCCTGCTGCACATGGATTCCTGCCGACTATTAAATAAATCCCTAGCTCATATGCTAACATTGCTAGGAGCAGATTAGGTCCTATTAGTTATAAAAGAGACCCATTTTCCCAGCATCACCAGCTTATCTGAACAAAGTGATATTAAAGATAAAAGTAGTTTAGTATTACAATTAAAGACCTTTTGGTAACTCAGACTCAGCATCAGCAAAAACCTTAGGTGTTAAACGTTAGGTGTAAAAATGCAATTCTGAGGTGTTAAAGGGAGGAGGGGAGAAATAGTATTATACTTACAGAAATAGCTAACTACCCATTTTCCTCCCGCAATTCCTAGAAAATATTTCAGTGTCCGTTCACACACAAACTCAGCATCTGCAGAATGAAAAACACTCAAAGGATTAGAAGTTGAAAACAAAATCAGGAAGTGCTGTCCTAAGAAGCTAAAGAGCCTCAGTTTTTTACACTCCCAAGATCAATCTGGATTTATGATTCTAAAACCCCTGGTGACAGAATCAGAGGCTGAAAACACCACTAATTATAACCAGCAGGTATGGATATTTGGAAGTCTAGGGGAGGCTGATATGAAGTTAAGACCAGAGGAAATATCTGTCCACTCCCTCTTCTCAACACCCATCTTCTAGACGCCAAGGCTAGCTATAGATCTCCATTATAGTGTTCAAGGAATTAGGAATTATCCATGTCAATAGTTTTGATTAATGTGGACGGAGAACATCTATATTACTAGATGGCAATATGTGAAAGAAGAAAACAGTATTGTTGAAAACCTAAATCTGAAATGTCAATGTAATGACAAATTTTCACCCCTAGAATGTCTACCTGGGGAGTCCTAACCCTCTAATATTCCCCTGAGAGGGATGGGAGAATACAGTGCAGAGCTTTTATATAAGTATTTCAGAAAGCAGTAGCTAAAGAATCACTTGTTTATTTCCCAGTGTTTCAAAGGCCCTTCTGAAGAACTAAGCAAACTAAGGAAAGACCATTTAGTTTTAAACAGGAGAAATGTATTTAACTAAATCCTAAACACAGCAGGCTATCTGCAAGCAGCAGCAGCAGCAGCAGCCATGCTCCCTCACAGAATCCTTACAATTTTTGAAGTTTTTTGTTTAACTGCTACAAAAGCCGATTTAGTAACATTTATTACACTTAAAAACTTCAGTTCATTTGTAGTTCAAAGCAAATGTATTGGCTTTGAGTTTAAAGACTGAACTACTTTAGATTTGATTTGCATTTTTTTTTTTTTTTTTTTTTGAGATGCAGTCTTGCTCTGTCAGCCAGGCTGGAGTGCAGTGGCTGGATCTCAGCTCACGGCAAGCTCTGCCTCCTGGGTTCATGCCATTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGACTACAGATGCCCGCCACCATGCCCGGCTAATTTTTTGTATTTTTACTAGAGATGGGGTTTCACCGTGTTAGCCAGGATGGTCTCGATCTCCTGACCTCGTGATCTGCCCGCCTTGGCCCCCCAAAGCGCTGGGATTACAGGCCTGAGCCACCACGCTTGGCATCTTTTTACCTTTCATTAACTTTGATGCAAACCTATAGCTTAAGGTATCTTAAACTTTAATGACATTTTTCTCTAAAATAGTAGTTTGTAATAACTTGTTCTGGCACCTGGCTCCAATGAACACTACCCTCTGACCCTGTGGTATAATTTTCATGAGTAAGTGGAAACCTAAGATCTTAGAAGTTCAACGGCAATGTGTCCAAGGGGTTTAGATCCTCTCCTTAAGTGCCTGTATCTCTGTGAAAAGAATCATCATAGGCTAGGCGCGATGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCCGAGGTAGGTGGATCACCTGAGGTCGGGAGTCCAAGACCAGCCTGACTGACATGGAAAAACCCTGTCTCTACTAAAAATACAAAATTAGGTATGGTGGTGCATTCCTGTAATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCGGGAGGGGGAGGTTGCAGCAAGCCAAGATCGTGCCATTGCACTCCAGCAGCCTGGGCAACAAGAGTGAAAAACTACACCTCAAAAACAAAAACAAAAACAAAAGAATCATCATCAAGTGAACTGGAACACATCCAGAGAACTAATTTTGTTAGAAAGATTTTAGAGTTGAGCCACACAATCTGCATCTTCTGCGTCCTCCATGCACTCGTCTGCTTTCTGGAGCCCCATGAGTGAGTCTTAATCCTGTTCCAGATAACAGTTCTCTTCCGGGTAACGGTTCTTCAGATACTTGAAGACAGTGTCTTATTTCCTTAAATCTTCTCATTTCTTCTTCAAAAGACAGTATTTCAAGTTACTTTTATGTATCTTTACCATCTACCTCTGGATAAACACTCTCCAATTTGTCAGTGACCATGTTAAAAACCAAGCACGGTGCTTAAAACTGACATCATCTTTCAGGCAATCACTCCATTGGAGAATACAGTGGGGCTCTGGATCTGTACTTCACTTGCTCCAGAGCCTCTGCTTGTGTTAATACGGCCCAGTTTCAAATAAGCATTTTTAGCAGCCCTGAAATGTGTACTCAGATTTAGTTTATAGTCAACTAAAAACACCCAGAGGTCTCCTGTATTACACAAGTTATAATTAAAACCTTAAAAGAGAAAGGTATAGGACAAATGATCTGTCTCCTCCCTTTTTTGCTTTTTCATATGTTAAGACTATCTCGGAGCTGTTATCAGACTTTTTTCCTGAAAAACTCTCAACAATACTCAAACTAGGTGTTACATGAAGCTGGGGTCTCCAGGTTTTGCCTCACTTGTTCTTTCTTTTGTTGTTGTTGAGACAGAGTCTCACTCTGTCGCCAGGCTGGAGTGCAGTGGCAGGATCTCAGCTGACTGCAACCTCAGCCTCCAGAGTTCAAGCAATTCTTCTGTGTCAGCCTCCCAAGTAGCTGGGATTACAGGTGCACACCACCACGCCCAGCCA

La secuencia de 42 bases

TTTAATTGAAAGAAGTTAATTGAATGAAAATGATC

AACTAAG

La secuencia de 42 bases

TTTAATTGAAAGAAGTTAATTGAATGAAAATGATC

AACTAAG

Está presente en el genoma de 10 vertebrados:Hombre, chimpancé, ratón, rata, perro, pollo, rana, pez, cebra, pez fugu, tetraodón

En: “The Mathematics of Phylogenomics”Lior Pachter and Bernd Sturmfels

http://arxiv.org/abs/math.ST/0409132

Ver también el libro: Algebraic Statistics for Computational BiologyCambridge University Press, 2005

• La probabilidad (de acuerdo al modelo de evolución de Jukes-Cantor) de que

esto haya ocurrido por azar es aproximadamente igual a:

10 -50 = 0, 0……..01

(50 cifras decimales)

Conjetura:

Esta secuencia de 42 bases estaba en un ancestro común a todos estos vertebrados

TAGAGACGGGGGTTTCACAATGTTGGCCA

Muchas gracias por venir!

Agradecemos a Agradecemos a Lior Pachter y Bernd SturmfelsLior Pachter y Bernd Sturmfelspor autorizarnos a reproducirpor autorizarnos a reproducir

la figura de su personajela figura de su personajeDiaNADiaNA

creado para su libro:creado para su libro:

Algebraic Statistics for Computational Biology

Cambridge University Press, 2005

top related