probabilidad 2
TRANSCRIPT
Una función f de R en R es una colección de pares ordenados de números reales que no contiene dos pares distintos con el primer elemento igual.
Variables Aleatorias
El resultado de un experimento aleatorio puede ser descrito como una cantidad
numérica.
Hemos visto que los posibles resultados de un experimento aleatorio (espacio
muestral E) no son siempre numéricos. El suceso "cara" al tirar una moneda al aire o
el suceso "bastos" al sacar una carta de la baraja. Hablábamos, por ejemplo, de que
saliese el dos o el cinco al tirar un dado, pero estos números sólo servían para
distinguir una cara del dado de la otra.
A partir de ahora nos vamos a referir a fenómenos cuantitativos, tales como cuántas
veces sale cara al tirar repetidamente una moneda al aire, la media de edad de los
consumidores de cierta marca de chicle, etc.
Desde un punto de vista formal diremos que una variable aleatoria es toda función que permite atribuir un número real y sólo uno a cada suceso del espacio muestral. En otras palabras es una aplicación X: E → R
Variables Aleatorias
Experimento aleatorio: Sacar dos cartas de una baraja española y observar el palo
al que pertenecen. Representamos con "O", "C", "E" y "B" los palos de oros, copas,
espadas y bastos respectivamente, los resultados posibles son:
OO, OC, OE, OB, CC, CE, CB, EE, EB, BB
Definamos, la variable aleatoria "número de copas", los valores que se atribuyen a
cada uno de los sucesos que constituyen el espacio muestral son: 0, 1, 0, 0, 2, 1, 1,
0, 0, 0 respectivamente.
Pero podemos definir también sobre este mismo espacio muestral otra variable
aleatoria que da 1 punto a cada carta de oros, 2 a las de copas, 3 a las de espadas
y 4 a las de bastos, sumando los valores de las cartas de cada mano, ahora los
valores de la nueva variable serían 2, 3, 4, 5, 4, 5, 6, 6, 7, 8 respectivamente.
Dado un único espacio muestral cabe definir distintas variables aleatorias pero, sea cual sea el procedimiento de atribución de valores seleccionado, a cada suceso le corresponderá un valor y sólo uno de la variable (recordar el concepto de función).
Variables Aleatorias
Dos tipos de variables aleatorias:
Puesto que los espacios muestrales pueden ser clasificados como discretos o
continuos, también las variables aleatorias definidas sobre dichos espacios
muestrales serán discretas o continuas, radicando la diferencia en si sus elementos
son numerables o no. La naturaleza, discreta o continua, de las variables aleatorias,
tiene una importancia decisiva sobre el proceso matemático del cálculo de las
probabilidades de sus valores.
Variables Aleatorias Discretas: Son aquellas variables que se definen sobre espacios muestrales finitos (p.e “tirar un dado al aire”) o infinitos pero numerables. (p.e. “el número de accidentes de trafico en un fin de semana”)
Variables Aleatorias Continuas: Son aquellas variables que se definen sobre espacios muestrales infinitos pero numerables. (p.e. la estatura de los alumnos de esta clase)
Variables Aleatorias Discretas
Dos conceptos de vital importancia relacionados con las variables
aleatorias discretas son los que se refieren a las funciones que asocian
a cada uno de sus valores las probabilidades de que éstas adopten esos
valores y a las de que adopten como mucho esos valores.
La Función de
Probabilidad.
La Función de Distribución
de Probabilidad.
Función de Distribución de Probabilidad F(x)
( ) ( )i iF x P X x= ≤
Es aquella que asigna a todo número real, xi, la probabilidad de que
la variable aleatoria X asuma ese valor xi o cualquier valor inferior a
xi. Simbólicamente se define:
Función de Probabilidad f(x)
Es aquella que asigna a todo número real, xi, la probabilidad de que la
variable aleatoria X asuma ese valor, valga xi. Simbólicamente se
define:
( ) ( )i if x P X x= =
Variables Aleatorias Discretas
1.0006487∑
0.008535
0.0503244
0.27717963
0.44128652
0.21914221
0.004270
pini Nº coches en la unidad familiar
Eligiendo al azar una familia, definamos la variable “Nº de coches de la unidad familiar”. Se trata de una Variable Aleatoria y dado que los valores encontrados oscilan entre 0 y 5 coches la variable es aleatoria y discreta.
1.000∑
1.0000.0085
0.9920.0504
0.9420.2773
0.6650.4412
0.2230.2191
0.0040.0040
Fx pafx px
Frecuencia Relativa
(Función de Probabilidad)
Frecuencia Relativa Acumulada
(Función de Distribución de Probabilidad)
∑ =1)(xP
277.0)3( ==xP
942.0)3( =≤xPProbabilidad de que una familia seleccionada al azar tenga 3 coches o menos
Probabilidad de que una familia seleccionada al azar tenga 3 coches
Variables Aleatorias Discretas
Funciones de Distribución y Probabilidad discretas
Las distribuciones de probabilidad discretas de mayor importancia para Psicología
son la de Bernoulli, la binomial y la de Poisson.
La distribución de Bernoulli ofrece las probabilidades de éxito y fracaso en
experimentos con dos resultados. Se trata de una función de probabilidad que se
define para variables aleatorias con sólo dos valores, 0 y 1 (fracaso y éxito)
Experimento de Bernoulli
Un gran número de problemas de estadística y probabilidad aplicada, se refieren a
situaciones donde un experimento se repite muchas veces, y éste sólo tiene dos
resultados posibles. Así en la posible efectividad de un nuevo tratamiento de la
fobia social, cada paciente recibe un tratamiento individual (ensayo) y para cada
uno de ellos, el tratamiento puede ser efectivo (éxito) o no efectivo (fracaso).
Funciones de Distribución y Probabilidad discretas
Un experimento se denomina de Bernoulli si:
a) El resultado de cada ensayo puede clasificarse como éxito (ocurrencia del
evento) o fracaso (no ocurrencia).
b) Los ensayos son independientes entre si.
c) La probabilidad de éxito p se mantiene constante entre ensayo y ensayo.
Experimento de Bernouilli
En una ruleta hay 38 números de los cuales 18 son rojos, 18 negros y 2 verdes. Si hacemos girar la ruleta, cada uno de los 38 números, son evidentemente equiprobables. Si ganamos solamente cuando la bola cae en rojo, sólo existirán dos resultados no igualmente equiprobables: éxito o fracaso.
Si definimos p como la probabilidad de éxito. En nuestro ejemplo:p = 18/38 = 0.474y la probabilidad de fracaso como 1-p = 1 – 0.474 = 0.526
Determina la probabilidad de los posibles resultados a partir de tres jugadas consecutivas en dicha ruleta ( 23 = 8 ) (E Éxito, F Fracaso)
106.0474.0474.0474.0 =⋅⋅ 118.0118.0 131.0
118.0526.0474.0474.0 =⋅⋅ 131.0 131.0 146.0FFFFEFEFFEEF
FFEFEEEFEEEE
Experimento de Bernouilli
106.0 354.03118.0 =⋅ 393.03131.0 =⋅ 146.0
FFFFFE EFF FEFEFE EEF FEEEEE
0 Éxito1 Éxito2 Éxitos3 Éxitos
Combinaciones de n elementos tomados de x en x
)!(!
!
xnx
n
x
n
exitos
ensayos
−=
=
Experimento de Bernouilli
32
6
)!23(!2
!3
2
3==
−=
16
6
)!33(!3
!3
3
3==
−=
16
6
)!03(!0
!3
0
3==
−=
3 jugadas 2 éxitos (rojo) =
3 jugadas 3 éxitos (rojo) =
3 jugadas 0 éxitos (rojo) =
32
6
12
123
)!13(!1
!3
1
3==
⋅⋅⋅=
−=
3 jugadas 1 éxito (rojo) =
Funciones de Distribución y Probabilidad discretas
Distribución Binomial
La distribución de probabilidad binomial es la más interesante de las distribuciones
discretas. Es la función de probabilidad que corresponde a una variable aleatoria
definida como el número de éxitos que se pueden alcanzar en n experimentos de
Bernoulli. El menor valor asumible para esta variable es el 0, en el caso que no se
obtenga ningún éxito en los n experimentos de Bernoulli, siendo el valor más alto
el 1 cuando se hubiesen obtenido todo éxitos en los n experimentos.
Su función de probabilidad tiene la siguiente forma:
x n-xnf(x)= (0 x n)p q
x
≤ ≤
n → es el número de experimentos de Bernoullix → son los valores de la variable aleatoria (número de éxitos)p → es la probabilidad de éxito en un experimento de Bernoulliq → es la probabilidad de fracaso en un experimento de Bernoulli.
Funciones de Distribución y Probabilidad Discretas: Binomial
De otra manera:
Supongamos un experimento aleatorio consistente en realizar n pruebas independientes o ensayos. En cada ensayo la probabilidad p de aparición del suceso S (denominado "acierto") es constante y conocida. Sea la variable X el número de aciertos (apariciones del suceso S) tras los n ensayos.
Evidentemente, los valores permisibles de X serán 0, 1, 2, 3,...,n.
En estas condiciones, la función de probabilidad de X viene da-da por:
x n-xn,xf(x)=C p q
n → Número de ensayos. x → Número de aciertos. Cn,x → Las combinaciones de n elementos tomados de x en x. p → La probabilidad de acierto. q=1 p‑ → La probabilidad de error.
Probabilidad Binomial
106.0 354.03118.0 =⋅ 393.03131.0 =⋅ 146.0
FFFFFE EFF FEFEFE EEF FEEEEE
Siguiendo con el ejemplo de la ruleta
xnx ppx
nxP −−⋅
= )1()(
( )( )( )( ) 146.0)474.01(474.010
394.0)474.01(474.031
354.0)474.01(474.032
106.0)474.01(474.013
30
21
12
03
=−⋅=
=−⋅=
=−⋅==−⋅=
P
P
P
P
16
6
)!33(!3
!3
3
3==
−=
Función de Probabilidad
Probabilidad Binomial
Función de Distribución del número de éxitos en una secuencia de ensayos de Bernoulli para el ejemplo de la ruleta.
( )( )( )( ) 146.0 0
540.0146.0394.0 1
894.0146.0394.0354.0 2
1146.0394.0354.0106.03
====+=≤=++=≤=+++=≤
xP
xP
xP
xP
( ) ( )( ) ( )( ) ( ) 394.0 146.0 540.00)1(1
354.0540.0894.01)2(2
106.0 894.0 12)3(3
=−==−≤===−=≤−≤===−=≤−≤==
xPxPxP
xPxPxP
xPxPxP
De donde se deduce que:
Función de Distribución
Funciones de Distribución y Probabilidad discretas
Supongamos, como ejemplo, que un estudiante contesta al azar los 20 ítems
de un examen. Cada ítem tiene 5 alternativas. ¿Cuál es la probabilidad de que
dicho estudiante acierte 10 preguntas al azar?
El valor de n, número de ensayos, es 20; puesto que nos interesa la probabilidad
de que acierte 10 preguntas, éste será el valor de x, número de aciertos; p es 0,20,
porque de las 5 alternativas sólo una es correcta; finalmente, q=1 p= 0,80. ‑
( )
x n-xn,x
2010
10 10
f(x)=C p q ;
! 20!C= 15504
!( )! 15! 5!
15504 0,20 0,80 0,002
n
x n x= = =
− ⋅⋅ =
Funciones de Distribución y Probabilidad discretas
Supongamos ahora que realizamos un experimento de telepatía, para lo cual
extraemos en cada ensayo una carta de un mazo de 50 pedimos al supuesto
telépata que la adivine, anotamos el resultado y devolvemos la carta al mazo
barajándolo a continuación. Si cada carta del mazo tiene uno de 5 dibujos
posibles, ¿Cuál es la probabilidad de que tras 25 ensayos el sujeto acierte 5
cartas por mero azar?
Evidentemente, n=25, x=5, p=(1/5)=0,2 y q=1 0,2 = 0,8,‑
x n-xn,x
5 20
f(x)=C p q
25!f(x=5)= 0,20 0,80 0,196
5!(20-5)!
=
=
Funciones de Distribución y Probabilidad discretas
Como hemos visto, en cuanto a la Función de Distribución sabemos que
podemos calcularla sumando las probabilidades de cada uno de los valores de
la variable iguales o menores que el dado. Así, si lo que nos interesa es saber
cuál es la probabilidad de que el estudiante que respondía al azar obtenga 9 o
menos respuestas correctas (es decir, suspenda) lo calcularemos como:
F(9)= f(0)+f(1)+f(2)+f(3)+f(4)+f(5)+f(6)+f(7)+f(8)+f(9)
Afortunadamente para nosotros, existen tablas de la función de distribución
binomial que nos permiten localizar rápidamente el valor de dicha función
para unos n, x y p dados
Tabla de Función de Distribución binomial: Cómo calcular la función de distribución a partir de las tablas
,000,000,003,048,245,588,872,983,9991,001,0010
,000,000,001,017,128,412,755,952,9971,001,009
,000,000,000,005,057,252,596,887,9901,001,008
,000,000,000,001,021,132,416,772,9681,001,007
,000,000,000,000,007,058,250,608,913,9981,006
,000,000,000,000,002,021,126,416,804,9891,005
,000,000,000,000,000,006,051,237,630,957,9974
,000,000,000,000,000,001,016,107,411,867,9843
,000,000,000,000,000,000,004,035,206,677,9252
,000,000,000,000,000,000,001,008,069,392,7361
,000,000,000,000,000,000,000,001,012,122,358020
,95,90,80,70,60,50,40,30,20,10,05xn
p
Supongamos, como ejemplo, que un estudiante contesta al azar los 20 ítems de un examen.
Cada ítem tiene 5 alternativas. ¿Cuál es la probabilidad de que dicho estudiante acierte 10
preguntas al azar? ¿Cuál es la probabilidad de que acierte 9 o menos preguntas correctas (es
decir suspenda)?
Localizamos el valor de la función de distribución binomial en las tablas: n=20, x=10, x=9; p=0,20.
Distribución Binomial
Si en el experimento de telepatía estuviésemos interesados en la probabilidad de
obtener 5 o menos aciertos, localizaríamos en la tabla los valores de n, x y p, para
obtener que F(x ≤ 5) = 0,617.
Las tablas de la función de distribución nos permiten también hallar el valor de la
función de probabilidad muy fácilmente. En el caso del examen, por ejemplo, es
evidente que f(x =10)= F(x ≤ 10) F(x ≤ 9), con lo que, buscando ambos valores en las ‑tablas, tendremos:
En el ejemplo de las respuestas al examen
f(10)=F(x ≤ 10) F(x ≤ 9)=0,999 0,997=0,002‑ ‑
En el ejemplo del telépata,
f(5)=F(x ≤ 5) F(x ≤ 4)=0,617 0,421=0,196‑ ‑
Distribución Binomial
Siguiendo con el ejemplo del telépata, supongamos que deseamos saber la
probabilidad de que acierte, por mero azar, 11 o más cartas. Puesto que la
probabilidad total es 1, se cumplirá que:
P(X≥ 11)= 1 P(X< 11)= 1 P(X ‑ ‑ ≤ 10)= 1 F(10)= 1 0,994=0,006‑ ‑
¿Cuál es la probabilidad de que acierte, más de cinco y menos de doce cartas?
P(5< X <12)= P(6≤ X ≤ 11) = f(6)+f(7)+f(8)+f(9)+f(10)+f(11)=
F(X ≤11)-F(X ≤5)= 0,381
Tabla de distribución binomial
,000,000,006,098,414,788,966,9981,001,001,0014
,000,000,002,044,268,655,922,9941,001,001,0013
,000,000,000,018,154,500,846,9831,001,001,0012
,000,000,000,006,078,345,732,956,9981,001,0011
,000,000,000,002,034,212,586,902,9941,001,0010
,000,000,000,001,013,115,425,811,9831,001,009
,000,000,000,000,004,054,274,677,9531,001,008
,000,000,000,000,001,022,154,512,891,9981,007
,000,000,000,000,000,007,074,341,780,9911,006
,000,000,000,000,000,002,029,193,617,967,9995
,000,000,000,000,000,001,009,090,421,902,9934
,000,000,000,000,000,000,002,033,234,764,9663
,000,000,000,000,000,000,000,009,098,537,8732
,000,000,000,000,000,000,000,002,027,271,6421
,000,000,000,000,000,000,000,000,004,072,277025
,950,900,800,700,600,500,400,300,200,100,050xn
p
Distribución de Poisson
Las condiciones que debe cumplir una variable aleatoria para que su función de probabilidad se ajuste a la distribución de Poisson son:
1) La probabilidad de que se dé más de un suceso en una unidad de tiempo lo suficientemente pequeña es despreciable.
2) La probabilidad de aparición de un suceso en un intervalo de longitud muy pequeña es proporcional a dicha longitud. Es decir, la probabilidad de que se produzca un suceso en un intervalo de longitud dt es λdt, donde λ es una constante positiva.
3) El número de sucesos que se dan en un intervalo de longitud T es independiente del número de sucesos que se den en otro intervalo de idéntica longitud.
Distribución de Poisson
Algunos ejemplos de variables cuya función de probabilidad se ajusta a
la de Poisson podrían ser el número de erratas por página en un libro
grande, el número de llamadas recibidas por minuto en una centralita, el
número de partículas a emitidas por unidad de tiempo por un elemento
radiactivo, el número de personas que cada minuto a las horas punta
hacen cola en la ventanilla de un banco, etc.
Distribución de Poisson
Bajo las mismas condiciones impuestas a la binomial:
1.- El resultado de cada ensayo puede clasificarse como éxito (ocurrencia del
evento) o fracaso (no ocurrencia)
2.- Los ensayos son independientes entre si
3.- La probabilidad de éxito p se mantiene constante entre ensayo y ensayo.
Si el número de ensayos tiende a infinito y la probabilidad de éxito o
verificación del evento tiende a 0. La distribución binomial tiende hacia
otra denominada de Poisson.
λλ −= ex
xPx
!)(
donde e = 2.7182 o base de los logaritmos neperianos y n pλ = ⋅
Distribución de Poisson
Supongamos como ejemplo que en un cierto libro hay un promedio de 10
erratas cada 50 páginas. ¿Cuál es la probabilidad de encontrar 5 erratas
en 5 páginas?
Puesto que la unidad de trabajo son las 5 páginas, debemos pasar a
dicha unidad el promedio, con lo que:
51
10(5 ) 1
50
1(5) 0,003
5!f e
λ
−
= ⋅ =
= ⋅ =
n pλ = ⋅
Distribución de Poisson
Si nos interesase la probabilidad de que entrasen entre cinco y diez clientes ambos incluidos…
Veamos otro ejemplo. En un determinado comercio entran por término medio 2
clientes cada hora. Calcular la probabilidad de que en una mañana concreta (en
4 horas) entren 5 clientes.
(2 4) 8
( 5) ( 5) ( 4) 0,191 0,100 0,09P x F x F x
λ = ⋅ == = ≤ − ≤ = − =
(5 10) ( 10) ( 4)
0,816 0,100 0,716
P x F x F x≥ ≥ = ≤ − ≤ =− =
Distribución de PoissonEjemplo:
En una gran superficie se ha constatado que un 2% de los usuarios realizan
hurtos en sus compras. ¿Cuál el la probabilidad de encontrar 3 clientes que
hayan robado, si hiciésemos un seguimiento de 100 clientes elegidos al azar?
32
3 97
( ) 100 0.02 2!
2 8P(3) 2.71828 0.135 0.18
3! 6
( ) (1 )
100!(3) 0.02 (1 0.02) 0.18
3!(100 3)!
x
x n x
P x ex
nP x p p
x
P
λλ λ−
−
−
= = ⋅ =
= = ⋅ =
= ⋅ −
= ⋅ − = −
Poisson
Binomial
Distribución de Poisson: tabla
Distribución de Poisson, P(X ≤ x)
1,0001,0001,0001,0001,0001,0001,0001,0001,0001,0009
,857,875,891,907,921,934,946,957,966,9743
,677,704,731,757,783,809,833,857,879,9002
,406,434,463,493,525,558,592,627,663,6991
,135,150,165,183,202,223,247,273,301,3330
2,001,901,801,701,601,501,401,301,201,10x
λ
18.0677.0857.0)2()3()3( =−=≤−≤== xPxPxP
Distribución de Poisson
Clarke (1946) intentó comprobar si las bombas volantes lanzadas por los alemanes caían sobre Londres aleatoriamente o de modo sistemático. Para ello dividió la superficie de la ciudad en 576 rectángulos de igual tamaño y observó donde cayeron 537 bombas. La siguiente tabla presenta el número de impactos registrados por área y sus probabilidades a posteriori o empíricas. (Amon, J. 1982)
¿Las bombas caían aleatoriamente o seguían un patrón sistemático?
Observamos que p(x), probabilidad de que cualquier área sea alcanzada, es muy
pequeño 1/576 y n (537 lanzamientos) grande, por lo que podemos asumir que si
estos fuesen aleatorios, el número de impactos por áreas seguirían la distribución
de Poisson con λ = 537 x 0.0017 = 0.91 ~ 0.9
Distribución de Poisson
398.0576229 =
366.0576211 =
161.057693 =
061.057635 =
012.05767 =
002.05761 =Áreas con 5 o más impactos
Áreas con 4 impactos
Áreas con 3 impactos
Áreas con 2 impactos
Áreas con 1 impacto
Áreas sin ningún impacto
Los resultados empíricos fueron los siguientes:
Distribución de Poisson
1,0001,0001,0001,0001,0001,0001,0001,0001,0001,0007
1,0001,0001,0001,0001,0n01,0001,0001,0001,0001,0006
,9991,001,0001,0001,0001,0001,0001,0001,0001,0005
,996,998,999,9991,0001,0001,0001,0001,0001,0004
,981,987,991,994,997,998,9991,0001,0001,0003
,920,937,953,966,977,986,992,996,9991,0002
,736,772,809,844,878,910,938,963,982,9951
,368,407,449,497,549,607,670,741,819,9050
1,00,90,80,70,60,50,40,30,20,10x
λ
Distribución de Poisson, P(X <= x)
Distribución de Poisson
0.0021- 0.998 = 0.002Poisson 5 impactos o más
0.0120.998 - 0.987 = 0.011Poisson 4 impactos
0.0610.987 - 0.937 = 0.050Poisson 3 impactos
0.1610.937 - 0.772 = 0.165Poisson 2 impactos
0.3660.772 - 0.407 = 0.365Poisson 1 impacto
0.398 0.407Poisson 0 impactos
Prop. de impactosPoisson P(x)
Tal y como podemos observar hay una coincidencia casi total entre las
proporciones de impactos esperados por puro azar y las proporciones empíricas
registradas. Por ello concluimos que los lanzamientos fueron realizados sin un
patrón de objetivos concreto.
Distribución de Poisson
• Sirve como aproximación de una distribución binomial con la misma media, para ‘n grande’ (n>30) y ‘p pequeño’ (p<0,1).
• Queda caracterizada por un único parámetro μ (que es a su vez su media y varianza.)
• Función de probabilidad:
,...2,1,0 ,!
][ === − kk
ekXPkµµ
Ejemplos de variables de Poisson
• El número de individuos que será atendido un día cualquiera en el servicio de urgencias del hospital clínico universitario.– En Málaga hay 500.000 habitantes (n grande)– La probabilidad de que cualquier persona tenga un accidente es
pequeña, pero no nula. Supongamos que es 1/10.000– Bin(n=500.000,p=1/10.000) ≈ Poisson(μ=np=50)
• Sospechamos que diferentes hospitales pueden tener servicios de traumatología de diferente “calidad” (algunos presentan pocos, pero creemos que aún demasiados, enfermos con secuelas tras la intervención). Es dificil compararlos pues cada hospital atiende poblaciones de tamaños diferentes (ciudades, pueblos,…)– Tenemos en cada hospital n, nº de pacientes atendidos o nº individuos
de la población que cubre el hospital.– Tenemos p pequeño calculado como frecuencia relativa de secuelas
con respecto al total de pacientes que trata el hospital, o el tamaño de la población,…
– Se puede modelar mediante Poisson(μ=np)