probabilidad 2

Una función f de R en R es una colección de pares ordenados de números reales que no contiene dos pares distintos con el primer elemento igual.

Variables Aleatorias

El resultado de un experimento aleatorio puede ser descrito como una cantidad

numérica.

Hemos visto que los posibles resultados de un experimento aleatorio (espacio

muestral E) no son siempre numéricos. El suceso "cara" al tirar una moneda al aire o

el suceso "bastos" al sacar una carta de la baraja. Hablábamos, por ejemplo, de que

saliese el dos o el cinco al tirar un dado, pero estos números sólo servían para

distinguir una cara del dado de la otra.

A partir de ahora nos vamos a referir a fenómenos cuantitativos, tales como cuántas

veces sale cara al tirar repetidamente una moneda al aire, la media de edad de los

consumidores de cierta marca de chicle, etc.

Desde un punto de vista formal diremos que una variable aleatoria es toda función que permite atribuir un número real y sólo uno a cada suceso del espacio muestral. En otras palabras es una aplicación X: E → R


Experimento aleatorio: Sacar dos cartas de una baraja española y observar el palo

al que pertenecen. Representamos con "O", "C", "E" y "B" los palos de oros, copas,

espadas y bastos respectivamente, los resultados posibles son:

OO, OC, OE, OB, CC, CE, CB, EE, EB, BB

Definamos, la variable aleatoria "número de copas", los valores que se atribuyen a

cada uno de los sucesos que constituyen el espacio muestral son: 0, 1, 0, 0, 2, 1, 1,

0, 0, 0 respectivamente.

Pero podemos definir también sobre este mismo espacio muestral otra variable

aleatoria que da 1 punto a cada carta de oros, 2 a las de copas, 3 a las de espadas

y 4 a las de bastos, sumando los valores de las cartas de cada mano, ahora los

valores de la nueva variable serían 2, 3, 4, 5, 4, 5, 6, 6, 7, 8 respectivamente.

Dado un único espacio muestral cabe definir distintas variables aleatorias pero, sea cual sea el procedimiento de atribución de valores seleccionado, a cada suceso le corresponderá un valor y sólo uno de la variable (recordar el concepto de función).


Dos tipos de variables aleatorias:

Puesto que los espacios muestrales pueden ser clasificados como discretos o

continuos, también las variables aleatorias definidas sobre dichos espacios

muestrales serán discretas o continuas, radicando la diferencia en si sus elementos

son numerables o no. La naturaleza, discreta o continua, de las variables aleatorias,

tiene una importancia decisiva sobre el proceso matemático del cálculo de las

probabilidades de sus valores.

Variables Aleatorias Discretas: Son aquellas variables que se definen sobre espacios muestrales finitos (p.e “tirar un dado al aire”) o infinitos pero numerables. (p.e. “el número de accidentes de trafico en un fin de semana”)

Variables Aleatorias Continuas: Son aquellas variables que se definen sobre espacios muestrales infinitos pero numerables. (p.e. la estatura de los alumnos de esta clase)

Variables Aleatorias Discretas

Dos conceptos de vital importancia relacionados con las variables

aleatorias discretas son los que se refieren a las funciones que asocian

a cada uno de sus valores las probabilidades de que éstas adopten esos

valores y a las de que adopten como mucho esos valores.

La Función de

Probabilidad.

La Función de Distribución

de Probabilidad.

Función de Distribución de Probabilidad F(x)

( ) ( )i iF x P X x= ≤

Es aquella que asigna a todo número real, xi, la probabilidad de que

la variable aleatoria X asuma ese valor xi o cualquier valor inferior a

xi. Simbólicamente se define:

Función de Probabilidad f(x)

Es aquella que asigna a todo número real, xi, la probabilidad de que la

variable aleatoria X asuma ese valor, valga xi. Simbólicamente se

define:

( ) ( )i if x P X x= =


1.0006487∑

0.008535

0.0503244

0.27717963

0.44128652

0.21914221

0.004270

pini Nº coches en la unidad familiar

Eligiendo al azar una familia, definamos la variable “Nº de coches de la unidad familiar”. Se trata de una Variable Aleatoria y dado que los valores encontrados oscilan entre 0 y 5 coches la variable es aleatoria y discreta.

1.000∑

1.0000.0085

0.9920.0504

0.9420.2773

0.6650.4412

0.2230.2191

0.0040.0040

Fx pafx px

Frecuencia Relativa

(Función de Probabilidad)

Frecuencia Relativa Acumulada

(Función de Distribución de Probabilidad)

∑ =1)(xP

277.0)3( ==xP

942.0)3( =≤xPProbabilidad de que una familia seleccionada al azar tenga 3 coches o menos

Probabilidad de que una familia seleccionada al azar tenga 3 coches


Funciones de Distribución y Probabilidad discretas

Las distribuciones de probabilidad discretas de mayor importancia para Psicología

son la de Bernoulli, la binomial y la de Poisson.

La distribución de Bernoulli ofrece las probabilidades de éxito y fracaso en

experimentos con dos resultados. Se trata de una función de probabilidad que se

define para variables aleatorias con sólo dos valores, 0 y 1 (fracaso y éxito)

Experimento de Bernoulli

Un gran número de problemas de estadística y probabilidad aplicada, se refieren a

situaciones donde un experimento se repite muchas veces, y éste sólo tiene dos

resultados posibles. Así en la posible efectividad de un nuevo tratamiento de la

fobia social, cada paciente recibe un tratamiento individual (ensayo) y para cada

uno de ellos, el tratamiento puede ser efectivo (éxito) o no efectivo (fracaso).


Un experimento se denomina de Bernoulli si:

a) El resultado de cada ensayo puede clasificarse como éxito (ocurrencia del

evento) o fracaso (no ocurrencia).

b) Los ensayos son independientes entre si.

c) La probabilidad de éxito p se mantiene constante entre ensayo y ensayo.

Experimento de Bernouilli

En una ruleta hay 38 números de los cuales 18 son rojos, 18 negros y 2 verdes. Si hacemos girar la ruleta, cada uno de los 38 números, son evidentemente equiprobables. Si ganamos solamente cuando la bola cae en rojo, sólo existirán dos resultados no igualmente equiprobables: éxito o fracaso.

Si definimos p como la probabilidad de éxito. En nuestro ejemplo:p = 18/38 = 0.474y la probabilidad de fracaso como 1-p = 1 – 0.474 = 0.526

Determina la probabilidad de los posibles resultados a partir de tres jugadas consecutivas en dicha ruleta ( 23 = 8 ) (E Éxito, F Fracaso)

106.0474.0474.0474.0 =⋅⋅ 118.0118.0 131.0

118.0526.0474.0474.0 =⋅⋅ 131.0 131.0 146.0FFFFEFEFFEEF

FFEFEEEFEEEE


106.0 354.03118.0 =⋅ 393.03131.0 =⋅ 146.0

FFFFFE EFF FEFEFE EEF FEEEEE

0 Éxito1 Éxito2 Éxitos3 Éxitos

Combinaciones de n elementos tomados de x en x

)!(!

!

xnx

n

x

n

exitos

ensayos

−=

=


32

6

)!23(!2

!3

2

3==

−=

16

6

)!33(!3

!3

3

3==

−=

16

6

)!03(!0

!3

0

3==

−=

3 jugadas 2 éxitos (rojo) =



32

6

12

123

)!13(!1

!3

1

3==

⋅⋅⋅=

−=

3 jugadas 1 éxito (rojo) =


Distribución Binomial

La distribución de probabilidad binomial es la más interesante de las distribuciones

discretas. Es la función de probabilidad que corresponde a una variable aleatoria

definida como el número de éxitos que se pueden alcanzar en n experimentos de

Bernoulli. El menor valor asumible para esta variable es el 0, en el caso que no se

obtenga ningún éxito en los n experimentos de Bernoulli, siendo el valor más alto

el 1 cuando se hubiesen obtenido todo éxitos en los n experimentos.

Su función de probabilidad tiene la siguiente forma:

x n-xnf(x)= (0 x n)p q

x

≤ ≤

n → es el número de experimentos de Bernoullix → son los valores de la variable aleatoria (número de éxitos)p → es la probabilidad de éxito en un experimento de Bernoulliq → es la probabilidad de fracaso en un experimento de Bernoulli.

Funciones de Distribución y Probabilidad Discretas: Binomial

De otra manera:

Supongamos un experimento aleatorio consistente en realizar n pruebas independientes o ensayos. En cada ensayo la probabilidad p de aparición del suceso S (denominado "acierto") es constante y conocida. Sea la variable X el número de aciertos (apariciones del suceso S) tras los n ensayos.

Evidentemente, los valores permisibles de X serán 0, 1, 2, 3,...,n.

En estas condiciones, la función de probabilidad de X viene da-da por:

x n-xn,xf(x)=C p q

n → Número de ensayos. x → Número de aciertos. Cn,x → Las combinaciones de n elementos tomados de x en x. p → La probabilidad de acierto. q=1 p‑ → La probabilidad de error.

Probabilidad Binomial

106.0 354.03118.0 =⋅ 393.03131.0 =⋅ 146.0

FFFFFE EFF FEFEFE EEF FEEEEE

Siguiendo con el ejemplo de la ruleta

xnx ppx

nxP −−⋅

= )1()(

( )( )( )( ) 146.0)474.01(474.010

394.0)474.01(474.031

354.0)474.01(474.032

106.0)474.01(474.013

30

21

12

03

=−⋅=

=−⋅=

=−⋅==−⋅=

P

P

P

P

16

6

)!33(!3

!3

3

3==

−=

Función de Probabilidad

Probabilidad Binomial

Función de Distribución del número de éxitos en una secuencia de ensayos de Bernoulli para el ejemplo de la ruleta.

( )( )( )( ) 146.0 0

540.0146.0394.0 1

894.0146.0394.0354.0 2

1146.0394.0354.0106.03

====+=≤=++=≤=+++=≤

xP

xP

xP

xP

( ) ( )( ) ( )( ) ( ) 394.0 146.0 540.00)1(1

354.0540.0894.01)2(2

106.0 894.0 12)3(3

=−==−≤===−=≤−≤===−=≤−≤==

xPxPxP

xPxPxP

xPxPxP

De donde se deduce que:

Función de Distribución


Supongamos, como ejemplo, que un estudiante contesta al azar los 20 ítems

de un examen. Cada ítem tiene 5 alternativas. ¿Cuál es la probabilidad de que

dicho estudiante acierte 10 preguntas al azar?

El valor de n, número de ensayos, es 20; puesto que nos interesa la probabilidad

de que acierte 10 preguntas, éste será el valor de x, número de aciertos; p es 0,20,

porque de las 5 alternativas sólo una es correcta; finalmente, q=1 p= 0,80. ‑

( )

x n-xn,x

2010

10 10

f(x)=C p q ;

! 20!C= 15504

!( )! 15! 5!

15504 0,20 0,80 0,002

n

x n x= = =

− ⋅⋅ =


Supongamos ahora que realizamos un experimento de telepatía, para lo cual

extraemos en cada ensayo una carta de un mazo de 50 pedimos al supuesto

telépata que la adivine, anotamos el resultado y devolvemos la carta al mazo

barajándolo a continuación. Si cada carta del mazo tiene uno de 5 dibujos

posibles, ¿Cuál es la probabilidad de que tras 25 ensayos el sujeto acierte 5

cartas por mero azar?

Evidentemente, n=25, x=5, p=(1/5)=0,2 y q=1 0,2 = 0,8,‑

x n-xn,x

5 20

f(x)=C p q

25!f(x=5)= 0,20 0,80 0,196

5!(20-5)!

=

=


Como hemos visto, en cuanto a la Función de Distribución sabemos que

podemos calcularla sumando las probabilidades de cada uno de los valores de

la variable iguales o menores que el dado. Así, si lo que nos interesa es saber

cuál es la probabilidad de que el estudiante que respondía al azar obtenga 9 o

menos respuestas correctas (es decir, suspenda) lo calcularemos como:

F(9)= f(0)+f(1)+f(2)+f(3)+f(4)+f(5)+f(6)+f(7)+f(8)+f(9)

Afortunadamente para nosotros, existen tablas de la función de distribución

binomial que nos permiten localizar rápidamente el valor de dicha función

para unos n, x y p dados

Tabla de Función de Distribución binomial: Cómo calcular la función de distribución a partir de las tablas

,000,000,003,048,245,588,872,983,9991,001,0010

,000,000,001,017,128,412,755,952,9971,001,009

,000,000,000,005,057,252,596,887,9901,001,008

,000,000,000,001,021,132,416,772,9681,001,007

,000,000,000,000,007,058,250,608,913,9981,006

,000,000,000,000,002,021,126,416,804,9891,005

,000,000,000,000,000,006,051,237,630,957,9974

,000,000,000,000,000,001,016,107,411,867,9843

,000,000,000,000,000,000,004,035,206,677,9252

,000,000,000,000,000,000,001,008,069,392,7361

,000,000,000,000,000,000,000,001,012,122,358020

,95,90,80,70,60,50,40,30,20,10,05xn

p

Supongamos, como ejemplo, que un estudiante contesta al azar los 20 ítems de un examen.

Cada ítem tiene 5 alternativas. ¿Cuál es la probabilidad de que dicho estudiante acierte 10

preguntas al azar? ¿Cuál es la probabilidad de que acierte 9 o menos preguntas correctas (es

decir suspenda)?

Localizamos el valor de la función de distribución binomial en las tablas: n=20, x=10, x=9; p=0,20.


Si en el experimento de telepatía estuviésemos interesados en la probabilidad de

obtener 5 o menos aciertos, localizaríamos en la tabla los valores de n, x y p, para

obtener que F(x ≤ 5) = 0,617.

Las tablas de la función de distribución nos permiten también hallar el valor de la

función de probabilidad muy fácilmente. En el caso del examen, por ejemplo, es

evidente que f(x =10)= F(x ≤ 10) F(x ≤ 9), con lo que, buscando ambos valores en las ‑tablas, tendremos:

En el ejemplo de las respuestas al examen

f(10)=F(x ≤ 10) F(x ≤ 9)=0,999 0,997=0,002‑ ‑

En el ejemplo del telépata,

f(5)=F(x ≤ 5) F(x ≤ 4)=0,617 0,421=0,196‑ ‑


Siguiendo con el ejemplo del telépata, supongamos que deseamos saber la

probabilidad de que acierte, por mero azar, 11 o más cartas. Puesto que la

probabilidad total es 1, se cumplirá que:

P(X≥ 11)= 1 P(X< 11)= 1 P(X ‑ ‑ ≤ 10)= 1 F(10)= 1 0,994=0,006‑ ‑

¿Cuál es la probabilidad de que acierte, más de cinco y menos de doce cartas?

P(5< X <12)= P(6≤ X ≤ 11) = f(6)+f(7)+f(8)+f(9)+f(10)+f(11)=

F(X ≤11)-F(X ≤5)= 0,381

Tabla de distribución binomial

,000,000,006,098,414,788,966,9981,001,001,0014

,000,000,002,044,268,655,922,9941,001,001,0013

,000,000,000,018,154,500,846,9831,001,001,0012

,000,000,000,006,078,345,732,956,9981,001,0011

,000,000,000,002,034,212,586,902,9941,001,0010

,000,000,000,001,013,115,425,811,9831,001,009

,000,000,000,000,004,054,274,677,9531,001,008

,000,000,000,000,001,022,154,512,891,9981,007

,000,000,000,000,000,007,074,341,780,9911,006

,000,000,000,000,000,002,029,193,617,967,9995

,000,000,000,000,000,001,009,090,421,902,9934

,000,000,000,000,000,000,002,033,234,764,9663

,000,000,000,000,000,000,000,009,098,537,8732

,000,000,000,000,000,000,000,002,027,271,6421

,000,000,000,000,000,000,000,000,004,072,277025

,950,900,800,700,600,500,400,300,200,100,050xn

p

Distribución de Poisson

Las condiciones que debe cumplir una variable aleatoria para que su función de probabilidad se ajuste a la distribución de Poisson son:

1) La probabilidad de que se dé más de un suceso en una unidad de tiempo lo suficientemente pequeña es despreciable.

2) La probabilidad de aparición de un suceso en un intervalo de longitud muy pequeña es proporcional a dicha longitud. Es decir, la probabilidad de que se produzca un suceso en un intervalo de longitud dt es λdt, donde λ es una constante positiva.

3) El número de sucesos que se dan en un intervalo de longitud T es independiente del número de sucesos que se den en otro intervalo de idéntica longitud.


Algunos ejemplos de variables cuya función de probabilidad se ajusta a

la de Poisson podrían ser el número de erratas por página en un libro

grande, el número de llamadas recibidas por minuto en una centralita, el

número de partículas a emitidas por unidad de tiempo por un elemento

radiactivo, el número de personas que cada minuto a las horas punta

hacen cola en la ventanilla de un banco, etc.


Bajo las mismas condiciones impuestas a la binomial:

1.- El resultado de cada ensayo puede clasificarse como éxito (ocurrencia del

evento) o fracaso (no ocurrencia)

2.- Los ensayos son independientes entre si

3.- La probabilidad de éxito p se mantiene constante entre ensayo y ensayo.

Si el número de ensayos tiende a infinito y la probabilidad de éxito o

verificación del evento tiende a 0. La distribución binomial tiende hacia

otra denominada de Poisson.

λλ −= ex

xPx

!)(

donde e = 2.7182 o base de los logaritmos neperianos y n pλ = ⋅


Supongamos como ejemplo que en un cierto libro hay un promedio de 10

erratas cada 50 páginas. ¿Cuál es la probabilidad de encontrar 5 erratas

en 5 páginas?

Puesto que la unidad de trabajo son las 5 páginas, debemos pasar a

dicha unidad el promedio, con lo que:

51

10(5 ) 1

50

1(5) 0,003

5!f e

λ

−

= ⋅ =

= ⋅ =

n pλ = ⋅


Si nos interesase la probabilidad de que entrasen entre cinco y diez clientes ambos incluidos…

Veamos otro ejemplo. En un determinado comercio entran por término medio 2

clientes cada hora. Calcular la probabilidad de que en una mañana concreta (en

4 horas) entren 5 clientes.

(2 4) 8

( 5) ( 5) ( 4) 0,191 0,100 0,09P x F x F x

λ = ⋅ == = ≤ − ≤ = − =

(5 10) ( 10) ( 4)

0,816 0,100 0,716

P x F x F x≥ ≥ = ≤ − ≤ =− =

Distribución de PoissonEjemplo:

En una gran superficie se ha constatado que un 2% de los usuarios realizan

hurtos en sus compras. ¿Cuál el la probabilidad de encontrar 3 clientes que

hayan robado, si hiciésemos un seguimiento de 100 clientes elegidos al azar?

32

3 97

( ) 100 0.02 2!

2 8P(3) 2.71828 0.135 0.18

3! 6

( ) (1 )

100!(3) 0.02 (1 0.02) 0.18

3!(100 3)!

x

x n x

P x ex

nP x p p

x

P

λλ λ−

−

−

= = ⋅ =

= = ⋅ =

= ⋅ −

= ⋅ − = −

Poisson

Binomial

Distribución de Poisson: tabla

Distribución de Poisson, P(X ≤ x)

1,0001,0001,0001,0001,0001,0001,0001,0001,0001,0009

,857,875,891,907,921,934,946,957,966,9743

,677,704,731,757,783,809,833,857,879,9002

,406,434,463,493,525,558,592,627,663,6991

,135,150,165,183,202,223,247,273,301,3330

2,001,901,801,701,601,501,401,301,201,10x

λ

18.0677.0857.0)2()3()3( =−=≤−≤== xPxPxP


Clarke (1946) intentó comprobar si las bombas volantes lanzadas por los alemanes caían sobre Londres aleatoriamente o de modo sistemático. Para ello dividió la superficie de la ciudad en 576 rectángulos de igual tamaño y observó donde cayeron 537 bombas. La siguiente tabla presenta el número de impactos registrados por área y sus probabilidades a posteriori o empíricas. (Amon, J. 1982)

¿Las bombas caían aleatoriamente o seguían un patrón sistemático?

Observamos que p(x), probabilidad de que cualquier área sea alcanzada, es muy

pequeño 1/576 y n (537 lanzamientos) grande, por lo que podemos asumir que si

estos fuesen aleatorios, el número de impactos por áreas seguirían la distribución

de Poisson con λ = 537 x 0.0017 = 0.91 ~ 0.9


398.0576229 =

366.0576211 =

161.057693 =

061.057635 =

012.05767 =

002.05761 =Áreas con 5 o más impactos

Áreas con 4 impactos



Áreas con 1 impacto

Áreas sin ningún impacto

Los resultados empíricos fueron los siguientes:


1,0001,0001,0001,0001,0001,0001,0001,0001,0001,0007

1,0001,0001,0001,0001,0n01,0001,0001,0001,0001,0006

,9991,001,0001,0001,0001,0001,0001,0001,0001,0005

,996,998,999,9991,0001,0001,0001,0001,0001,0004

,981,987,991,994,997,998,9991,0001,0001,0003

,920,937,953,966,977,986,992,996,9991,0002

,736,772,809,844,878,910,938,963,982,9951

,368,407,449,497,549,607,670,741,819,9050

1,00,90,80,70,60,50,40,30,20,10x

λ

Distribución de Poisson, P(X <= x)


0.0021- 0.998 = 0.002Poisson 5 impactos o más

0.0120.998 - 0.987 = 0.011Poisson 4 impactos



0.3660.772 - 0.407 = 0.365Poisson 1 impacto

0.398 0.407Poisson 0 impactos

Prop. de impactosPoisson P(x)

Tal y como podemos observar hay una coincidencia casi total entre las

proporciones de impactos esperados por puro azar y las proporciones empíricas

registradas. Por ello concluimos que los lanzamientos fueron realizados sin un

patrón de objetivos concreto.


• Sirve como aproximación de una distribución binomial con la misma media, para ‘n grande’ (n>30) y ‘p pequeño’ (p<0,1).

• Queda caracterizada por un único parámetro μ (que es a su vez su media y varianza.)

• Función de probabilidad:

,...2,1,0 ,!

][ === − kk

ekXPkµµ

Ejemplos de variables de Poisson

• El número de individuos que será atendido un día cualquiera en el servicio de urgencias del hospital clínico universitario.– En Málaga hay 500.000 habitantes (n grande)– La probabilidad de que cualquier persona tenga un accidente es

pequeña, pero no nula. Supongamos que es 1/10.000– Bin(n=500.000,p=1/10.000) ≈ Poisson(μ=np=50)

• Sospechamos que diferentes hospitales pueden tener servicios de traumatología de diferente “calidad” (algunos presentan pocos, pero creemos que aún demasiados, enfermos con secuelas tras la intervención). Es dificil compararlos pues cada hospital atiende poblaciones de tamaños diferentes (ciudades, pueblos,…)– Tenemos en cada hospital n, nº de pacientes atendidos o nº individuos

de la población que cubre el hospital.– Tenemos p pequeño calculado como frecuencia relativa de secuelas

con respecto al total de pacientes que trata el hospital, o el tamaño de la población,…

– Se puede modelar mediante Poisson(μ=np)

probabilidad 2

Documents