distribucion hipergeometrica

38
3) DISTRIBUCIÓN HIPERGEOMÉTRICA. Los experimentos que tienen este tipo de distribución tienen las siguientes características: a) Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados. b) Las probabilidades asociadas a cada uno de los resultados no son constantes. c) Cada ensayo o repetición del experimento no es independiente de los demás. d) El número de repeticiones del experimento (n) es constante. Ejemplo: En una urna o recipiente hay un total de N objetos, entre los cuales hay una cantidad a de objetos que son defectuosos, si se seleccionan de esta urna n objetos al azar, y sin reemplazo, ¿cuál es la probabilidad de obtener x objetos defectuosos? Solución: Luego;

Upload: ricardo-miguel-ep

Post on 29-Jan-2016

379 views

Category:

Documents


2 download

DESCRIPTION

distribucion hipergeometrica

TRANSCRIPT

3) DISTRIBUCIÓN HIPERGEOMÉTRICA.

 

Los experimentos que tienen este tipo de distribución tienen las siguientes características:

a)      Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados.

b)      Las probabilidades asociadas a cada uno de los resultados no son constantes.

c)      Cada ensayo o repetición del experimento no es independiente de los demás.

d)      El número de repeticiones del experimento (n) es constante.

 

 

Ejemplo:

En una urna o recipiente hay un total de N objetos, entre los cuales hay una cantidad a de objetos que son defectuosos, si se seleccionan de esta urna n objetos al azar, y sin reemplazo, ¿cuál es la probabilidad de obtener x objetos defectuosos?

Solución:

 

Luego;

 

 

 

donde:

p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados

 

muestras de n objetos en donde hay x que son defectuosos y n-x buenos

 

todas las muestras posibles de seleccionar de n objetos tomadas de entre N objetos en total = espacio muestral

 

 

Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos?

 

Solución:

 

N = 10 objetos en total

a = 3 objetos defectuosos

n = 4 objetos seleccionados en muestra

x = 2 objetos defectuosos deseados en la muestra

 

 

 

 

donde:

 

probabilidad asociada a cada muestra de 4 objetos que se seleccionaron, con lo que se demuestra que las probabilidades no son constantes

 

formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados = muestras de 4 objetos entre los que 2 son defectuosos

 

 

Como se observa en el desarrollo de la solución del problema, la pretensión es demostrar que las probabilidades asociadas a cada uno de los resultados no son constantes.

 

Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sería:

 

 

 

 

Ejemplos:

1. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?.

 

Solución:

a) N = 9+6 =15 total de tabletas

a = 6 tabletas de narcótico

n = 3 tabletas seleccionadas

x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas de narcótico que se puede encontrar al seleccionar las 3 tabletas

 

p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas seleccionadas haya 1 o más tabletas de narcótico)

 

 

 

otra forma de resolver;

 

p(el viajero sea arrestado por posesión de narcóticos) = 1 – p(de que entre las tabletas seleccionadas no haya una sola de narcótico)

 

 

b)      p(no sea arrestado por posesión de narcóticos)

 

 

 

 

2. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote contiene 3 proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad de que , a) los 4 exploten?, b) al menos 2 no exploten?

 

Solución:

a) N = 10 proyectiles en total

a = 7 proyectiles que explotan

n = 4 proyectiles seleccionados

x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número de proyectiles que explotan entre la muestra que se dispara

 

 

b) N = 10 proyectiles en total

a = 3 proyectiles que no explotan

n = 4 proyectiles seleccionados

x = 0, 1, 2 o 3 proyectiles que no explotan

 

p(al menos 2 no exploten) = p( 2 o más proyectiles no exploten) = p(x = 2 o 3; n=4) =

 

 

 

3. a)¿Cuál es la probabilidad de que una mesera se rehúse a servir bebidas alcohólicas únicamente a dos menores de edad si verifica aleatoriamente solo 5 identificaciones de entre 9 estudiantes, de los cuales 4 no tienen la edad suficiente?, b) ¿Cúal es la probabilidad de que como máximo 2 de las identificaciones pertenezcan a menores de edad?

Solución:

 

a) N = 9 total de estudiantes

a = 4 estudiantes menores de edad

n = 5 identificaciones seleccionadas

x = variable que nos define el número de identificaciones que pertenecen a personas menores de edad

x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad

 

 

b) N = 9 total de estudiantes

a = 4 estudiantes menores de edad

n = 5 identificaciones seleccionadas

x = variable que nos define el número de identificaciones que pertenecen a personas menores de edad

x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad

 

 

 

 

4. Una compañía manufacturera utiliza un esquema para la aceptación de los artículos producidos antes de ser embarcados. El plan es de dos etapas. Se preparan cajas de 25 para embarque y se selecciona una muestra de 3 para verificar si tienen algún artículo defectuoso. Si se encuentra uno, la caja entera se regresa para verificarla al 100%. Si no se encuentra ningún artículo defectuoso, la caja se embarca. a)¿Cuál es la probabilidad de que se embarque una caja que tiene tres artículos defectuosos?, b)¿Cuál es la probabilidad de que una caja que contiene solo un artículo defectuoso se regresa para verificación?

LECCION 30ªDistribuciones discretas: Hipergeométrica

Las distribución hipergeométrica es el modelo que se aplica en experimentos del siguiente tipo:

En una urna hay bolas de dos colores (blancas y negras), ¿cuál es la probabilidad de que al sacar 2 bolas las dos sean blancas?

Son experimentos donde, al igual que en la distribución binomial, en cada ensayo hay tan sólo dos posibles resultados: o sale blanca o no sale. Pero se diferencia de la distribución binomial en que los distintos ensayos son dependientes entre sí:

Si en una urna con 5 bolas blancas y 3 negras en un primer ensayo saco una bola blanca, en el segundo ensayo hay una bola blanca menos por lo que las probabilidades son diferentes (hay dependencia entre los distintos ensayos).

La distribución hipergeométrica sigue el siguiente modelo:

Donde:

Vamos a tratar de explicarlo:

N: es el número total de bolas en la urna

N1: es el número total de bolas blancas

N2: es el número total de bolas negras

k: es el número de bolas blancas cuya probabilidad se está calculando

n: es el número de ensayos que se realiza

Veamos un ejemplo: en una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas ¿Cuál es la probabilidad de que 3 sean blancas?

Entonces:

N = 12; N1 = 7; N2 = 5; k = 3; n = 4

Si aplicamos el modelo:

Por lo tanto, P (x = 3) = 0,3535. Es decir, la probabilidad de sacar 3 bolas blancas es del 35,3%.

Pero este modelo no sólo se utiliza con experimentos con bolas, sino que también se aplica con experimentos similares:

Ejemplo: en una fiesta hay 20 personas: 14 casadas y 6 solteras. Se eligen 3 personas al azar ¿Cuál es la probabilidad de que las 3 sean solteras?

Por lo tanto, P (x = 3) = 0,0175. Es decir, la probabilidad de que las 3 personas sean solteras es tan sólo del 1,75%.

Clase anterior Proxima clase

Haz AulaFácil tu página de inicio             Envía esta página a un amigo

Env � anos un comentario        P � gina de Inicio        Cont � ctanos        � Qui � nes somos? Este es un producto de AulaFacil S.L. - © Copyright 2000

Distribuciones discretas: Multinomial

La distribución multinomial es similar a la distribución binomial, con la diferencia de que en lugar de dos posibles resultados en cada ensayo, puede haber múltiples resultados:

Ejemplo de distribución binomial: a unas elecciones se presentaron 2 partidos políticos: el POPO obtuvo un 70% de los votos y el JEJE el 30% restante. ¿Cuál es la probabilidad de que al elegir 5 ciudadanos al azar, 4 de ellos hallan votado al JEJE?

Ejemplo de distribución multinomial: a esas elecciones se presentaron 4 partidos políticos: el POPO obtuvo un 40% de los votos, el JEJE el 30%, el MUMU el 20% y el LALA el 10% restante. ¿Cuál es la probabilidad de que al elegir 5 ciudadanos al azar, 3 hayan votado al POPO, 1 al MUMU y 1 al LALA?

La distribución multinomial sigue el siguiente modelo:

Donde:

X1 = x1: indica que el suceso X1 aparezca x1 veces (en el ejemplo, que el partido POPO lo hayan votado 3 personas)

n: indica el número de veces que se ha repetido el suceso (en el ejemplo, 5 veces)

n!: es factorial de n (en el ejemplo: 5 * 4 * 3 * 2 * 1)

p1: es la probabilidad del suceso X1 (en el ejemplo, el 40%)

Veamos el ejemplo:

Luego:

P = 0,0256

Es decir, que la probabilidad de que las 5 personas elegidas hayan votado de esta manera es tan sólo del 2,56%

Nota: 0! es igual a 1, y cualquier número elevado a 0 es también igual a 1

Veamos otro ejemplo:

En una fiesta, el 20% de los asistentes son españoles, el 30% franceses, el 40% italiano y el 10% portugueses. En un pequeño grupo se han reunido 4 invitados: ¿cual es la probabilidad de que 2 sean españoles y 2 italianos?

Aplicamos el modelo:

Luego

P = 0,0384

Por lo tanto, la probabilidad de que el grupo esté formado por personas de estos países es tan sólo del 3,84%.

Clase anterior Proxima clase

Haz AulaFácil tu página de inicio             Envía esta página a un amigo

Env � anos un comentario        P � gina de Inicio        Cont � ctanos        � Qui � nes somos? Este es un producto de AulaFacil S.L. - © Copyright 2000

Distribuciones discretas: Multihipergeométrica

La distribución multihipergeométrica es similar a la distribución hipergeométrica, con

la diferencia de que en la urna, en lugar de haber únicamente bolas de dos colores, hay bolas de diferentes colores.

Ejemplo: en una urna hay 7 bolas blancas, 3 verdes y 4 amarillas: ¿cuál es la probabilidad de que al extraer 3 bolas sea cada una de un color distinto?

La distribución multihipergeométrica sigue el siguiente modelo:

Donde:

X1 = x1: indica que el suceso X1 aparezca x1 veces (en el ejemplo, que una de las bolas sea blanca)

N1: indica el número de bolas blancas que hay en la urna (en el ejemplo, 7 bolas)

N: es el número total de bolas en la urna (en el ejemplo, 14 bolas)

n: es el número total de bolas que se extraen (en el ejemplo, 3 bolas)

Veamos el ejemplo:

Luego:

P = 0,2307

Es decir, que la probabilidad de sacar una bola de cada color es del 23,07%.

Veamos otro ejemplo:

En una caja de lápices hay 10 de color amarillo, 3 de color azul y 4 de color rojo. Se extraen 7 lápices, ¿cual es la probabilidad de que 5 sean amarillos y 2 rojos?

Aplicamos el modelo:

Luego

P = 0,0777

Por lo tanto, la probabilidad de que los 5 lápices sean de los colores indicados es del 7,77%.

Clase anterior Proxima clase

Haz AulaFácil tu página de inicio             Envía esta página a un amigo

Env � anos un comentario        P � gina de Inicio        Cont � ctanos        � Qui � nes somos? Este es un producto de AulaFacil S.L. - © Copyright 2000

Distribuciones continuas: Uniforme

La distribución uniforme es aquella que puede tomar cualquier valor dentro de un intervalo, todos ellos con la misma probabilidad.

Es una distribución continua porque puede tomar cualquier valor y no únicamente un número determinado (como ocurre en las distribuciones discretas).

Ejemplo: el precio medio del litro de gasolina durante el próximo año se estima que puede oscilar entre 140 y 160 ptas. Podría ser, por tanto, de 143 ptas., o de 143,4 ptas., o de 143,45 ptas., o de 143,455 ptas, etc. Hay infinitas posibilidades, todas ellas con la misma probabilidad.

Su función de densidad, aquella que nos permite conocer la probabilidad que tiene cada punto del intervalo, viene definida por:

Donde:

b: es el extremo superior (en el ejemplo, 160 ptas.)

a: es el extremo inferior (en el ejemplo, 140 ptas.)

Por lo tanto, la función de distribución del ejemplo sería:

Es decir, que el valor final esté entre 140 ptas. y 141 ptas. tiene un 5% de probabilidad, que esté entre 141 y 142, otro 5%, etc.

El valor medio de esta distribución se calcula:

En el ejemplo:

Por lo tanto, el precio medio esperado de la gasolina para el próximo año es de 150 ptas.

Veamos otro ejemplo:

El volumen de precipitaciones estimado para el próximo año en la ciudad de Sevilla va a oscilar entre 400 y 500 litros por metro cuadrado. Calcular la función de distribución y la precipitación media esperada:

Es decir, que el volumen de precipitaciones esté entre 400 y 401 litros tiene un 1% de probabilidades; que esté entre 401 y 402 litros, otro 1%, etc.

El valor medio esperado es:

Es decir, la precipitación media estimada en Sevilla para el próximo año es de 450 litros.

Clase anterior Proxima clase

Haz AulaFácil tu página de inicio             Envía esta página a un amigo

Env � anos un comentario        P � gina de Inicio        Cont � ctanos        � Qui � nes somos? Este es un producto de AulaFacil S.L. - © Copyright 2000

Distribuciones continuas: Normal (I)

Es el modelo de distribución más utilizado en la práctica, ya que multitud de fenómenos se comportan según una distribución normal.

Esta distribución de caracteriza porque los valores se distribuyen formando una campana de Gauss, en torno a un valor central que coincide con el valor medio de la distribución:

Un 50% de los valores están a la dercha de este valor central y otro 50% a la izquierda

Esta distribución viene definida por dos parámetros:

X: N ( 2)

es el valor medio de la distribución y es precisamente donde se sitúa el centro de la

curva (de la campana de Gauss).

2 : es la varianza. Indica si los valores están más o menos alejados del valor central: si la varianza es baja los valores están próximos a la media; si es alta, entonces los valores están muy dispersos.

Cuando la media de la distribución es 0 y la varianza es 1se denomina "normal tipificada", y su ventaja reside en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución.

Además, toda distribución normal se puede transformar en una normal tipificada:

Ejemplo: una variable aleatoria sigue el modelo de una distribución normal con media 10 y varianza 4. Transformarla en una normal tipificada.

X: N (10, 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y) que será igual a la anterior (X) menos su media y dividida por su desviación típica (que es la raíz cuadrada de la varianza)

En el ejemplo, la nueva variable sería:

Esta nueva variable se distribuye como una normal tipificada, permitiéndonos, por tanto, conocer la probabilidad acumulada en cada valor.

Y: N (0, 1)

Clase anterior Proxima clase

Haz AulaFácil tu página de inicio             Envía esta página a un amigo

Env � anos un comentario        P � gina de Inicio        Cont � ctanos        � Qui � nes somos? Este es un producto de AulaFacil S.L. - © Copyright 2000

Características de la Distribución Hipergeométrica

Para efectos de esta distribución, llamemos población al conjunto de elementos disponibles para realizar un experimento y muestra a un subconjunto de dichos elementos seleccionados en forma aleatoria.

La distribución Binomial se generó al estudiar el comportamiento de repetir n veces un experimento de Bernoulli, en el cual hay dos resultados posibles, las repeticiones son independientes y la probabilidad asociada a cada repetición permanece constante. Para cumplir la última característica, es indispensable que cuando hay extracción de elementos se debe realizar con reemplazo, esto es, regresar el elemento extraído antes de realizar la siguiente extracción.

En el caso de la distribución Hipergeométrica, a diferencia de la distribución Binomial, los elementos se extraen simultáneamente, o si es uno a uno, sin devolverlos antes de realizar la siguiente extracción, de forma que un elemento no puede aparecer dos veces en una muestra. A esta manera de obtener la muestra se le llama muestreo sin reemplazo.

De esta forma, la probabilidad del segundo elemento depende o está condicionada al elemento que se haya sacado en la primera extracción o sea que existe dependencia. Este concepto también se aplica en la extracción del tercero, cuarto y demás elementos, dependiendo del tamaño de la muestra, donde la probabilidad depende de los elementos obtenidos en las extracciones anteriores. Obsérvese que el muestreo sin reemplazo origina la dependencia probabilística, a diferencia del modelo binomial que no la tiene.

Función de Probabilidad

Supongamos que se tiene una población finita de tamaño N, en donde los elementos sólo tienen dos características, digamos éxito y fracaso, hombres y mujeres, aprobados y reprobados, buenos y malos, empleados y desempleados, enfermos y sanos, etc. Esto significa que de acuerdo a las características, la población se puede dividir en dos subconjuntos disjuntos: los que cumplen y los que no cumplen con la característica estudiada. Supongamos también que en esta población existen a elementos de cierta característica que nos interesa analizar, por lo que N – a elementos no la tienen, como se puede apreciar en la figura siguiente.

Poner figura 1 de la distribución hipergeométrica

Por ejemplo:

a)        Una población de 30 alumnos contiene 20 aprobados y 10 no aprobados.

b)        Una caja contiene 50 focos, de los cuales 45 funcionan y 5 no funcionan.

c)        En un grupo de 35 personas hay 25 del partido político A y 10 que no lo son.

Tomemos una muestra aleatoria de tamaño n de la población. Es obvio que en tal muestra pueden haber elementos

tanto del tipo a como del tipo N – a. El número mínimo de elementos del tipo a en la muestra es 0 y el máximo es n. Definamos la variable aleatoria X como el número de elementos del tipo a en la muestra de tamaño n.

Cuando la variable aleatoria X tome el valor x, entonces se tendrá que 0 x n, lo cual se observa en la figura siguiente:

Poner figura 2 de la distribución hipergeométrica

También se puede apreciar en la figura que n = x + (n – x), por lo que la muestra puede contener x elementos del tipo a y (n – x) elementos del tipo (N – a).

Ahora deduzcamos la función de probabilidad de dicha variable aleatoria.

El número total de formas de extraer una muestra de n elementos de una población que tiene N elementos igualmente

probables es .

Por otro lado, el total de formas de extraer sin reemplazo x

elementos del tipo a en la muestra de tamaño n es y de extraer sin reemplazo de la misma muestra (n – x) elementos del tipo (N –

a) es y por la regla de multiplicación para conformar la

muestra de tamaño n se tiene . Por lo tanto

.

Definición. Se dice que el modelo de probabilidad de una variable aleatoria X es Hipergeométrico, si su función de probabilidades es:

donde N es el número de elementos de la población, a es el número de elementos de la población que tienen la característica de interés, n es el tamaño de la muestra y x el número de elementos de la muestra que tienen la característica de interés.

Ejemplo 5. 21. Una tienda de artículos eléctricos tiene 20 planchas, de las cuales 5 son amarillas. Si se extraen aleatoriamente y sin sustitución 10 planchas ¿Cuál es la probabilidad de que dos de ellas sean amarillas?

Solución.

En este caso se tiene una población de 20 planchas (N = 20), de las cuales 5 son amarillas (a = 5) y se extrae una muestra de 10 planchas (n = 10). La variable aleatoria será el número de

planchas amarillas que hay en la muestra (entre las extraídas), por lo que x = 2. Sustituyendo en el modelo de la distribución Hipergeométrica tenemos:

=

Ejemplo 5. 22. Si se extraen 8 canicas sin reemplazo de una urna que contiene 9 azules y 3 negras. Encontrar la probabilidad de haya 6 canicas azules dentro de las 8 que se extrajeron.

Solución.

En total se tienen 12 canicas (N = 12), de las cuales 9 son azules (a = 9). Se extrae una muestra de 8 canicas (n = 8) y se desea obtener la probabilidad de que en la muestra haya 6 canicas azules (x = 6) por lo que:

=

Ejemplo 5. 23. Un vendedor de insecticidas quiere vender a una planta un lote de 50 barriles de cierto producto. El gerente de la planta sospecha que los barriles están caducos, pero el vendedor sostiene que sólo 10 barriles han caducado y está dispuesto a permitir que se analicen 5 barriles sin costo para el comprador, para que éste decida si adquiere el lote. ¿Cuál es la probabilidad de que el gerente encuentre que 4 o más de los 5 barriles examinados han caducado, suponiendo que el vendedor tiene razón en su afirmación?

Solución.

De acuerdo a la información se tiene que N = 50, a = 10 y n = 5. La función de probabilidad de la variable X, definida por el número de barriles defectuosos en la muestra es:

por lo que la probabilidad buscada es:

Ejemplo 5. 24. Una caja contiene 10 focos, de los cuales 3 son defectuosos. ¿Cuál es la probabilidad de que si se toma una muestra aleatoria sin reemplazo de tamaño 2, se extraiga cuando mucho un foco defectuoso?

Solución.

Definamos la variable aleatoria X: Número de focos defectuosos.

Entonces N = 10, a = 3, n = 2 y x = 0, 1.

Media y Variancia

Al igual que en la distribución Binomial, podemos considerar a la variable Hipergeométrica como una suma de N variables Xi dependientes, ya que no hay reemplazo. Sin embargo, la propiedad aditiva de la Esperanza no requiere independencia, por lo que para esta variable es válido establecer que:

E(X1 + X2 + .... + Xn) = E(X1) + E(X2) + ...+ E(Xn)

Cada E(Xi) es la proporción de éxito del tipo a en la

muestra de tamaño n, lo que podemos calcular como y como son n elementos entonces:

= E(X) = n =

En el caso de la variancia recordemos que en el modelo Binomial, donde el muestreo es con reemplazo, se tiene que:

V(X) = npq = n , pero como en el modelo Hipergeométrico no hay reemplazo, se introduce el llamado factor de corrección, cuya deducción queda fuera del alcance este libro,

por lo solamente lo usaremos y que es . Entonces tenemos que la variancia es:

V(X) = n =

Ejemplo 5. 25. Refiriéndonos al problema del vendedor de insecticidas visto anteriormente, donde N=50, a = 10, y n = 5, calcular la media o valor esperado y la variancia.

Solución.

Sustituyendo los datos anteriores en las fórmulas respectivas tenemos:

Ejemplo 5. 26. Un grupo de 30 alumnos contiene 20 mujeres y 10 hombres. Obtener el valor esperado y la variancia.

Solución.

En este caso N = 30, a = 20, n = 4, por lo que sustituyendo valores tenemos:

= E(X) = = 1.3333

V(X) = =

Semejanzas y Diferencias con la Distribución Binomial

Enseguida se mencionan las semejanzas y diferencias entre los modelos Hipergeométrico y Binominal.

Las semejanzas son:

1. Tanto el modelo Hipergeométrico como el Binominal surgen de la repetición de un experimento con sólo dos resultados posibles.

1.      Si el tamaño de la población es grande o si el tamaño de la muestra es muy pequeño en relación con el de la población, mediante el modelo Binomial se puede obtener una buena aproximación al modelo Hipergeométrico, aunque el muestreo

se realice sin reemplazo, haciendo .

Las diferencias entre ellos son:

1.        Las repeticiones en un modelo Binomial son independientes, mientras que en el modelo Hipergeométrico las repeticiones no son independientes. Por ejemplo, si al realizar por primera vez un experimento el resultado es defectuoso (D1) y al realizar por segunda vez también es defectuoso (D2), entonces se tiene que:

P(D2 | D1) P(D2)

2. Las medias en los dos modelos son iguales, pero las variancias son diferentes. La variancia en el modelo Hipergeométrico siempre es menor que en el Binomial, salvo cuando n = 1, pero entonces las dos distribuciones se reducen al modelo de Bernoulli.

De acuerdo a lo anterior, es fácil ver las condiciones en que se debe aplicar cada distribución. Si la población es infinita o el muestreo se realiza con reemplazo, el modelo adecuado es el Binomial. Si la población es finita y el muestreo se realiza sin reemplazo, el modelo adecuado es el Hipergeométrico, salvo el caso en que se pueda realizar la aproximación mediante el modelo Binomial.

Ir al Inicio de la Página

 

Distribución hipergeométrica

Distribución hipergeométrica

Parámetros

Dominio

Función de

probabilidad

(fp)

Media

Moda

Varianza

Coeficiente

de simetría

Curtosis

Función

generadora

de momentos

(mgf)

Función

característica

En teoría de la probabilidad la distribución hipergeométrica es una distribución discreta relacionada con muestreos aleatorios y sin reemplazo. Supóngase que se tiene una población de N elementos de los cuales, d pertenecen a la categoría A y N-d a la B. La

distribución hipergeométrica mide la probabilidad de obtener x ( ) elementos de la categoría A en una muestra sin reemplazo de n elementos de la población original.

Propiedades

La función de probabilidad de una variable aleatoria con distribución hipergeométrica puede deducirse a través de razonamientos combinatorios y es igual a

donde es el tamaño de población, es el tamaño de la muestra extraída, es el número de elementos en la población original que pertenecen a la categoría deseada y es el

número de elementos en la muestra que pertenecen a dicha categoría. La notación hace referencia al coeficiente binomial, es decir, el número de combinaciones posibles al seleccionar elementos de un total .

El valor esperado de una variable aleatoria X que sigue la distribución hipergeométrica es

y su varianza,

En la fórmula anterior, definiendo

y

se obtiene

La distribución hipergeométrica es aplicable a muestreos sin reemplazo y la binomial a muestreos con reemplazo. En situaciones en las que el número esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es así cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es pequeño.

Enlaces externos

[1] Cálculo de la probabilidad de una distribución hipergeométrica con R (lenguaje de programación)

Calculadora Distribución hipergeométrica

Categoría:

Distribuciones discretas

Menú de navegación

Crear una cuenta Acceder

Artículo Discusión

Leer Editar Ver historial

Portada Portal de la comunidad Actualidad Cambios recientes Páginas nuevas Página aleatoria Ayuda Donaciones Notificar un error

Imprimir/exportar

Crear un libro Descargar como PDF Versión para imprimir

Herramientas

Lo que enlaza aquí Cambios en enlazadas Subir un archivo Páginas especiales Enlace permanente Información de la página Elemento de datos Citar este artículo

En otros idiomas

Català Čeština Deutsch Ελληνικά English Euskara فارسی Suomi Français עברית Magyar Italiano 日本語 한국어 Nederlands Norsk nynorsk Norsk bokmål Polski Português Русский Slovenščina Svenska Türkçe Українська 中文

Editar los enlaces

Esta página fue modificada por última vez el 25 feb 2014, a las 16:10. El texto está disponible bajo la Licencia Creative Commons Atribución Compartir

Igual   3.0 ; podrían ser aplicables cláusulas adicionales. Léanse los términos de uso para más información.Wikipedia® es una marca registrada de la Fundación Wikimedia, Inc., una organización sin ánimo de lucro.

Contacto