apuntes - probabilidad y estadistica - neftali

119

Click here to load reader

Upload: navarreteac9645

Post on 21-Oct-2015

99 views

Category:

Documents


17 download

TRANSCRIPT

Page 1: Apuntes - Probabilidad y Estadistica - Neftali

APUNTES DE PROBABILIDAD Y

ESTADÍSTICA

NEFTALÍ ANTÚNEZ H.

Page 2: Apuntes - Probabilidad y Estadistica - Neftali

NE

FTA

AN

NE

Z H

.

1

PROBABILIDAD Y ESTADÍSTICA La teoría de las probabilidades es, como mucho, simple sentido común reducido a cálculo. Pierre Simón Laplace

La historia de la probabilidad comienza en el siglo XVII cuando Fermat y Pascal tratan de resolver algunos problemas relacionados con los juegos de azar.Aunque algunos marcan sus inicios cuando Cardano escribió en 1520 El Libro de los Juegos de Azar (aunque no fué publicado hasta más de un siglo después, en 1660) no es hasta dicha fecha que comienza a elaborarse una teoría aceptable sobre los juegos.

Diversos restos arqueológicos ponen de manifiesto que es desde muy antiguo la fascinación que el hombre sintió por el juego. Astrágalos, dados, cartas, etc. es un ejemplo de ello y, en la actualidad, ruletas, máquinas tragamonedas, loterías, quinielas, etc., nos indican que dicha fascinación continúa.

Christian Huygens conoció la correspondencia entre Blaise Pascal y Pierre Fermat suscitada por el caballero De Méré y publicó (en 1657) el primer libro sobre probabilidad: De Ratiociniis in Ludo Aleae, (Calculating in Games of Chance), un tratado sobre juegos de azar.

Durante el siglo XVIII, debido muy particularmente a la popularidad de los juegos de azar, se publicaron varios documentos de este tipo. Jacob Bernouilli (1654-1705) Ars Conjectandi (publicado en 1713 aunque escrito sobre 1690) y Auguste De Moivre (1667-1754) constribuyeron de forma importante a este desarrollo.

En 1812 Pierre Laplace publicó Théorie analytique des probabilités en el que expone un análisis matemático sobre los juegos de azar.

Desde los orígenes la principal dificultad para poder considerar la probabilidad como una rama de la matemática fue la elaboración de una teoría suficientemente precisa como para que fuese aceptada como una forma de matemática. A principios del siglo XX el matemático ruso A. Kolmogorov la definió de forma axiomática y estableció las bases para la moderna teoría de la probabilidad que en la actualidad es parte de una teoría más amplia como es la teoría de la medida.

CONJUNTOS

Es una colección de objetos bien definidos. Se representan con letras mayúsculas A,B,C y sus elementos con letras minúsculas a,b,c y encerrados entre llaves {}.

B= {b,a,c} Pertenencia de elementos a un conjunto: b∈B, a ∈B, pero j∉B

Formas de definir un conjunto: A) Método por extensión o tabular B) Método constructivo o por

comprensión

A) A = { a,b,c,}

B) A= { x/x es una de las primeras letras del alfabeto}

Conjunto Vació ∅={} es subconjunto de todo conjunto, es aquel que no tiene elementos.

Conjunto Universal ∪ = Ω representa la totalidad de elementos para un problema dado.

Subconjunto ⊂ El conjunto A es el subconjunto de B (A ⊂ B) si todo elemento que pertenece a A también pertenece a B.

Por ejemplo: A= { 1,2,3}

B={ 1,2,3,4}

A⊂B (subconjunto)

B ⊃ A (superconjunto)

Page 3: Apuntes - Probabilidad y Estadistica - Neftali

NE

FTA

AN

NE

Z H

.

2

Todo conjunto es subconjunto de sí mismo A⊆A

Subconjunto propio A es subconjunto propio de B, si todo elemento de A pertenece a B y además B tiene otros elementos.

A⊂B , A⊆A

Conjuntos iguales = A es igual que B si todo elemento que pertenece a A también pertenece a B, y si todo elemento que pertenece a B también pertenece a A.

A=B < = > A⊂B y B⊂A

Ejemplo: A= {2,4,5} => A=B

B= { 2,4,2,5}

Familias de Conjuntos

Son conjuntos cuyos elementos son a su vez conjuntos.

A ={ {e}, A,B} A ⊄ A

Conjuntos Disjuntos o Ajenos Los conjuntos A y B son disjuntos si no tienen elementos en común.

Ejemplo: A={a,b,c} B={f,j,k} A y B son disjuntos o ajenos

Conjuntos Comparables

Dos conjuntos A y B son comparables sí A ⊂ B o B ⊂ A

Conjuntos No Comparables

Dos conjuntos A y B son no comparables Si A ⊄ B y B ⊄ A

OPERACIONES CON CONJUNTOS.

Unión ∪ La unión de dos o más conjuntos A y B es un nuevo conjunto tal que sus elementos pertenecen a A o a B o a los dos.

A∪B = {x/x ∈ A o x ∈ B}

Intersección ∩

La intersección de los conjuntos A y B es un nuevo conjunto cuyos elementos son aquellos que pertenecen al mismo tiempo a los dos conjuntos.

A∩B={x/x ∈ A y x ∈ B}

Diferencia o Resta – La diferencia de A-B es un nuevo conjunto cuyos elementos pertenecen al conjunto minuendo A pero no al sustraendo B.

A-B= {x/x ∈ A y x ∉ B} =>x ∈ A

Complemento El complemento de un conjunto A es el conjunto formado por todos los elementos que no pertenezcan a A.

Ac=A’={ x/x ∉ A} = {x/x ∈ ∪ y x ∉ A}

∪ - A= A’

Correspondencia Biunívoca.

Dos conjuntos A y B están en correspondencia biunívoca si a cada elemento del conjunto A le corresponde un único elemento del conjunto B y a cada elemento del conjunto B le corresponde un único elemento de A.

Conjuntos Equivalentes ∼

Dos conjuntos equivalentes (A y B) si se pueden poner en correspondencia biunívoca.

Propiedades de los conjuntos.

A∪∅=A

A∩∅=∅

A∪U=U

∅‘=U

U‘=∅

(A’)’=A

Conmutativa. Unión A∪B=B∪A

Intersección A∩B=B∩A

Page 4: Apuntes - Probabilidad y Estadistica - Neftali

NE

FTA

AN

NE

Z H

.

3

Asociatriva.- Unión (A∪B)∪C=A∪(B∪C)

Intersección (A∩B)∩C=A∩(B∩C)

Leyes de Morgan.

Union (A∪B)’=A’∩B’

Intersección(A∩B)’=A’∪B’

Distributiva

Union A∪(B∩C)=(A∪B)∩(A∪C)

Intersección A∩(B∪C)=(A∩B)∪(A∩C)

PRODUCTO CARTESIANO DE DOS CONJUNTOS.

Se llama producto cartesiano de dos conjuntos, al conjunto de parejas ordenadas formado de manera que el primer elemento de la pareja viene del primer conjunto y el segundo elemento de la pareja del segundo conjunto. Se denota como AXB.

AXB={(a,b) a∈A y b∈B}

Factorial

Para cualquier entero positivo n,

n! = n (n - 1)(n - 2)(n - 3) ... 3.2.1

n! se lee como n factorial. Se obtiene multiplicando consecutivamente los números enteros hasta n.

Por definición 0! = 1

Reglas útiles de factoriales:

n! = n (n - 1)!

Demostración:

n! = n (n - 1)(n - 2)(n - 3) ... 3.2.1

n (n - 1)! = n [(n - 1)(n - 2)(n - 3) ... 3.2.1]

De aquí que ambas sean lo mismo.

Similarmente, (n + 1)! = (n + 1) n!

Ejemplos: 3! = 3.2.1 = 6

4! = 4.3.2.1 = 24

5! = 5.4.3.2.1 = 120

Una combinación es una expresión de tipo nCr. Que nos da el número de elementos tomados de r en r. La fórmula es:

8 5

nn!nCrrr!(n r)!

Ejemplos :8 8! 8!C 565 5!(8 5)! 5!3!

⎛ ⎞= = ⎜ ⎟− ⎝ ⎠

⎛ ⎞= = = =⎜ ⎟ −⎝ ⎠

Teorema Binomial

Para exponentes positivos enteros

Si escribimos el triangulo de Pascal y lo relacionamos con el símbolo de combinatoria, tenemos:

n = 1 1C0 1C1

n = 2 2C0 2C1 2C2

n = 3 3C0 3C1 3C2 3C3

n = 4 4C0 4C1 4C2 4C3 4C4

n = 5 5C0 5C1 5C2 5C3 5C4 5C5

Page 5: Apuntes - Probabilidad y Estadistica - Neftali

NE

FTA

AN

NE

Z H

.

4

De aquí que la expansion de (1 + b)n es

(1 + b)n = nC0 b0 + nC1 b1 + nC2 b2 + ... + bn

= 1 + nb + nC2 b2 + ... + bn

La forma más general del teorema es:

(a + b)n = an + nC1 an-1b + nC2 an-2b2 + ... + bn

Ejemplo: Expandir (1 + 3x)5.

Solución:

(1 + 3x)5 = 1 + 5 (3x) + 5C2 (3x)2 + 5C3 (3x)3 + 5C4 (3x)4 + (3x)5

= 1 + 15x + 90x2 + 270x3 + 405x4 + 243x5

Encuentre los tres primeros términos de la expansion

Solución:

=

= x7 - 7x4 + 21x + ...

ANALISIS COMBINATORIO Principio Fundamental

Si un trabajo o evento puede hacerse de a1 maneras diferentes cuando sea hecho puede hacerse un segundo trabajo, independiente de a2 modos diferentes y luego un tercer trabajo a3 maneras diferentes y así sucesivamente entonces el número total de maneras diferentes en que los trabajos se pueden realizar es a1 * a2 * a3 * a4…

Ejemplo:

Suponiendo que una persona tiene 2 modos de ir a la ciudad A a la ciudad B (pie-bicicleta). Una vez que llega a la ciudad B tiene 3 maneras de llegar a la ciudad C (avión, auto, barco).

En cuantos modos puede realizarse el viaje de A a C pasando por B

Page 6: Apuntes - Probabilidad y Estadistica - Neftali

NE

FTA

AN

NE

Z H

.

5

El numero de caminos es: Pie-Avion, Pie-Auto, Pie-Barco, Bici-Avion, Bici-Auto, Bici-Barco= 2 x 3 = 6 caminos posibles.

PERMUTACIONES.

Es un arreglo ordenado de una parte de los elementos o todos los elementos de un conjunto.

Ejemplo: Sea un conjunto de letras: o, p, i. Escribir todas las permutaciones empleando las 3 letras cada vez.

Ipo

Opi

Iop

Poi

Pio

n = número total de elementos

r = número de elementos que se toman al mismo tiempo

La condición debe ser r <= n.

Ejemplo: De cuantas maneras pueden sentarse 5 personas en 5 sillas pero de 3 en 3.

5 3

n!nPr(n r)!

Ejemplos :5! 5!C 60

(5 3)! 2!

=−

= = =−

Permutaciones con Repeticiones Se trata de permutaciones de n objetos tomados de n donde n1 son objetos repetibles y no diferenciables.

Ejemplo:

Cuantas palabras diferentes se podrán formar con las letras “ rara ”.

nPnn

n nn

n=−

= =!

( )!!

!1

Page 7: Apuntes - Probabilidad y Estadistica - Neftali

NE

FTA

AN

NE

Z H

.

6

COMBINACIONES.

Es un subconjunto de r elementos que se puede formar a partir de un conjunto de n elementos. Dos conjuntos que tienen el mismo número sin importar el orden.

Las permutaciones de todos los elementos del conjunto nPn= n!. Las combinaciones:

Para cada subconjunto r se tiene: rPr= r!

Combinaciones n tomadas de r:

Ejemplo: Un entrenador de fútbol tiene un equipo formado por 11 jugadores de los cuales uno es su hijo. Cuantas quintetas de basketball se pueden formar si su hijo siempre debe estar dentro de ella.

n =10

r =4

Si no estuviera:

Problemas de Conteo

De cuantas maneras pueden arreglarse 7 diferentes libros, de manera tal que un libro

4 2

42 2

244

6P = = =!

! !

nn

n rPr

!( )!

=−

n rPr !=

nCrnr

nn r r

= =−

PrPr

!( )! !

C =−

= = =10

10 4 410 9 8 7 6

6 4504024

210!

( )! !* * * * !

! !

C =−

= = =11

11 5 510 9 8 7 6

6 555440120

462!

( )! !* * * * !

! !

Page 8: Apuntes - Probabilidad y Estadistica - Neftali

7

especifico esté en el tercer lugar.

• Removemos el tercer libro. Ahora podemos arreglar arbitrariamente los 6 libros restantes en 6! formas.

De cuantas maneras podemos sacar 3 canicas de una caja que contiene 15 canicas diferentes.

• Tomando un subconjunto de 3 elementos de un conjunto de 15 elementos posibles, puede ser hecha de C(15,3) = 455 formas.

En una empresa hay 20 trabajadores y 10 directivos. De cuantos maneras podemos formar un comité con 3 trabajadores y 2 directivos.

• Primeros escogemos los 3 trabajadores. Esto puede ser hecho en C(20,3) = 1145 formas. Después, escogemos los 2 directivos de C(10,2) = 45 formas. El comité puede ser formado de C(20,3)x.C(10,2)= 51 300 formas.

En estas notas, entenderemos por experimento aleatorio cualquier situación que, realizada en las mismas condiciones, sea imposible de predecir el resultado que obtendremos.

Son experimentos aleatorios, por ejemplo, los siguientes:

Lanzar un dado y considerar el resultado obtenido

Extraer una carta (o varias) de una baraja

Lanzar dos dados y hallar la suma de cada una de las caras obtenidas

Se lanza una moneda. Si sale cara se extrae de una urna U 1, con una determinada composición de bolas de colores, una bola B y si sale cruz se extrae de una urna U 2, con otra determinada composición de bolas de colores, una bola. Después se considera el color de la bola extraído.

Los tres primeros son ejemplos de experimentos aleatorios simples y el último un ejemplo de experimento aleatorio compuesto

Consideremos el experimento aleatorio consistente en lanzar dos dados (o un dado dos veces) y sumar la puntuación obtenida.

El conjunto E = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} formado por todos las posibles sumas que pueden obtenerse se denomina Espacio Muestral de dicho experimento aleatorio y suele designarse por E. Cada uno de los elementos de E es un suceso elemental

A partir de dicho subconjunto podemos considerar distintos subconjuntos de E.

A = {2, 4, 6, 8, 10, 12} = {“obtener suma par”}

B = {2, 5, 7, 11} = {“obtener una suma que sea número primo”}

Page 9: Apuntes - Probabilidad y Estadistica - Neftali

8

C = {10, 11, 12} = {“obtener una suma mayor o igual que 10”}

D = {3, 6, 9, 12} = {“obtener suma múltiplo de 3”}

F = {2, 3} = {“que la suma que sea 2 ó 3”}

Ø = {“obtener una suma mayor que 15”} suceso imposible

E = {“Obtener una suma mayor o igual que 2 y menor o igual que 12”} suceso seguro

M = {7} = {“Obtener un 7”}

Entre los sucesos anotados, existen sucesos simples (o elementales) (por ejemplo el M) y otros sucesos compuestos constituidos por varios sucesos elementales. El conjunto de todos estos sucesos, incluidos los sucesos seguro e imposible, se denomina Espacio de Sucesos (constituido por todos los subconjuntos que pueden formarse a partir del espacio muestral E) que suele designarse por P(E).

Puede probarse que si el número de elementos de E es n, entonces P(E) tiene 2 n elementos.

A veces, suele ser útil utilizar un gráfico como el de la figura anterior para hallar el espacio muestral de un determinado experimento aleatorio.

El diagrama de árbol de la figura anterior corresponde al experimento aleatorio de lanzar una moneda tres veces (o tres monedas) y considerar el resultado obtenido. C = Cara, + = Cruz.

El espacio muestral se obtiene fácilmente sin más que ir recorriendo todas las ramas y es:

E = {CCC, CC+, C+C, C++, +CC, +C+, ++C, +++}

Son sucesos de dichos experimento aleatorio

A = {CCC, CC+, C+C, C++, +CC, +C+, ++C} = {“obtener al menos una cara”}

B = {CC+, C+C, +CC} = {“obtener dos caras”}

Ø = {“obtener 5 cruces”} suceso imposible

C = {C++, +C+, ++C, +++} = {“obtener más cruces que caras”}

Page 10: Apuntes - Probabilidad y Estadistica - Neftali

9

Se considera el experimento aleatorio consistente en lanzar una moneda. Si sale cara (C) se extrae de una urna que contiene bolas azules y rojas una bola y si sale cruz (+) se extrae una bola de otra urna que contiene bolas rojas y verdes.

El espacio muestral de dicho experimento aleatorio compuesto es:

E = {(C,R), (C,A), (+,R), (+,V)}

El espacio de sucesos consta de 2 4 = 16 elementos que son P(E) =

{{(C,R)}, {(C,A)}, {(+,R)}, {(+,V)}, {(C,R), (C,A)}, {(C,R), (+,R)}, {(C,R), (+,V)}, {(C,A), (+,R)}, {(C,R), (+,V)}, {(+,R), (+,V)}, {(C,R), (C,A), (+,R)}, {(C,R), (C,A), (+,V)}, {(C,R), (+,R), (+,V)}, {(C,A), (+,R), (+,V)}, Ø, E }

El experimento aleatorio consistente en el lanzamiento de dos dados (o un dado dos veces).

En la figura siguiente se muestra el espacio muestral del experimento aleatorio consistente en el lanzamiento de dos dados (o un dado dos veces) y observar el resultado.

Como E tiene 36 elementos el espacio de sucesos tiene 236 sucesos.

Page 11: Apuntes - Probabilidad y Estadistica - Neftali

10

En el experimento aleatorio del lanzamiento de dos dados, el suceso “la suma obtenida sea 7” se muestra en la figura anterior. Su espacio es S = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}

En el experimento aleatorio del lanzamiento de dos dados, el suceso “la suma obtenida es número primo” se muestra en la figura anterior y su espacio es:

S = {(1,1), (1,2), (2,1), (1,4), (2,3), (3,2), (4,1), (1,6), (2,5), (3,4), (4,3), (5,2), (6,1), (5,6), (6,5)}

En el experimento aleatorio del lanzamiento de dos dados, el suceso “en los dos lanzamientos se obtiene número primo” se muestra en la figura anterior y su espacio es:

S = {(2,2), (2,3), (2,5), (3,2), (3,3), (3,5), (5,2), (5,3), (5,5),}

Page 12: Apuntes - Probabilidad y Estadistica - Neftali

11

Complemento de un suceso A es el suceso que se verifica si no se verifica A. El complemento de A, lo designamos por Ac y también por (no A).

En el experimento aleatorio consistente en lanzar dos dados y considerar la suma de ambos, los sucesos {“obtener suma par”} y {“obtener suma impar”} son complementarios. También son complementarios los sucesos {“obtener suma mayor o igual que 5”} y {“obtener suma menor que 5”}.

En el experimento aleatorio consistente en lanzar dos monedas los sucesos {“obtener al menos una cara”} y {“no obtener ninguna cara”} son complementarios.

El complementario del suceso A = {“en los dos lanzamientos se obtiene número primo”} (color claro) es el suceso B = {“en alguno de los dos lanzamientos (o en ambos) no se obtiene número primo”} (en color más oscuro)

OPERACIONES CON SUCESOS

Se definen las siguientes operaciones con sucesos de un determinado experimento aleatorio

Unión de dos sucesos A, B es el suceso que se verifica si se verifica A o se verifica B o ambos. La unión de los sucesos A y B la designaremos por (A o B) (cuando no haya lugar a confusión lo expresaremos sin paréntesis es decir A o B) . Equivale a la unión de conjuntos.

Intersección de dos sucesos A, B es el suceso que se verifica si se verifica A y se verifica B. La intersección de los sucesos A y B la designaremos por (A y B) (cuando no haya lugar a confusión lo expresaremos sin paréntesis es decir A y B). Equivale a la intersección de conjuntos.

Diferencia de dos sucesos A, B es el suceso que se realiza cuando se realiza A y no B. La diferencia de los sucesos A y B la designaremos por

A - B = (A y Bc )

Igualmente podemos considerar la diferencia B - A

Por ejemplo, si lanzamos un dado y consideramos los sucesos:

A = {“obtener número par”} = {2, 4, 6} B = {“obtener múltiplo de 3”} = {3, 6}

Las operaciones de unión, intersección y diferencias de dichos sucesos se muestran en sus correspondientes diagramas:

Page 13: Apuntes - Probabilidad y Estadistica - Neftali

12

Unión

{“números pares o múltiplos de 3”} = {2, 3, 4, 6}

Intersección

{“números pares y múltiplos de 3”} = {6}

Diferencia B - A

{“múltiplos de 3 y no números pares”} = {3}

Diferencia A - B

{“números pares y no múltiplos de 3”} = {2, 4}

Ejemplo: Si se lanza una moneda tres veces y se consideran los sucesos:

A = {“salen al menos dos cruces”} = {c++, +c+, ++c, +++}

B = {“sale alguna cara”} = {ccc, cc+, c+c, c++, +cc, +c+, ++c}

Page 14: Apuntes - Probabilidad y Estadistica - Neftali

13

Unión (A o B) = {“salen al menos dos cruces o sale alguna cara”} = {+++, c++, +c+, ++c, ccc, cc+, c+c, +cc}

Intersección (A y B) = {“salen al menos dos cruces y sale alguna cara”} = {c++, +c+, ++c}

Diferencias A - B = (A y Bc ) = {“salen al menos dos cruces y no sale alguna cara”}

B - A = (B y Ac ) = {“sale alguna cara y no salen al menos dos cruces”}

Algunas consideraciones básicas con sucesos que serán útiles para la resolución de problemas, son las siguientes:

Sucesos incompatibles y complementarios

Si A es un suceso de un determinado experimento aleatorio cuyo espacio muestral es E, entonces A y su complementario son incompatibles, es decir, (A y Ac ) = Ø. Además (A o Ac ) = E

Si lanzamos un dado y A es el suceso A = {“obtener múltiplo de 3”} = {3, 6} entonces Ac = {“no obtener múltiplo de 3”} = {1, 2, 4, 5} por lo que (A o Ac ) = {1, 2, 3, 4, 5, 6} = E y (A y Ac ) = Ø

Dos sucesos complementarios son incompatibles, pero el recíproco no es cierto, es decir dos sucesos incompatibles no tienen por qué ser complementarios. Por ejemplo, los sucesos A = {“obtener múltiplo de 3”} = {3, 6} y B = {“obtener múltiplo de 5”} = {5} son incompatibles pero no complementarios.

Dados dos sucesos A y B de un determinado experimento aleatorio que no sean incompatibles los sucesos (A - B), (B - A) y (A y B) son incompatibles. Además podemos expresar tanto A como B como unión de dos sucesos incompatibles:

A = (A - B) o (A y B)

B = (B - A) o (A y B)

También podemos expresar el suceso (A o B) como unión de tres sucesos incompatibles

(A o B) = (A - B) o (A y B) o (B - A)

Page 15: Apuntes - Probabilidad y Estadistica - Neftali

14

Suceso contenido en otro Consideremos el experimento aleatorio consistente en lanzar tres monedas y los sucesos

A = {“salen al menos dos cruces”} = {c++, +c+, ++c, +++}

B = {“salen dos cruces”} = {c++, +c+, ++c}

El suceso B es un subconjunto del suceso A. Si se verifica A necesariamente se verifica B. En este sentido, diremos que el suceso B está contenido en el suceso A. Es interesante observar en el caso anterior que se verifican las inclusiones siguientes:

(A y B) está contenido en A

(A y B) está contenido en B

LEYES DE DE MORGAN

Dos propiedades importantes que, a veces, resultan útiles en la resolución de problemas son las siguientes:

El complemento de la unión de dos sucesos es la intersección de los complementarios de dichos sucesos (A o B)c = Ac y Bc

El complemente de la interseción de dos sucesos es la unión de los complementarios de dichos sucesos (A y B)c = Ac o Bc

Dos conjuntos son iguales si tienen los mismos elementos.

Una técnica fácil para demostrar que dos conjuntos son iguales es demostrar que todos los elementos de uno están contenidos en el otro y viceversa. De ambas inclusiones podemos deducir que ambos conjuntos tienen los mismos elementos y por lo tanto son iguales. Eso es lo que haremos para demostrar dichas leyes.

Primera Ley El complementario de la unión de dos conjuntos es igual a la intersección de los complementarios de dichos conjuntos.

Es decir, todo elemento que pertenece al complemento de la unión pertenece a la intersección de los complementos de los conjuntos

Recíprocamente:

Page 16: Apuntes - Probabilidad y Estadistica - Neftali

15

Es decir, todo elemento que pertenezca a la intersección de los complementarios de dos conjuntos pertenece al complementario de la unión de dichos conjuntos. De ambas inclusiones deducimos que ambos conjuntos son iguales

Segunda Ley El complemento de la intersección de dos conjuntos es igual a la unión de los complementos de dichos conjuntos.

La demostración es lógicamente análoga a la anterior.

De donde se deducen los dos teoremas.

DEFINICIÓN DE PROBABILIDAD

Sea un determinado experimento aleatorio cuyo espacio muestral es E y P(E) el espacio de sucesos del mismo. Sea p la aplicación con dominio en P(E) e imagen en R

con las siguientes condiciones

Axioma AI

Axioma AII

p(Suceso seguro) = 1

Axioma AIII

Si A y B son dos sucesos incompatibles del experimento aleatorio, (A y B) = Ø, entonces:

p(A o B) = p(A) + p(B)

Mediante AI asignamos a todo suceso del espacio de sucesos un número real comprendido entre 0 y 1; al suceso seguro se le asigna el valor de 1 (mediante AII). Podríamos haber elegido como axioma AII el dual del elegido, es decir p(suceso imposible) = 0. Más adelante veremos que ambos axiomas son intercambiables (Propiedad 1).

Mediante AIII se le asigna a la probabilidad de la suma de dos sucesos incompatibles, que es igual a la suma de las probabilidades de cada uno de ellos. Este es un axioma bastante "aceptable" como sería aceptable en una definición axiomática de áreas considerar que el área de la suma de dos superficies disjuntas es la suma de cada una de ellas.

Justificación de algunas propiedades

Propiedad 1

p(Suceso imposible) = 0 es decir p(Ø) = 0

Page 17: Apuntes - Probabilidad y Estadistica - Neftali

16

Como los sucesos Ø y E son incompatibles y además (Ø o E) = E resulta

p(E) = p(Ø o E) = 1 por Axioma AII

p(Ø o E) = p(Ø) + p(E) por Axioma AIII

De ambas igualdades resulta

1 = p(Ø) + p(E) = p(Ø) + 1 => p(Ø) = 0

Propiedad 2 La probabilidad de un suceso más la probabilidad de su complementario es la unidad.

p(A) + p(no A) = 1

Como A y (no A) son sucesos incompatibles tales que (A o A c) = E podemos razonar análogamente como en la Propiedad 1 para llegar al resultado. En realidad la Propiedad 1 es un caso particular de esta propiedad.

En el experimento aleatorio consistente en lanzar dos monedas los sucesos {“obtener al menos una cara”} y {“no obtener ninguna cara”} son complementarios por lo que:

p({“obtener al menos una cara”}) + p({“no obtener ninguna cara”}) = 1

Propiedad 3 Si el suceso B está contenido en A entonces p(A - B) = p(A) - p(B) Como los sucesos A - B y B son incompatibles y además A = (A - B) o B tendremos

p(A) = p((A - B) o B) = por Axioma AIII = p(A - B) + p(B) de donde se deduce la propiedad indicada.

Propiedad 4 Dados dos sucesos cualesquiera (no necesariamente incompatibles) se verifica

p(A o B) = p(A) + p(B) - p(A y B)

Una propiedad bastante "lógica" pues si sumamos el valor de la probabilidad de A y el valor de la probabilidad de B habremos de restar una vez el valor de la intersección, pues el valor de (A y B) lo habríamos sumados dos veces.

Si los sucesos son incompatibles, es decir (A y B) = Ø, entonces p(A y B) = 0 por Propiedad 1 y resultaría el Axioma AIII.

Page 18: Apuntes - Probabilidad y Estadistica - Neftali

17

La demostración, aunque más laboriosa que las vistas hasta ahora es muy fácil. Como A = (A - B) o (A y B), incompatibles, resulta, por Axioma AIII

p(A) = p(A - B) + p(A y B)

de donde: p(A - B) = p(A) - p(A y B) (1)

Igualmente como B = (B - A) o (A y B), razonando análogamente es

p(B - A) = p(B) - p(A y B) (2)

Por otra parte A o B = (A - B) o (B - A) o (A y B) incompatibles, por lo que volviendo a aplicar el Axioma AIII, resulta :

p(A o B) = p(A - B) + p(B - A) + p(A y B) y sustituyendo los valores de p(A - B) y p(B - A) por los valores obtenidos en (1) y (2) se obtiene la igualdad indicada.

LA LEY DE LAPLACE

Supongamos el experimento aleatorio consistente en lanzar una dado e intentemos calcular la probabilidad del suceso A ={"obtener número primo"}

E = A 1 o A 2 o A 3 o A 4 o A 5 o A 6

El espacio muestral de dicho experimento aleatorio es:

E = {A 1, A 2, A 3, A 4, A 5, A 6} En donde Ai designa obtener el valor i. Como estos sucesos son incompatibles entre sí (sólo podemos obtener un resultado al lanzar el dado) y todos tienen la misma probabilidad de salir (estamos suponiendo un dado honesto) designemos por k la probabilidad de uno cualesquiera de ellos.

Tendremos: 1 = por Axioma AII = p(E) = por Axioma AIII =

= p(A 1) + p(A 2) + p(A 3) + p(A 4) + p(A 5) + p(A 6) = 6 × k

de donde k = 1/6 y

p(A1) = p(A2) = p(A3) = p(A4) = p(A5) = p(A6) = k = 1/6

E = A 1 o A 2 o A 3 o A 4 o A 5 o A 6 A = A 2 o A 3 o A 5

Si Consideramos ahora el suceso A ={"obtener número primo"} = A 2 o A 3 o A 5.

Su probabilidad es P(A) = p(A 2 o A 3 o A 5) = = p(A 2) + p(A 3) + p(A 5) =

= 3 × 1/6 = 1/2

Es decir tres sucesos elementales que son favorables a la aparición de número primo entre los seis posibles del espacio muestral E. Esta regla puede generalizarse muy fácilmente a n sucesos elementales equiprobables del espacio muestral y se obtiene la denominada Regla de Laplace o Ley de Laplace, también se le conoce como la definición clásica de probabilidad.

Page 19: Apuntes - Probabilidad y Estadistica - Neftali

18

La probabilidad de un suceso A es igual a

Con lo que en definitiva, el cálculo de probabilidades de sucesos en un modelo uniforme, se limita a contar el número de casos favorables a dicho suceso y el número de casos posibles.

No obstante, dicho cómputo no resulta siempre fácil por lo que es conveniente tener presente las fórmulas de las variaciones, combinaciones y permutaciones, ya que éstas facilitarán el cálculo.

Si de un grupo de N elementos tomamos n importándonos el orden de los n elementos seleccionados, tendremos variaciones y si no nos importa el orden, combinaciones. Además, si admitimos la posibilidad de que entre estos n pueda haber elementos repetidos, hablaremos, respectivamente, de variaciones y de combinaciones con repetición.

Por último, si solamente queremos contar el número posible de reordenaciones de un conjunto de elementos, hablaremos de permutaciones con o sin repetición dependiendo de que admitamos o no la posibilidad de que haya elementos repetidos.

Las fórmulas son:

Variaciones de N elementos tomados de n en n

V N , n = N · (N - 1) · ... · (N - n +1)

Variaciones con repetición de N elementos tomados de n en n

VR N , n = N n

Combinaciones de N elementos tomados de n en n

Combinaciones con repetición de N elementos tomados de n en n

Permutaciones de N elementos

Page 20: Apuntes - Probabilidad y Estadistica - Neftali

19

PN = N! = N · (N - 1) · ... · 2 · 1

Permutaciones con repetición de N elementos, uno de los cuales se repite n1 veces, otro n2 veces, ..., otro nr veces

Ejemplo:

Una enciclopedia de seis volúmenes es colocada en una biblioteca de forma aleatoria. La probabilidad de que resulte colocada de forma correcta, supuesto que esto signifique empezar a contar por la izquierda, será

Ejemplo 1

Los 36 elementos del espacio muestral son igualmente

probables. Como el suceso S está compuesto por 6 de estos elementos, aplicando la regla de Laplace resulta

p(S) = casos favorables / casos posibles = = 6/36 = 1/6 = 0,1667

En el experimento aleatorio del lanzamiento de dos dados, consideramos el suceso “la suma obtenida sea 7”

S = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}

Los 36 sucesos elementales del espacio muestral son igualmente probables por lo que podemos asignar a cada uno de ellos la probabilidad 1/36. Como estos sucesos son disjuntos dos a dos, aplicando el Axioma AIII

p(S) = p((1,6)) + p((2,5)) + p((3,4)) + p((4,3)) + p((5,2)) +

p((6,1)) = = 6/36 = 1/6 = 0,1667

Ejemplo 2

Se lanza una moneda tres veces. Calcular la probabilidad de los sucesos

Page 21: Apuntes - Probabilidad y Estadistica - Neftali

20

A = {CCC, CC+, C+C, C++, +CC, +C+, ++C} = {"obtener al menos una cara"} B = {CC+, C+C, +CC} = {"obtener dos caras"} C = {C++, +C+, ++C, +++} = {"obtener más cruces que caras"}

El espacio muestral es, como ya sabemos, E = {CCC, CC+, C+C, C++, +CC, +C+, ++C, +++}

Todos estos sucesos elementales son igualmente probables e incompatibles dos a dos Suceso A

Como el suceso A está compuesto de 7 casos favorables y existen 8 posibles, aplicando la Regla de Laplace resulta

p(A) = 7/8 = 0,875

Suceso A Podemos asignar a cada suceso elemental del espacio muestral la probabilidad 1/8 Como

A = {CCC, CC+, C+C, C++, +CC, +C+, ++C}

tendremos p(A) = p(CCC) + p(CC+) +

p(C+C) + p(C++) + p(+CC) + p(+C+) + p(++C) =

= 7 × 1/8 = 7/8 = 0,875 El suceso contrario de A es (no A) = {"No obtener ninguna

cara"} = = {+++}.

Como p(A) + p((no A)) = 1 tendremos: P(no A) = 1 - 0,8750 = 0,125

Suceso B Como el suceso B está compuesto de 3 casos favorables y existen 8 posibles, aplicando la Regla de Laplace resulta

p(B) = 3/8 = 0,375

Suceso B Como

B = {CC+, C+C, +CC} tendremos

p(B) = p(CC+) + p(C+C) + p(+CC) =

= 3 × 1/8 = 0,375 ya que a cada suceso elemental del espacio muestral se le ha asignado la probabilidad 1/8

Suceso C Como el suceso C está compuesto de 4 casos favorables y existen 8 posibles, aplicando la Regla de Laplace resulta

p(B) = 4/8 = 0,5

Suceso C Como

C = {C++, +C+, ++C, +++} tendremos

p(C) = p(C++) + p(+C+) + + p(++C) + p(+++) =

= 4 ×1/8 = 0,5 ya que a cada suceso elemental del espacio

Page 22: Apuntes - Probabilidad y Estadistica - Neftali

21

muestral se le ha asignado la probabilidad 1/8

Ejercicio

Dos personas juegan a obtener la puntuación más alta lanzando cada una sus dados A y B. El dado A tiene cuatro caras con un 6 y las otras dos con un 10. El dado B tiene una cara con la puntuación 3, cuatro caras con la puntuación 6 y la cara restante con un 12. Cada jugador lanza su dado y gana quien tenga la puntuación más alta. Determinar la probabilidad de ganar de cada jugador y la probabilidad de empatar. Probabilidad de ganar A = 0,3889; probabilidad de ganar B = 0,1667; probabilidad de empatar = 0,444

Hasta ahora se han tratado sucesos equiprobables del espacio muestral, pero qué ocurriría si jugásemos con un dado trucado. Por ejemplo, ¿cuál sería la probabilidad de obtener número primo con un dado trucado de tal forma que la probabilidad de obtener una determinada cara fuese proporcional a la numeración de dicha cara?. En este caso los sucesos del espacio muestral no son equiprobables y no podemos aplicar la regla de Laplace.

Sea k la constante de proporcionalidad. Resulta

p(A 1) = 1 × k p(A 2) = 2 × k p(A 3) = 3 × k p(A 4) = 4 × k p(A 5) = 5 × k p(A 6) = 6 × k

Ante todo veremos qué probabilidad asignamos a cada suceso del espacio muestral

1 = p(E) = = p(A 1 o A 2 o A 3 o A 4 o A 5 o A 6) = = p(A 1) + p(A 2) + p(A 3) + p(A 4) +

+ p(A 5) + p(A 6) = 21 × k de donde k = 1/21 y resulta

p(A 1) = 1 × k = 1/21 p(A 2) = 2 × k = 2/21 p(A 3) = 3 × k = 3/21 p(A 4) = 4 × k = 4/21 p(A 5) = 5 × k = 5/21 p(A 6) = 6 × k = 6/21

Entonces : p(A) = p("obtener número primo") =

= p(A 2 o A 3 o A 5) = = p(A 2) + p(A 3) + p(A 5) =

= 10/21 = 0,476 Ejercicio

Un dado con forma de tetraedro está cargado de manera que la cara 4 tiene doble probabilidad de salir que las restantes (que son equiprobables). Determinar la probabilidad de obtener número par al lanzarlo Probabilidad 0,6

Page 23: Apuntes - Probabilidad y Estadistica - Neftali

22

EJEMPLOS

Jugando Quinielas

Para 1 partido, los posibles resultados son P1 - 1 x 2 (3 posibles resultados: 1(Gana), x (Empate), 2 (Pierde))

Para dos partidos, tendremos P1 - 1 x 2 1 x 2 1 x 2 P2 - 1 1 1 x x x 2 2 2 (9 = 3 2 posibles resultados)

Con tres partidos resulta P1 - 1 x 2 1 x 2 1 x 2 1 x 2 1 x 2 1 x 2 1 x 2 1 x 2 1 x 2 P2 - 1 1 1 x x x 2 2 2 1 1 1 x x x 2 2 2 1 1 1 x x x 2 2 2 P3 - 1 1 1 1 1 1 1 1 1 x x x x x x x x x 2 2 2 2 2 2 2 2 2 (27 = 3 3 posibles resultados)

Evidentemente, la quiniela 1 - x - 1 que corresponde a los partidos P1-P2-P3 es distinta de la x - 1 - 1. Una quiniela de 10 partidos será de la forma

1 - x - 2 - 1 - 1 - 1 - x - 1 - 2 - x Es decir, una variación con repetición de 3 elementos tomados de 10 en 10 y su número es 3 10 = 59049. En un boleto de 14 partidos el número de quinielas es 3 14 = 4782969 por lo que, al menos en teoría, la probabilidad de acertar una es 1/(3 14) = 0.0000002 . Hay una posibilidad muy baja de atinarle a una quiniela.

Jugando a la Lotería Melate El juego de Melate consiste en adivinar 6 números de 49 posibles. Dos de estos boletos son diferentes cuando lo es la naturaleza de algún elemento. Es decir los boletos {6 - 13 - 23 - 34 - 45 - 47} y {6 - 34 - 45 - 13 - 23 - 47} se consideran el mismo boleto. Dicho boleto es una combinación de seis elementos de las posibles que se pueden formar con los números 1, 2, 3, 4, ..., 49. El número de las mismas es

y la probabilidad de que UNA de ellas sea la premiada es

El problema del cumpleaños

Determinar la probabilidad de que en una reunión de 5 personas, al menos dos cumplan años el mismo día

Page 24: Apuntes - Probabilidad y Estadistica - Neftali

23

Sea el suceso A = {"al menos dos personas celebran su cumpleaños a la vez"} y su complementario Ac = {"no hay dos personas que celebren su cumpleaños a la vez"} Suponiendo el año de 365 días, el número de casos posibles de celebración de cumpleaños es 3655 = 6,478 × 10 12 Los casos favorables son los siguientes: como la primera de las personas puede haber nacido uno de los 365 días del año, la siguiente unos de los 364 días restantes y así sucesivamente, resultan 365 × 364 × 363 × 362 × 361 = 6,303 × 10 12 casos favorables a que no existan dos personas no hayan nacido el mismo día y tendremos

p(Ac) = 6,303 / 6,478 = 0,973 por lo que la probabilidad pedida es

p(A) = 1 - p(Ac) = 1 - 0,973 = 0,027

El problema puede generalizarse para una reunión de n personas. La probabilidad de que al menos dos de ellas cumplan años el mismo día es

La siguiente tabla, resume la situación

n = 10 p = 0,1169 n = 15 p = 0,2529 n = 20 p = 0,4114 n = 25 p = 0,5687 n = 30 p = 0,7063 n = 35 p = 0,8144

Leyendo la prensa

En Zoochilpan existen dos periódicos A y B. El 50% de sus habitantes son lectores del Diario y el 30% del Vértice. Un 20% de ciudadanos leen ambos periódicos. Si se elige un ciudadano al azar. Calcular la probabilidad de que dicho ciudadano:

Sea lector de algún diario. Lea sólo el Diario No lea la prensa Lea sólo uno de los diarios.

Page 25: Apuntes - Probabilidad y Estadistica - Neftali

24

Sean los sucesos A={"El ciudadano elegido lee el Diario"}" y B={"El ciudadano elegido lee el Vértice}".Además los sucesos A y B no son incompatibles (es decir, existen ciudadanos que leen ambos periódicos: p(A y B) = 0,20).

Ser lector de algún diario. Podemos expresar el suceso pedido como (A o B) y puesto que ambos sucesos no son incompatibles, resulta

p(A o B) = p(A) + p(B) - p(A y B) = = 0,5 + 0,3 - 0,2 = 0,6

(Es decir, el 60% de los habitantes de Zoochilpan es lector de algún diario: Sea el Diario o el Vértice)

Leer sólo el Diario Dicho suceso es A - B; como podemos expresar A como unión de los sucesos A - B y (A y B) (incompatibles) y por tanto

p(A) = p(A - B) + p(A y B) por lo que

p(A - B) = p(A) - p(A y B) = 0,5 - 0,2 = 0,3

(El 30% de los habitantes de Zoochilpan sólo leen el Diario. ¿Cuántos habitantes de Zoochilpan leen sólo el Vértice?)

No leer la prensa

Primer procedimiento Como la probabilidad de un suceso y de su complementario suman 1 y los sucesos "leer algún diario" y " no leer la prensa" son complementarios resulta

p("no leer la prensa") = 1 - p("leer algún diario") = 1 - 0,6 = 0,4 Segundo procedimiento Aplicando las leyes de Morgan Podemos expresar el suceso "No leer la prensa" como "No leer el Diario" y "No leer el Vértice", es decir (A o B) c = A c y B c Por tanto

p(A c y B c) = p((A o B) c) = 1 - p(A o B) = 1 - 0,6 = 0,4

Leer sólo uno de los diarios

Page 26: Apuntes - Probabilidad y Estadistica - Neftali

25

Podemos expresar dicho suceso por (A - B) o (B - A) ambos incompatibles.

p((A - B) o (B - A)) = p(A - B) + p(B - A) = = p(A) - p(A y B) + p(B) - p(A y B) = = p(A) + p(B) - 2 × p(A y B) = 0,4

Veraneando en Acapulco

El 40% de las personas que pasaron sus vacaciones en Acapulco eran extranjeras; el 70% eran mayores de 50 años y el 30% no eran extranjeras y tenían más de 50 años. Si se elige al azar una de las personas que veranearon en Acapulco, determinar:

probabilidad de que sea extranjera y mayor de 50 años. Probabilidad de que ni sea extranjera ni mayor de 50 años.

Consideramos los sucesos E = {"ser extranjero"} y M = {"ser mayor de 50 años"}. Podemos expresar el suceso {"no ser extranjero y tener más de 50 años"} por (Ec y M). Según el enunciado, asignamos a cada uno de estos sucesos las siguientes probabilidades

p(E) = 0,4; p(M) = 0,7 p(Ec y M) = 0,3

Probabilidad de que la persona elegida sea extranjera y mayor de 50 años. El suceso pedido es (E y M) y calculamos su probabilidad. Como podemos expresar el suceso M mediante la unión de los dos sucesos incompatibles (M y Ec) y (E y M) resulta

p(M) = p(M y Ec) + p(E y M) => => p(E y M) = p(M) - p(M y Ec) = 0,7 - 0,3 = 0,4

Probabilidad de que ni sea extranjera ni mayor de 50 años. El suceso pedido puede expresarse por (Mc y Ec). A partir del resultado obtenido en el apartado anterior puede calcularse p(M o E) = 0,7

Teniendo en cuentas las Leyes de DeMorgan es

(Mc y Ec) = (M o E)c por lo que

p(Mc y Ec) = p((M o E)c) = 1 - p(M o E) = 1 - 0,7 = 0,3

Ejemplo:

Un estudio sobre el color de los ojos en niños recién nacidos de una población determinada dio la siguiente distribución de frecuencias relativas:

Page 27: Apuntes - Probabilidad y Estadistica - Neftali

26

Color fi

Azules 0'05

Verdes 0'02

Castaños 0'69

Negros 0'24

Supuesto que no consideremos la componente genética que esta característica tiene, no teniendo en cuenta el color de ojos de los padres, podríamos considerar esta distribución de frecuencias como una buena aproximación de la probabilidad y decir, por ejemplo, que la probabilidad que tiene un recién nacido de esta población de tener los ojos claros es

P{ ojos claros } = P{Azules} + P{Verdes} = 0'05 + 0'02 = 0'07.

Jugando al Póker

Como una mano de póker está compuesta de 5 cartas, las posibles combinaciones quinarias (o manos de póker) distintas que se pueden obtener con las 52 cartas son

Escalera de color

Con cada palo de la baraja es posible formar 10 escaleras tal como se indica en el esquema. Por lo tanto existen 4 × 10 = 40 manos que son escaleras de color. Aplicando la regla de Laplace resulta

(Como puedes comprobar es 218 veces más probable sacar una escalera de color en una mano de póker que acertar una Quiniela o al Melate)

Póker

Page 28: Apuntes - Probabilidad y Estadistica - Neftali

27

En la posición "libre" puede ir una de las 48 cartas restantes. Como esta disposición puede repetirse para las 13 cartas (A - 2 - 3 - 4 - 5 - 6 - 7 - 8 - 9 - 10 - J - Q - K) resulta que el número posibles de mano que son póker es de 13 × 48 = 624. La probabilidad de obtener póker es, por tanto,

Full

En el full de la figura, las dos posiciones libres pueden ser ocupadas por una pareja de cartas que sean A - 3 - 4 - 5 - 6 - 7 - 8 - 9 - 10 - J - Q - K. Es decir 12 × C4, 2 = 72 posibles situaciones. Ahora bien, existen C4, 3 = 4 posibles "trios" en el full con el 2 por lo que tendremos 4 × 72 = 288 full con el 2 como "trio". Este razonamiento se puede realizar para las restantes figuras A - 3 - 4 - 5 - 6 - 7 - 8 - 9 - 10 - J - Q - K. En resumen resultan 13 × 288 = 3744 manos que son full.

Color

El color está formado por 5 cartas del mismo palo. El número de manos que son color es, por tanto, 4 × C13, 5 = 5148. A estas manos es necesario quitar las 40 escaleras de color antes consideradas, por lo que el número de manos de póker que son color es de 5108 y su probabilidad es

Escalera

Page 29: Apuntes - Probabilidad y Estadistica - Neftali

28

Supongamos la escalera de la figura. A partir de ella, es posible obtener 4 × 4 × 4 × 4 × 4 = 1024 posibles escaleras. Como hay 10 posibles comienzos de escaleras el número de escaleras es de 10240, a las que hay que retirar las 40 escaleras de color.

Trío

Las dos posiciones libres (sin contar el 6 que falta) pueden ser ocupadas por las restantes 48 cartas de C 48, 2 = 1128 formas posibles. Los "6" pueden colocarse de C4, 3 = 4 por lo que para esa situación existen 4 × 1128 = 4512 manos. Como existen 13 posibles situaciones a la anterior resultan 58656 "tríos" de los que es necesario quitar los full que son, como ya sabemos, 3744 quedando 54912 manos de tríos.

Doble pareja

Se pueden para los 4 ases obtener C4, 2 = 6 posibles situaciones e igualmente para los reyes, por lo que tendríamos entotal 36 posibles AAKK_ La posición "libre" podría estar ocupada por una carta (que no sea A o K) de las 44 restantes y tendríamos 36 × 44 = 1584 parejas dobles de ases y reyes. Esta situación se podría repetir con dobles parejas de A y Q, A y J, A y 10, etc, es decir existen C13, 2 = 78 posibles tipos de dobles parejas, por lo que tendremos 1584 × 78 = 123552 dobles parejas.

Pareja

Las dobles parejas de ases pueden presentarse de C4, 2 = 6 formas distintas; ésto es

Page 30: Apuntes - Probabilidad y Estadistica - Neftali

29

válido para las restantes cartas, por lo que tendremos 13 × 6 = 78 distintas dobles parejas. Veamos qué ocurre con las tres posiciones restantes. Deberán estar ocupadas por cada uno de los restantes figuras o números. Una mano es la de la figura K-5-4. Es decir, C12, 3 = 220 manos que es necesario multiplicar por 4 × 4 × 4 = 64 (pues cada una puede ser de 4 palos). En definitiva tendremos 78 × 220 × 64 = 1098240 parejas.

Menos que pareja

Todas las manos anteriores suman un total de 1296420 manos. Como en total existen 2598960 manos de póker resulta que

PROBABILIDAD CONDICIONADA

Conceptos básicos Si lanzamos un dado y consideramos los sucesos B = {"Obtener puntuación inferior a 5"} y B = {"Obtener puntuación par"} la probabilidad de cada uno de ellos es, como sabemos, p(B) = 4/6 y p(A) = 1/2 ya que el espacio muestral del experimento aleatorio considerado es E = {1, 2, 3, 4, 5, 6} y los casos favorables son, respectivamente, B = {1, 2, 3, 4} y A = {2, 4, 6} sin embargo la probabilidad del suceso {"Obtener par en el supuesto que se ha obtenido una puntuación inferior a 5"} es 2/4 puesto que el espacio muestral de dicho experimento aleatorio es E = {1, 2, 3, 4} = B y los casos favorables son 2 y 4.

Dicho suceso se representa, generalmente como A/B que se lee "el suceso A está condicionado por el suceso B" y para determinar la probabilidad de dicho suceso hemos de considerar como espacio muestral del mismo al suceso B. Con dicha notación podemos escribir, para el ejemplo considerado, que p(A/B) = 2/4

Un ejemplo: Se ha realizado una encuesta sobre el fenómeno de la violencia en los medios de comunicación y la información obtenida queda recogida en la siguiente tabla

Page 31: Apuntes - Probabilidad y Estadistica - Neftali

30

Dicha tabla se denomina tabla de contingencia de frecuencias y a partir de ella se puede obtener abundante información.

Elegido un encuestado al azar, la probabilidad de que haya dicho (S)í es p(S) = 418/600, de que haya dicho (N)o p(N) = 140/600 y la probabilidad de (N)s/(N)c es p(NN) = 42/600

Igualmente podemos determinar la probabilidad de que hayamos elegido un (H)ombre p(H) = 280/600 o de una mujer p(M) = 320/600

La probabilidad del suceso (H y S) = {"Hombres que han dicho sí"} es p(H y S) = 162/600. Dicho suceso no es lo mismo que el suceso

H/S = {"Seleccionar un hombre entre los que han dicho sí"} ni

S/H = {"Seleccionar respuesta afirmativa entre los hombres"} cuyas probabilidades respectivas son:

Seleccionar un hombre entre

los que han dicho sí

p(H/S) = 162/418 (#1)

Seleccionar respuesta afirmativa

entre los hombres

p(S/H) = 162/280 (#2)

A partir de (#1) podemos escribir

y análogamente a partir de (#2)

Page 32: Apuntes - Probabilidad y Estadistica - Neftali

31

Resumiendo Dados dos sucesos A y B podemos calcular la probabilidad p(A/B) teniendo en cuenta que el número de casos favorables vendría dado por el suceso (A y B) y que el número de casos posibles vendría dado por el suceso B. Es decir, como si B fuese el nuevo espacio muestral.

Es evidente que si el suceso A no está condicionado por B entonces p(A/B) = p(A) por lo que p(A y B) = p(A) p(B)

Si dos sucesos A y B son independientes p(A y B) = p(A) p(B) y recíprocamente

Otro ejemplo

Una urna tiene tres bolas azules y tres bolas rojas. Se extraen dos bolas, con reemplazamiento. Consideramos los sucesos M = {La primera bola extraída es azul} y N = {Al menos una bola extraída es azul}. Vamos a ver si dichos sucesos son independientes o no.

El espacio muestral es el conjunto E = {AA, AR, RA, RR} y los sucesos M y N son

M = {AA, AR} N = {AA, AR, RA} por lo que p(M) = 2/4 y p(N) = 3/4

Como (M y N) = {AA, AR} (en el gráfico puede observarse que M está contenido en N) resulta p(M y N) = 2/4

Como p(M y N) p(M)×p(N) los sucesos M y N no son independientes

La probabilidad del suceso M/N = {La primera bola es azul en el supuesto que al menos una es azul} es

Page 33: Apuntes - Probabilidad y Estadistica - Neftali

32

(Y sólo tienes que observar el dibujo para convencerte de ello)

Por otra parte, la probabilidad del suceso N/M = {Al menos una bola es azul en el supuesto que la primera es azul} es, evidentemente ...

¡El suceso seguro! (¿Lógico no?)

Otro Ejemplo Supongamos la urna anterior, pero en ella hay tres bolas rojas y dos azules. Extraemos, sin reemplazamiento dos bolas y nuevamente consideramos los sucesos M = {La primera bola extraída es azul} y N = {Al menos una bola extraída es azul}. Al no devolver la bola a la urna la probabilidad de la siguiente extracción dependerá de la bola que hayamos sacado en primer lugar.

El siguiente diagrama de árbol nos da una idea de la situación

y los sucesos M y N son

M = { A 1 y R 2, A 1 y A 2 } N = { A 1 y R 2, A 1 y A 2, R 1 y A 2 }

Por lo tanto:

p(M) = p(A 1 y R 2) + p(A 1 y A 2) = = p(A 1)×p(R 2 / A 1) + p(A 1)× p(A 2 / A 1) =

= 2/5 × 3/4 + 2/5 × 1/4 = 2/5

p(N) = p(A 1 y R 2) + p(A 1 y A 2) + p(R 1 y A 2) = = p(A 1)×p(R 2 / A 1) + p(A 1)× p(A 2 / A 1) + p(R 1)× p(A 2 / R 1) =

= 2/5 × 3/4 + 2/5 × 1/4 + 3/5 × 2/4 = 7/10

En resumen: p(M) × p(N) = 7/25 que es distinto de p(M y N) = 2/5 por lo

Page 34: Apuntes - Probabilidad y Estadistica - Neftali

33

que los sucesos M y N son dependientes.

La probabilidad de los sucesos condicionados M/N y N/M viene dada por

A veces es útil tener en cuenta que si dos sucesos A y B son independientes sus complementos también lo son, es decir si

p(A y B) = p(A) × p(B) entonces p(Ac y Bc) = p(Ac) × p(Bc) En efecto: p(Ac y Bc) = p((A o B)c) = Según las leyes de DeMorgan = 1 - p(A o B) = Pues p(Sc) = 1 - p(S) = 1 - (p(A) + p(B) - p(A y B)) = = 1 - p(A) - p(B) + p(A y B) = Pues p(A o B) = p(A) + p(B) - p(A y B)

= 1 - p(A) - p(B) + p(A) × p(B) = Por hipótesis p(A y B) = p(A) × p(B) = p(A) × (p(B) - 1) + 1 - p(B) = = - p(A) × (1 - p(B)) + 1 - p(B) = = (1 - p(B)) × (1 - p(A)) = p(Ac) × p(Bc)

Sacando factor común y operando

Puede probarse igualmente que si A y B son independientes también se verifica que

p(A y Bc) = p(A) × p(Bc) p(Ac y B) = p(Ac) × p(B)

Si los sucesos A y B son independientes y compatibles, ¿cuál de las siguientes afirmaciones son ciertas?: 1) p( (A o B) / B) = 1 2) p(B / Ac) = p(B)

Los sucesos A y B son tales que su unión es el suceso seguro y p(A/B) = 1/2 y p(B/A) = 1/3 determinar p(A) y p(B). Solución 3/4 y 1/2

ESTADISTICA. Rama de las matemáticas que a través de la obtención, organización y graficación de datos, analiza y permite la toma racional de decisiones.

Uso de la Estadística. 1. Representación funcional de fenómenos

numéricos

2. Representación gráfica de situaciones de toda índole, ejemplo: Economía, Demografía, Física, Población, Biología, etc.

3. Recopilación de datos y su interpretación 4. Previsión científica de efectos de causas

evaluables matemáticamente 5. Interpretación de la experimentación 6. Corrección de errores inevitables en toda

ciencia

Page 35: Apuntes - Probabilidad y Estadistica - Neftali

34

ESTADISTICA. Rama de las matemáticas que a través de la obtención, organización y graficación de datos, analiza y permite la toma racional de decisiones.

Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadística como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra.

"La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares". (Gini, 1953.

Murray R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis.

"La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos". (Yale y Kendal, 1954).

Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la estadística, debido al gran campo de aplicación que posee.

Uso de la Estadística. 1. Representación funcional de fenómenos

numéricos

2. Representación gráfica de situaciones de toda índole, ejemplo: Economía, Demografía, Física, Población, Biología, etc.

3. Recopilación de datos y su interpretación 4. Previsión científica de efectos de causas

evaluables matemáticamente 5. Interpretación de la experimentación 6. Corrección de errores inevitables en toda

ciencia 7. Aprovechamiento de muestreo para el

estudio de fenómenos

DEFINICIONES

Universo: Conjunto determinado de objetos o elementos

Población: Número total de valores posibles que tienen la característica de que determine un conjunto. La población es un subconjunto del universo.

Muestra: Es una parte de la población.

Población:

El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.

"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).

"Una población es un conjunto de elementos que presentan una característica común". Cadenas (1974).

Ejemplo:

Los miembros del Colegio de Ingenieros del Estado de Guerrero.

Page 36: Apuntes - Probabilidad y Estadistica - Neftali

35

El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación estadística, y este tamaño vienen dado por el número de elementos que constituyen la población, según el número de elementos la población puede ser finita o infinita. Cuando el número de elementos que integra la población es muy grande, se puede considerar a esta como una población infinita, por ejemplo; el conjunto de todos los números positivos. Una población finita es aquella que está formada por un limitado número de elementos, por ejemplo; el número de estudiantes de la Universidad Autónoma de Guerrero.

Cuando la población es muy grande, es obvio que la observación de todos los elementos se dificulta en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística.

Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una pequeña parte del grupo llamada muestra.

Muestra:

"Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murray R. Spiegel (1991).

"Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin & Rubin (1996).

"Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).

Ejemplo;

El estudio realizado a 50 miembros del Colegio de Ingenieros del Estado.

El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y lleva menos tiempo. Se ha probado que el examen de una población entera todavía permite la aceptación de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad.

Una muestra representativa contiene las características relevantes de la población en las mismas proporciones que están incluidas en tal población.

Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer inferencias o conclusiones sobre la población que está representada por la muestra. En consecuencia muestra y población son conceptos relativos. Una población es un todo y una muestra es una fracción o segmento de ese todo.

Muestreo:

Esto no es más que el procedimiento empleado para obtener una o más muestras de una población; el muestreo es una técnica que sirve para obtener una o más muestras de población.

Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.

Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no necesariamente serían iguales, y lo más probable es que variaran de una muestra a otra.

Ejemplo:

Consideremos como una población a los estudiantes de Ingeniería de la UAG,

Page 37: Apuntes - Probabilidad y Estadistica - Neftali

36

determinando por lo menos dos caracteres a ser estudiados en dicha población;

• Religión de los estudiantes • Sexo.

Tipos de muestreo

Existen dos métodos para seleccionar muestras de poblaciones; el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este último todos los elementos de la población tienen la oportunidad de ser escogidos en la muestra. Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la población. Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir como tomar una muestra aleatoria más adelante. Las muestras de juicio evitan el análisis estadístico necesarios para hacer muestras de probabilidad.

TIPOS DE ESTUDIO ESTADÍSTICO. a) Descriptivo : que trabaja con toda la

población b) No descriptivo: que trabaja con la

muestra y los resultados se aplican a toda la población

Algunos conceptos propios de la terminología de la Estadística Descriptiva son los siguientes:

Caracteres

Cada uno de los individuos de la población en estudio posee uno o varias características, a las cuales en estadística se les llama caracteres. Así por ejemplo, si la población en consideración es la de los estudiantes de una determinada universidad, éstos poseen una serie de caracteres, o si se quiere características, que permiten describirlo. Los caracteres en este ejemplo pueden ser "facultad en la que está inscrito", "curso que sigue", "sexo", "edad", etc. Precisamente la observación de uno o más de esos caracteres

en los individuos de la muestra es lo que dará origen a los datos.

Los caracteres pueden ser de dos clases: cuantitativos, cuando son tales que su observación en un individuo determinado proporciona un valor numérico como medida asociada, como ocurre por ejemplo con los caracteres "edad" o "curso que sigue", y cualitativos, cuando su observación en los individuos no suministra un número, sino la pertenencia a una clase determinada, como por ejemplo el "sexo", o la "facultad en la que está inscrito".

Modalidades de los caracteres

Consideremos un carácter cualquiera, como por ejemplo el "gusto". Este carácter, al ser observado en un individuo (una sustancia), puede presentar cuatro posibilidades, es decir, es posible percibir cuatro sensaciones diferentes: dulce, amargo, salado y ácido. Pues bien, a las posibilidades, tipos o clases que pueden presentar los caracteres las denominaremos modalidades.

Las modalidades de un carácter deben ser a la vez incompatibles y exhaustivas. Es decir, las diversas modalidades de un carácter deben cubrir todas las posibilidades que éste puede presentar y además deben ser disjuntas. Un individuo no puede presentar a la vez más de una de ellas y además debe presentar alguna de ellas.

Así, al estudiar algún carácter, como por ejemplo la raza, el investigador deberá considerar todas las posibles modalidades del carácter (todas las posibles razas), con objeto de poder clasificar a todos los individuos que observe.

Variables y Atributos:

Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante números. Son caracteres susceptibles de medición. Como por ejemplo, la estatura, el peso, el salario, la edad, etc.

Page 38: Apuntes - Probabilidad y Estadistica - Neftali

37

Según, Murray R. Spiegel, (1992) "una variable es un símbolo, tal como X, Y, Hx, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor, se llama constante."

Todos los elementos de la población poseen los mismos tipos de caracteres, pero como estos en general no suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por lo tanto estos distintos números o medidas que toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una variable.

Los atributos también llamados caracteres cualitativos, son aquellos que no son susceptibles de medición, es decir que no se pueden expresar mediante un número.

IUTIN (1997). "Reciben el nombre de variables cualitativas o atributos, aquellas características que pueden presentarse en individuos que constituyen un conjunto.

La forma de expresar los atributos es mediante palabras, por ejemplo; profesión, estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de "modalidades".

Ejemplo:

El estado civil y el peso de cada uno de los estudiantes del curso de Probabilidad y Estadística, no se presenta en la misma modalidad en todos.

Formas de Observar la Población:

1. Atendiendo a la fuente se clasifican en directa o indirecta.

• Observación directa: es aquella donde se tienen un contacto directo con los elementos o caracteres en los cuales se presenta el fenómeno que se pretende investigar, y los resultados obtenidos se consideran datos estadísticos originales. Para Ernesto Rivas González (1997) "Investigación directa, es aquella en que el investigador observa directamente los casos o individuos en los cuales se produce el fenómeno, entrando en contacto con ellos; sus resultados se consideran datos estadísticos originales, por esto se llama también a esta investigación primaria".

Ejemplo; el seguimiento de la población agrícola por año, llevado en una determinada granja.

• Observación Indirecta: es aquella donde la persona que investiga hace uso de datos estadísticos ya conocidos en una investigación anterior, o de datos observados por un tercero (persona o entidad). Con el fin de deducir otros hechos o fenómenos.

Ejemplo; si un investigador pretende estudiar la producción por años de una granja avícola, en sus últimos cinco años de producción, tendría que hacer un seguimiento, a tal fin recurriría a las observaciones que posee la oficina administrativa de la granja durante estos cinco años, o dirigirse a la oficina de estadística, llevada en la Asociación Agrícola y Ganadera de la localidad donde está registrada dicha granja. Es de notar que el

Page 39: Apuntes - Probabilidad y Estadistica - Neftali

38

investigador se vale de observaciones realizadas por terceros.

1. Atendiendo a la periodicidad, puede ser continua, periódica o circunstancial.

o Una observación continua; como su nombre lo indica es aquella que se lleva acabo de un modo permanente.

Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras operaciones que se van registrando a medida que van produciéndose.

o Una observación periódica; es aquélla que se lleva a cabo a través de períodos de tiempo constantes. Estos períodos de tiempos pueden ser semanas, trimestres, semestres, años, etc. Lo que debemos destacar es que los períodos de tiempo tomados como unidad deben tomarse constantes en lo posible.

Ejemplo; el registro llevado por la Oficinas de Control de Estudios de la UAG, en cuanto a la inscripción de los estudiantes por semestre.

o La observación circunstancial, es aquella que se efectúa en

forma ocasional o esporádica, esta observación hecha más por una necesidad momentánea, que de carácter regular o permanente.

Ejemplo; la obtención de números de aulas utilizadas y no utilizadas en los colegios pertenecientes al municipio de Chilpancingo.

1. Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta

o Observación Exhaustiva. Cuando la observación es efectuada sobre la totalidad de los elementos de la población se habla de una observación exhaustiva.

o Observación Parcial. Dado que las poblaciones en general son grandes, la observación de todos sus elementos se ve imposibilitada. La solución para superar este inconveniente es observar una parte de esta población.

o Observación Mixta. En este tipo de observación se combinan adecuadamente la observación exhaustiva con la observación parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran básicos se observan exhaustivamente y los otros mediante una muestra; o bien cuando la población es muy grande, parte de ella se observa parcialmente.

Censo:

Page 40: Apuntes - Probabilidad y Estadistica - Neftali

39

Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los caracteres componentes de una población.

Para Levin & Rubin (1996) "Algunas veces es posible y práctico examinar a cada persona o elemento de la población que deseamos describir. A esto lo llamamos una numeración completa o censo. Utilizamos el muestreo cuando no es posible contar o medir todos los elementos de la población.

Los censos se utilizan rara vez porque a menudo su compilación es bastante difícil, consume mucho tiempo y resulta demasiado costoso.

Encuesta:

Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales.

El diseño de encuestas es exclusivo de las ciencias sociales, aunque pueden ser utilizadas en otra areas y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, más directo y simple es preguntárselo directamente a ellas. (Cadenas, 1974).

Según Antonio Napolitano "La encuesta, es un método mediante el cual se quiere averiguar algo. Se efectúa a través de cuestionarios verbales o escritos que son aplicados a un gran número de personas".

Estadística Descriptiva:

Tienen por objeto fundamental describir y analizar las características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observación de todos los elementos de una población (observación exhaustiva) sino también a la descripción de

los elementos de una muestra (observación parcial).

En relación a la estadística descriptiva, Ernesto Rivas Gonzáles dice; "Para el estudio de estas muestras, la estadística descriptiva nos provee de todos sus medidas; medidas que cuando quieran ser aplicadas al universo total, no tendrán la misma exactitud que tienen para la muestra, es decir al estimarse para el universo vendrá dada con cierto margen de error; esto significa que el valor de la medida calculada para la muestra, en el oscilará dentro de cierto límite de confianza, que casi siempre es de un 95 a 99% de los casos.

Estadística Inductiva:

Está fundamentada en los resultados obtenidos del análisis de una muestra de población, con el fin de inducir o inferir el comportamiento o característica de la población, de donde procede, por lo que recibe también el nombre de Inferencia estadística.

Según Berenson y Levine; Estadística Inferencial son procedimientos estadísticos que sirven para deducir o inferir algo acerca de un conjunto de datos numéricos (población), seleccionando un grupo menor de ellos (muestra).

El objetivo de la inferencia en investigación científica y tecnológica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeñas compuestas por los mismos elementos.

En relación a la estadística descriptiva y la inferencial, Levin & Rubin (1996) citan los siguientes ejemplos para ayudar a entender la diferencia entre las dos.

Supóngase que un profesor calcula la calificación promedio de un grupo de historia. Como la estadística describe el desempeño

Page 41: Apuntes - Probabilidad y Estadistica - Neftali

40

del grupo pero no hace ninguna generalización acerca de los diferentes grupos, podemos decir que el profesor está utilizando estadística descriptiva. Graficas, tablas y diagramas que muestran los datos de manera que sea más fácil su entendimiento, estos son ejemplos de estadística descriptiva.

Supóngase ahora que el profesor de historia decide utilizar el promedio de calificaciones obtenidos por uno de sus grupos para estimar la calificación promedio de las diez unidades del mismo curso de historia. El proceso de estimación de tal promedio sería un problema concerniente a la estadística inferencial.

Los estadísticos se refieren a esta rama como inferencia estadística, esta implica generalizaciones y afirmaciones con respecto a la probabilidad de su validez.

Medición de Caracteres

Medición

Existen diversas definiciones del termino "medición", pero estas dependen de los diferentes puntos de vista que se puedan tener al abordar el problema de la cuantificación y el proceso mismo de la construcción de una escala o instrumento de medición.

En general, se entiende por medición la asignación de números a elementos u objetos para representar o cuantificar una propiedad. El problema básico está dado por la asignación de un numeral que representa la magnitud de la característica que queremos medir y que dichos números pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la medición, los atributos de nuestras percepciones se transforman en entidades conocidas y manejables llamadas "números". Es evidente que el mundo resultaría caótico si no pudiéramos medir nada. En este caso

cabría preguntarse de que le serviría la físico saber que el hierro tiene una alta temperatura de fusión.

Niveles o Escalas de mediciones

Escala Nominal:

La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en la asignación, puramente arbitraria de números o símbolos a cada una de las diferentes categorías en las cuales podemos dividir el carácter que observamos, sin que puedan establecerse relaciones entre dichas categorías, a no ser el de que cada elemento pueda pertenecer a una y solo una de estas categorías.

Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes respecto del atributo o propiedad en estudio, después de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan números, puede ser una de las razones por las cuales se le conoce como "medidas nominales".

Por ejemplo, podemos estar interesados en clasificar los estudiantes del CBTis 134 de acuerdo a la carrera que cursan.

Carrera Número asignada a la categoría

Construcción 1

Laboratorista Clínico 2

Administración 3

Computación 4

Se ha de tener presente que los números asignados a cada categoría sirven única y exclusivamente para identificar la categoría y no poseen propiedades cuantitativas.

Page 42: Apuntes - Probabilidad y Estadistica - Neftali

41

Escala Ordinal:

En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden" de los números asignándolo a los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B.

La asignación de números a las distintas categorías no puede ser completamente arbitraria, debe hacerse atendiendo al orden existente entre éstas.

Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder ordenar todas sus categorías, el cálculo de las medidas estadísticas de posición, como por ejemplo la mediana.

Ejemplo:

Al asignar un número a los pacientes de una consulta médica, según el orden de llegada, estamos llevando una escala ordinal, es decir que al primero en llegar ordinal, es decir que al primeo en llegar le asignamos el nº 1, al siguiente el nº 2 y así sucesivamente, de esta forma, cada número representará una categoría en general, con un solo elemento y se puede establecer relaciones entre ellas, ya que los números asignados guardan la misma relación que el orden de llegada a la consulta.

Escalas de intervalos iguales:

la escala de intervalos iguales, está caracterizada por una unidad de medida común y constante que asigna un número igual al número de unidades equivalentes a la de la magnitud que posea el elemento observado. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningún momento ausencia de la magnitud que

estamos midiendo. Esta escala, además de poseer las características de la escala ordinal, encontramos que la asignación de los números a los elemento es tan precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida pueden calculársele todas las medidas estadísticas a excepción del coeficiente de variación.

Ejemplo:

El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.

Escala de coeficientes o Razones:

El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las escalas de intervalos iguales únicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los números asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Además, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la propiedad presente en B.

Ejemplo:

En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3 hijos.

Las variables y su medición:

Page 43: Apuntes - Probabilidad y Estadistica - Neftali

42

Una variable es un símbolo, tal como X, Y, H, x ó B, que pueden tomar un conjunto prefijado de valores, llamado dominio de esa variable. Para Murray R. Spiegel (1991) "una variable que puede tomar cualquier valor entre dos valores dados se dice que es una variable continua en caso contrario diremos que la variable es discreta".

Las variables, también llamadas caracteres cuantitativos, son aquellas cuyas variaciones son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numéricamente la magnitud de dichas variaciones. Por intuición y por experiencia sabemos que pueden distinguirse dos tipos de variables; las continuas y las discretas

Las variables continuas se caracterizan por el hecho de que para todo par de valores siempre se puede encontrar un valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.)

Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura. Se representan por números decimales.

Ejemplo:

En el preescolar Salpinx, ubicado en la Colonia Siglo XXI de esta ciudad se procedió a recoger las medidas de talla y peso de los niños que a este asisten.

Niño Peso Talla

José 18,300 1,15

Julio 20,500 1,20

Pedro 19,000 1,10

Luis 18,750 1,18

.Las variables discretas serán aquellas que pueden tomar solo un número limitado de valores separados y no continuos; son aquellas que solo toman un determinado números de valores, porque entre dos valores consecutivos no pueden tomar ningún otro; por ejemplo el número de estudiantes de una clase es una variable discreta ya que solo tomará los valores 1, 2, 3, 4... nótese que no encontramos valor como 1,5 estudiantes. Las variables discretas se representan por números enteros.

Estadísticas Primarias

Datos Estadísticos:

Los datos estadísticos no son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenómeno que queremos estudiar. Dicho en otras palabras, son los antecedentes (en cifras) necesarios para llegar al conocimiento de un hecho o para reducir las consecuencias de este.

Los datos estadísticos se pueden encontrar de forma no ordenada, por lo que es muy difícil en general, obtener conclusiones de los datos presentados de esta manera. Para poder obtener una precisa y rápida información con propósitos de descripción o análisis, estos deben organizarse de una manera sistemática; es decir, se requiere que los datos sean clasificados. Esta clasificación u organización puede muy bien hacerse antes de la recopilación de los datos.

Ejemplo:

Si se quiere conocer las características de los estudiantes de la UAG, que solicitan préstamo a la biblioteca de dicha Universidad, la recolección de la información debe clasificar a cada estudiante sobre la base de: Carrera que estudia, edad, semestre de estudios, etc. Vemos pues que la clasificación marca la pauta de la clase de datos que debe ser obtenido.

Page 44: Apuntes - Probabilidad y Estadistica - Neftali

43

Clasificación de los datos

Los datos estadísticos pueden ser clasificados en cualitativos, cuantitativos, cronológicos y geográficos.

Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad.

Ejemplo:

Si deseamos clasificar los estudiantes que cursan la materia de estadística I por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos.

Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos.

Ejemplo:

Se clasifican los estudiantes de la Unidad Académica de Ingeniería de acuerdo a sus notas, observamos que los valores (nota) representan diferentes magnitudes.

Datos cronológicos: cuando los valores de los datos varían en diferentes instantes o períodos de tiempo, los datos son reconocidos como cronológicos.

Ejemplo:

Al registrar los promedios de notas de los Alumnos de la Unidad Académica de Ingeniería en los diferentes semestres.

Datos geográficos: cuando los datos están referidos a una localidad geográfica se dicen que son datos geográficos.

Ejemplo

El número de estudiantes de educación superior en las distintas regiones del país.

Fuentes de datos Estadísticos:

Los datos estadísticos necesarios para la comprensión de los hechos pueden obtenerse a través de fuentes primarias y fuentes secundarias.

Fuentes de datos primarias: es la persona o institución que ha recolectado directamente los datos.

Fuentes secundarias: son las publicaciones y trabajos hechos por personas o entidades que no han recolectado directamente la información.

Las fuentes primarias más confiables, son las efectuadas por oficinas gubernamentales encargadas de tal fin, como el INEGI.

En la práctica, es aconsejable utilizar fuentes de datos primarias y en última instancia cuando estas no existan, usar estadísticas de fuentes secundarias. Con este último tipo no debemos pasar por alto que la calidad de las conclusiones estadísticas dependen en grado sumo de la exactitud de los datos que se recaben. De anda serviría usar técnicas estadísticas precisas y refinadas para llegar a conclusiones valederas, si estas técnicas no son aplicadas a datos adecuados o confiables.

Cuando un investigador quiere obtener datos estadísticos relativos a un estudio que desea efectuar, puede elegir entre una fuente primaria o en su defecto, una secundaria. O recopilar los datos por sí mismo. La posibilidad mencionada en último término podrá deberse bien a la inexistencia de los datos o bien a que estos no se encuentran discriminados en la forma requerida.

Ejemplo:

Si un investigador quiere conocer el número de alumnos repetidores en educación media superior, clasificados por ciclos, para los últimos diez años, el investigador puede usar una fuente primaria, tal como los registros de

Page 45: Apuntes - Probabilidad y Estadistica - Neftali

44

calificaciones del Departamento de Servicios Escolares de los últimos diez años.

Método para la recolección de datos:

En estadística se emplean una variedad de métodos distintos para obtener información de los que se desea investigar. Discutiremos aquí los métodos más importantes, incluyendo las ventajas y limitaciones de estos.

La entrevista personal: los datos estadísticos necesarios para una investigación, se reúnen frecuentemente mediante un proceso que consiste en enviar un entrevistador o agente, directamente a la persona investigada. El investigador efectuará a esta persona una serie de preguntas previamente escritas en un cuestionario o boleta, donde anotará las respuestas correspondientes. Este procedimiento que se conoce con el nombre de entrevista personal, permite obtener una información más veraz y completa que la que proporcionan otros métodos, debido a que al tener contacto directo con la persona entrevistada, el entrevistador podrá aclarar cualquier duda que se presente sobre el cuestionario o investigación.

Otra ventaja es la posibilidad que tienen los entrevistadores de adaptar el lenguaje de las preguntas al nivel intelectual de las personas entrevistadas.

Una de las desventajas de este método se debe a que si el entrevistador no obra de buena fé o no tiene un entrenamiento adecuado, puede alterar las respuestas por las personas entrevistadas.

Otra desventaja es su alto costo, ya que resulta bastante oneroso el entrenamiento de los agentes o entrenadores y los supervisores de estos, sobre todo si se trata de una investigación extensa.

Cuestionarios por correo: consiste en enviar por correo el cuestionario acompañado por el

instructivo necesario, dando en este no solo las instrucciones pertinentes para cada una de las preguntas, sino también una breve explicación del objeto de la encuesta con el fin de evitar interpretaciones erróneas.

Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento, puesto que no hay que incluir gastos de entrenamiento de personal, el único gasto sería el de franqueo postal.

Dentro de las desventajas de este procedimiento podemos señalar que solo un porcentaje bastante bajo de estos es devuelto, en algunos casos no estamos seguros de que los formularios hayan sido recibidos por sus destinatarios y que hayan sido respondido por ellos mismos. Lo que trae como consecuencia que la información se obtenga con una serie de errores difíciles de precisar por el investigador.

Entrevista por teléfono: como lo indica su nombre, este método consiste en telefonear a la persona a entrevistar y hacerle una serie de preguntas. Este método es bastante simple y económico, ya que el entrenamiento y supervisión de las personas encargadas de efectuar las preguntas es siempre fácil.

Entre las limitaciones que presenta este método podemos señalar el número de preguntas que pueden formularse es relativamente limitado; además las investigaciones efectuadas por este método tienen un carácter selectivo, debido a que muchas de las personas que potencialmente podrían ser investigadas no posee servicio telefónico, por lo que quedan sin la posibilidad de ser entrevistados.

Instrumentos para la recolección de datos:

Cuestionarios:

Cualquiera que sea el método por el que se decida el investigador para recabar

Page 46: Apuntes - Probabilidad y Estadistica - Neftali

45

información, es necesario elaborar un estudio de preguntas.

Los cuestionarios en general, constan de las siguientes partes:

a. La identificación del cuestionario: nombre del patrocinante de la encuesta, (oficial o privada), nombre de la encuesta, número del cuestionario, nombre del encuestador, lugar y fecha de la entrevista.

b. Datos de identificación y de carácter social del encuestado: apellidos, nombres, cédula de identidad, nacionalidad, sexo, edad o fecha de nacimiento, estado civil, grado de instrucción, ocupación actual, ingresos, etc.

c. Datos propios de la investigación, son los datos que interesa conocer para construir el propósito de la investigación.

Como es natural, estas partes, así como las preguntas, varían de acuerdo a la finalidad de la encuesta. En algunos tipos de investigación, la parte referente a los datos personales es eliminada por no tener ningún tipo de interés para el estudio.

Consideraciones que debemos tomar en cuenta:

• El cuestionario debe ser conciso; tratar en los posible de que con el menor número de preguntas, se obtenga la mejor información.

• Claridad de la redacción; evitar preguntas ambiguas o que sugieran respuestas incorrectas, por lo que deben estar formuladas las preguntas de la forma más sencilla.

• Discreción: un cuestionario hecho a conciencia, no debe tener preguntas indiscretas o curiosas, sobre datos personales que puedan ofender al entrevistado.

• Facilidad de contestación: se deben evitar, en lo posible, las preguntas de respuestas libres o abiertas y también la formulación de preguntas que requieran cálculos numéricos por parte del entrevistado.

• Orden de las preguntas: estas deben tener una secuencia y un orden lógico, agruparlas procurando que se relacionen unas con otras.

Series o distribuciones estadísticas:

Anteriormente hemos señalado que la estadística, no se encarga del estudio de un hecho aislado, sino que tienen por objeto de los colectivos. Pues bien cuando se realiza una investigación se obtiene una masa de datos que deben ser organizados para disponerlos en un orden, arreglo o secuencia lógica, con el fin de facilitar el análisis de los mismos esta colección de datos numéricos obtenidos de la observación, que se clasifican y ordenan según un determinado criterio, se denominan "series estadísticas", también conocidas como "distribución estadística".

Clasificación de las series estadísticas:

1. Series temporales o cronológicas; estas se definen como una masa o conjunto de datos producto de la observación de un fenómeno individual o colectivo, cuantificable en sucesivos instantes o periodos de tiempo.

Ejemplo:

Producción nacional de madera en Rola en m³

Rollizos (periodo 1993 – 1998)

Años Producción (m³ rollizos)

1993 1.161.061,454

Page 47: Apuntes - Probabilidad y Estadistica - Neftali

46

1994 981.668,626

1995 1.087.926,142

1996 1.440.306,250

1997 1.618.075,000

1998 1.027.177,876

Es importante resaltar que cuando se trata de series temporales o cronológicas, se debe especificar el instante o el periodo de tiempo a los que se refieren los caracteres en estudio.

Cuando nos referimos a instantes de tiempo, por el hecho de que la observación se hace en un momento específico de tiempo.

Ejemplo:

Plantaciones forestales ejecutadas a nivel nacional, al 31 de diciembre de cada año entre 1997 – 2001.

2. Series atemporales; cuando las observaciones de un fenómeno se hacen referidas al mismo instante o intervalo de tiempo, nos encontramos ente una serie atemporal. Aquí el tiempo no va incluido a cada observación, puesto que es el mismo tiempo para todas ellas. Este tipo de observación proporciona una "visión instantánea" de los fenómenos o caracteres de los componentes del colectivo en estudio.

Ejemplo:

Las notas de las participantes en la materia de estadística I en el periodo académico que terminó en septiembre del 2001.

2.1) series de frecuencia; cuando realizamos un estudio de cada uno de los elementos que componen la población o muestra bajo análisis, observamos que en general, hay un número de veces en que aparece repetido un mismo valor de una variable, o bien

repeticiones de la misma modalidad de un atributo. Este número de repeticiones de un resultado, recibe el nombre de frecuencia absoluta o simplemente frecuencia.

El procedimiento mediante el cual se realiza el conteo, para así determinar el número de veces que cada dato se repite, recibe el nombre de tabulación.

Ejemplo:

Consideremos las edades de 20 niños, pertenecientes al Preescolar Salpinx de la Colonia Siglo XXI.

5 6 5 4 3

6 3 4 5 4

3 4 6 5 3

4 3 6 4 6

Tabulando los datos tenemos

Niños distribuidos por edades:

Edad (variable) Nº de niños (Frecuencia)

3 5

4 6

5 4

6 5

Total = 20

Al agrupar los resultados de las observaciones en término de las veces que éstos se repiten, da lugar a las llamadas "series de frecuencias" o distribuciones de frecuencias; las cuales se dividen a su vez en series de frecuencia cualitativas y cuantitativas, según que los caracteres de estudio se refieran a atributos o variables respectivamente.

2.2.1) Series de frecuencia acumulativa: son comúnmente llamadas series de frecuencia de atributos o caracteres cualitativos y las

Page 48: Apuntes - Probabilidad y Estadistica - Neftali

47

formas de representar un atributo recibe el nombre de modalidades.

Cuando se observan y se obtienen los elementos que deseamos estudiar con respecto a un carácter de tipo cualitativo y se procede a agruparlos según las distintas modalidades que toma el atributo, "frecuencia cualitativa".

Ejemplo:

Agrupamos los resultados obtenidos al observar los 35 estudiantes de la materia estadística I, respecto a su estado civil.

Estudiantes de la materia Estadísticas I, clasificados por su estado civil.

Estado civil Nº de Estudiantes (frecuencia)

Solteros 18

Casados 12

Viudos 1

Divorciados 4

2.1.2) Series de frecuencias cualitativas: es el resultado del agrupamiento de los valores que se repiten (frecuencia) al ser observada una variable.

Ejemplo:

Tomamos nuevamente los 35 estudiantes de la materia estadística I, respecto a su edad.

Edad (en años) Nº de estudiantes (frecuencia)

19 12

20 2

25 8

28 6

32 4

42 3

Total = 35

2.2) series especiales o geográficas: es aquella que está formada por los valores que toman una variable en función del espacio geográfico.

La matriz de datos

Habitualmente, la información primaria sobre los individuos, es decir, la forma más elemental en la que se expresan los datos es la de una matriz, en la que aparecen en la primera columna los individuos identificados de alguna manera y en las siguientes columnas las observaciones de los diferentes caracteres en estudio para cada uno de los individuos, tal y como aparece en la tabla siguiente. Dicha matriz recibe el nombre de matriz de datos.

carácter 1

carácter 2

. .

. carácter p

individuo 1

* * . . .

*

individuo 2

* * . . .

*

. . . . . . . . . . . .

. . .

individuo n

* * . . .

*

Matriz de Datos Así, los datos correspondientes a una investigación llevada a cabo para el estudio de una posible contaminación radioactiva en un determinado lugar produjeron como resultado la matriz de datos, en donde se recogen las observaciones de los caracteres "edad", "sexo", "cáncer", "caída anormal del cabello" y "profesión" en los 100 individuos seleccionados en la muestra.

Page 49: Apuntes - Probabilidad y Estadistica - Neftali

48

edad sexo cáncer Caída cabello

profesión

individuo 1 32 masculino no no agricultor

individuo 2 29 femenino no no maestra

. . . . . . . . . . . . . . . . . .

individuo 100 61 masculino si si agricultor Estudio de Contaminación Radioactiva

En algunas ocasiones se reserva el nombre de matriz de datos a la obtenida de la anterior eliminando la primera columna.

Clases de datos

Es habitual denominar a los caracteres variables estadísticas o simplemente variables, calificándolas de cualitativas o cuantitativas según sea el correspondiente carácter, y hablar de los valores de la variable al referirnos a sus modalidades, aunque de hecho solamente tendremos verdaderos valores numéricos cuando analicemos variables cuantitativas.

En ocasiones, con objeto de facilitar la toma de los datos, el investigador los agrupa en intervalos. Así por ejemplo, resulta más sencillo averiguar cuantos individuos hay en una muestra con una estatura, por ejemplo, entre 1'70 y 1'80 que medirlos a todos, en especial si tenemos marcas en la pared cada 10 cm.

Observemos, no obstante, que siempre se producirá una pérdida de información al agrupar los datos en intervalos y dado que hoy en día la utilización de la computadora suele ser de uso corriente, un agrupamiento en intervalos es en general muy recomendable.

Consideraremos, por tanto, tres tipos posibles de datos:

Datos correspondientes a un carácter cualitativo

Datos sin agrupar correspondientes a un carácter cuantitativo

Datos agrupados en intervalos correspondientes a un carácter cuantitativo

Agrupamiento en intervalos

Si tenemos la opción de poder agrupar los datos en intervalos, lo primero que debemos plantearnos es la cuestión de cuantos y cuales intervalos elegir.

Previamente daremos algunas definiciones. Si los intervalos o clases, como a veces se denominan, son:

[x 0 , x 1) , [x 1 , x 2) , ... , [x j-1 , x j) , ... , [x k-1 , x k]

Llamaremos amplitud del intervalo j-ésimo a xj - xj-1, j=1,...,k, hablando de intervalos de amplitud constante o variable según tengan o no todos la misma amplitud.

Llamaremos extremos de la clase j-ésima a xj-

1 y a xj, y por último, llamaremos centro o marca de clase correspondiente al intervalo j-ésimo al punto medio del intervalo, es decir, a cj= (xj + xj-1)/2.

Consideraremos que el dato xj pertenece al intervalo j+1, j=1, ..., k-1 , siendo el xk del k-ésimo. Debemos notar también que el primer y último intervalo generalmente pueden tener, respectivamente, los extremos inferiores y superiores indeterminados con objeto de incluir observaciones poco frecuentes, pero el primer intervalo o clase tiene que incluir al menor dato y el último

Page 50: Apuntes - Probabilidad y Estadistica - Neftali

49

intervalo o clase debe contener al dato mayor.

Podemos considerar como regla general la de construir, siempre que sea posible, intervalos de amplitud constante, sugiriendo sobre el número k de intervalos a considerar el propuesto por Sturges

k = 1 + 3'322 log 10 n siendo n el número total de datos.

Una vez determinado el número k de intervalos a considerar, y si es posible tomarlos de igual amplitud, esta será:

en donde x(n) es el dato mayor y x(1) el menor.

En este apartado consideraremos que tenemos datos correspondientes a un solo carácter, el cual, como antes dijimos llamaremos variable estadística y representaremos por X.

Llamaremos frecuencia total al número de datos n. Llamaremos frecuencia absoluta ni de la modalidad Mi (valor xi o intervalo Ii) de la variable X al número de datos que presentan la modalidad Mi (valor xi o valor del intervalo Ii). Si existen k modalidades

posibles, se verificará ni = n1 + n2 + ... + nk = n

Llamaremos frecuencia relativa fi de la modalidad Mi (valor xi o intervalo Ii) de la variable X al cociente fi = ni/n, verificándose:

fi = f1 + f2 + ... + fk = 1

Llamaremos frecuencia absoluta acumulada Ni hasta la modalidad Mi (valor xi o intervalo

Ii) a la suma Ni=n1 + ... + ni= nj

Claramente es Nk= nj=n

Llamaremos frecuencia relativa acumulada Fi hasta la modalidad Mi (valor xi o intervalo Ii) al cociente Fi=Ni/N, o lo que es lo mismo, a

Fi=f1 + ... + fi= fj

siendo Fk= fj=1

Distribuciones unidimensionales de frecuencias

La tabla formada por las distintas modalidades (valores o intervalos) del carácter X y por las frecuencias absolutas (relativas, absolutas acumuladas o relativas acumuladas) recibe el nombre de distribución de frecuencias absolutas (relativas, absolutas acumuladas o relativas acumuladas respectivamente).

Tenemos, por tanto, para cada tipo de datos, cuatro distribuciones de frecuencias, obteniéndose a partir de una cualquiera de ellas las tres restantes, supuesto que se conoce la frecuencia total.

Las cuatro distribuciones de frecuencias se expresan en tablas como siguientes dependiendo del tipo de datos que sean:

1. Carácter cualitativo:

Page 51: Apuntes - Probabilidad y Estadistica - Neftali

50

Mi ni fi Ni Fi

Cualidad1 n1 f1 N1 F1

Cualidad2 n2 f2 N2 F2

. . . . . . . . . . . . . . .

Cualidadi ni fi Ni Fi

. . . . . . . . . . . . . . .

Cualidadk nk fk Nk=n Fk=1

n 1

Carácter Cualitativo

2. Carácter cuantitativo sin agrupar:

Xi ni fi Ni Fi

x1 n1 f1 N1 F1

x2 n2 f2 N2 F2

. . . . . . . . . . . . . . .

xi ni fi Ni Fi

. . . . . . . . . . . . . . .

xk nk fk Nk=n Fk=1

n 1

Carácter Cuantitativo sin Agrupar

3. Carácter cuantitativo agrupado en intervalos:

Ii ni fi Ni Fi

I1 n1 f1 N1 F1

I2 n2 f2 N2 F2

. . . . . . . . . . . . . . .

Ii ni fi Ni Fi

. . . . . . . . . . . . . . .

Ik nk fk Nk=n Fk=1

n 1

Carácter Cuantitativo Agrupado en Intervalos

Ejemplo: Durante una semana en el Laboratorio Bioclin se midieron los niveles de colinesterasa en un recuento de eritrocitos en μmol/min/ml de 34 agricultores de Tepechicotlán expuestos a insecticidas agrícolas y a la contaminación del Huacapa, obteniéndose los siguientes datos:

Individuo Nivel Individuo Nivel Individuo Nivel

1 10.6 13 12.2 25 11.8

2 12.5 14 10.8 26 12.7

3 11.1 15 16.5 27 11.4

4 9.2 16 15.0 28 9.3

5 11.5 17 10.3 29 8.6

6 9.9 18 12.4 30 8.5

7 11.9 19 9.1 31 10.1

8 11.6 20 7.8 32 12.4

9 14.9 21 11.3 33 11.1

10 12.5 22 12.3 34 10.2

11 12.5 23 9.7

12 12.3 24 12.0

Niveles de Colinesterasa

Page 52: Apuntes - Probabilidad y Estadistica - Neftali

51

Aplicando la fórmula de Sturges obtenemos:

k = 1 + 3'322 log10 34 = 1 + 3'322 · 1'53148 = 6'08757 es decir, una sugerencia de 6 intervalos. Como el mayor valor es x(34) = 16'5 y el menor valor es x(1) = 7'8, la longitud sugerida es

Parece, por tanto, razonable tomar como amplitud 1.5, obteniendo como intervalos en los que clasificar los datos

[7'5 - 9) , [9 - 10'5) , [10'5 - 12) , [12 - 13'5) , [13'5 - 15) , [15 - 16'5]

Medidas de Tendencia Central

Definiremos una serie de medidas o valores que tratan de representar o resumir a una distribución de frecuencias dada, sirviendo la cual además para realizar comparaciones entre distintas distribuciones de frecuencias. Estas medidas reciben el nombre de promedios, medidas de posición o medidas de tendencia central.

a. Media aritmética

Llamando xl, ..., xk a los datos distintos de un carácter en estudio, o las marcas de clase de los intervalos en los que se han agrupado dichos datos, y ni,..., nk a las correspondientes frecuencias absolutas de dichos valores o marcas de clase, llamaremos media aritmética de la distribución de frecuencias a

en donde n es la frecuencia total.

En nuestro ejemplo, la distribución de frecuencias y las marcas de clase serán:

Intervalo Ii 7'5-9 9-10'5 10'5-12 12-13'5 13'5-15 15-16'5

Marca de Clase xi 8'25 9'75 11'25 12'75 14'25 15'75

Frecuencia ni 3 8 10 10 1 2

la cual proporciona una media aritmética de

b. Mediana La mediana es otra medida de posición, la cual se define como aquel valor de la variable

Page 53: Apuntes - Probabilidad y Estadistica - Neftali

52

tal que, supuestos ordenados los valores de ésta en orden creciente, la mitad son menores o iguales y la otra mitad mayores o iguales

Así, si en la siguiente distribución de frecuencias,

xi ni Ni

0 3 3

1 2 5

2 2 7

7

ordenamos los valores en orden creciente,

0 0 0 1 1 2 2

el 1 será el valor que cumple la definición de mediana.

Lógicamente, en cuanto el valor de la frecuencia total sea ligeramente mayor, este procedimiento resulta inviable. Por esta razón, daremos a continuación una fórmula que permita calcularla. No obstante, será necesario distinguir los casos en los que los datos vengan agrupados de aquellos en los que vengan sin agrupar.

o Datos sin agrupar:

Las gráficas siguientes, correspondientes a un diagrama de frecuencias absolutas acumuladas, recogen las dos situaciones que se pueden presentar:

Si la situación es como la de la figura de la derecha, es decir, si

Si la situación que se presenta es como la de la figura de la izquierda, entonces la mediana queda indeterminada, aunque en este caso se toma como mediana la media aritmética de los dos valores entre los que se produce la indeterminación; así pues, si

Nj-1 = n/2 < Nj entonces la mediana es

Page 54: Apuntes - Probabilidad y Estadistica - Neftali

53

Ejemplo 2:

La distribución de frecuencias acumuladas del número de hijos es

Nº de hijos(xi) 0 1 2 3 4

Frecuencias Acumuladas(Ni) 5 11 19 23 25

y como es n/2=12'5 y en consecuencia

11 < 12'5 < 19

la mediana será Me= 2.

o Datos Agrupados

Las gráficas siguientes, correspondientes a polígonos de frecuencias absolutas acumuladas, nos plantea de nuevo dos situaciones diferentes a considerar:

El más sencillo, el de la derecha, en el que existe una frecuencia absoluta acumulada Nj tal que n/2 = Nj, la mediana es Me = xj.

Si la situación es como la que se representa en la figura de la izquierda, en la que

Nj-l < n/2 < Nj

entonces, la mediana, está en el intervalo [xj-1, xj), es decir entre xj-1 y xj, tomándose en ese caso, por razonamientos de proporcionalidad, como mediana el valor

siendo cj la amplitud del intervalo [xj-1, xj).

En nuestro ejemplo principal, la distribución de frecuencias de los niveles de colinesterasa es:

Page 55: Apuntes - Probabilidad y Estadistica - Neftali

54

Intervalo Ii 7'5-9 9-10'5 10'5-12 12-13'5 13'5-15 15-16'5

Frecuencia ni 3 8 10 10 1 2

Frecuencia Acumulada Ni 3 11 21 31 32 34

Al ser n/2 = 17 y estar

11 < 17 < 21

la mediana estará en el intervalo [10'5 , 12), y aplicando la fórmula anterior, será

c. Moda La moda se define como aquel valor de la variable al que corresponde máxima frecuencia (absoluta o relativa). Para calcularla, también será necesario distinguir si los datos están o no agrupados.

o Datos sin agrupar: Para datos sin agrupar, la determinación del valor o valores (ya que puede haber más de uno) modales es muy sencilla. Basta observar a que valor le corresponde una mayor ni. Ese será la moda.

Así en el ejemplo del número de hijos, la simple inspección de la tabla siguiente proporciona como valor para la moda el Md = 2.

Nº de hijos(xi) 0 1 2 3 4

Nº de familias(ni) 5 6 8 4 2

Datos agrupados:

Si los datos se presentan agrupados en intervalos es necesario, a su vez, distinguir si éstos tienen o no igual amplitud.

Si tienen amplitud constante c, una vez identificado el intervalo modal [xj-1, xj), es decir el intervalo al que corresponde mayor frecuencia absoluta nj = max{nl, ..., nk}, la moda se define, también por razones geométricas, como

En nuestro ejemplo principal, presenta un caso de distribución bimodal, ya que tanto el intervalo [10'5 - 12) como el [12 - 13'5) tienen frecuencia absoluta máxima. Deberíamos aplicar, por tanto, para cada uno de los dos intervalos la fórmula anterior, determinando así las dos modas de la distribución. No obstante, este ejemplo presenta además la peculiaridad adicional de ser ambos intervalos

Page 56: Apuntes - Probabilidad y Estadistica - Neftali

55

modales contiguos. En esta situación se considera la distribución unimodal, eligiendo como moda el extremo común, Md = 12.

d. Cuantiles Los cuantiles o cuantilas son las últimas medidas de posición que veremos. De hecho algunos autores las incluyen dentro de las medidas de dispersión al ser medidas de posición no centrales.

El cuantil pr/k r= 1,2,..., k - 1 se define como aquel valor de la variable que divide la distribución de frecuencias, previamente ordenada de forma creciente, en dos partes, estando el (100·r/k)% de ésta formado por valores menores que pr/k.

Si k = 4 los (tres) cuantiles reciben el nombre de cuartíles. Si k = 10 los (nueve) cuantiles reciben, en este caso, el nombre de decíles. Por último, si k = 100 los (noventa y nueve) cuantiles reciben el nombre de centiles.

Obsérvese que siempre que r y k mantengan la misma proporción (r/k) obtendremos el mismo valor. Es decir, por ejemplo, el primer cuartil es igual al vigésimo quinto centil.

En este sentido, la mediana Me es el segundo cuartil, o el quinto decil, etc.

Medidas de dispersión Las medidas de Tendencia Central sirven para resumir la distribución de frecuencias en un solo valor. Las medidas de dispersión, tienen como propósito estudiar lo concentrada que está la distribución en torno a algún promedio o que tanto se desvían de ese promedio..

Estudiaremos las cuatro medidas de dispersión más utilizadas: recorrido, varianza, desviación típica y coeficiente de variación de Pearson, estando definidas las tres primeras medidas en unidades concretas y estándolo la cuarta en unidades abstractas.

a. Recorrido o Rango

Si x max es el dato mayor o la última marca de clase, si es que los datos vienen agrupados en intervalos, y x min el dato menor o primera marca de clase, llamaremos recorrido a

R = x max - x min

Así, en el ejemplo de los niveles de colinesterasa el recorrido es R = 15'75 - 8'25 = 7'5

La principal ventaja del recorrido es la de proporcionar una medida de la dispersión de los datos fácil y rápida de calcular.

b. Varianza

Denotando por x1,...,xk los datos o las marcas de clase, llamaremos varianza a

siendo a la media de la distribución.

Page 57: Apuntes - Probabilidad y Estadistica - Neftali

56

Así en el ejemplo de los niveles de colinesterasa

s2 = 133'97 - (11'426)2 = 3'42.

c. Desviación Típica

La varianza tiene un problema, y es que está expresada en unidades al cuadrado. Esto puede producir una falsa imagen de la dispersión de la distribución. En su lugar suele utilizarse su raíz cuadrada, denominada desviación típica. Así, la desviación típica de la distribución de frecuencias del ejemplo de los niveles de colinesterasa es s = 1'1906

Su Histograma o Diagrama de Barras es:

NIVEL DE COLINESTERAS

17.016.015.014.013.012.011.010.09.08.0

NIVEL DE COLINESTERASA

FRE

CU

EN

CIA

12

10

8

6

4

2

0 1

2

4

10

6

55

1

En el

En el se muestra la curva normal o campana de Gauss que corresponde a la Distribución Normal.

Polígono de frecuencias acumuladas:

Se utiliza para representar distribuciones de frecuencias (relativas o absolutas) acumuladas. Consiste en representar la gráfica de una función que una por segmentos las alturas correspondientes a los extremos superiores de cada intervalo, tengan o no todos igual amplitud, siendo dicha altura igual a la frecuencia acumulada, dando una altura cero al extremo inferior del primer intervalo y siendo constante a partir del extremo superior del último.

Así, para el ejemplo de los Niveles de Colinesterasa, el polígono de frecuencias relativas acumuladas tendrá una representación gráfica de la forma:

Page 58: Apuntes - Probabilidad y Estadistica - Neftali

57

Su diagrama de Pastel o Pie es:

Page 59: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

58 

TEORÍA BÁSICA DEL MUESTREO 1. Introducción al muestreo.

a. Concepto e importancia: Es la actividad por la cual se toman ciertas muestras de una población de elementos de los cuales vamos a tomar ciertos criterios de decisión, el muestreo es importante porque a través de él podemos hacer análisis de situaciones de una empresa o de algún campo de la sociedad.

b. Terminología básica para el muestreo. Los nuevos términos, los cuales son frecuentemente usados en inferencia estadística son:

Estadístico: Un estadístico es una medida usada para describir alguna característica de una muestra , tal como una media aritmética, una mediana o una desviación estándar de una muestra.

Parámetro: Una parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana o una desviación estándar de una población. Cuando los dos nuevos términos de arriba son usados, por ejemplo, el proceso de estimación en inferencia estadística puede ser descrito como le proceso de estimar un parámetro a partir del estadístico correspondiente, tal como usar una media muestral ( un estadístico para estimar la media de la población (un parámetro). Los símbolos usados para representar los estadísticos y los parámetros, en éste y los siguientes capítulos, son resumidos en la tabla siguiente:

Tabla 1 Símbolos para estadísticos y parámetros correspondientes

Medida Símbolo para el estadístico

(muestra)

Símbolo para el parámetro

(Población)

Media X µ

Desviación estándar s σ

Número de elementos n N

Proporción p P

Distribución en el muestreo: Cuando el tamaño de la muestra (n) es más pequeño que el tamaño de la población (N), dos o más muestras pueden ser extraídas de la misma población. Un cierto estadístico puede ser calculado para cada una de las muestras posibles extraídas de la población. Una distribución del estadístico obtenida de las muestras es llamada la distribución en el muestreo del estadístico.

Por ejemplo, si la muestra es de tamaño 2 y la población de tamaño 3 (elementos A, B, C), es posible extraer 3 muestras ( AB, BC Y AC) de la población. Podemos calcular la media para cada muestra. Por lo tanto, tenemos 3 medias muéstrales para las 3 muestras. Las 3 medias muéstrales forman una distribución. La distribución de las medias es llamada la distribución de las medias muéstrales, o la distribución en el muestreo de la media. De la misma manera, la distribución de las proporciones (o porcentajes) obtenida de todas las

Page 60: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

59 

muestras posibles del mismo tamaño, extraídas de una población, es llamada la distribución en el muestreo de la proporción.

Error Estándar: La desviación estándar de una distribución, en el muestreo de un estadístico, es frecuentemente llamada el error estándar del estadístico. Por ejemplo, la desviación estándar de las medias de todas la muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la media. De la misma manera, la desviación estándar de las proporciones de todas las muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la proporción. La diferencia entre los términos "desviación estándar" y "error de estándar" es que la primera se refiere a los valores originales, mientras que la última está relacionada con valores calculados. Un estadístico es un valor calculado, obtenido con los elementos incluidos en una muestra.

Error muestral o error de muestreo: La diferencia entre el resultado obtenido de una muestra (un estadístico) y el resultado el cual deberíamos haber obtenido de la población (el parámetro correspondiente) se llama el error muestral o error de muestreo. Un error de muestreo usualmente ocurre cuando no se lleva a cabo la encuesta completa de la población, sino que se toma una muestra para estimar las características de la población. El error muestral es medido por el error estadístico, en términos de probabilidad, bajo la curva normal. El resultado de la media indica la precisión de la estimación de la población basada en el estudio de la muestra. Mientras más pequeño el error muestras, mayor es la precisión de la estimación. Deberá hacerse notar que los errores cometidos en una encuesta por muestreo, tales como respuestas inconsistentes, incompletas o no determinadas, no son considerados como errores muéstrales. Los errores no muéstrales pueden también ocurrir en una encuesta completa de la población.

2. Métodos de selección de muestras.

Una muestra debe ser representativa si va a ser usada para estimar las características de la población. Los métodos para seleccionar una muestra representativa son numerosos, dependiendo del tiempo, dinero y habilidad disponibles para tomar una muestra y la naturaleza de los elementos individuales de la población. Por lo tanto, se requiere una gran volumen para incluir todos los tipos de métodos de muestreo. Los métodos de selección de muestras pueden ser clasificados de acuerdo a:

1. El número de muestras tomadas de una población dada para un estudio y

1. La manera usada en seleccionar los elementos incluidos en la muestra. Los métodos de muestreo basados en los dos tipos de clasificaciones son expuestos en seguida.

Métodos de muestreo clasificados de acuerdo con el número de muestras tomadas de una población.

Bajo esta clasificación, hay tres tipos comunes de métodos de muestreo. Estos son, muestreo simple, doble y múltiple.

Muestreo simple: Este tipo de muestreo toma solamente una muestra de una población dada para el propósito de inferencia estadística. Puesto que solamente una muestra es tomada, el tamaño de muestra debe ser los suficientemente grande para extraer una conclusión. Una muestra grande muchas veces cuesta demasiado dinero y tiempo.

Muestreo doble: Bajo este tipo de muestreo, cuando el resultado dele estudio de la primera muestra no es decisivo, una segunda muestra es extraída de la misma población. Las dos muestras son combinadas para analizar los resultados. Este método permite a una persona

Page 61: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

60 

principiar con una muestra relativamente pequeña para ahorrar costos y tiempo. Si la primera muestra arroja una resultado definitivo, la segunda muestra puede no necesitarse. Por ejemplo, al probar la calidad de un lote de productos manufacturados, si la primera muestra arroja una calidad muy alta, el lote es aceptado; si arroja una calidad muy pobre, el lote es rechazado. Solamente si la primera muestra arroja una calidad intermedia, será requerirá la segunda muestra. Un plan típico de muestreo doble puede ser obtenido de la Military Standard Sampling Procedures and Tables for Inspection by Attributes, publicada por el Departamento de Defensa y también usado por muchas industrias privadas. Al probar la calidad de un lote consistente de 3,000 unidades manufacturadas, cuando el número de defectos encontrados en la primera muestra de 80 unidades es de 5 o menos, el lote es considerado bueno y es aceptado; si el número de defectos es 9 o más, el lote es considerado pobre y es rechazado; si el número está entre 5 y 9, no puede llegarse a una decisión y una segunda muestra de 80 unidades es extraída del lote. Si el número de defectos en las dos muestras combinadas (incluyendo 80 + 80 = 160 unidades) es 12 o menos, el lote es aceptado si el número combinado es 13 o más, el lote es rechazado.

Muestreo múltiple: El procedimiento bajo este método es similar al expuesto en el muestreo doble, excepto que el número de muestras sucesivas requerido para llegar a una decisión es más de dos muestras.

Métodos de muestreo clasificados de acuerdo con las maneras usadas en seleccionar los elementos de una muestra.

Los elementos de una muestra pueden ser seleccionados de dos maneras diferentes: a. Basados en el juicio de una persona.

b. Selección aleatoria (al azar)

Muestreo de juicio: Una muestra es llamada muestra de juicio cuando sus elementos son seleccionados mediante juicio personal. La persona que selecciona los elementos de la muestra, usualmente es un experto en la medida dada. Una muestra de juicio es llamada una muestra probabilística, puesto que este método está basado en los puntos de vista subjetivos de una persona y la teoría de la probabilidad no puede ser empleada para medir el error de muestreo, Las principales ventajas de una muestra de juicio son la facilidad de obtenerla y que el costo usualmente es bajo.

Muestreo Aleatorio: Una muestra se dice que es extraída al azar cuando la manera de selección es tal, que cada elemento de la población tiene igual oportunidad de ser seleccionado. Una muestra aleatoria es también llamada una muestra probabilística son generalmente preferidas por los estadísticos porque la selección de las muestras es objetiva y el error muestral puede ser medido en términos de probabilidad bajo la curva normal. Los tipos comunes de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemático, muestreo estratificado y muestreo de conglomerados.

A. Muestreo aleatorio simple: Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del mismo tamaño tiene igual probabilidad de ser seleccionada de la población. Para obtener una muestra aleatoria simple, cada elemento en la población tenga la misma probabilidad de ser seleccionado, el plan de muestreo puede no conducir a una muestra aleatoria simple. Por conveniencia, este método pude ser reemplazado por una tabla de números aleatorios. Cuando una población es infinita, es obvio que la tarea de numerar cada elemento de la población es infinita, es obvio que la tarea de numerar cada elemento de la población es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son necesarias. Los tipos más comunes de muestreo aleatorio modificado son sistemático, estratificado y de conglomerados.

B. Muestreo sistemático. Una muestra sistemática es obtenida cuando los elementos son seleccionados en una manera ordenada. La manera de la selección depende del número de

Page 62: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

61 

elementos incluidos en la población y el tamaño de la muestra. El número de elementos en la población es, primero, dividido por el número deseado en la muestra. El cociente indicará si cada décimo, cada onceavo, o cada centésimo elemento en la población va a ser seleccionado. El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra sistemática puede dar la misma precisión de estimación acerca de la población, que una muestra aleatoria simple cuando los elementos en la población están ordenados al azar.

C. Muestreo Estratificado: Para obtener una muestra aleatoria estratificada, primero se divide la población en grupos, llamados estratos, que son más homogéneos que la población como un todo. Los elementos de la muestra son entonces seleccionados al azar o por un método sistemático de cada estrato. Las estimaciones de la población, basadas en la muestra estratificada, usualmente tienen mayor precisión (o menor error muestral) que si la población entera muestreada mediante muestreo aleatorio simple. El número de elementos seleccionado de cada estrato puede ser proporcional o desproporcional al tamaño del estrato en relación con la población.

D. Muestreo de conglomerados. Para obtener una muestra de conglomerados, primero dividir la población en grupos que son convenientes para el muestreo. En seguida, seleccionar una porción de los grupos al azar o por un método sistemático. Finalmente, tomar todos los elementos o parte de ellos al azar o por un método sistemático de los grupos seleccionados para obtener una muestra. Bajo este método, aunque no todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria.

Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisión de las estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño. Los elementos individuales dentro de cada "conglomerado" tienden usualmente a ser iguales. Por ejemplo la gente rica puede vivir en el mismo barrio, mientras que la gente pobre puede vivir en otra área. No todas las áreas son muestreadas en un muestreo de áreas. La variación entre los elementos obtenidos de las áreas seleccionadas es, por lo tanto, frecuentemente mayor que la obtenida si la población entera es muestreada mediante muestreo aleatorio simple. Esta debilidad puede reducida cuando se incrementa el tamaño de la muestra de área. El incremento del tamaño de la muestra puede fácilmente ser hecho en muestra muestra de área. Los entrevistadores no tienen que caminar demasiado lejos en una pequeña área para entrevistar más familias. Por lo tanto, una muestra grande de área puede ser obtenida dentro de un corto período de tiempo y a bajo costo.

Por otra parte, una muestra de conglomerados puede producir la misma precisión en la estimación que una muestra aleatoria simple, si la variación de los elementos individuales dentro de cada conglomerado es tan grande como la de la población.

La teoría del muestreo es el estudio de las relaciones existente entre una población y muestras extraídas de la misma. Tiene gran interés en muchos aspectos de la estadística. Por ejemplo permite estimar cantidades desconocidas de la población (tales como la media poblacional, la varianza, etc.), frecuentemente llamada parámetros poblacionales o brevemente parámetros, a partir del conocimiento, de las correspondientes cantidades muestrales (tales como la media muestral, la varianza , etc.), a menudo llamadas estadísticos muestrales o brevemente estadísticos.

La teoría de muestreo es también útil para determinar si la diferencias que se puedan observar entre dos muestras son debidas a la aleatoriedad de las mismas o si por el contrario son solamente significativas. Tales preguntas surgen por ejemplo, al ensayar un nuevo suero para el tratamiento de una enfermedad, o al decir si un proceso de producción

Page 63: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

62 

es mejor que otro. Estas decisiones envuelven a los llamados ensayos e hipótesis de significación, que son de gran importancia en la teoría de la decisión.

En general, un estudio de inferencias, realizados sobre una población mediante muestras extraídas de la misma, junto con las indicaciones de la exactitud de tales inferencias aplicadas a la teoría de la probabilidad, se le conoce como inferencia estadística.

Muestras al Azar

Números aleatorios.

Para que las conclusiones de la teoría del muestreo e inferencia estadística sean validas, las muestras deben de elegirse de forma que sean representativas de la población. Un estudio sobre métodos de muestreo y los problemas que tales métodos implican, se conoce como diseño de experimentos.

El proceso mediante el cual se extrae de una población una muestra representativa de la misma se conoce como muestro al azar, de acuerdo con ello cada miembro de la población tiene la posibilidad de ser incluido en la muestra. Una técnica para obtener una muestra al azar es asignar números a cada miembro de la población, escritos estos números en pequeños papeles, se introducen en una urna y después se extraen los números de la urna, teniendo cuidado de mezclarlos bien antes de cada extracción. Esto puede ser sustituido por el empleo de una tabla de números aleatorios, construida especialmente para tales propósitos.

Muestreo con y sin reemplazamiento.

Si se extrae un número de una urna, se puede volver o no el número a la urna antes de una segunda extracción. En el primer caso un mismo número puede salir varias veces, mientras que en el segundo un numero determinado puede salir solamente una vez. En el muestro, en el que cada miembro de la población puede elegirse mas de una vez, se le llama muestro con remplazamiento mientras que si cada miembro no puede ser elegido más de una vez se tiene el muestreo sin remplazaminento.

Las poblaciones pueden ser finitas o infinitas. Si, por ejemplo, se extraen sucesivamente 10 bolas sin remplazamiento de una urna que contiene 100 , se está tomando muestras de una población finita, mientras que si se lanza al aire una moneda 50 veces, anotándose el número de caras, se está muestreando en una población infinita.

Una población finita, en la que se realiza un muestro con remplazamiento, puede teóricamente se considerada como infinita, puesto que puede extraerse de cualquier número de muestras, sin agotar la población. En muchos casos prácticos, el muestreo de una población finita que es muy grande, puede considerarse como una población infinita.

Cada sistema de muestreo se usa para obtener estimaciones de ciertas propiedades de la población objeto de estudio, y será tanto más adecuado cuanto mejores sean las estimaciones que proporcione. Las estimaciones individuales pueden ser, por casualidad, muy aproximadas o diferir considerablemente del verdadero valor, dando una prueba deficiente de los méritos del sistema. Un mal sistema de muestreo puede dar a veces algunas estimaciones muy exactas, así como también un buen sistema dar alguna muy alejada del verdadero valor. La mejor manera de juzgar un sistema de muestreo consiste en observar la distribución de frecuencias de las estimaciones que se obtienen por muestreos repetidos. Un buen sistema proporciona estimaciones cuya distribución de frecuencias

Page 64: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

63 

posee una pequeña variancia y su valor medio está muy próximo al valor verdadero. La diferencia entre la estimación media y el valor verdadero se denomina sesgo. (El término «sesgo» se usa también refiriéndose al proceso por el cual se producen las diferencias.) Las magnitudes del sesgo y la variancia de un sistema de muestreo son, en una gran extensión, independientes entre sí; un sistema puede dar estimaciones con una pequeña variancia, es decir, difiriendo poco entre ellas, pero con un gran sesgo, esto es, quedando todas las estimaciones muy lejos del valor verdadero. (Un ictiómetro con las cifras de la escala casi ilegibles introducirá cierta variancia extra; y un medidor con la escala desplazada producirá un sesgo.)

Ejemplo 2.1.1

Dos observadores examinan el porcentaje en que aparece en capturas de peces una especie de Leiognathus en una mezcla con otras varias. El observador A trabaja rápidamente pero con poco cuidado, equivocándose en la identificación de algunos peces; el observador B trabaja mucho más lentamente pero con más cuidado. Según una serie de muestras, las estimaciones del porcentaje de presencia de Leiognathus splendens en las capturas fueron

A. 4 4 3 5 4 3 5 4 6 4 6 3 4 3 5 4 5 4 4 6 5 3 5 4 5

B. 9 7 11 4 8 4 10 8 9 12 8 3 6 10 15 11 12 7 13 11 10 5 8 9 12

Después de calculadas las medias y variancias de las anteriores distribuciones, resulta que: (a) las estimaciones obtenidas por A son más precisas (tienen una variancia menor) que las de B (0,89: 9,03); (b) sabiendo, por otras estimaciones, que el verdadero porcentaje es 9,1, resulta que A tiene un fuerte sesgo negativo; (c) si se admite que A omite la mitad de los peces, se puede obtener una estimación relativamente no sesgada y precisa duplicando las estimaciones obtenidas por A (media 8,64, sesgo [o sea, diferencia entre la media estimada y la real] - 0,46, variancia 3,6).

Se puede producir un sesgo como consecuencia de un método deficiente de análisis, pero con más frecuencia por una elección defectuosa de las muestras, o por el mismo método que se emplea para realizar las mediciones o al contar las muestras; por ejemplo, si los peces se clasifican por tamaños al ser desembarcados, y se toma una muestra de una partida de los grandes, se producirá una sobreestimación de la talla - un sesgo positivo en la talla media - o si se hacen caladas con una red clara para plancton, al escapar las diatomeas pequeñas, quedarán éstas subestimadas, mientras que las grandes resultarán sobreestimadas (sesgos negativo y positivo respectivamente en la proporción de diatomeas pequeñas y grandes). Es difícil librarse de los sesgos, especialmente si se toman muestras en ambientes marinos naturales, bien de diatomeas con una red de plancton, o peces con un arte de arrastre.

Page 65: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

64 

Por más que se aumente el tamaño de la muestra, o se combinen varias de ellas, el sesgo permanece inalterado, pero la variancia se reducirá de una manera inversamente proporcional al tamaño de la muestra, o al número de muestras combinadas. Esta doble manera de reducir la variancia está, a su vez, muy en relación con el problema del ahorro de trabajo y del costo de un programa de muestreo. Al menos en teoría, se puede obtener un grado de precisión1 determinado, tomando una muestra suficientemente grande. El objetivo de un buen muestreo es no sólo obtener un nivel de precisión (variancia pequeña), sino también hacerlo con el menor costo. El sesgo, por el contrario, no puede ser reducido aumentando el muestreo, y a menudo no se logra descubrir su presencia por un análisis de los datos (en el Ejemplo 2.1.1 no hay ningún indicio para que, por medio de los propios datos, podamos descubrir si las muestras A o B están sesgadas). Normalmente, el sesgo sólo podrá descubrirse y eliminarse nada más que a través de un examen cuidadoso del sistema de muestreo, desde el comienzo al fin. En la mayor parte de las situaciones, debe ponerse un gran cuidado para comprobar que han sido eliminadas todas las fuentes probables de sesgos. Sin embargo, hay casos en los que resulta muy fácil medir el sesgo y, por lo tanto, eliminarlo de los análisis posteriores (por ejemplo, las redes de enmalle son altamente selectivas del tamaño de los peces que capturan, y darán muestras sesgadas en la estimación de la talla media. Sin embargo, esta selectividad puede ser medida, y corregida, en los análisis posteriores). No obstante, en este caso, como en todos los demás, es preciso examinar todas las posibilidades de sesgos antes de proceder al muestreo y, si se reconoce la existencia de un sesgo, éste debe medirse cuidadosamente, independientemente del proceso del muestreo.

1 Conviene aquí seguir manteniendo la distinción entre precisión y exactitud, que se corresponde estrechamente con la distinción entre variancia y sesgo (o, más bien, sus recíprocos). Una cantidad precisa tendrá poca variancia y será dada con muchas cifras, pero puede estar alejada del valor verdadero. Siendo la talla real de un pez 17,638 cm, serán mediciones precisas de su longitud 17,64 cm, ó 18,32 cm, pero esta última será aproximadamente inexacta. Más exactas, pero menos precisas, serán las tallas de 17,6 ó 18 cm.

Ejemplo 2.1.2

En el Ejemplo 2.1.1 puede considerarse que las muestras mayores están compuestas por otras cinco de las originales. Tomando la media de estas muestras menores, como una estimación de las grandes, aparece:

a) que las variancias de las dos series han sido reducidas (la de A de 0,89 a 0,52, y la de B de 9,03 a 1,29);

b) que el valor del sesgo de las muestras de A no se modifica (la media queda inalterada).

Las condiciones anteriores (eliminación del sesgo, o al menos conocerlo y medirlo, y la reducción de la variancia a un mínimo, dada una cantidad de muestreo) determinarán el método de muestreo, pero la cantidad de muestras a tomar dependerá del grado de precisión que se requiera. Corrientemente, no es posible determinar la precisión deseada, pero si se pueden dar dos límites. En el límite más bajo la variancia será tan grande que la información que proporcionará la muestra no tendrá valor práctico, con lo que la muestra deberá hacerse mayor o abandonarse el método de muestreo. Las estimaciones obtenidas por medio de un plan de muestreo frecuentemente se completan con otros datos, que pueden proceder de otros planes de muestreo, y la mayoría de ellos con una variancia diferente. La variancia final dependerá de la variancia de todas las informaciones

Page 66: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

65 

aportadas, pero sobre todo de las menos exactas, de la misma manera que la fortaleza de una cadena depende de los eslabones más delgados. Por ejemplo, la captura total de una flota puede estimarse multiplicando la captura media por el total de desembarques. Si la precisión con que se conoce el número de desembarques es del orden de ± 10 por ciento, aunque se conozca muy bien la captura media, la cantidad total desembarcada sólo será conocida, en el mejor de los casos, con una precisión de ± 10 por ciento. Una vez que en un plan único de muestreo se ha conseguido un cierto grado de precisión, las nuevas mejoras que se introduzcan no aumentarán la precisión de los resultados, por lo que será mejor dedicar el esfuerzo (tiempo, mano de obra, etc.) a incrementar la precisión de otros datos.

2.2 Muestreo al azar

El concepto básico de todo muestreo es el de la muestra al azar. Una muestra de objetos de una población se llama al azar cuando todos los miembros de la población tienen igual oportunidad de aparecer en la muestra. Es muy importante insistir en que esto es igualmente válido para todos los miembros de la población, tanto para los raros como para los típicos. Por ejemplo, el plegonero (Merlangus merlangus) desembarcado por un solo barco en Lowestoft suele tener (aquí supondremos que siempre) una composición de longitudes suavemente unimodal, con la moda normalmente entre 28 y 30 cm, pero alguna vez, por ejemplo, una entre 30, llega a ser hasta de 35 cm. Por lo tanto, si tomamos una muestra al azar de plegonero de cada barco, una vez de cada 30, por término medio, tendrá una moda de 35 cm o más, aunque normalmente estará entre 28 y 30 cm. Si entonces un biólogo pesquero, apoyándose en una sola muestra, obtiene una moda de 35 cm, esta desviación de la media de 29 cm no significará necesariamente una muestra que no sea al azar, puesto que se puede dar este caso una vez de cada 30; pero se puede comprobar tomando más muestras, por ejemplo tres muestras, que sólo tendrán juntas una moda superior a 35 cm una vez entre 27.000.

2.2.1 Números al azar

Un procedimiento muy útil y de amplia aplicación para tomar muestras al azar consiste en utilizar números al azar, tal como se describe en la mayor parte de los libros de estadística. A cada individuo de la población de la cual se quiere extraer una muestra se le atribuye un número, y los que se tomen como muestra estarán determinados por la tabla de números al azar. Por ejemplo, si se quieren elegir 5 individuos entre 100, como una muestra, y los 5 primeros números de la tabla son 3, 47, 43, 73 y 86, se tomarán los individuos correspondientes a estos números. Cuando la cantidad de individuos no sea exactamente 100 (o 1.000, etc.) saldrán números que no correspondan a ningún individuo, y no se tendrán en cuenta. Esta pérdida de tiempo puede ser reducida atribuyendo a cada individuo dos o más números, con tal de que todos tengan igual cantidad de números. Supongamos, por ejemplo, que se quieren tomar 5 unidades de una población de 24; en este caso, a cada individuo se le adscriben cuatro números; así la primera unidad tendrá, por ejemplo, los números 01 al 04, etc., la 24 tendrá 93-96, con lo que quedarán sólo cuatro números, 97-100, sin utilizar. Los individuos sometidos al muestreo, que corresponden a la serie previa de 5 números al azar, serían entonces los números 1, 12, 11, 16 y 22 (si uno de los números al azar es 97 o más, se descarta y se toma otro). En lugar de escoger todas las unidades en la muestra individualmente de la tabla de números al azar, las unidades se pueden tomar a intervalos regulares, por ejemplo, cada 5 ó 100 individuos, y solamente el primero elegido utilizando los números al azar. En el primer ejemplo, la muestra era de 1/20 de la población, de modo que el intervalo de la muestra será 20 y como el primer número elegido al azar era el 3, los siguientes serían 23, 43, 63 y 83. Este sistema es peligroso si en la población hay una periodicidad natural equivalente al intervalo elegido; por ejemplo, en el caso de someter a muestreo los desembarcos totales

Page 67: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

66 

en un puerto, no se debe anotar la captura cada 7 ó 14 días, puesto que pudiera haber grandes variaciones sistemáticas asociadas a los distintos días de la semana.

Ejemplo 2.2.1.1

En un determinado lugar se efectúan los desembarcos de pesca durante todo el año. Se desea determinar la cantidad total anual desembarcada, mediante el muestreo de la captura en 30 días del año. Determínense los días en que se debe efectuar el muestreo por medio de números al azar:

a) directamente por medio de una serie de números al azar del 000 al 999, y numerando los días del año de 1 a 365;

b) dando a cada día 2 números, desde el 1 y 2 al 729 y 730;

c) dando a cada día 27 números, de 1-27 a 9.829-9.855, y usando números al azar de 0000 a 9999;

d) haciendo un muestreo cada 12 días a partir de un día elegido al azar entre los 1-12 días primeros (algunas muestras podrán tener 31 días).

Si no se usan números al azar, o cualquier otro proceso similar, entonces lo más probable es que no todos los individuos de la población tengan igual oportunidad de salir en la muestra. Caso de haber alguna correlación entre la cantidad que se va a medir y la probabilidad de que aparezca en la muestra, el resultado podría estar sesgado, quizás demasiado. Por ejemplo, al hacer el muestreo de la captura procedente de un barco en una lonja abarrotada de peces, muchas veces se hace necesario trabajar con las cajas que se desembarcan primero. Dado que en éstas vendrán los peces últimamente capturados, si es que se pretende conocer la frescura media obtendremos una estimación muy sesgada; en cambio, lo más probable es que sus tamaños sean similares a los de los peces capturados anteriormente, de modo que la muestra dará estimaciones sin sesgo de la talla media. Nunca debe darse rápidamente por supuesto que no existen sesgos, y la posibilidad de su existencia debe investigarse cuidadosamente. En el ejemplo anterior existiría cierto sesgo si los barcos acostumbran hacer una última calada cerca ya del puerto, donde el tamaño medio de los peces se desvía del tamaño medio general. Estas y otras fuentes de posibles sesgos solamente pueden encontrarse y eliminarse si se tiene un completo conocimiento de la pesquería - cómo se capturan los peces, cómo se manipulan a bordo y qué distribución sufren en el mercado.

La precisión de las estimaciones que se obtienen por verdaderos muestreos al azar puede ser determinada rápidamente. Si se está efectuando el muestreo de una población para conocer alguna de sus características (como el número de vértebras), cuya media en la población es M y la variancia S2, y se toma al azar una muestra de n individuos, cuyos valores son xi...xn, la estimación de la media de la población será

.....................................(2.1)

Page 68: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

67 

y la media de (si las estimaciones no están sesgadas) y la variancia de (o más

brevemente var ) = , si es que N, el número total en la población, es grande comparado con n.

En caso contrario, la fórmula de la variancia se hace

Ejemplo 2.2.1.2 a) Suponiendo que la media y la variancia de los datos en el Ejemplo 1.2.1 están próximos a los valores de la población, calcúlese la variancia en la estimación de la longitud media a partir de las muestras de 5, 20, y 100 peces;

b) mediante el empleo de números al azar, o por cualquier otro método, tómense 20 muestras al azar de 5 peces de los 449 del Ejemplo 1.2.1. Calcúlese la longitud media de cada una de estas muestras; calcúlese la variancia de estos 20 valores, y compárese con la variancia esperada tal como se calculó en (a). (Nótese cómo la variancia calculada a partir de una serie de números no mayor de 20 está sujeta a cierta variabilidad);

c) si se necesita estimar la longitud media del bacalao del Mar del Norte con una precisión de ±5 cm, determínese el tamaño de la muestra al azar que es preciso tomar (para esto se requiere que el doble de la desviación típica de la longitud media estimada sea igual a 5).

2.3 Muestreo estratificado

Cuando se efectúa el muestreo de una población heterogénea, se puede incrementar la precisión, a veces de manera muy señalada, y reducir el riesgo de sesgos, dividiéndola en una serie de secciones, cada una de las cuales es relativamente homogénea, y haciendo el muestreo de cada sección (o estrato) por separado. Así, se hace una muestra de cada estrato independientemente, obteniéndose estimaciones para cada uno de ellos. Luego estas estimaciones pueden combinarse para dar la estimación del conjunto de la población. La variancia de esta estimación se obtendrá también combinando las variancias de las estimaciones hechas en cada estrato. Como las variancias de cada estrato tenderán a ser pequeñas, dado que los estratos son relativamente homogéneos, posiblemente mucho menores que la variancia en la población en conjunto, la variancia final de la estimación combinada será también pequeña.

En términos matemáticos, sea una población de N individuos, Ni en el estrato i°, de modo que N = � Ni, y una muestra ni del estrato i°, en la que los valores de la cantidad que hay que estimar (longitud del pez, peso capturado, etc.) es igual a yij = 1...ni; la estimación del

valor medio en el estrato será

................... (2.2)

obteniéndose una estimación sin sesgo de la media de la población total como la media ponderada de las medias de los estratos, siendo el factor ponderador el número total en cada estrato, es decir:

Page 69: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

68 

Si la variancia en el estrato i° es Si2

y

.............................(2.3)

suponiendo que ni, sea pequeño comparado con Ni. En otro caso, la variancia será

Esta variancia puede compararse con la de la estimación obtenida por un muestreo al azar en el conjunto de la población, que será

si n no es pequeño comparado con N, y donde S2 es la variancia en el conjunto de la población.

Ejemplo 2.3.1

La captura de eglefino de un barco de arrastre se desembarca en Aberdeen dividida en cuatro categorías de tamaños, que serán los cuatro estratos (datos tomados de Pope, 1956). Se hicieron muestras de cada categoría, y los resultados se pueden resumir del modo siguiente:

Categoría Ni ni Σ yij Σ y2ij Pequeño 2 432 152 5 284 185 532 Pequeño-Mediano 1 656 92 3 817 158 953

Page 70: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

69 

Mediano 2 268 63 3 033 146 357 Grande 665 35 2 027 118 169 TOTAL 7 021 342 14 161 609 011

donde y = longitud del pez en cm.

Partiendo de estos datos, se realizan estimaciones de Si2 por medio de

y se tiene:

Categoría

Si2 Si2/ni Ni2Si2/ni

Pequeño 34 763 84 544 12,21 0,0803 474 900 Pequeño-mediano 41 489 68 706 6,47 0,0703 192 800 Mediano 48 143 109 188 5,48 0,0870 447 500 Grande 57 914 38 513 22,85 0,6529 288 700 300 951 1 403 900

y de aquí

y desviación típica

Los límites de seguridad del 95 por ciento para la longitud media verdadera de los peces capturados son, por tanto, 42,9 ± 2 × 0,17, es decir, 42,6 - 43,2 cm.

Los datos pueden usarse también para dar una medida aproximada de la variancia de la estimación obtenida de una muestra al azar de 342 del conjunto de la captura. En este caso tomaremos como una estimación de s2 la variancia del conjunto de la población,

por tanto, s2 = 66,4 (compárese con la mayor variancia obtenida dentro de un estrato, que fue 22,85).

y

desviación típica

Page 71: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

70 

Aunque esta estimación de s2 no sea del todo correcta, puesto que la muestra estaba lejos de ser una verdadera muestra al azar, ya que los peces medianos no estaban completamente representados, no obstante, ha servido para poner de manifiesto la gran reducción de la variancia al usar un muestreo estratificado, que es del orden de 1/7, lo que equivaldría a haber aumentado siete veces la muestra.

Se pueden incrementar las ventajas de un muestreo estratificado si se efectúa un muestreo de cada estrato en la forma más conveniente. Los estratos conteniendo muchos individuos, o que sean muy variables, requerirán mayor muestreo que los poco numerosos o más homogéneos. La variancia será mínima para un cierto tamaño total de muestra, n, si

Ni x Si ∝ ni

o

Si ∝ ni/Ni

es decir, si la proporción bajo muestra es proporcional a la variancia del estrato. Si ni no es pequeña comparada con Ni, esta fórmula no es enteramente exacta, pero sirve para tener una buena idea sobre la mejor distribución de las muestras.

Ejemplo 2.3.2

Determínese en el Ejemplo 2.3.1 la mejor distribución en cada estrato del número total de peces sometidos a muestreo (342) y, usando los valores de S2, calcúlese la variancia de la longitud media estimada por esta distribución de las muestras.

Ejemplo 2.3.3

A lo largo de una costa, los peces se desembarcan en 100 lugares, que pueden clasificarse, grosso modo, en tres categorías, de acuerdo con el peso de los peces. En el transcurso de una semana, los pesos de los desembarcos fueron:

Lugares de grandes desembarcos: 45 59 87 41 71 25 9 69 10 7 Medianos: 17 13 19 26 1 8 27 11 12 26 5 8 10 16 16 4 16 16 13 29 14 25 29 27 20 25 2 7 3 12 Pequeños: 2 6 7 0 1 2 1 5 4 7 8 9 3 2 5 4 2 0 2 8 5 3 8 9 8 9 1 6 5 3 3 4 7 5 5 3 2 4 6 1 6 2 5 1 0 3 8 0 4 3 3 5 5 0 7 0 9 7 9 0

Determínese, mediante el cálculo de la variancia en cada categoría y en el conjunto de la población, cuál es el mejor método de estimación de la captura semanal total en toda la costa, si es que sólo se puede registrar la captura en 20 lugares (uno de cada cinco, visitando los lugares de desembarco), cuál es la variancia de esta estimación, y compararla (a) con la obtenida de una sola muestra al azar del conjunto de la población, y (b) usando un muestreo estratificado, tomando una muestra que sea de 1/5 de cada categoría.

Page 72: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

71 

2.4 Submuestreo, o muestreo en dos etapas

Cuando las poblaciones son muy extensas, o complejas, la simple toma de muestras al azar se transforma en un gran problema, que suele requerir mucho tiempo. El tiempo necesario para obtener una muestra de dimensiones determinadas puede ser muy abreviado mediante el empleo de un muestreo en dos etapas. En primer lugar, el conjunto de la población puede ser dividido en una serie de unidades primarias, o subpoblaciones, varias de las cuales se toman como muestra. Se toma una muestra secundaria, o submuestra, de cada una de estas subpoblaciones, que a su vez son muestras de la población total. Por ejemplo, para estimar la captura total a lo largo de una línea costera, se puede tomar como unidad básica cada desembarco. La medición de una serie de desembarcos tomados al azar a lo largo de la costa requeriría efectuar muchos viajes, imposibles de realizar; la solución consiste en seleccionar (por ejemplo, mediante números al azar) ciertos lugares de desembarco en determinados días, y en estos lugares seleccionar una serie de desembarcos.

Por supuesto, el submuestreo se puede realizar en más de dos etapas. En el ejemplo anterior, podría interesar algún dato, como el estado de madurez, para lo cual se tomaría una caja de pescado (o una parte de la misma), con lo que el muestreo se habría realizado en tres (o cuatro) etapas.

La desventaja de un submuestreo consiste, desde luego, en que los individuos de una misma unidad primaria son probablemente más parecidos entre sí que los del conjunto de la población. De esta manera, después de examinar un individuo de una unidad, tal como el peso de la captura de un barco en un lugar determinado, si se siguen examinando individuos de esa unidad, se obtendrá menos información del conjunto de la población (por ejemplo, la captura media por barco de todos los lugares de desembarco) que si se examinan individuos de otras unidades primarias. El problema consiste en deducir el número más conveniente de muestras que se debe tomar en un tiempo dado al emplear un muestreo en dos etapas. En términos generales, si los individuos dentro de una unidad primaria son muy variables, lo mejor será tomar muchas muestras dentro de cada unidad en, comparativamente, pocas unidades primarias. Por el contrario, si la variación de los individuos es pequeña dentro de cada unidad, pero hay diferencias considerables entre las unidades, entonces deberán someterse a muestreo muchas unidades primarias, con un pequeño número de individuos por muestra en cada una de ellas.

El método puede ser ilustrado en términos matemáticos: supóngase, para mayor sencillez, que la población puede dividirse en K unidades primarias, cada una de N individuos, y que están sometidas a muestreo k unidades primarias, tomándose una submuestra de n individuos en cada una.

Si M es la media de la población, y Mi la media de la ia unidad primaria, entonces la estimación de la media de una unidad primaria bajo muestreo será:

donde xij es el valor del j° individuo en la unidad ia y la estimación de la media de la población será

Page 73: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

72 

............................(2.4)

La variancia de mi en torno a Mi será 1/n × Sw2, en donde Sw2 es la variancia de los individuos de la ia unidad primaria en torno a la media de la unidad. La variancia de la media estimada para la población constará de dos partes: la variancia de las medias estimadas para las unidades en torno a las medias verdaderas de las unidades, y la variancia de estas últimas en torno a la media de la población; esto es

........................................(2.5)

donde SB2 es la variancia de las medias de las unidades en torno a la media de la población. Una estimación no sesgada de la variancia de m será

.............................(2.6)

Ejemplo 2.4.1

(tomado de Pope, 1956)

Como muestra al azar del desembarco total de arenque en una semana, se toma una serie de desembarcos individuales, y de cada desembarco seleccionado una muestra de 50 arenques, y se miden. Se obtienen los siguientes datos:

Barco 1 2 3 4 5

Suma

1 244,3 1 324,2 1 335,4 1 299,7 1 270,5

Suma de cuadrados

31 020,97 35 127,08 35 730,30 33 900,99 32 558,55

Estímese la longitud media del arenque en los desembarcos de la semana, y su error típico. Primero se obtendrá la media para cada barco, que son 24,9, 26,5, 26,7, 26,0 y 25,4. Por tanto, las estimaciones que se piden se obtendrán por

m2 = 1/5 (24,9 + ... + 25,4) = 25,9

sm=0,34

Las variancias entre y dentro de las unidades primarias pueden también estimarse separadamente. Dentro de cada unidad primaria, se tendrá una estimación de Sw2 por

Page 74: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

73 

Estas estimaciones por separado en las unidades primarias pueden combinarse por medio de

.............................(2.7)

Según las ecuaciones (2.5) y (2.6) la variancia entre las unidades puede deducirse de la ecuación

.............................(2.8)

Siendo dados los valores de Sw2 por la ecuación (2.7)

Ejemplo 2.4.2

Calcúlese la variancia de la longitud del arenque dentro y entre los barcos, de acuerdo con los datos del Ejemplo 2.4.1. Como estimación de la variancia dentro de los barcos, se tiene que

5 x 49 x Sw2 = (31020,97 - 1/50 x 1244,32) + ... + ...

por tanto

245 Sw2 = 378,62

Sw2 = 1,545

También

SB2 = 0,56 - 0,03 = 0,53

En los cálculos de los ejemplos 2.4.1 y 2.4.2 se ha podido ver que la mayor parte de Sm2, la variancia de la longitud media estimada de todos los peces desembarcados, se debe a SB2 la variancia entre los barcos. De la ecuación (2.5) se deduce que el efecto de esta variancia puede reducirse aumentando k, o sea, el número de unidades primarias bajo muestreo, pero no incrementando n, el número de individuos sometidos a muestreo en cada unidad primaria. Así pues, el tiempo empleado en el muestreo de los desembarcos de arenque podría aprovecharse más eficazmente reduciendo el número de individuos en las muestras

Page 75: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

74 

y aumentando el número de barcos bajo muestra, por ejemplo, 6 muestras de 30 peces, con un total de 180 peces, en vez de 5 muestras de 50 peces, con un total de 250 peces. La mejor forma de utilizar el tiempo dependerá del que se emplee en cada etapa de muestreo y de la variancia contenida en ellas. El tiempo total empleado se puede dividir aproximadamente en tres partes:

a) el tiempo inicial; el tiempo que se emplea en la preparación, incluyendo el traslado desde el centro de trabajo al área de muestreo. Este tiempo es más o menos constante, independientemente del volumen del muestreo;

b) el tiempo entre las unidades primarias; en el ejemplo anterior, el tiempo empleado en ir de un barco a otro, que será proporcional al número de unidades primarias;

c) el tiempo dentro de las unidades primarias; que es el tiempo que se emplea en examinar los individuos en cada unidad primaria. El tiempo total podra ser, por tanto, igual a

t = t0 + k tb + n k tw .............................. (2.9) t0 = tiempo inicial tb = tiempo para ir de una unidad primaria a otra tw = tiempo empleado en examinar un individuo.

La mejor forma de distribuir el tiempo de muestreo (es decir, la que da una variancia mínima), de acuerdo con un número determinado de individuos bajo muestreo en cada unidad primaria, viene dada por

............................(2.10)

Ejemplo 2.4.3

Utilizando los datos de los ejemplos anteriores, y suponiendo que en un minuto se pueden medir 20 peces, y que el tiempo empleado para ir de un barco a otro es de 5 minutos, demuéstrese que la variancia mínima en la longitud media estimada y para una cantidad dada de muestreo es de 17 peces aproximadamente, resultado obtenido con muestras secundarias.

Hasta ahora, se había supuesto que todas las unidades primarias eran del mismo tamaño, pero esto no es lo corriente. Cuando sean desiguales, se hará preciso aplicar un factor de corrección para cada unidad. La ecuación (2.4) puede reescribirse como sigue

..........................(2.11)

donde Ni = número de individuos en la ia unidad primaria N = � Ni = número total en todas las unidades primarias de muestreo

o como ..................................(2.12)

Page 76: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

75 

donde ni es el número de individuos bajo muestra en la ia unidad primaria, que no tiene por qué ser igual en todas ellas. Si se toma ni en cada unidad de tal manera que en todas ellas la razón de muestreo ni/Ni sea la misma para todas las unidades, e igual a p, entonces (2.12) se reduce a

es decir

..........................................(2.13)

donde n es el número total de individuos de la muestra, siendo ésta, desde luego, la forma más conveniente de computación. La fórmula de la variancia (ecuación 2.5) puede también reescribirse así

donde

La fórmula (ecuación 2.10) sobre el mejor número de individuos por muestra en cada unidad no hay que aplicarla de manera estricta. Podría modificarse para que determinara con precisión la mejor muestra en cada unidad primaria. Sin embargo, esta fórmula sería más bien prolija, y necesitaría una información adicional sobre la variancia en cada unidad primaria (que puede no ser igual en todas las unidades). Tanto esfuerzo puede muy bien no merecer la pena, y ser más razonable utilizar la ecuación (2.10), modificada empíricamente, incrementando la muestra en las unidades más grandes o más variables.

Cuando el objetivo del muestreo sea medir alguna cantidad total, como el peso total desembarcado de cierta especie de peces, y no un valor medio, como la longitud media de los peces, el análisis de los resultados, como figura en las ecuaciones (2.11) - (2.13) deberá modificarse. El total en la ia unidad bajo muestreo será

donde Ni/ni es el factor elevador o de ponderación para la ia unidad primaria, y es igual al recíproco de la proporción tomada como muestra. El total en el conjunto de la población viene dado por

Page 77: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

76 

donde N = número total de individuos en la población. Si N no es conocido, como bien puede suceder, entonces en vez de N/Ni debe emplearse como factor aproximado elevador K/k, donde K es el número total de unidades primarias y k es el número total de unidades bajo muestreo (si el número de individuos de cada unidad primaria fuera el mismo, los dos factores coincidirían). Es absolutamente indispensable utilizar dos factores elevadores, uno para relacionar la muestra con el conjunto de la unidad primaria, y otro para relacionar las unidades primarias sometidas a muestreo con el conjunto de la población. El empleo de factores ponderadores equivocados puede ocasionar sesgos importantes, si es que hay grandes diferencias en la composición entre las unidades primarias, en especial si están correlacionadas con el número de individuos en la unidad primaria. Supóngase, por ejemplo, que se desea estimar la cantidad total desembarcada en un cierto lugar de una determinada especie de peces que viven predominantemente en fondos costeros. Como unidad primaria se puede tomar la captura de cada barco, utilizando como muestra una caja de pescado de cada barco seleccionado. Es muy probable que los barcos grandes pesquen en fondos más alejados de la costa, que consigan capturas mayores, y que haya en ellas una pequeña proporción de peces costeros. Si a las muestras de estos barcos grandes se les diera el mismo factor ponderador que a las de los más pequeños que actúan junto a la costa, la proporción de especies costeras podría muy bien ser sobreestimada.

Ejemplo 2.4.4

Treinta barcos desembarcaron peces en un lugar determinado. Se tomaron como muestra 10 barcos, de cada uno de los cuales se sometió a muestreo una caja, determinándose el peso de dos de las especies, con los siguientes resultados:

Número del barco 1 2 3 4 5 6 7 8 9 10 Número de cajas desembarcadas 28 10 16 20 18 12 10 5 15 25 Peso de la especie A en 1 caja (kg) 10 1 2 2 7 8 3 2 9 12 Peso de la especie B en 1 caja (kg) 1 10 2 2 2 7 3 9 8 2

Calcúlese el peso total de los desembarcos de cada especie, (a) utilizando la información anterior, (b) utilizando la información adicional de que el total de desembarcos de todos los barcos fue de 450 cajas. Compárese la proporción de las dos especies en el total de desembarcos, con la proporción en las 10 cajas bajo muestreo (una caja equivale a 50 kg).

Definiciones.

1- Población: Es aquel conjunto de individuos o elementos que podemos observar, medir una característica o atributo. Ejemplos de población:

* El conjunto de todos los estudiantes de una Universidad.

* El conjunto de personas fumadoras de una región.

2- Muestreo: Se refiere al procedimiento empleado para obtener una o más muestras de una población. Este se realiza una vez que se ha establecido un marco muestral representativo de la población, luego se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.

Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no necesariamente son iguales, lo más probable es que varíen de una muestra a otra.

3- Estadístico: Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros.

Page 78: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

77 

4- Parámetro: Son las medidas o datos que se obtienen sobre la distribución de probabilidades de la población, tales como: la media, la varianza, la proporción, etc.

5- Error: Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos indicará hasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varían muestra a muestra). Varía según se calcule al principio o al final. Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Se puede decir que es la desviación de la distribución muestral de un estadístico y su fiabilidad.

Usos del Muestreo.

El Muestreo es utilizado en diversos campos:

1- Política: Las muestras de las opiniones de los votantes se usan para que los candidatos midan la opinión pública y el apoyo en las elecciones.

2- Educación: Las muestras de las calificaciones de los exámenes de estudiantes se usan para determinar la eficiencia de una técnica o programa de enseñanza.

3- Industria: La muestras de los productos de una línea de ensamble sirve para controlar la calidad.

4- Medicina: Las muestras de medidas de azúcar en la sangre de pacientes diabéticos prueban la eficacia de una técnica o de un fármaco nuevo.

5- Agricultura: Las muestras del maíz cosechado en una parcela proyectan en la producción los efectos de un fertilizante nuevo.

6- Gobierno: Una muestra de opiniones de los votantes se usaría para determinar los criterios del público sobre cuestiones relacionadas con el bienestar y la seguridad nacional.

Métodos de Muestreo Probabilísticos:

1- Muestreo Aleatorio Simple: Es la forma más común de obtener una muestra en la selección al azar, es decir, cada uno de los individuos de una población tiene la misma posibilidad de ser elegido. Si no se cumple este requisito, se dice que la muestra es viciada. Para tener la seguridad de que la muestra aleatoria no es viciada, debe emplearse para su constitución una tabla de números aleatorios. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande. Ejemplo:

Supongamos que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de estadística de 20 alumnos. 20C5 da el número total de formas de elegir una muestra no ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos las 15,504 en trozos separados de papel, una tarea tremenda, luego los colocamos en un recipiente y después los revolvemos, entonces podremos tener una muestra aleatoria de 5 si seleccionamos un trozo de papel con cinco nombres. Un procedimiento más simple para elegir una muestra aleatoria sería escribir cada uno de los 20 nombres en pedazos separados de papel, colocarlos en un recipiente, revolverlos y después extraer cinco papeles al mismo tiempo.

Otro método parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20 utiliza una tabla de números aleatorios. Se puede construir la tabla usando una calculadora o una computadora. También se puede prescindir de estas y hacer la tabla escribiendo diez dígitos del 0 al 9 en tiras de papel, las colocamos en un recipiente y los revolvemos, de ahí,

Page 79: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

78 

la primera tira seleccionada determina el primer número de la tabla, se regresa al recipiente y después de revolver otra vez se selecciona la seguida tira que determina el segundo número de la tabla; el proceso continúa hasta obtener una tabla de dígitos aleatorios con tantos números como se desee.

Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco práctico, imposible o no deseado; aunque sería deseable usar muestras aleatorias simples para las encuestas nacionales de opinión sobre productos o sobre elecciones presidenciales, sería muy costoso o tardado.

2- Muestreo Aleatorio Sistemático: Es una técnica de muestreo que requiere de una selección aleatoria inicial de observaciones seguida de otra selección de observaciones obtenida usando algún sistema o regla. Ejemplo:

Para obtener una muestra de suscriptores telefónicos en una ciudad grande, puede obtenerse primero una muestra aleatoria de los números de las páginas del directorio telefónico; al elegir el vigésimo nombre de cada página obtendríamos un muestreo sistemático, también podemos escoger un nombre de la primera página del directorio y después seleccionar cada nombre del lugar número cien a partir del ya seleccionado. Por ejemplo, podríamos seleccionar un número al azar entre los primeros 100; supongamos que el elegido es el 40, entonces seleccionamos los nombres del directorio que corresponden a los números 40, 140, 240, 340 y así sucesivamente.

3- Muestreo Aleatorio Estratificado: Una muestra es estratificada cuando los elementos de la muestra son proporcionales a su presencia en la población. La presencia de un elemento en un estrato excluye su presencia en otro. Para este tipo de muestreo, se divide a la población en varios grupos o estratos con el fin de dar representatividad a los distintos factores que integran el universo de estudio. Para la selección de los elementos o unidades representantes, se utiliza el método de muestreo aleatorio.

En síntesis, requiere de separar a la población según grupos llamados estratos, y de elegir después una muestra aleatoria simple en cada estrato. La información de las muestras aleatorias simples de cada estrato constituiría entonces una muestra global. Ejemplo:

Supongamos que nos interesa obtener una muestra de las opiniones de los profesores de una gran universidad. Puede ser difícil obtener una muestra con todos los profesores, así que supongamos que elegimos una muestra aleatoria de cada colegio, o departamento académico; los estratos vendrían a ser los colegios, o departamentos académicos.

4- Muestreo Aleatorio por Área o Conglomerado: Requiere de elegir una muestra aleatoria simple de unidades heterogéneas entre sí de la población llamadas conglomerados. Cada elemento de la población pertenece exactamente a un conglomerado, y los elementos dentro de cada conglomerado son usualmente heterogéneos o disímiles. Ejemplo:

Supongamos que una compañía de servicio de televisión por cable está pensando en abrir una sucursal en una ciudad grande; la compañía planea realizar un estudio para determinar el porcentaje de familias que utilizarían sus servicios, como no es práctico preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al azar, la cual forma un conglomerado.

En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como sea posible, a toda la población; entonces se usa una muestra aleatoria simple de conglomerados para estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y prisiones se realizan, generalmente, con base en el muestreo por conglomerados.

Otros Métodos de Muestreo:

Page 80: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

79 

1- Muestreo Discrecional: A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio. Ejemplo.: muestreo por juicios; cajeros de un banco o un supermercado; etc.

2- Muestreo Doble: Bajo este tipo de muestreo, cuando el resultado del estudio de la primera muestra no es decisivo, una segunda muestra es extraída de la misma población. Las dos muestras son combinadas para analizar los resultados. Este método permite a una persona principiar con una muestra relativamente pequeña para ahorrar costos y tiempo. Si la primera muestra arroja un resultado definitivo, la segunda muestra puede no necesitarse. Por ejemplo, al probar la calidad de un lote de productos manufacturados, si la primera muestra arroja una calidad muy alta, el lote es aceptado; si arroja una calidad muy pobre, el lote es rechazado. Solamente si la primera muestra arroja una calidad intermedia, será requerida la segunda muestra.

3- Muestreo Múltiple: El procedimiento bajo este método es similar al expuesto en el muestreo doble, excepto que el número de muestras sucesivas requerido para llegar a una decisión es más de dos muestras.

4- Muestreo Opinático o Intencional: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.

5- Muestreo Casual o Incidental: Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso particular es el de los voluntarios.

Tabla de Números Aleatorios.

Las Tablas de Números Aleatorios contienen los dígitos 0, 1, 2,..., 7, 8, 9. Tales dígitos se pueden leer individualmente o en grupos y en cualquier orden, en columnas hacia abajo, columnas hacia arriba, en fila, diagonalmente, etc., y es posible considerarlos como aleatorios. Las tablas se caracterizan por dos cosas que las hacen particularmente útiles para el muestreo al azar. Una característica es que los dígitos están ordenados de tal manera que la probabilidad de que aparezca cualquiera en un punto dado de una secuencia es igual a la probabilidad de que ocurra cualquier otro. La otra es que las combinaciones de dígitos tienen la misma probabilidad de ocurrir que las otras combinaciones de un número igual de dígitos. Estas dos condiciones satisfacen los requisitos necesarios para el muestreo aleatorio, establecidos anteriormente. La primera condición significa que en una secuencia de números, la probabilidad de que aparezca cualquier dígito en cualquier punto de la secuencia es 1/10. La segunda condición significa que todas las combinaciones de dos dígitos son igualmente probables, del mismo modo que todas las combinaciones de tres dígitos, y así sucesivamente.

Existen métodos más eficaces para generar números aleatorios, en muchos de los cuales se utilizan calculadoras u otra clase de aparatos electrónicos. Las tablas elaboradas mediante estos métodos son verificadas completamente para asegurarse de que en realidad sean aleatorias. Sin embargo, el interés no radica en elaborar estas tablas, sino utilizarlas.

Para utilizar una Tabla de Números Aleatorios:

1- Hacer una lista de los elementos de la población.

2- Numerar consecutivamente los elementos de la lista, empezando con el cero (0, 00, 000, etc.).

Page 81: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

80 

3- Tomar los números de una Tabla de Números Aleatorios, de manera que la cantidad de dígitos de cada uno sea igual a la del último elemento numerado de su lista. De ese modo, si el último número fue 18, 56 ó 72, se deberá tomar un dígito de dos números.

4- Omitir cualquier dígito que no corresponda con los números de la lista o que repita cifras seleccionadas anteriormente de la tabla. Continuar hasta obtener el número de observaciones deseado.

5- Utilizar dichos números aleatorios para identificar los elementos de la lista que se habrán de incluir en la muestra.

Donald B. Owen, Handbook of Statistical Tables, Reading Mass:Addisson-Wesley, 1.962.

3690 2492 7171 7720 6509 7549 2330 5733 4730

0813 6790 6858 1489 2669 3743 1901 4971 8280

6477 5289 4092 4223 6454 7632 7577 2816 9002

0772 2160 7236 0812 4195 5589 0830 8261 9232

5692 9870 3583 8997 1533 6466 8830 7271 3809

2080 3828 7880 0586 8482 7811 6807 3309 2729

1039 3382 7600 1077 4455 8806 1822 1669 7501

7227 0104 4141 1521 9104 5563 1392 8238 4882

8506 6348 4612 8252 1062 1757 0964 2983 2244

5086 0303 7423 3298 3979 2831 2257 1508 7642

0092 1629 0377 3590 2209 4839 6332 1490 3092

0935 5565 2315 8030 7651 5189 0075 9353 1921

2605 3973 8204 4143 2677 0034 8601 3340 8383

7277 9889 0390 5579 4620 5650 0210 2082 4664

5484 3900 3485 0741 9069 5920 4326 7704 6525

6905 7127 5933 1137 7583 6450 5658 7678 3444

8387 5323 3753 1859 6043 0294 5110 6340 9137

4094 4957 0163 9717 4118 4276 9465 8820 4127

4951 3781 5101 1815 7068 6379 7252 1086 8919

9047 0199 5068 7447 1664 9278 1708 3625 2864

7274 9512 0074 6677 8676 0222 3335 1976 1645

9192 4011 0255 5458 6942 8043 6201 1587 0972

0554 1690 6333 1931 9433 2661 8690 2313 6999

9231 5627 1815 7171 8036 1832 2031 6298 6073

3995 9677 7765 3194 3222 4191 2734 4469 8617

2402 6250 9362 7373 4757 1716 1942 0417 5921

5295 7385 5474 2123 7035 9983 5192 1840 6176

5177 1191 2106 3351 5057 0967 4538 1246 3374

7315 3365 7203 1231 0546 6612 1038 1425 2709

Page 82: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

81 

5775 7517 8974 3961 2183 5295 3096 8536 9442

5500 2276 6307 2346 1285 7000 5306 0414 3383

3251 8902 8843 2112 8567 8131 8116 5270 5994

4675 1435 2192 0874 2897 0262 5092 5541 4014

3543 6130 4247 4859 2660 7852 9096 0578 0097

3521 8772 6612 0721 3899 2999 1263 7017 8057

5573 9396 3464 1702 9204 3389 5678 2589 0288

7478 7569 7551 3380 2152 5411 2647 7242 2800

3339 2854 9691 9562 3252 9848 6030 8472 2266

5505 8474 3167 8552 5409 1556 4247 4652 2953

6381 2086 5457 7703 2758 2963 8167 6712 9820

Un ejemplo de una tabla de números aleatorios consiste en la lista de los números de Lotería Nacional premiados a lo largo de su historia, pues se caracterizan por que cada dígito tiene la misma probabilidad de ser elegido, y su elección es independiente de las demás extracciones. Un modo de hacerlo es el siguiente:

Supongamos que tenemos una lista de números aleatorios de k= 5 cifras (00000-99.999), una población de N= 600 individuos, y deseamos extraer una muestra de n= 6 de ellos. En este caso ordenamos a toda la población (usando cualquier criterio) de modo que a cada uno de sus elementos le corresponda un número del 1 al 600. En segundo lugar nos dirigimos a la tabla de números aleatorios, y comenzando en cualquier punto extraemos un número t, y tomamos como primer elemento de la muestra al elemento de la población:

El proceso se repite tomando los siguientes números de la tabla de números aleatorios, hasta obtener la muestra de 10 individuos.

Las cantidades pueden ser consideradas como observaciones de una v.a. U, que sigue una distribución uniforme en el intervalo [0,1]

Razones para el Muestreo.

1- No estamos interesados realmente en todos los elementos: sino sólo en algunos ejemplares o casos de la población. Este tipo habitual de investigación no es de hecho un estudio de muestreo, sino un estudio de caso ampliado.

2- Estamos interesados por igual en todos los elementos de la población y querríamos estudiarlos todos. Pero por razones prácticas, tendremos que escoger solo una muestra. Tal vez tenemos una población de millones de objetos y es imposible abarcar incluso una mayoría de entre ellos. También en aquellos casos (con poblaciones, digamos, de 10.000) en que podríamos escoger estudiar cada objeto, el estudio de muestreo puede ser una elección prudente, porque ahorra tiempo y podemos usar el tiempo ahorrado para

Page 83: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

82 

estudiar los elementos más cuidadosamente. Todos estos son buenos casos para un estudio de muestreo.

En la investigación de muestreo estamos siempre interesados no es en la muestra sino en la población; más exactamente, en los atributos de los elementos de la población. Cuando estamos estudiando los elementos del ejemplo querríamos escoger elementos que tengan los mismos atributos que la media de la población. Si ese es el caso, nuestra muestra es representativa.

Este es el caso ideal, pero en la práctica no tenemos medio de saber si los elementos son representativos en realidad; el cálculo de probabilidades nos dice que en la mayor parte de los casos habrá algunas diferencias entre la muestra y la población. La diferencia se llama sesgo, y en alguna medida casi siempre está presente en la muestra, simplemente por el carácter accidental del muestreo.

Sin embargo, si tenemos razones para sospechar de la presencia de un sesgo sistemático en la muestra, debiéramos siempre intentar encontrar cuál es y ver si puede ser eliminado.

Diferencia entre los siguientes términos: Error de Muestreo y Error no de Muestreo.

La diferencia radica en los tipos de errores que son medidos o detectados en los resultados que arrojan las encuestas. Mientras que el Error de Muestreo señala desde las preguntas mal redactadas por los entrevistadores en las encuestas, indisposición por parte de los entrevistados y cálculos errados; el Error no de Muestreo localiza la información falsa suministrada por los entrevistados.

En síntesis un Error de Muestreo usualmente ocurre cuando no se lleva a cabo la encuesta completa de la población y, los Errores no de Muestreo pueden ocurrir en una encuesta completa de la población.

Población Blanco y Muestreada.

La Población Blanco: Es aquella población perteneciente a una ciudad que se tiene como meta ser estudiada.

La Población Muestreada: Comprende el estudio real de una parte de los elementos de una población.

Precisión y Exactitud.

La Precisión: Se refiere a la identidad o por lo menos a la similitud entre dos o más mediciones de la misma cantidad. En cierto grado, la precisión está relacionada con la estabilidad de la técnica del experimentador, que puede necesitar más mejoras de las que él cree. Sin embargo, dependiendo de la naturaleza de la medición particular que se está considerando, puede aparecer una falta de precisión debido a un control defectuoso de temperatura, a una pieza de vidrio astillada, corroídas o flojas en los instrumentos utilizados.

La Exactitud: Se refiere a la cercanía a su valor verdadero de las mediciones obtenidas. Para un procedimiento dado, la exactitud se estima llevando a cabo mediciones físicas o químicas de un patrón conocido. Por ejemplo, si una investigación depende de una titulación con una solución normalizada de álcali, es conveniente comprobar la confiabilidad de este reactivo de tiempo en tiempo, titulando una cantidad conocida o determinada gravimétricamente de una sal de un ácido.

Introducción

Partiendo de la importancia que tiene para cualquier profesional e investigador conocer varios conceptos importantes de la estadística para poder desarrollar exitosamente una investigación de cualquier índole, en el presente trabajo nos proponemos dar tratamiento a

Page 84: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

83 

algunos elementos de la estadística matemática de la forma mas elemental posible para que pueda ser asimilada por cualquier profesional sin tener en cuenta su especialidad ya sea de las ciencias sociales como de las ciencias exactas.

Nuestro propósito es encaminar al profesional en:

• Conocer el aparato conceptual necesario desde el punto de vista estadístico para emprender de forma sólida y científica una investigación.

• Mostrar algunas de las formas científicas de obtener una muestra. • Tipo de muestreo a utilizar según el interés del profesional. • Como determinar el tamaño de muestra necesario para el desarrollo de la investigación.

Dentro de esa gama de conceptos primarios tenemos los siguientes:

• Población. • Muestra • Parámetro • Estadístico • Error muestral • Nivel de confianza • Varianza poblacional • Inferencia estadística

Desarrollo

Población. No es más que aquel conjunto de individuos o elementos que le podemos observar, medir una característica o atributo.

Ejemplos de población:

• El conjunto formado por todos los estudiantes universitarios en Cuba. • El conjunto de todos los estudiantes de una Universidad. • El conjunto de personas fumadoras de una región.

Son características medibles u observables de cada elemento por ejemplo, su estatura, su peso, edad, sexo, etc.

Supongamos que nos interesa conocer el peso promedio de la población formada por los estudiantes de una universidad. Si la universidad tiene 5376 alumnos, bastaría pesar cada estudiante, sumar los 5376 pesajes y dividirlo por 5376. Pero este proceso puede presenta dificultades dentro de las que podemos mencionar:

• localizar y pesar con precisión cada estudiante: • escribir todos los datos sin equivocaciones en una lista: • efectuar los cálculos.

Las dificultades son mayores si en número de elementos de la población es infinito, si los elementos se destruyen, si sufren daños al ser medidos o están muy dispersos, si el costo para realizar el trabajo es muy costoso.

Una solución a este problema consiste en medir solo una parte de la población que llamaremos muestra y tomar el peso medio en la muestra como una aproximación del verdadero valor del peso medio de la población.

El tamaño de la población es la cantidad de elementos de esta y el tamaño de la muestra es la cantidad de elementos de la muestra. Las poblaciones pueden ser finitas e infinitas.

Page 85: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

84 

Los datos obtenidos de una población pueden contener toda la información que se desee de ella. De lo que se trata es de extraerle esa información a la muestra, es decir a los datos muestrales sacarle toda la información de la población.

La muestra debe obtener toda la información deseada para tener la posibilidad de extraerla, esto sólo se puede lograr con una buena selección de la muestra y un trabajo muy cuidadosos y de alta calidad en la recogida de los datos.

Es bueno señalar que en un momento una población puede ser muestra en una investigación y una muestra puede ser población, esto esta dado por el objetivo del investigación, por ejemplo en el caso de determinar la estatura media de los estudiantes universitarios en Cuba una muestra podía ser escoger algunas universidades del país y realizar el trabajo, si por el contrario se quiere saber la estatura promedio de los estudiantes de una universidad en especifico en Cuba, entonces el conjunto formado por todos los estudiantes de esta universidad sería la población y la muestra estaría dada por los grupos, carreras o años seleccionado para realzar el experimento.

Parámetro : Son las medidas o datos que se obtienen sobre la distribución de probabilidades de la población, tales como la media, la varianza, la proporción, etc.

Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros.

Error Muestral, de estimación o standard. Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos indicará hasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varían muestra a muestra). Varía según se calcule al principio o al final. Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamos decir que es la desviación de la distribución muestral de un estadístico y su fiabilidad.

Nivel de Confianza. Probabilidad de que la estimación efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro.

Varianza Poblacional. Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias para construir un modelo reducido del universo, o de la población, será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.

Inferencia estadística. Trata el problema de la extracción de la información sobre la población contenida en las muestras.

Para que los resultados obtenidos de los datos muestrales se puedan extender a la población, la muestra debe ser representativa de la población en lo que se refiere a la característica en estudio, o sea, la distribución de la característica en la muestra debe ser aproximadamente igual a la distribución de la característica en la población.

La representatividad en estadística se logra con el tipo de muestreo adecuado que siempre incluye la aleatoriedad en la selección de los elementos de la población que formaran la muestra. No obstante, tales métodos solo nos garantizan una representatividad muy probable pero no completamente segura.

Después de estos preliminares imprescindibles es posible pasa a tratar algunas de las formas que desde el punto de vista científico se puede extraer una muestra.

Page 86: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

85 

Al realizar un muestreo en una población podemos hablar de muestreos probabilísticos y no probabilísticos, en nuestro caso nos referiremos a los muestreos probabilísticos y dentro del mismo estudiaremos el muestreo aleatorio simple (MAS), como método básico en la estadística, el muestreo estratificado y el muestreo por racimos.

Muestreo aleatorio simple: Es aquel en que cada elemento de la población tiene la misma probabilidad de ser seleccionado para integrar la muestra.

Una muestra simple aleatoria es aquella en que sus elementos son seleccionados mediante el muestreo aleatorio simple.

En la práctica no nos interesa el individuo o elemento de la población seleccionado en general, sino solo una característica que mediremos u observaremos en él y cuyo valor será el valor de una variable aleatoria que en cada individuo o elemento de la población puede tomar un valor que será un elemento de cierto conjunto de valores. De modo que una

muestra simple aleatoria se puede interpretar como un conjunto de valores

de variables aleatorias independientes, cada una de las cuales tiene la misma distribución que es llamada distribución poblacional.

Existen dos formas de extraer una muestra de una población: con reposición y sin reposición.

Muestreo con reemplazo: Es aquel en que un elemento puede ser seleccionado más de una vez en la muestra para ello se extrae un elemento de la población se observa y se devuelve a la población, por lo que de esta forma se pueden hacer infinitas extracciones de la población aun siendo esta finita.

Muestreo sin reemplazo: No se devuelve los elementos extraídos a la población hasta que no se hallan extraídos todos los elementos de la población que conforman la muestra.

Cuando se hace una muestra probabilística debemos tener en cuenta principalmente dos aspectos:

• El método de selección. • El tamaño de la muestra

1.- Método de selección:

Un procedimiento de extraer una muestra aleatoria de una población finita es el de enumerar todos los elementos que conforman la población, escribir esos números en bolas o papelitos echarlos en un bombo o bolsa mezclarlos bien removiéndolos y sacar uno a uno tantos como lo indique el tamaño de la muestra. En este caso los elementos de la muestra lo constituirán los elementos de la población cuyos número coincidan con los extraídos de la bolsa o bombo.

Otro procedimiento para obtener una muestra de una población ya sea el muestreo con replazo o sin reemplazo es mediante la utilización de la tabla de números aleatorios pero solamente para poblaciones finitas, la utilización de estas tablas puede realizarse de diferentes modos pero en el presente trabajo solo expondremos el que consideramos mas eficiente ya que no se necesita de la búsqueda de una gran cantidad innecesaria de números aleatorios en la tabla, el cual será ejemplificado.

Existen diferentes tablas de números aleatorios nosotros en nuestro trabajo utilizaremos como referencia la tabla de M. G. Kendall y B. Babington Smith que se encuentra en el texto de tablas estadísticas, la misma está constituida por 4 bloques de 1000 números aleatorios dispuestos en 25 filas y 40 columnas.

Page 87: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

86 

Veamos como se procede para la utilización de la tabla. Consideremos que se desea extraer de una población de tamaño N una muestra de tamaño n se selecciona el bloque, la fila y la columna de la tabla que se va a comenzar, a partir de esta selección (que la hace el muestrista) se toman tantas columnas como dígitos tiene N. Comenzando por el primer número de las columnas seleccionadas se irán incluyendo en la muestra aquellos individuos que en la lista de la población ( ya sea de forma horizontal o vertical) ocupa la posición de los n números de las columnas seleccionadas que resultan menores que N, en los caso que al seleccionar un número en la tabla de números aleatorios sea mayor que N se divide este por N y el resto de la división que será un número entre 0 y N-1 será la posición del individuo a seleccionar tomando el convenio de que el resto 0 corresponde a la posición N. Para la aplicación de este procedimiento requiere que se fije previamente el mayor múltiplo de N que se considerará, para así garantizar que todos los restos desde 0 a N -1 tengan la misma probabilidad de ser seleccionados, por ejemplo si N = 150 y tomando 3 columnas se consideraran sólo aquellos números menores o iguales que 900, los números mayores que 900 no serán analizados en la selección de la muestra.

Ejemplo 1.1: Dada la siguiente población formada por la edad del hijo mayor de 200 núcleos familiares de una cierta región.

Seleccione una muestra aleatoria de tamaño 10 (use la tabla de números aleatorios, escoja la tercera fila, tercera columna del segundo bloque de a 1000) numere la población horizontalmente.

48 49 50 51 50 46 47 56 47 38

53 50 47 46 48 47 48 46 46 50

42 51 51 49 47 51 48 47 42 49

46 48 50 47 48 47 51 56 45 49

45 54 61 46 48 46 46 47 50 34

46 46 51 39 53 55 52 49 47 46

33 40 52 46 44 52 44 54 41 33

48 49 52 42 42 49 47 47 38 48

44 43 44 40 44 45 49 44 43 42

49 49 48 41 51 51 52 42 40 47

37 48 45 46 50 45 47 53 43 47

44 40 46 46 45 48 47 42 47 46

52 53 47 49 46 47 49 42 43 42

43 38 52 50 44 52 44 53 43 45

41 57 47 48 52 53 40 49 40 50

45 42 44 53 57 46 62 47 50 47

Page 88: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

87 

45 51 43 45 39 39 41 44 35 41

54 48 51 53 54 42 48 51 37 38

42 37 52 50 45 55 51 46 38 43

53 43 42 39 46 52 53 39 51 40

Para extraer la muestra lo primero que hacemos es disponer tres columnas en las cuales la primera se ubicaran los números aleatorios, es decir los números extraídos de la tabla de números aleatorios; en la segunda columna pondremos los números aleatorios rectificados que serán aquellos números aleatorios menores que N =200 y los restos de las divisiones de los números aleatorios mayores que N =200 y menores que el mayor múltiplo de N es decir 800 y en la tercera columna de encontrara los valores de la muestra.

En la tabla de números aleatorios la tercera fila, tercera columna del segundo bloque de a 1000 le corresponde al número 3 pero como tenemos que coger el número aleatorio de tres dígitos el primer número aleatorio sería el 017, los demás serian, 984, 955, 130, 850, 374, 665, 910, 288, 753, 765, 691, 496, 001, hemos escogido 14 números de la tabla de números aleatorios debido a que hay 4 que son mayores que 800. Veamos a continuación como extraemos la muestra de la población:

Para el primer número aleatorio 017 se busca en la población el valor que ocupa la posición 017 leída la población horizontalmente que seria la edad de 48 años, el número aleatorio 984 no se contempla dentro del análisis ya que es mayor que 800, al igual que el número 955, el número 130, le corresponde la edad de 52 años, al número 850 no se contempla dentro del análisis, el 374 como es mayor que 200 se divide por 200 y se obtiene reto 174 y este es el número aleatorio rectificado correspondiéndole la edad de 53 años, al número 665 se divide por 200 y se obtiene resto 65 que es el número aleatorio rectificado correspondiéndole la edad de 44 años en la población, a continuación presentaremos la tabla de las tres columnas a la cual nos referimos anteriormente como una vía fácil y práctica para obtener la muestra deseada.

Número aleatorio Número aleatorio rectificado muestra

017 017 48

984 --

955 --

130 130 42

850 --

374 174 53

665 065 53

910 --

288 088 44

Page 89: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

88 

753 153 44

765 165 39

691 091 49

496 096 51

001 001 48

Nota: obsérvese que en la muestra existen edades que se repiten esto puede pasar si el muestreo es con reemplazo si el muestreo es sin reemplazo debemos seguir buscando de la misma manera en la tabla de números aleatorios seguido del número 001, hasta lograr tener la muestra con 10 valores de la población no repetidos.

Este muestreo se puede realizar utilizando Microsoft Excel siguiendo los pasos siguiente:

a. Se instala la opción de análisis de datos para ello se va a herramienta luego a complemento y se activa en la ventana complemento la opción herramienta para análisis.

b. Se abre una hoja Excel y se introducen los datos de la población en columna. c. Se va a herramienta y se elige análisis de datos y en esta ventana se selecciona la

opción muestra. d. En la ventana muestra se introduce el rango de entrada que sería seleccionar todos los

valores de la población, si al suministrar en la hoja Excel los datos de la población al inicio se le designan a estos alguna variable o comentario debe activarse la opción rótulo de lo contrario no debe ser activada, se activa la casilla de muestreo aleatorio y se introduce el tamaño de muestra deseado.

e. Se selecciona el rango de salida que consiste en seleccionar una celda en la hoja Excel que no esté afectada por ninguna información ni hacia abajo ni a la derecha de la misma.

f. Se selecciona aceptar en esta ventana y saldrá el resultado deseado que sería las muestras elegidas por el programa en la población.

2.- El tamaño de la muestra:

Al realizar un muestreo probabilística nos debemos preguntar ¿Cuál es el número mínimo de unidades de análisis ( personas, organizaciones, capitulo de telenovelas, etc), que se

necesitan para conformar una muestra ( que me asegure un error estándar menor que 0.01 ( fijado por el muestrista o investigador), dado que la población es aproximadamente de tantos elementos.

En el tamaño de una muestra de una población tenemos que tener presente además si es conocida o no la varianza poblacional.

Para determinar el tamaño de muestra necesario para estimar con un error máximo

permisible prefijado y conocida la varianza poblacional ( ) podemos utilizar la formula:

Page 90: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

89 

(1)

que se obtiene de reconocer que es el error estándar o error máximo prefijado y está

dado por la expresión para el nivel de confianza y constituye una medida de la precisión de la estimación, por lo que podemos inferir además que

.

Ejemplo 1.2

Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento en una industria. Se conoce que el peso de un saco que se llena con este instrumento es una variable aleatoria con distribución normal. Si se supone que la desviación típica del peso es de 0,5 kg. Determine el tamaño de muestra aleatoria necesaria para determinar una probabilidad igual a 0,95 de que el estimado y el parámetro se diferencien modularmente en menos de 0,1 kg.

Solución:

Evidentemente un tamaño de muestra no puede ser fraccionario por lo que se debe aproximar por exceso. El tamaño de muestra sería de 97.

Si la varianza de la población es desconocida, que es lo que mas frecuente se ve en la práctica el tratamiento será diferente, no es posible encontrar una fórmula cuando la varianza poblacional es desconocida por lo que para ello aconsejamos utilizar el siguiente procedimiento-

Primeramente, se toma una pequeña muestra, que se le llama muestra piloto, con ella se

estima la varianza poblacional ( ) y con este valor se evalúa en la formula (1),

sustituyendo ( ) por su estimación ( ). El valor de obtenido será aproximadamente el valor necesario, nuevamente con ese valor de se extrae una muestra de este tamaño de la población se le determina la varianza a esa muestra, como una segunda estimación de (

) y se aplica de nuevo la formula (1), tomando la muestra con el obtenido como muestra piloto para la siguiente iteración, se llegará a cumplir con las restricciones

prefijadas. Se puede plantear esta afirmación ya que la de tiende a estabilizarse a

medida que aumenta alrededor de la por lo que llegará el momento en que se encuentre el tamaño de muestra conveniente, sin embargo, en la práctica es mucho más sencillo pues, a lo sumo con tres iteraciones se obtiene el tamaño de muestra deseado, este

Page 91: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

90 

procedimiento para obtener el tamaño de muestra deseado se puede realizar utilizando en Microsoft Excel en la opción análisis de datos las opciones estadística descriptiva para ir hallando la varianza de cada una de las muestras y la opción muestra para ir determinado las muestras pilotos. Para obtener el tamaño de la muestra utilizando este método recomendamos la utilización de un paquete de computo como por ejemplo el Microsoft Excel, aplicando las opciones muestra y estadística descriptiva.

Para determinar el tamaño de la muestra cuando los datos son cualitativos es decir para el análisis de fenómenos sociales o cuando se utilizan escalas nominales para verificar la ausencia o presencia del fenómeno a estudiar, se recomienda la utilización de la siguiente formula:

(2)

Siendo

sabiendo que:

es la varianza de la población respecto a determinadas variables.

es la varianza de la muestra, la cual podrá determinarse en términos de

probabilidad como

es error estandar que está dado por la diferencia entre ( ) la media poblacional y la media muestral.

es el error estandar al cuadrado, que nos servirá para determinar ,

por lo que = es la varianza poblacional.

Ejemplo 1.3

De una población de 1 176 adolescentes de una ciudad X se desea conocer la aceptación por los programas humorísticos televisivos y para ello se desea tomar una muestra por lo que se necesita saber la cantidad de adolescentes que deben entrevistar para tener una información adecuada con error estandar menor de 0.015 al 90 % de confiabilidad.

Solución:

= 1 176

= 0,015

Page 92: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

91 

por lo que

Es decir para realizar la investigación se necesita una muestra de al menos 298 adolescentes.

Muestreo Estratificado:

El pasado ejemplo corresponde a una muestra probabilística simple. Determinamos en este caso que el tamaño de muestra sería n =298 adolescentes muestreados. Pero supongamos que la situación se complica y que esta n la tendremos que estratificar a fin de que los elementos muestrales o unidad de análisis posean un determinado atributo. En nuestro ejemplo este tributo es los diferentes canales de televisión. Es decir, cuando no basta que cada uno de los elementos muestrales tengan la misma probabilidad de ser escogidos, sino que además es necesario estratificar la muestra en relación a estratos o categorías que se presentan en la población y que aparte son relevantes para los objetivos del estudio, se diseña una muestra probabilística estratificada. Lo que aquí se hace es dividir a la población en subpoblaciones o estratos y se selecciona la muestra para cada estrato. La estratificación aumenta la precisión de la muestra e implica el uso deliberado de diferentes tamaños de muestra para cada estrato, " a fin de lograr reducir la varianza de cada unidad muestral " (Kish, 1965 ), en su libro de muestreo que en un número

determinado de elementos muestrales n = la varianza de la media muestral puede reducirse al mínimo si el tamaño de la muestra para cada estrato es proporcional a la desviación estándar dentro del estrato.

Esto es,

(3 )

En donde es la fracción del estrato, el tamaño de la muestra, el tamaño de la población, es la desviación estándar de cada elemento del estrato , y es una proporción constante que nos dará como resultado una óptima para cada estrato.

Siguiendo nuestro ejemplo de los adolescentes tenemos que la población es de 1176 adolescentes y que el tamaño de la muestra es = 298. la fracción para cada estrato fh será :

(4)

De manera que el total de la subpoblación se multiplicará por esta fracción constante a fin de obtener el tamaño de muestra para el estrato. Sustituyendo tenemos que:

Page 93: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

92 

(5)

MUESTRA PROBABILÍSTICA ESRTRATIFICADA DE LA ACEPTACIÓN DE ADOLESCENTES POR LOS PROGRAMAS HUMORÍSTICOS TELEVISIVOS DE LA CIUDAD X.

Estratos Repartos de la ciudad X Total población*

(fh) = 0.2534

Muestra

Nh (fh) = nh

1

53 13

2

109

3

215 55

4

87 22

5

98 25

6

110 28

7

81 20

8

221 56

9

151 38

10

51 13

= 1176

Por ejemplo :

= 53 directores de empresas extractivas corresponde a la población total de este giro.

= 0.2534 es la fracción constante.

= 13 es el número redondeado de directores de empresa del giro Estractivo que tendrán que entrevistarse.

MUESTREO PROBABILÍSTICO POR RACIMOS:

En algunos casos en donde el investigador se ve limitado por recursos financieros, por tiempo, por distancias geográficas o por una combinación de estos y otros obstáculos, se

Page 94: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

93 

recurre a otra modalidad de muestreo llamado por racimos. En este tipo de muestreo se reducen costos, tiempo y energía al considerar que muchas veces nuestras unidades de análisis se encuentran encapsuladas o encerradas en determinados lugares físicos o geográficos que denominamos racimos. Para dar algunos ejemplos tenemos la tabla 8.3., en donde en la primera columna se encuentran unidades de análisis que frecuentemente vamos a estudiar en ciencias sociales. En la segunda columna, sugerimos posibles racimos en donde se encuentran dichos elementos.

EJEMPLOS DE RACIMOS

Unidad de Análisis Posibles Racimos

Adolescentes Preparatorias

Obreros Industrias

Amas de casa Mercados

Niños Colegios

Personajes de televisión Programas de televisión

El muestrear por racimos implica diferencias entre la unidad de análisis y la unidad muestral. La unidad de análisis - como lo indicamos al principio de este capítulo – se refiere a quiénes van a ser medidos, o sea , el sujeto o sujetos a quienes en última instancia vamos a aplicar el instrumento de medición . la unidad muestral – en este tipo de muestra – se refiere al racimo a través del cual se logra el acceso a la unidad de análisis. El muestreo por racimos supone una selección en dos etapas, ambas con procedimientos probabilísticos. En la primera, se seleccionan los racimos, siguiendo los ya reseñados pasos de una muestra probabilística simple o estratificada. En la segunda, y dentro de estos racimos se seleccionan a los sujetos u objetos que van a ser medidos. Para ello se hace una selección que asegure que todos los elementos del racimo tienen la misma probabilidad de ser elegidos. A continuación daremos un ejemplo que comprenda varios de los procedimientos descritos hasta ahora y que ilustra la manera como frecuentemente se hace una muestra probabilística en varias etapas.

EJEMPLO

¿Cómo hacer una muestra probabilística estratificada y por racimos?

Problema de investigación: Una estación de radio local necesita saber con precisión – a fin de planear sus estrategias – cómo usan la radio los adultos de una ciudad de 2 500 000 habitantes. Es decir, qué tanto radio escuchan, a qué horas, qué contenidos prefieren y sus opiniones con respecto a los programas noticiosos.

Procedimientos: Se diseñará un cuestionario que indague estas áreas sobre uso del radio. Los cuestionarios se aplicarán por entrevistadores a una muestra de sujetos adultos.

Población: Todos aquellos sujetos – hombres o mujeres – de más de 21 años de edad, y que vivan en una casa o departamento propio o rentado de la ciudad X.

Diseño por conglomerado: los directivos de la estación de radio desconocen el número total de sujetos con las características arriba señaladas. Sin embargo, nos piden que diseñemos una muestra que abarque a todos los sujetos adultos de la ciudad, adultos por edad cronológica y por ser jefes de familia , es decir, excluye a los adultos dependientes. Se recurre entonces a la estrategia de seleccionar conglomerados y se considera el uso de un mapa actualizado de la ciudad y que demuestra que en dicha ciudad hay 5 000 cuadras.

Page 95: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

94 

Las cuadras se utilizan como conglomerados, es decir, como unidades muestrales a partir de las cuales obtendremos en última instancia a nuestros sujetos adultos. Lo primero entonces es determinar ¿Cuántas cuadras necesitaremos muestrear, de una población de una población total de 5 000 cuadras, si queremos que nuestro error estándar sea no mayor de 0.15 y con una probabilidad de ocurrencia del 50 % ?.

Tenemos entonces que para una muestra probabilística simple. (6)

Necesitaremos una muestra de 909 cuadras de ciudad X para estimar los valores de la población con una probabilidad de error menor a 0.1 .

Sabemos que la población N = 5 000 cuadras de la ciudad, está dividida por previos estudios de acuerdo a 4 estratos socioeconómicos , que categorizar las 5 000 cuadras según el ingreso mensual promedio de sus habitantes de manera que se distribuyen como sigue :

Estrato Número de cuadras

1 270

2 1940

3 2000

4 790

T = 5 000

• Estratificación de la muestra:

¿ Cómo distribuiremos los 909 elementos muestrales de , para optimizar nuestra muestra , de acuerdo a la distribución de la población en los 4 estratos socioeconómicos?.

Page 96: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

95 

Estrato No. de cuadras fh = 0.1818

1 270 (0.1818 ) 50

2 1940 (0.1818 ) 353

3 2000 (0.1818 ) 363

4 790 (0.1818 ) 143

N = 5000 n = 909

Tenemos que en principio, de 5000 cuadras de la ciudad se seleccionarán 50 del estrato 1, 553 del estrato 2, 363 del estrato 3 y 143 del estrato 4. Esta comprende la selección de los conglomerados, los cuales se pueden numerar y elegir aleatoriamente hasta completar el número de cada estrato. En una última etapa se seleccionan a los sujetos dentro de cada conglomerado. Este procedimiento también se hace de manera aleatoria, hasta lograr un número de sujetos determinados en cada conglomerado.

Estrato Nh cuadras Nh número de hogares – sujeto en cada cuadra

Total de hogares por estrato

1 270 50 20 1000

2 1940 353 20 7060

3 2000 363 20 7220

4 790 143 20 2860

N = 5000 n = 909 11840

Nota: El procedimiento para realizar el muestreo en cada conglomerado se hace de forma aleatoria utilizando la tabla de números aleatorios o mediante Microsoft Excel tal como se explico en el ejemplo (1.1)

INTERVALO DE CONFIANZA Se llama intervalo de confianza en estadística a un intervalo de valores alrededor de un parámetro muestral en los que, con una probabilidad o nivel de confianza determinado, se situará el parámetro poblacional a estimar. Si α es el error aleatorio que se quiere cometer, la probabilidad será de 1 − α. A menor nivel de confianza el intervalo será más preciso, pero se cometerá un mayor error.

Para comprender las siguientes fórmulas, es necesario conocer los conceptos de variabilidad del parámetro, error, nivel de confianza, valor crítico y valor α (véase Estimación por intervalos).

Page 97: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

96 

Un intervalo de confianza es, pues, una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el parámetro a estimar. Este intervalo contiene al parámetro estimado con una determinada certeza o nivel de confianza 1-α.

Al ofrecer un intervalo de confianza se da por supuesto que los datos poblacionales se distribuyen de un modo determinado. Es habitual que lo hagan mediante la distribución normal. La construcción de intervalos de confianza se realiza usando la desigualdad de Chebyshev

CAPITULO 7: ESTADISTICA INFERENCIAL

7.1 INTRODUCCIÓN

Es evidente que un conocimiento previo por parte del investigador de las características de la realidad de la población mejora o debe mejorar los resultados inferenciales que se pueden obtener de la obtención de una muestra; parece claro que si bien el método de selección aleatoria conlleva los mejores resultados, quizá el adecuar la manera de extraer la muestra a las posibles distintas naturalezas de las poblaciones puede mejorar el rendimiento, aunque sólo fuere a nivel de costos. No es por tanto lo mismo intentar conocer la altura media de los habitantes de un país, que el número de errores en una gran contabilidad, dado que la naturaleza de su universo y por tanto el comportamiento poblacional son distintos. Es por ello, que para distintas "naturalezas" del problema han de plantearse distintas soluciones, si bien todas, o casi todas, pasan por la aleatoriedad; de ahí que se establezcan diversas "técnicas" o "métodos" de muestreo, de los que brevemente enumeramos algunos.

El objetivo de la estadística inferencial es obtener la información acerca de una población, partiendo de la información que contiene una muestra. El proceso que se sigue para seleccionar una muestra se denomina Muestreo.

Las ventajas que nos brinde el muestreo son:

- Los operativos son menores. - Posibilita analizar un mayor número de variables. - Permite controlar las variables en estudio.

7.2 TIPOS DE MUESTREO

- Muestreo Probabilístico: Cuando el muestreo o proceso para seleccionar una muestra es aleatorio. Así definimos una muestra probabilística a una muestra extraída de una población de tal manera que todo elemento de la población conocida pueda ser incluida en la muestra. Puede ser a su vez:

A. MUESTREO ALEATORIO SIMPLE: (M.A.S.): Es aquel muestreo aleatorio en el que la probabilidad de que un elemento resulte seleccionado se mantiene constante a lo largo de todo el proceso de obtención de la misma. La técnica del muestreo puede asimilarse a un modelo de extracción de bolas de una urna con devolución (reemplazamiento) de la bola extraída. Un mismo dato puede, en consecuencia, resultar muestreado más de

Page 98: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

97 

una vez. Cada elección no depender de las anteriores y, por tanto, los datos muestrales serán estocásticamente independientes.

B. MUESTREO ALEATORIO SISTEMÁTICO. Esta técnica consiste en extraer elementos de la población mediante una regla sistematizadora que previamente hemos creado (sencillamente cada K elementos). Así; numerada la población, se elige (aleatoriamente) un primer elemento base, partiendo de éste se aplica la regla para conseguir los demás hasta conseguir el tamaño muestral adecuado. Este procedimiento conlleva el riesgo de dar resultados sesgados si en la población se dan periodicidades o rachas.

C. MUESTREO ALEATORIO ESTRATIFICADO: Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen una gran homogeneidad interna (poca varianza interna) y no obstante son heterogéneos entre sí (mucha varianza entre estratos). La muestra se distribuye (se extrae de) entre los estratos predeterminados según la naturaleza de la población (ejemplo: sexo, lugar geográfico, etc.). Dicha distribución-reparto de la muestra se denomina afijación ; que puede ser de varias formas : - Afijación simple: a cada estrato le corresponde igual número de elementos

(extracciones) muestrales. - Afijación proporcional: La distribución se hace de acuerdo con el peso (tamaño)

relativo de cada estrato. - Afijación óptima: Se tiene en cuenta la previsible dispersión de los resultados, de

modo que se considera la proporción y la desviación típica. D. MUESTREO POR CONGLOMERADOS: La unidad muestral es un grupo de elementos

de la población que forman previsiblemente una unidad de comportamiento representativo. Dicha unidad es el conglomerado cuyo comportamiento interno puede ser muy disperso (varianza grande) pero que presumiblemente poseerá un comportamiento próximo a otros conglomerados (varianza entre conglomerados, pequeña). Los conglomerados se estudian en profundidad hasta conseguir el tamaño muestral adecuado.

E. OTROS TIPOS DE MUESTREO. Es evidente que los planteados no son las únicas técnicas de muestreo. Existen otras como las no aleatorias: Cuotas, Intencional, Incidental, bola de nieve, etc. Y otras aleatorias y complicadas como el muestreo por superpoblaciones, y que en este curso no podemos desarrollar.

7.3 ESTIMACION DE INTERVALO

La "estimación por intervalo" consiste en determinar un par de valores a y b, tales que constituidos en intervalo [a ,b] ; y para una probabilidad 1-α prefijada (nivel de confianza) se verifique en relación al parámetro θ a estimar se cumpla:

αϑ −=∈ 1]),[( baP ó en otros términos: αϑ −=≤≤ 1)( baP .

Podemos considerar el nivel de confianza (1-α ) que hemos prefijado para la expresión anterior como la probabilidad que existe (antes de tomar la muestra) de que el intervalo a

Page 99: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

98 

construir a partir de la muestra incluya el verdadero valor del parámetro a estimar. Refleja la "confianza" en la "construcción" del intervalo y de que éste tras concretar la muestra contendrá el valor a estimar. De ahí que en términos numéricos dicho nivel o probabilidad haya de tomar un valor alto (0.9, 0.95, 0.99).

Evidentemente el complementario al nivel de confianza; es decir α, nivel de significación supondrá las probabilidades de cometer el error de no dar por incluido el verdadero valor del parámetro a estimar en un intervalo en el que realmente si está. De ahí y dado que se trata de un error posible a cometer, su cuantificación en términos de probabilidad sea muy pequeña (0.1, 0.05, 0.005,..).

En relación a lo anterior. Obviamente, cuanto mayor sea el nivel de confianza prefijado la amplitud del intervalo de estimación será también mayor y por tanto la estimación será menos precisa.

La siguiente tabla presenta las diferentes fórmulas que ayudaran a crear los intervalos.

Para la distribución Normal utilice la siguiente tabla:

Page 100: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

99 

Nivel de confianza

α α/2 2

αZ

90% 0.1 0.05 1.645 95% 0.05 0.025 1.96 99% 0.01 0.005 2.576

Ejemplo Nº 001

En población cuya distribución se desconoce se obtiene una muestra (m.a.s.) de 2000 valores de la que resulta una media de 225 y una desviación típica de 10. Suponiendo que la varianza muestral coincide con la poblacional, estimar un intervalo para la media de la población con un nivel de confianza del 95%.

Tendríamos 1-α =0.95 luego α =0.05; S=10=σ (muestra grande n>30); n=2000, para una población normal.

95.0)(22

=+≤≤−n

Zxun

ZxP σσαα

el resultado sería : µ ∈ [224,56 , 225,44] con el 95 % de confianza.

Ejemplo Nº 002

Las ventas diarias de cierta oficina comercial se supone que siguen una distribución normal. Para estimar el volumen medio de ventas por día se realiza una muestra de 10 días escogidos al azar, resultando que la media de las ventas de esos 10 días es S/. 100 con una desviación típica de S/. 4. Dar un intervalo de estimación para el volumen medio de ventas por día con una confianza del 95 %.

Conocemos que según la información que poseemos, estamos ante: Distribución normal; n=10 (muestra pequeña); S=4(poblacional desconocida); media muestral=100;

Para 1-α =0.95, luego α =0.05 con lo que 26.2)9(2

=gltα (según tabla T)

95.0)(22

=+≤≤−n

Stxun

StxP αα

El resultado sería: µ ∈ [S/.96,99 ; S/.103,01] con el 95 % de confianza.

Ejemplo Nº 003

Se quiere obtener un intervalo de confianza para el valor de las ventas medias por hora que se producen en un kiosco. Para ello realizamos una muestra consistente en elegir al azar las ventas que se realizaron durante 1000 horas distintas; muestra cuyos resultados fueron: ventas medias por hora S/. 4000, y varianza de dicha muestra S2/. 4000. Obtener dicho intervalo con un nivel de confianza del 95.5 %.

Queremos construir un intervalo para la media con las siguientes características:

Page 101: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

100 

Tamaño muestral=n=1000, con muestreo aleatorio simple, la población no es normal ni conocemos su varianza.

El resultado de la muestra es 4000=x , S2=4000.

Si bien se trata de un intervalo para la media con varianza desconocida y población no normal, dado que el tamaño muestral es grande podemos suponer normalidad y tomar como varianza poblacional a la muestral así:

95.0)(22

=+≤≤−n

zxun

zxP σσαα

El resultado sería: µ ∈ [S/.399,08 ; S/.4003,92] con el 95 % de confianza.

7.4 DETERMINACION DEL TAMAÑO DE LA MUESTRA

Cuando se necesita información para realizar estudios con datos estadísticos y no se puede contar un censo, porque es muy caro, o porque demora mucho o no se cuenta con el personal adecuado; entonces será necesario obtener una muestra, ahora. Pero viene la pregunta: ¿cuál será el número adecuado mínimo del tamaño de la muestra? En principio existe todo un proceso para obtener una muestra representativa de la población. Si el método es aleatorio o probabilístico, entonces el número adecuado de los elementos de la muestra, se pueden calcular usando las siguientes fórmulas.

1. CUANDO EL ESTUDIO ES DE CARÁCTER CUALITATIVO a. Cuando se supone que N es muy grande o cuando el muestreo es con reposición:

2

2

EPQZn α=

b. Cuando la población es finita (se conoce N) o el muestro es sin reposición.

PQZENPQNZn 22

2

)1( α

α

+−=

Donde:

P=Proporción de éxito; que se conoce por estudios anteriores o similares.

Q=(1-P). Proporción de fracaso.

Zα=Valor que se obtiene de la distribución normal, para un nivel de significación a. Generalmente se toma:

Z=1.96 para un nivel de significancia del 5%.

Z=2.575 para un nivel de significancia del 1%.

E=Error de estimación. Valor que lo determina el investigador. Se sugiere valores en torno al 5%.

N= Número de los elementos de la población.

Page 102: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

101 

Nota:

Si no se conoce P, se puede adoptar las siguientes decisiones:

i) Tomar una muestra piloto y calcular el valor de P. ii) Considerar el valor de P=0.5, lo cual dará el número de elementos de la muestra

el mayor posible. iii)

2. CUANDO EL ESTUDIO ES DE CARÁCTER CUANTITATIVO a) Cuando no se conoce el tamaño N de la población o éste es infinito:

2

22

EZn σα=

b) Cuando el tamaño N de la población es finito:

222

22

)1( σσ

α

α

ZENNZn

+−=

Ejemplos Nº 004

Se van a realizar un gran y desconocido número de ensayos para calibrar la resistencia media a la rotura de un determinado azulejo en una partida de 10 000,000 unidades. Si deseamos cometer un error inferior a 10 kg/cm2, y por ensayos anteriores conocemos que la varianza en la rotura ha sido de 40 (kg/cm2)2, ¿Qué número de ensayos hemos de realizar si hemos decidido trabajar con un nivel de confianza del 95%?

Si suponemos un gran número de ensayos, suponemos, también, que el tamaño muestral es grande, por lo que podemos establecer normalidad. Los datos serian los siguientes: α=95%, E2=10 kg/cm2, σ2=40(kg/cm2)2.

Utilizando la fórmula siguiente: 2

22

EZn σα= , tenemos:

1536.1510

)40)(96.1( 2

≈==n muestras de azulejos.

Ejemplo Nº 005

Para conocer la valoración en forma de porcentaje de aceptación hacia un determinado profesor decidimos encuestar a un determinado número de sus 100 alumnos. Calcular dicho número, si el error que estamos dispuestos a admitir es del más menos 3% y trabajamos con un nivel de confianza del 95%.

Tenemos los siguientes datos:

N=100, E=3%, α=95%, p=0.5. q=1-p=0.5

Utilizando la fórmula tenemos:

Page 103: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

102 

9151.91)5.0)(5.0()96.1()03.0)(1100(

)5.0)(5.0()96.1)(100()1( 22

2

22

2

≡=+−

=+−

=PQZEN

PQNZnα

α alumnos.

Ejemplo Nº 006

Para conocer la valoración en forma de porcentaje de aceptación hacia un determinado profesor decidimos encuestar a un determinado número de sus 100 alumnos. Calcular dicho número, si el error que estamos dispuestos a admitir es del más menos 3% y trabajamos con un nivel de confianza del 95%.

El tamaño de la población es pequeño con Ν=100, Ε=3%, α=95%, p=0,5 q=1-p=0.5.

Utilizando la fórmula tenemos:

9151.91)5.0)(5.0()96.1()03.0)(1100(

)5.0)(5.0()96.1)(100()1( 22

2

22

2

≡=+−

=+−

=PQZEN

PQNZnα

α alumnos.

7.5 CONSTRASTE DE HIPÓTESIS

El problema del contraste de hipótesis consiste básicamente en comprobar cotejar, decidir, en definitiva, sobre la veracidad de una hipótesis prefijada previamente como supuestamente cierta. En términos estadísticos, la o las hipótesis que formulamos lo serán lógicamente sobre la población. Bien afectando a algún parámetro de ésta, lo que da origen a los contrastes paramétricos o bien a otras características de la mismas que no lo sean estrictamente, lo que origina contrates "no" paramétricos.

La solución estadística del problema de contrastación se basará en los datos muestrales y la base estadística (probabilística) de la que arrancará el contraste, de algún estadístico muestral.

Pasemos a definir los principales conceptos implicados en nuestro problema:

Región crítica: Será aquella región del campo de variación del estadístico tal que si contiene al valor evaluado del mismo con los datos muestrales nos llevará a rechazar la hipótesis. La designaremos por R1

Región de aceptación: Es la región complementaria de la anterior. Si el valor evaluado del estadístico pertenece a ella No rechazamos la hipótesis (las hipótesis nunca se aceptan de forma definitiva, sólo se aceptan provisionalmente, es decir, no se rechazan, a la espera de una nueva información que eventualmente pueda llevarnos a rechazarla en el futuro). La designaremos por R0. Evidentemente los conjuntos de puntos que forman ambas regiones son disjuntos.

Una hipótesis estadística (paramétrica): Es una conjetura sobre el valor concreto que tiene en realidad. El establecer una hipótesis sobre un parámetro θ, supone dividir los posibles valores del parámetro en dos grupos disjuntos tales que unos son hipotéticamente ciertos (θ0) y los otros (θ1) no lo son. A la hipótesis que se desea contrastar se la denomina "hipótesis nula", siendo, por tanto, el valor o valores θ� que hipotéticamente consideramos reales, dicha hipótesis viene

Page 104: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

103 

expresada como H0. Alternativamente y consecuentemente se establece la denominada "hipótesis alternativa" (H1) compuesta ésta por el valor o valores θ1 que en consecuencia de la elección y de la complementariedad de los de la hipótesis nula, son los que, en principio, no consideramos cómo hipotéticamente reales.

El hecho de que las hipótesis, tanto la nula cómo la alternativa puedan recoger en sus planteamientos uno o varios valores, da lugar a hipótesis de carácter simple, si el número de valores plausibles e hipotéticos es de uno en ambas, o bien a hipótesis compuestas si dicho valor no es único en alguna de ellas.

Teniendo en cuenta lo dicho anteriormente, el problema de rechazar o aceptar una hipótesis puede plantearse como un problema de decisión, en el que evidentemente existe la posibilidad de fracasar o acertar en la elección o decisión a la hora de concluir que la hipótesis, bien nula o bien alternativa, son rechazables o no.

El problema de decisión: rechazo/no rechazo, vendría expresado en las siguientes opciones en forma de tabla:

Hipótesis/Acción No Rechazamos

Rechazamos

Es cierta Correcto Error Tipo I Es falsa Error Tipo II Correcto

• Si la hipótesis nula (H0) es cierta y nuestra decisión es no rechazarla, la decisión ha sido correcta.

• Si la hipótesis nula (H0) es cierta y nuestra decisión es rechazarla, la decisión provoca un error. Dicho error se denomina error tipo I.

• Si la hipótesis nula (H0) es falsa y nuestra decisión es no rechazarla, la decisión provoca un error. Dicho error se denomina error tipo II.

• Si la hipótesis nula (H0) es falsa y nuestra decisión es rechazarla, la decisión ha sido correcta.

Ejemplo 007:

Enunciado 1:

La altura del estudiante de la Universidad Nacional de Tumbes es 1,65 m.

Planteando las Hipótesis tenemos:

H0: μ=1.65

H1: μ>1.65, μ<1.65 � μ ≠ 1.65

Enunciado 2:

El promedio ponderado de los alumnos de la Escuela de contabilidad de la Universidad Nacional de Tumbes es 13.5.

Planteando las Hipótesis tenemos:

Page 105: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

104 

H0: μ=13.5

H1: μ>13.5, μ<13.5 � μ ≠ 13.5

Enunciado 3:

El porcentaje de alumnos de escuelas de la Región que tienen caries es mayor que 0.7. Planteando las Hipótesis tenemos:

H0: p ≥ 0.7

H1: p<0.7

PRUEBA UNILATERALES Y BILATERALES

Dependiendo de cómo se formulen H0 y H1, las pruebas pueden ser:

a) Pruebas Unilaterales o de una cola: Que puede ser: - Prueba de cola inferior o de lado izquierdo: cuyo caso la hipótesis en general toma la

siguiente forma: Ho: θ=θ0, Η1: θ<θ0

Donde θ es el parámetro de la población estadística sobre la cual se esta haciendo la prueba de hipótesis.

Ejemplo:

1) H0: μ=1.65

H1: μ<1.65

2) H0: μ=13.5

H1: μ<13.5

- Prueba de cola superior o de lado derecho: cuyo caso la hipótesis en general toma la siguiente forma: Ho: θ=θ0, H1: θ>θ0

Donde θ es el parámetro de la población estadística sobre la cual se esta haciendo la prueba de hipótesis.

Ejemplo 008:

1) H0: μ=1.65

H1: μ>1.65

2) H0: μ=13.5

Page 106: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

105 

H1: μ>13.5

b) Pruebas de dos colas o bilateral: Que puede ser: Ho: θ=θ0, H1: θ ≠ θ0

Ejemplo 009:

1) H0: μ=1.65

H1: μ ≠ 1.65

2) H0: μ=13.5

H1: μ ≠ 13.5

PROCEDIMIENTO PARA UNA PRUEBA DE HIPOTESIS

Los pasos a seguir son:

1. Formular la hipótesis nula H0 y la alternativa H1, de acuerdo al problema. 2. Escoger un nivel de significación o riesgos α. 3. Elegir la estadística de prueba apropiada, cuya distribución por muestreo sea

conocida en el supuesto de que Ho es cierta. 4. En base a α y H1, determinar el valor (o los valores) críticos y con ello se establecen

las regiones de aceptación o rechazo. 5. Calcular los valores de la prueba estadística a partir de una muestra aleatoria de

tamaño n, Ho y reemplazarlos en la estadística de prueba elegida en el paso 3, para hallar el valor experimental.

6. Tomar la decisión de aceptar Ho si el valor experimental cae en la región de aceptación y rechazarla si dicho valor cae en la región crítica o de rechazo.

7. Opcional: Si se rechaza H0, se puede hallar un intervalo de confianza para el parámetro de interés.

PRUEBA DE HIPOTESIS SOBRE LA MEDIA POBLACIONAL

Caso A: Cuando la varianza poblacional es conocida.

Deseamos contrastar la hipótesis de que el parámetro poblacional θ = μ toma un determinado valor μ=0 . Conocemos que la población se distribuye normalmente y conocemos también su varianza , o bien si nos es desconocida, el tamaño muestral es lo suficientemente grande cómo para poder utilizar la muestral cómo poblacional.

Hemos determinado un nivel de significación para la realización del contraste y vamos a plantearlo en el supuesto de realizar una muestra aleatoria de tamaño n.

Así: conocemos que ⎥⎦⎤

⎢⎣⎡⇒

nuNx σ, de lo que deducimos que ]1,0[N

n

ux⇒

−σ

de forma

que la hipótesis nula es: H0: μ=μ0.

Page 107: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

106 

El estadístico está dado por:

n

uxZ σ0−

= .

Ejemplo:

De 100 observaciones de una población normal se obtiene que x = 5 y que S=2.Contrastar con un nivel de significación del 5% la hipótesis de que la media de la población sea 7.

Aplicando el procedimiento para probar una hipótesis tenemos:

1. H0: μ0=7 H1: μ0 ≠ 7

2. El nivel de significancia es del 5%. (α=5%)

3. n

uxZ σ0−

=

4. Establecemos la región de aceptación y de rechazo:

5. Realizamos la prueba estadística: 10100

275

−=−

=Z

6. Dado que Z=-10 y no pertenece a la región de aceptación estamos en condiciones de rechazar la hipótesis nula, luego aceptar la alternativa : μ0 ≠ 7.

Ejemplo Nº 010

Un empresario está considerando la posibilidad de ampliar su negocio mediante la adquisición de un pequeño bar. El dueño actual del bar afirma que el ingreso diario del establecimiento sigue una distribución normal de media 675 soles y una desviación estándar de 75 soles. Para comprobar si decía la verdad, tomó una muestra de treinta días y ésta reveló un ingreso diario promedio de 625 soles. Utilizando un nivel de significación del 10 %. ¿Hay evidencia de que el ingreso diario promedio sea menor del que afirma el presente dueño?.

Aplicando el procedimiento para probar una hipótesis tenemos:

Page 108: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

107 

1. Η0: μ0 ≥ 675 Η1: μ0<675

2. El nivel de significancia es del 10%. (α=10%)

3. n

uxZ σ0−

=

4. Establecemos la región de aceptación y de rechazo:

5. Realizamos la prueba estadística: 65.330

75675625

−=−

=Z

6. Dado que Z=-3.65 y no pertenece a la región de aceptación estamos en condiciones de rechazar la hipótesis nula, luego aceptar la alternativa: μ0<7.

Caso B: Cuando no se conoce la varianza poblacional y para una muestra pequeña.

Deseamos contrastar la hipótesis de que el parámetro poblacional θ = μ toma un determinado valor μ=0 . Desconocemos la varianza de la población y, dado que el tamaño muestral es pequeño, no podemos utilizar la muestral en su lugar.

Hemos determinado un nivel de significación para la realización del contraste y vamos a plantearlo en el supuesto de realizar una muestra aleatoria de tamaño n.

Así: conocemos que 1−⇒−

ntn

sux de forma que la hipótesis nula es: H0: μ=μ0.

El estadístico está dado por:

ns

uxt 0−= .

Ejemplo 011.

Se escoge a 17 individuos al azar y se les mide, resultando que su estatura media es de 1,71 metros con desviación típica de 0,02 .Contrastar la hipótesis de que la estatura media nacional sea de 1.75 metros si utilizamos un nivel del significación del 5%. Se supone normalidad

Aplicando el procedimiento para probar una hipótesis tenemos:

Page 109: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

108 

1. H0: μ0=1.75 Η1: μ0 ≠ 1.75

2. El nivel de significancia es del 5%. (α=5%).

3. n

suxt 0−

=

4. Establecemos la región de aceptación y de rechazo: Utilizamos la tabla T.

5. Realizamos la prueba estadística: 25.817

02.075.171.1

−=−

=t

6. Dado que t=-8.25 y no pertenece a la región de aceptación estamos en condiciones de rechazar la hipótesis nula, luego aceptar la alternativa: μ0=1.75.

PRUEBA DE HIPOTESIS PARA LA PROPORCIÓN POBLACIONAL: p

Se trata de efectuar una prueba de hipótesis acerca de la proporción de elementos con cierto atributo en una población, hipótesis de la forma:

H0: p=p0.

H1: p ≠ p0.

H0: p ≤ p0.

H1: p>p0.

H0: p ≥ p0.

H1: p<p0.

Page 110: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

109 

El estadístico está dado por:

npp

pPZ)1( 00

0

−−

=

Donde nxP = (proporción muestral)

Tiene una distribución N(0,1) cuando n ≥ 30.

Ejemplo 012.

Una empresa de publicidad desea comprobar si un determinado programa de televisión es visto por el 30% de la audiencia potencial. Para ello se escoge al azar una muestra de 200 familias resultando que de ellas 50 lo ven asiduamente. Contrastar la hipótesis con un nivel de significación del 5%.

Aplicando el procedimiento para probar una hipótesis tenemos:

1. H0: p=0.3 H1: p ≠ 0.30

2. El nivel de significancia es del 5%. (α=5%).

3.

npp

pPZ)1( 00

0

−−

=

4. Establecemos la región de aceptación y de rechazo:

5. Realizamos la prueba estadística:

25.020050

==P

Page 111: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

110 

54.1

200)3.01(3.0

30.025.0)1( 00

0 −=−

−=

−−

=

npp

pPZ

6. Dado que Z=-1.54 y pertenece a la región de aceptación estamos en condiciones de acepta la hipótesis nula, es decir: p=0,3

Ejemplo 013

Un fabricante de refrescos sin burbujas desea sacar al mercado una variedad de su producto que tenga burbujas. Su director comercial opina que al menos el 50 % de los consumidores verá con buenos ojos la innovación. Se realiza un sondeo de mercado y resulta que de 100 consumidores encuestados 40 son favorables a la innovación.

a) Contrastar la hipótesis del director comercial frente a la alternativa de que el % de aceptación es inferior, con un nivel de significación del 1%.

b) Si el aceptable la hipótesis de que el % de aceptación del nuevo producto es inferior o igual al 30 % el fabricante decidirá no fabricarlo. Si es aceptable el criterio del director comercial entonces sí fabricarán el refresco con burbujas. Y si ninguna de las 2 hipótesis es aceptable procederán a hacer otro sondeo. Para tomar esta decisión trabajarán con un nivel de significación del 5 %. ¿ Por qué optarán?

Para el punto a)

Aplicando el procedimiento para probar una hipótesis tenemos:

1. H0: p ≤ 0.5 H1: p>0.5

2. El nivel de significancia es del 1%. (α=1%).

3.

npp

pPZ)1( 00

0

−−

=

4. Establecemos la región de aceptación y de rechazo:

Page 112: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

111 

5. Realizamos la prueba estadística:

4.010040

==P

2

100)5.01(5.0

5.04.0)1( 00

0 −=−

−=

−−

=

npp

pPZ

6. Dado que Z=-2 y pertenece a la región de aceptación estamos en condiciones de aceptar la hipótesis nula, es decir: p ≤ 0,5.

Para el punto b)

Aplicando el procedimiento para probar una hipótesis tenemos:

1. H0: p ≤ 0.3 H1: p>0.3

2. El nivel de significancia es del 1%. (α=1%).

3.

npp

pPZ)1( 00

0

−−

=

4. Establecemos la región de aceptación y de rechazo:

Page 113: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

112 

5. Realizamos la prueba estadística:

4.010040

==P

18.2

100)3.01(3.0

3.04.0)1( 00

0 =−

−=

−−

=

npp

pPZ

6. Dado que Z=2.18 y pertenece a la región de aceptación estamos en condiciones de aceptar la hipótesis nula, es decir: p ≤ 0,3. Por lo tanto se recomiendo no fabricar el refresco.

ESTIMACIÓN DE UNA DIFERENCIA ENTRE DOS MEDIAS DE POBLACIONES NORMALES (Población 1 y 2)

Para encontrar el intervalo de la diferencia de la media de dos poblaciones se considera que las muestras tomadas de las poblaciones son independientes.

SI SE CONOCE LAS DESVIACIONES ESTÁNDAR POBLACIONALES ( 1σ Y 2σ ).

El intervalo de ( )%1100 α− , resulta ser:

Límite inferior: ( )2

22

1

21

21 nnzxx tabla

σσ+•−− ;

Límite superior: ( )2

22

1

21

21 nnzxx tabla

σσ+•+−

Donde:

Page 114: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

113 

1n : es el tamaño de la muestra tomada de la población 1

1n : es el tamaño de la muestra tomada de la población 2

1x : es la media de la muestra tomada de la población 1

2x : es la media de la muestra tomada de la población 2

1σ : es la desviación estándar de la población 1

2σ : es la desviación estándar de la población 2

N es el tamaño de la población

tablaz : es el valor z de la tabla N(0,1)

SI NO SE CONOCE LAS DESVIACIONES ESTÁNDAR POBLACIONALES ( 1σ Y 2σ ).

El intervalo de ( )%1100 α− , resulta ser:

Límite inferior: 21

2;2111**

21 nnstxx pnngltabla +−− −+= ;

Límite superior: 21

2;2111**

21 nnstxx pnngltabla ++− −+=

Donde:

2; −=ngltablat : es el valor “t” de la tabla “t” de Student, con 221 −+ nn grados de libertad

Donde las varianzas poblacionales, si bien son desconocidas, se considera que son iguales, 2

cs representa entonces la varianza común y se calcula:

( ) ( )2

11

21

222

2112

−+⋅−+⋅−

=nn

snsnsp

ESTIMACIÓN DE UNA DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES (Población 1 y 2). (Caso de muestras grandes)

El intervalo de ( )%1100 α− , resulta ser:

Page 115: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

114 

Límite inferior: ( )2

22

1

1121

ˆˆˆˆˆˆ

nQP

nQP

zpp tabla•

+•

•−− ;

Límite superior: ( )2

22

1

1121

ˆˆˆˆˆˆ

nQP

nQP

zpp tabla•

+•

•+−

Donde:

1n : es el tamaño de la muestra tomada de la población 1

2n : es el tamaño de la muestra tomada de la población 2

1̂P : es la proporción en la muestra tomada de la población 1; 11ˆ1ˆ PQ −=

2P̂ : es la proporción en la muestra tomada de la población 1; 22ˆ1ˆ PQ −=

N es el tamaño de la población

tablaz : es el valor z de la tabla N(0,1)

PRUEBA DE HIPÓTESIS PARA UNA DIFERENCIA DE MEDIAS DE POBLACIONES CON DISTRIBUCIÓN NORMAL (Con muestras independientes).

Aquí se tiene entonces: ( )2111 ;~ σμNX y ( )2

222 ;~ σμNX

En este caso las hipótesis son de la forma:

1. 21

210

::

μμμμ

≠=

aHH

2. 21

210

::

μμμμ

<=

aHH

3.

En forma equivalente se puede plantear las hipótesis:

1. 0:0:

21

210

≠−=−

μμμμ

aHH

2. 0:0:

21

210

<−=−

μμμμ

aHH

3. 0:0:

21

210

>−=−

μμμμ

aHH

CASO EN QUE SE CONOCEN LAS VARIANZAS POBLACIONALES ( 21σ Y

22σ )

21

210

::

μμμμ

>=

aHH

Page 116: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

115 

El valor calculado es:

2

22

1

21

21

nn

xxzcalc

σσ+

−=

Los valores críticos son: Hipótesis tipo 1: tablaz− y tablaz , Hipótesis tipo 2: tablaz− ,

Hipótesis tipo 3:

CASO EN QUE NO SE CONOCEN LAS VARIANZAS POBLACIONALES (21σ Y 2

2σ )

Si se considera que: 22

21 σσ =

El valor calculado es:

21

21

11nn

s

xxt

p

calc

+

−=

Donde:

( ) ( )2

11

21

222

2112

−+⋅−+⋅−

=nn

snsnsp

21s y 2

2s ; son las varianzas de las muestras sacadas de la población 1 y 2 respectivamente

1x y 2x ; son las medias de las muestras sacadas de la población 1 y 2 respectivamente

Los valores críticos son:

Hipótesis tipo 1: 2; 21 −+=− nngltablat y 2; 21 −+= nngltablat

Hipótesis tipo 2: 2; 21 −+=− nngltablat

Hipótesis tipo 3: 2; 21 −+= nngltablat

SI SE CONSIDERA QUE: 22

21 σσ ≠

tablaz

Page 117: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

116 

El valor calculado es:

2

22

1

21

21

ns

ns

xxtcalc

+

−=

Los valores críticos son los mismos anteriores, pero, los grados de libertad están dados por:

2

11

11

2

2

22

2

2

1

21

1

2

2

22

1

21

⎟⎟⎠

⎞⎜⎜⎝

⎛+

+⎟⎟⎠

⎞⎜⎜⎝

⎛+

⎟⎟⎠

⎞⎜⎜⎝

⎛+

=

ns

nns

n

ns

ns

gl

Ejemplo: Dos fabricantes A y B producen un artículo similar, cuyas vidas útiles tienen desviaciones estándar respectivas de 120 horas y 90 horas. Para comparar el promedio de vida útil de estos artículos se extrae una muestra aleatoria de 60 artículos de cada fabricante encontrándose la duración media de 1.230 horas para la marca A y de 1.190 horas para la marca B. ¿Se puede concluir a un nivel de significación del 5% que los artículos de marca A tienen mayor duración media que los artículos de marca B?

Se tiene una prueba de hipótesis para la diferencia de dos medias con varianzas poblacionales conocidas.

Datos: 645,1z 90 ;120 ;190.1 ;230.1 ;60 tabla22

222

12121 ======= σσxxnn

En este problema, si bien es cierto, no se dice que las poblaciones sean normales, se tiene que los tamaños de muestra son grandes, por lo que la estadística de prueba:

Tiene una distribución aproximadamente normal estándar, por lo que se puede usar lo presentado en el punto 4.1.

0:0:

21

210

>−=−

μμμμ

aHH

2

22

1

21

21

nn

xxzcalc

σσ+

−=

Page 118: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

117 

El valor calculado es: 07,2

6090

60120

190.1230.122

2

22

1

21

21 =

+

−=

+

−=

nn

xxzcalc

σσ

Valor critico: 645,1=tablaz

La región de rechazo es entonces: [ [∞= ;645,1RR

Por lo tanto se rechaza Ho, se acepta Ha. Se puede decir que existen evidencias significativas, al nivel de significación del 5%, para decir que la duración media de los artículos de marca A es mayor a los de marca B.

PRUEBA DE HIPÓTESIS PARA UNA DIFERENCIA DE PROPORCIONES (Muestras grandes).

En este caso las hipótesis son de la forma:

1. 21

210

::

PPHPPH

a ≠=

2. 21

210

::

PPHPPH

a <=

3. 21

210

::

PPHPPH

a >=

En forma equivalente se puede plantear las hipótesis:

1. 0:0:

21

210

≠−=−

PPHPPH

a

2. 0:0:

21

210

<−=−

PPHPPH

a

3. 0:0:

21

210

>−=−

PPHPPH

a

El valor calculado es:

( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛+−•

−=

21

21

11ˆ1ˆ

ˆˆ

nnPP

PPzcalc

Donde: 21

2211ˆˆˆ

nnPnPnP

+•+•

=

Los valores críticos son:

Hipótesis tipo 1: tablaz− y tablaz

Hipótesis tipo 2: tablaz−

Hipótesis tipo 3:

tablaz

Page 119: Apuntes - Probabilidad y Estadistica - Neftali

Neftali Antunez H Antunez Software

118 

Ejemplo:

Una muestra aleatoria de 300 hombres y otro de 400 mujeres de una determinada población reveló que 120 hombres y 120 mujeres estaban a favor de cierto candidato. ¿Se puede concluir a un nivel de significación del 5% que la proporción de hombres a favor del candidato es mayor que la proporción de mujeres?

Aquí se tiene una prueba de hipótesis para diferencias de proporciones con muestras grandes.

Si denotamos con 1 a la población de hombres y con 2 a la de mujeres, se tiene:

1° Plantear las hipótesis de interés

21

210

::

PPHPPH

a >=

2° Calcular la estadística de prueba (valor calculado), bajo Ho:

El valor calculado es:

( )76,2

4001

300166,034,0

3,04,0

11ˆ1ˆ

ˆˆ

21

21 =

⎟⎠⎞

⎜⎝⎛ +•

−=

⎟⎟⎠

⎞⎜⎜⎝

⎛+−•

−=

nnPP

PPzcalc

Donde: 34,0400300

3,04004,0300ˆˆˆ21

2211 =+

•+•=

+•+•

=nn

PnPnP

3° Construir la regla de decisión y decidir

El valor crítico es: 645,1=tablaz

La región de rechazo (RR) es: [ [∞= ;645,1RR

Por lo tanto se rechaza Ho, se acepta Ha

Se puede decir entonces que existen evidencias suficientes, a un 5% de significación, para decir que la proporción de hombres a favor del candidato es mayor que el de las mujeres, en esa población.