estadistica ii contabilidad

95
UNIVERSIDAD MARTIN LUTERO Un ministerio de las asambleas de Dios Facultad de Ciencias Económicas Carrera: Contabilidad Pública y Auditoría. Modalidad: Encuentros Presenciales. Asignatura: Estadística II. Encuentros Presenciales: 6. Turnos: Fin de semana (quincenal). II año FASCICULO DE ESTADISTICA II

Upload: franklin-jose-briceno

Post on 04-Jan-2016

358 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Estadistica II Contabilidad

UNIVERSIDAD MARTIN LUTEROUn ministerio de las asambleas de Dios

Facultad de Ciencias Económicas

Carrera: Contabilidad Pública y Auditoría.

Modalidad: Encuentros Presenciales.

Asignatura: Estadística II.

Encuentros Presenciales: 6.

Turnos: Fin de semana (quincenal).

II año

FASCICULO DE ESTADISTICA II

Profesor: Franklin Briceño.

Page 2: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

OBJETIVOS

1. Desarrollar la habilidad de traducir el lenguaje estadístico a problemas propios del perfil ocupacional de su carrera.

2. Desarrollar la habilidad de aplicar las técnicas del muestreo y las pruebas de hipótesis como elemento fundamental en la toma de decisiones.

3. Desarrollar habilidad operativa en teoría de conjuntos como herramienta indispensable para el cálculo de probabilidades.

2

Page 3: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

Unidad I. CALCULO DE PROBABILIDADES.

Contenido:

1. Teoría de conjunto.

2. Técnicas de conteo.

3. Espacio muestral, acontecimientos.

4. Probabilidad clásica.

- Axiomas básicos de probabilidad.

- Teoremas de probabilidad.

5. Probabilidad condicional.

6. Teorema de Bayes.

7. Independencia de eventos

8. Variable aleatoria discreta y, continua.

- Media, varianza y desviación típica de una variable aleatoria.

I. TEORIA DE CONJUNTOS

Conjunto: Aun cuando éste resulta ser un concepto matemático primitivo, podemos decir que “conjunto es la colección de seres u objetos que tienen una o más características comunes”.

Ejemplos de conjuntos:

Ejemplo 1. Conjunto: vocales

La colección sería: a, e, i, o, u.

La característica común es: que al pronunciar éstas letras articulamos un sonido que se produce al hablar cuando, a su paso por la laringe y la boca, el aire no encuentra algún obstáculo: paladar,

3

Page 4: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño labios, dientes o lengua.Ejemplo 2. Conjunto: Lunas de Neptuno

Colección: Náyade, Thalassa, Despina, Galatea, Larisa, Proteo, Tritón y Nereida.

Característica común: satélites naturales que orbitan alrededor de Neptuno.

Ejemplo 3. Conjunto: Apóstoles de Jesús

Colección: Pedro, Andrés, Jacobo, Juan, Felipe, Bartolomé, Mateo, Tomás, Simón, Judas Iscariote, Santiago y Judas Tadeo.

Característica común: Cada uno de los doce discípulos de Jesús.

Ejercicios

Dar 5 ejemplos de conjuntos, señalando las características comunes de la colección de seres u objetos. ¡Inténtelo! ¡Diga que sí puede!

Elementos de un conjunto: Son todos y cada uno de los seres u objetos que forman el conjunto.

Nomenclatura: Los conjuntos se representan con letras mayúsculas y, los elementos, con letras minúsculas. Se utiliza llave para encerrar los elementos de un conjunto.

Ejemplo. Sean los dígitos, elementos del conjunto D.

D = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}

Relación de pertenencia: Para indicar que un elemento forma parte de un conjunto, se utiliza el símbolo “”, se lee: “pertenece a…”.

Así, al escribir u {vocales}; se lee: u pertenece al conjunto de las vocales.

¡Advertencia!: El símbolo “”, sólo se utiliza en la relación de elemento con conjunto, nunca entre elementos ó entre conjuntos.

Para indicar que un elemento no pertenece a un conjunto, se utiliza el símbolo “”.

Subconjunto: Un conjunto B, es subconjunto de otro conjunto A, cuando todo elemento de B es elemento de A.

Se representa B A4

Page 5: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoNota: para indicar que cierto conjunto, no es subconjunto de otro, se utiliza el símbolo “”.

Ejemplo 1. Sean los conjuntos M = a, b, c, N = a, b, c, d

M N: M es subconjunto de N. Observe que todos los elementos del conjunto M, también se encuentran en el conjunto N.

Ejemplo 2. Sean los conjuntos V = x/x es vocal, A = alfabeto

V es subconjunto de A, por que todas las vocales pertenecen al alfabeto.

Tipos de conjuntos:

Conjunto vacío: Son aquellos conjuntos que no poseen elemento alguno.

Ejemplo 1. A = satélites naturales de MercurioEl conjunto A es vacío. El planeta Mercurio no posee satélites naturales.

Ejemplo 2. B = x N/ x 0Todos lo números naturales son mayores que cero; por lo tanto, el conjunto B no posee ningún elemento.Observación: Para indicar que un conjunto es vacío, se puede utilizar cualquiera de las siguientes notaciones ó .

Conjunto unitario: Son aquellos conjuntos que poseen un único elemento.

Ejemplo 1. F = satélites naturales de la TierraEl conjunto F está compuesto por un único elemento. ¿Cuál es ese elemento?

Ejemplo 2. G = x/x es un estado con extensión menor a 1 km2 G = Vaticano

Conjunto infinito: Son aquellos conjuntos de los que no podemos nombrar un último elemento. ¿Cuáles serían los conjuntos finitos? Ejemplifique.

Conjunto Universal (U): También conocido como conjunto referencia o lleno, es el conjunto que contiene a todos los conjuntos que se generan de cierta situación o circunstancia.

Cualquiera de los siguientes conjuntos puede considerarse lleno, dependiendo de la situación:

A = números naturales

B = reino animal

C = China

5

Page 6: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoCardinalidad de un conjunto: Se llama cardinalidad de un conjunto cualquiera, al número de elementos del conjunto.

Ejemplo. B = América continental

La cardinalidad de este conjunto es n(B) = 22. Sólo señalo los estados emplazados en la parte continental. Para indicar el cardinal de un conjunto utilice la letra “n” y entre paréntesis el conjunto.

Operaciones con conjuntos:Unión de conjuntos:

Se llama unión de los conjuntos A y B, al conjunto formado por todos los elementos del conjunto A y del conjunto B.

Se simboliza A B

Ejemplo 1. Encuentre la unión entre los conjuntos X = 30, 31, 32 y Y = 50, 51, 52, 53

X Y = 30, 31, 32, 50, 51, 52, 53

Ejemplo 2. A = húmero, cúbito, radio y B = carpo, metacarpo

A B = esqueleto del brazo

Ejemplo 3. C = flagelo, membrana, pared celular y L = ADN, ribosoma

C L = célula procarionte

Nota: Los elementos repetidos se consideran como uno solo.

Intersección de conjuntos: Dados los conjuntos A y B, se llama intersección de los conjuntos A y B al conjunto formado por los elementos del conjunto A que también pertenecen al conjunto B.

Se expresa A B

Ejemplos. Encuentre la intersección entre los conjuntos:1. M = a, b, c, d y N = a, b, g, h, i

M N = a, b

2. T = Afganistán, Chad, China, Níger, Sudan, Turquía S = Asia

S T = Afganistán, China, Turquía3. K = xN/ 2x7

6

Page 7: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño H = xN/ x5

K H = 3, 4

Le toca a usted comprobar que tal intersección es correcta.

Conjunto complemento: Sea A un conjunto cualquiera y U el conjunto universo, el complemento de A será:

A´ = x/xU xA

Interpretación: El complemento del conjunto A (A´), es el conjunto formado por los elementos que no pertenecen al conjunto A; pero sí, al universo.

Ejemplo 1.Sean los conjuntos U = dígitos y A = 3, 4, 5El complemento del conjunto A, será: A´ = 0, 1, 2, 6, 7, 8, 9

Como puede observarse, en el complemento, se escriben los elementos del universo; pero sin escribir los elementos del conjunto del cual se desea encontrar el complemento.

Ejemplo 2.Si U = números naturales B = xN/ x 100 000El complemento del conjunto B será:

B´ = xN/ x 100 000

Diferencia de conjuntos:Sean dos conjuntos cualquiera A y B, la diferencia A - B estará formada por los elementos de A que no pertenecen a B.

A - B = x/xA xB

Ejemplo1. Sean los conjuntos C = l, m, n, ñ, o, p, q y D = q, r, sCalculamos C - D = l, m, n, ñ, o, pObserve que D - C = r, s

Ejemplo 2. A = 1, 2, 3, 4 y B = 3, 4, 5, 6A - B = 1, 2

¿Cuál sería el conjunto resultante de B - A?Propiedades de las operaciones con conjuntos

Propiedad de Idempotencia:

7

Page 8: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

A A = AA A = A

Propiedad conmutativa:

A B = B AA B = B A

Propiedad asociativa:

(A B) C = A (B C)(A B) C = A (B C)

Propiedad distributiva:

A (B C) = (A B) (A C)A (B C) = (A B) (A C)

Propiedades complementarias:

A A´ = UA A´ =

(A´)´ = AU´ =

Leyes de D´Morgan

(A B)´ = A´ B´(A B)´ = A´ B´

Ejercicios¡Jamás se desanime! Usted es capaz hasta donde su propia voluntad lo permita.

1. Sabiendo que N = números naturales Z = números enteros Q = números racionales E = 0, +1, +2, +3…

a) Si x E y x N, ¿Qué número debe ser x?b) Si x Z, ¿debe ser verdad que x N?c) Si x Z, ¿debe ser verdad que x Q?d) ¿Qué tipo de conjuntos son N, Z, Q y E?, ¿Cuál su cardinalidad?

8

Page 9: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

2. Dados los conjuntos:A = 1, 2, 3, 4, 5B = 1, 2, 3C = 4, 5, 6D = 1, 2, 3,…, 10E = 3, 4, 5,…F =

a) ¿Es B un subconjunto de A?, ¿De C? Justifique.b) ¿Cuáles de los conjuntos dados son finitos? Justifique.c) Enumerar los elementos de A B.d) ¿Qué conjunto es B C?e) ¿Es F un subconjunto de C? Justifique.f) ¿Puede, la unión de dos conjuntos no vacíos, ser un conjunto vacío?Justifique.g) ¿4 A? ¿Es cierto que 2 E?h) ¿Cuál es el cardinal de F? ¿Y de E?

3. Dados los conjuntos:A = 1, 2, 3, 4B = 5, 6, 7, 8C = 1, 2, 3,…, 20D = 2, 4, 6,…E = F = 5, 8, 7, 6

a) ¿Cuáles de los conjuntos son infinitos?b) ¿Cuál es la cardinalidad del conjunto B? ¿En E?c) Mencionar la característica común de los elementos del conjunto D?d) Nombrar los 4 elementos mayores del conjunto C.

4. Si U = a, b, c, d, e, f, g, h, i, j; A = c, d, e, f y B = e, f, g, h, iDetermine los siguientes conjuntos:

a) A Bb) A´ Bc) A B´d) A´ B´e) (A B)´

f) A g) A Uh) A´ Bi) A´ B´j) (A B)´

5. Si U = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 A = 2, 3, 4, 5, 6, 7 B = 5, 6, 7, 8 C = 6, 7, 8, 9, 10

9

Page 10: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

Encuentre:a) A B Cb) A B Cc) A (B C)d) A (B C)

6. Si U = a, b, c, d, e, f, g, h, i, j, k, l, m, n, p, q, r, s M = b, c, d, e, f, g, h, i N = f, g, h, i, j, k, l, m P = e, f, i, e, m, n, p, q Q = d, e, f, g, m, n, p, r

Encuentre:a) (M N) (P Q)b) (M N) (P Q)c) (M N)´ (P Q)´d) (M N)´ (P Q)´

7. Dado los conjuntosU = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10F = 3, 2, 1, 5, 7G = 2, 4, 6, 8, 10H = 3, 4, 5, 6, 7, 8, 2, 9

Calcule:a) F - Gb) H - Fc) H - Ud) U - Fe) G´

II. TECNICAS DE CONTEO

Técnica 1. Es posible que tengamos n eventos en un experimento y que tal experimento se repita k veces; el número de posibles resultados será:

nk

Ejemplo 1.Supongamos que una moneda (cinco, escudo) se ha lanzado al aire 10 veces. Calculemos el número de diferentes resultados que podemos obtener.

Solución:

10

Page 11: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoExisten dos posibles eventos en un lanzamiento, que la moneda caiga escudo o cinco. Como el experimento se repite 10 veces, el número de resultados posibles es:

210 = 1024

Ejemplo 2.Si un dado se lanza dos veces. ¿Cuántos posibles resultados existen?

Solución:Hay seis posibles eventos en el lanzamiento de un dado y, el experimento se repite dos veces; así, el número de posibles resultados es:

62 = 36

Esto lo podemos observar al realizar un diagrama de árbol.

Técnica 2. Si hay n1 eventos del primer intento, n2 eventos del segundo intento, ni eventos del i-ésimo intento, entonces el número de resultados posibles es:

n1 · n2 · … · ni

Ejemplo 1.Un urbanista de una nueva subdivisión ofrece a los interesados en la primera compra de una casa la posibilidad de seleccionar el estilo de la fachada entre Tudor (semejante al gótico), Rústico, Colonial y Tradicional y; una sola planta, dos plantas o desnivel. ¿De cuántas maneras diferentes puede, un comprador, ordenar una de estas casas?

Solución:Sea

n1: los posibles estilos de la fachada.n2: las posibles plantas que tendrá la casa.

Así, el comprador puede escoger de 12 maneras diferentes una de estas casas, por que:

n1 · n2 = 4 · 3 = 12

Al igual que en el caso anterior podemos utilizar el diagrama de árbol para verificar.

Ejemplo 2.Una oficina estatal de vehículos automotores desearía saber de cuántos números de placa se dispondrían, si la placa consistiera en tres letras seguidas de tres dígitos.Solución:Como la placa contiene letras, cada lugar que ocupa una letra tiene 27 posibles resultados (en el alfabeto castellano).La placa tendrá dígitos; por lo tanto, cada uno tiene diez posibilidades.Por lo tanto, el número de placas sería:

11

Page 12: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

27 · 27 · 27 · 10 · 10 · 10 = 19 683 000

Técnica 3. El número de formas en que se pueden ordenar n objetos es n!, mejor conocido como n factorial.

Ejemplo 1.Encuentre el número de formas en que se pueden ordenar las cuatro letras a, b, c, d.

Solución:Intentemos hacerlo empíricamente a b c da b d ca c b da c d ba d b ca d c b

b a c db a d cb c a db c d ab d a cb d c a

c a b dc a d bc b a dc b d ac d a bc d b a

d a b cd a c bd c a bd c b ad b a cd b c a

Lo cual resulta también al calcular usando el factorial

4! = 4 · 3 · 2 · 1 = 24

Técnica 4. El número de formas en que podemos ordenar r objetos seleccionados de n objetos (sin repeticiones), es:

nPr = n! / (n -r)!

A “P” se le conoce como permutación. n y r representan el cardinal del conjunto universo y del subconjunto, respectivamente.

Cuando hay repetición se utiliza la expresión nPr = nr

La permutación nos permite calcular el número de maneras en que cierto subconjunto puede ordenarse.

Suponga que queremos ordenar dos de las cinco vocales, sin repetición. Los resultados son:a ea ia oa u

e ae ie oe u

i ai ei oi u

o ao eo io u

u au eu iu o

12

Page 13: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoRealice usted el cálculo correspondiente y observará que también obtiene 20 formas de ordenar.

Ahora, suponga que deseamos ordenar dos de las cinco vocales, con repetición; los resultados son:

a aa ea ia oa u

e ee ae ie oe u

i ii ai ei oi u

o oo ao eo io u

u uu au eu iu o

Usando la fórmula de la permutación, cuando existen repeticiones, nos arrojara el mismo resultado: 25 maneras de ordenar.

Ejemplo 1.¿De cuántas formas diferentes se pueden realizar una primera, segunda, tercera o cuarta selección entre 12 empresas arrendadoras de equipos para construcción?

Solución:Las doce empresas representan el conjunto universo del cual se seleccionará un subconjunto formado por cuatro empresas. Por lo tanto

n = 12 y r = 4

12P4 = 12! / (12 - 4)! = 12! / 8! = 11 880

Ejemplo 2.Un mecanismo electrónico de control requiere de 5 chips de memoria idénticos. ¿De cuántas maneras puede ensamblarse este mecanismo colocando los cinco chips en las cinco posiciones del controlador.

Solución:Como podemos ver n = 5 y r = 5Por tanto,

5P5 = 5! / (5 - 5)! = 120

13

Page 14: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoLa moraleja de este ejemplo es que el factorial de cero, es uno (0! = 1).

Técnica 5. El número de formas para seleccionar r objetos -sin considerar el orden- entre n objetos (sin repetición), es:

nCr = n! / (n - r)!·r!

A “C” se le conoce como combinación. n y r, tienen el mismo significado descrito anteriormente.

Cuando hay repeticiones se utiliza la expresión C = (n+1)!/(n+1) - r!r!

Suponga que se desea seleccionar dos de las cinco vocales, sin repetición. Los resultados serán:

a e a i a o a u e i e o e u i o i u o u

Utilice usted la fórmula para verificar que sólo hay diez maneras de seleccionar.

Ahora, suponga que seleccionamos dos de las cinco vocales, con repetición. Los resultados se presentan a continuación:

a a a e a i a o a u e e e i e o e u i i i o i u o o o u u u

Ejemplo 1.¿De cuántas maneras diferentes pueden seleccionarse 3 de 20 asistentes de contabilidad para colaborar en una auditoría?

Solución:Para n = 20 y r = 3

20C3 = 20! / (3!·(20 - 3)!) = 1140El 1140 representa el número total de maneras en las que se pueden seleccionar los ayudantes de contabilidad, sin importar el orden en el cual se haga la selección.

Ejemplo 2.

14

Page 15: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoSe precisa la realización de un estudio de eficiencia para probar si los libros contables de 15 instituciones estatales están bien ordenados, completos y tienen los elementos requeridos por hacienda. ¿De cuántas maneras pueden seleccionarse 5 de las 15 instituciones, para la investigación?

Solución:n = 15 y r = 5

15C5 = 15! / (5!·10!) = 3003

EjerciciosNadie dijo que esto sería totalmente fácil, pero ¿cuáles son las cosas fáciles de la vida? ¡A continuar con la lucha!

1. Entre 7 personas, ¿de cuántos modos puede seleccionarse un comité de 4 personas?

2. ¿Cuántos números distintos de 4 cifras (sin repeticiones) se pueden formar con los números 1, 2, 3, 4, 5, 6, 7, 8, 9? ¿Con repeticiones?

3. Se lanza un dado 4 veces. ¿Cuántos posibles resultados existen?

4. ¿De cuántas formas se pueden ordenar los caracteres del alfabeto británico?

5. ¿De cuántas maneras se pueden ordenar los nombres de los compañeros de clase?

6. ¿Cuántas combinaciones (con repeticiones) distintas de 3 cifras se pueden formar con los números 4, 5, 6, 7, 8 y 9?

Nos aproximamos a la parte medular de este curso; hasta el momento, lo que hemos hecho es recordar algunas herramientas necesarias para el cálculo de probabilidades. A partir de ahora, todos estos recursos serán utilizados para tal fin.

III. ESPACIO MUESTRAL Y ACONTECIMIENTOS

Espacio muestral:Es la colección de todos los posibles resultados de un experimento aleatorio y lo

denotaremos por S. Este se puede representar de lista o diagrama de árbol.

Suceso o eventos:Es cualquier subconjunto del espacio muestral S. Se dice que ha ocurrido el suceso A cuando al efectuar una prueba del experimento aleatorio obtenemos como resultado uno de

15

Page 16: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceñolos puntos muestrales que componen el suceso A. En caso contrario diremos que no se presenta el evento A.

Ejemplo 1.Si se lanza un dado al aire, los resultados que pueden obtenerse son: 1, 2, 3, 4, 5 y 6. Luego el espacio muestral es S = 1, 2, 3, 4, 5, 6

De este espacio muestral podemos extraer algunos sucesos:El suceso, caer un número par, es: A = 2, 4, 6El suceso, caer un número impar, es B = 1, 3, 5El evento, caer múltiplo de tres, es C = 3, 6

Ejemplo 2.El espacio muestral asociado al experimento aleatorio de lanzar una moneda de un córdoba, es: S = e, 1.

De este espacio muestral, son sucesos todos los subconjuntos de S; es decir: , e, 1, s.

Sucesos simples:Es el formado por un sólo punto muestral (un valor posible del experimento).

Ejemplo. Sea el espacio muestral S = 1, 2, 3, 4, 5, 6Los sucesos simples serían A = 1, B = 2, etc.

Sucesos compuestos:Son los sucesos formados por dos ó más puntos muestrales.

Ejemplo. Suponiendo el mismo espacio muestral anterior.Los sucesos compuestos podrían ser H = 2, 4, 6, G = 1, 3, 5, etc.

IV. PROBABILIDAD CLASICA

En el curso de estadística anterior analizábamos la frecuencia relativa, cuando pensamos en lanzar una moneda de un córdoba al aire, fácilmente pensamos de forma intuitiva que la probabilidad de que caiga escudo es ½, lo cual representa una frecuencia relativa. Pero es probable que usted realice tres lanzamientos de la moneda y en ninguno de los casos caiga escudo. Ahora bien, que tal si hacemos una inmensurable cantidad de lanzamientos, esto permitiría observar que la frecuencia relativa de este suceso se aproxima a un medio. Este ejemplo nos da pie para definir el concepto de probabilidad.

La probabilidad es el límite de la frecuencia relativa. Si el suceso de que la moneda caiga escudo lo denotamos por A, la expresión de la probabilidad estaría dada por

P(A) = lim n(A) / n(S) n(S)

16

Page 17: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

n(S) es el nùmero total de veces que se repite el experimento (cardinalidad del espacio muestral). n(A) es el número de veces que aparece el resultado (cardinalidad del evento).n(A)/n(S) es la frecuencia relativa.

Axiomas de probabilidad:1. P(S) = 1

Este axioma dice que si un suceso ocurre con certeza, entonces la probabilidad de ese suceso es uno.

2. 0 P(A) 1Este axioma nos indica que la probabilidad de cualquier suceso nunca es negativa.

3. P() = 0Este axioma se refiere a que si un suceso es imposible, su probabilidad es cero.

4. P(X1) + P(X2) + P(X3) + … + P(Xi) = 1Este axioma nos dice que cuando los eventos son igualmente verosímiles, la suma

de las probabilidades es 1. Propiedades de las probabilidades:1. P(A´) = 1 - P(A)

La probabilidad de que no ocurra un evento; es igual a 1, menos la probabilidad de que éste ocurra.

2. Si A y B son dos sucesos mutuamente excluyentes, entonces

P(A B) = P(A) + P(B)

3. Si A y B son dos eventos cualquiera de un espacio muestral S, entonces

P(A B) = P(A) + P(B) - P(A B)

Eventos mutuamente excluyentes: Es cuando los eventos no ocurren simultáneamente; es decir, no existe intersección entre ellos.

Ejemplos de cálculo de probabilidades1. Calcule la probabilidad de obtener un número impar al lanzar un dado.Sea A, el evento en que al lanzar al aire un dado éste cae un número impar

P(A) = 3 / 6 = 0.5Esto lo interpretamos como “la probabilidad de obtener un número impar al lanzar un dado es del 50%.

2. Calcule la probabilidad de que sea rey una carta sacada de un juego de naipes.Sea B, el evento donde se saca un rey. Utilizando el concepto de probabilidad

17

Page 18: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

P(B) = 4 / 52

La probabilidad de sacar rey en una baraja es, aproximadamente, del 7.7%

3. Cuál es la probabilidad de que usted se case el próximo mes?A esta situación no se le puede aplicar la definición anterior, por que ésta, solamente se aplica cuando el espacio muestral está bien definido.

Ahora calculemos probabilidades utilizando las propiedades4. Se sabe que entre 360 profesores de primaria que estudian en la Facultad de Humanidades (UNAN), hay 60 que estudian Biología (B), 200 que estudian Pedagogía (G) y 20 que estudian ambas licenciaturas. Determine la probabilidad de que uno de los escogidos al azar estudie:

a. Biología ó Pedagogía.b. No estudie ambas licenciaturas simultáneamente.

Solución:a. De la definición clásica de probabilidad P(B) = 60/360, P(G) = 200/360 y P(B G) = 20/360.Así, P(B G) = P(B) + P(G) - P(B G) = 60/360 + 200/360 - 20/360 = 2/3

Por lo tanto, la probabilidad de que un profesor de primaria estudie licenciatura en Biología o Pedagogía es de aproximadamente el 67%.

b. Para dar respuesta a este inciso, simplemente hacemos uso de otra propiedadP(B G)´ = 1 - P(B G)

= 1 - 20/360 = 17/18

Por lo que concluimos que la probabilidad de que un estudiante escogido al azar “no estudie” ambas licenciaturas a la vez, ronda los 94.4%.

5. Si la probabilidad de ocurrencia de un evento A es de 0.3, la probabilidad de B es de 0.4 y, si A y B son eventos mutuamente excluyentes. Calcule las siguientes probabilidades:

a. P(A´)b. P(B´)c. P(A B)d. P(A B)

Solución:a. P(A´) = 1 - 0,3 = 0.7

Esto quiere decir que existe el 70% de probabilidad de que no ocurra A.

18

Page 19: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

b. P(B´) = 1 - 0.4 = 0.6¿Qué interpretación podemos darle a este resultado?

c. P(A B) = 0.3 + 0.4 = 0.7La probabilidad de que uno de los eventos ocurra, es del 70%

d. Como son dos eventos mutuamente excluyentes, la intersección es vacía y; por lo tanto, la probabilidad de dicha intersección es cero.

3. Si las probabilidades son, respectivamente: 0.86, 0.35 y 0.29 de que una familia elegida al azar para realizar un estudio de muestreo de un área metropolitana grande, tendrá un televisor a color, uno en blanco y negro ó ambos. ¿Cuál es la probabilidad de que esta familia poseerá uno u otro tipo de televisor?

Solución:Sea A: que la familia posea un televisor a color. B: que la familia posea un televisor blanco y negro.

Así, P(A) = 0.86, P(B) = 0.35 y P(A B)

P(A B) = P(A) + P(B) - P(A B) = 0.86 + 0.35 - 0.29 = 0.92

EjerciciosSi alcanzó llegar hasta la Universidad, no puede ser posible que usted se diga a sí mismo: “Yo no puedo con la Matemática, es muy difícil”. ¡Claro que puede con la, maravillosa y extraordinariamente útil, Matemática! 1. Se lanzan dos dados.

a. Describir el espacio muestral.b. Sea A, el evento donde la suma de los números obtenidos sea mayor que 5. Calcular

P(A).c. Sea M, el evento donde xi = yi. calcular P(M).d. Calcular la probabilidad de que el número en el segundo dado sea par.e. Calcular la probabilidad de que la suma de los dos números obtenidos sea impar.

2. Una fabrica produce botellas en una línea de producción con tres máquinas A, B y C. Si de un lote de 278 botellas, 95 fueron producidas por la máquina A, 80 por la máquina B y 103 por la máquina C. Si se extrae una botella aleatoriamente de este lote, describa los eventos siguientes y encuentre la probabilidad.

a. Que la botella haya sido producida por la máquina C.b. Que la botella haya sido producida por la máquina A o B.

3. Si A y B son eventos mutuamente excluyentes, P(A) = 0.37 y P(B) = 0.44. Determine:

19

Page 20: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

a. P(A´)b. P(B´)c. P(A B)d. P(A B)e. P(A´ B´)

4. Un hombre, con los ojos vendados, tiene que extraer dos fichas de una urna que contiene 5 fichas rojas, 4 blancas y 1 negra. Suponga que el reemplaza la primera ficha antes de extraer la segunda. ¿Cuál es la probabilidad de que ambas fichas sean del mismo color? ¿y sin reemplazo?

5. Suponga que se arroja una moneda de un córdoba (escudo “e”, y uno “u”) 3 veces, de forma deshonesta, de modo que a la larga se observan las siguientes frecuencias relativas:

E P(E)e e ee e ue u ee u uu e eu e uu u eu u u

0.150.100.100.150.150.100.100.15

Suponga que estamos interesados en los siguientes eventos:G: menos de dos escudos.H: todas las monedas caen lo mismo.K: menos de dos unos.L: al menos una cae diferente.

Encuentre las siguientes probabilidades:a. P(G)b. P(H)c. P(G H)d. P(G H)e. P(K L)f. Siguen siendo válidas las propiedades de probabilidad?

6. Al planificar una familia de 4 niños.a. ¿Cuál es la probabilidad de por lo menos un varón?b. ¿Cuál es la probabilidad de a lo sumo 3 niñas?

V. PROBABILIDAD CONDICIONAL

Probabilidad condicional:La probabilidad condicional de un evento A ya que ha ocurrido un evento B, se define de la siguiente forma:

P(A/B) = P(A B) / P(B) P(B) 0

20

Page 21: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

Regla de la multiplicación:A menudo la expresión anterior se utiliza en una versión un poco distinta y se le

conoce como regla general de la multiplicación.P(A B) = P(B) · P(A/B)

Ejemplo 1.Sean A y B sucesos tales que P(A) = 1/2, P(B) = 1/3 y P(A B) = 1/4 Encuentre P(A/B) y P(B/A).Solución:

De la definición de probabilidad condicional, vemos que:

P(A/B) = 1/4 1/3 = ¾

Esto significa que la probabilidad de que ocurra el suceso A dado que el suceso B ya ocurrió, es del 75%.Ahora, la probabilidad de que ocurra B dado que ya ocurrió A, es:

P(B/A) = ¼ ½ = 1/2

Lo cual muestra una probabilidad del 50%.

Ejemplo 2.Un contador, sabe por experiencias pasadas, que la probabilidad de equivocarse en una cuenta T es del 40%; Pero, la probabilidad de que entregue a tiempo su informe dado que se ha equivocado es del 60%. Suponga que al individuo le toca entregar un informe de contabilidad ¿Cuál es la probabilidad de que se equivoque y entregue a tiempo su informe?

Solución:Sea R: El contador se equivoca en una cuenta T.

D: El contador entrega a tiempo su informe contable.

Así, P(R) = 0.40 y P(D/R) = 0.60A partir de la regla de la multiplicación

P(D R) = P(R) · P(D/R)P(D R) = 0.4 · 0.6 = 0.24

EjerciciosHay hombres que luchan un día y son buenos, hay otros que luchan un año y son mejores, hay quienes luchan muchos años y son muy buenos; pero hay los que luchan toda la vida… ¡esos son los imprescindibles!

21

Page 22: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño1. Una organización de investigación del consumidor ha estudiado los servicios dentro del periodo de garantía que ofrecen los 50 distribuidores de automóviles nuevos en cierta ciudad y sus hallazgos se resumen a continuación:

Tiempo en el negocio Brindan un buen servicio dentro del período de garantía.

Dan mal servicio dentro del periodo de garantía

10 a más años en negocio 16 4Menos de 10 años en el

negocio10 20

Si una persona selecciona aleatoriamente uno de los distribuidores de autos nuevos. ¿Cuál es la probabilidad de que

a. elegirá uno que ofrezca un buen servicio de garantía?b. encuentre alguno que ofrezca un buen servicio de garantía, dado que ha estado en el

negocio por más de 9 años?c. obtenga un mal servicio en el período de garantía, dado que el distribuidor tiene

menos de 10 años en el negocio?d. elija uno que brinde un buen servicio de garantía y tenga menos de 10 años en el

negocio?

2. Si la probabilidad de que un sistema de comunicación tenga alta fidelidad es 0.81 y la probabilidad de que tenga alta fidelidad y alta selectividad es 0.18. ¿Cuál es la probabilidad de que un sistema tenga alta selectividad dado que tiene alta fidelidad’

3. En un estudio reciente se les preguntó a 670 personas de USA qué medio de transporte utilizaban para llegar a su centro de trabajo. Los resultados se resumen en la siguiente tabla.

Medio de transporte Urbano RuralAutomóvil

Transporte público40050

20020

Al seleccionar una de las personas al azar. Cuál es la probabilidad de qué:a. use automóvil, dado que es del área rural?b. use transporte público, dado que es citadino?

4. Una casa vendedora de ropa mediante pedidos por correo, comercializa dos líneas de producción, una relativamente cara y otra económica. Un registro de 1000 pedidos produjo la frecuencia de los pedidos por líneas de productos y por el sexo de los clientes, como se detalla en la tabla siguiente. Suponga que se selecciona uno solo de los pedidos. Calcular la probabilidad de que:

a. el consumidor sea mujer?b. el pedido sea para la línea de producción 1 y que el consumidor sea mujer?c. el consumidor sea hombre o el pedido sea para la línea 2?

22

Page 23: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

5. En una encuesta de mercadeo para un gran almacén, se clasificó a los clientes de la tienda según el sexo y su residencia, la información se resume en la siguiente tabla:

Residencia Masculino FemeninoSuburbio 170 70

40 120Se selecciona un consumidor al azar. Encuentre la probabilidad de que:

a. el consumidor resida en la ciudad o sea mujer?b. el consumidor resida en los suburbios o sea hombre?c. sea citadino dado que es mujer?

6. Se extrae dos cartas de un mazo común. ¿Cuál es la probabilidad de que:a. ambas sean ases?b. las dos sea ases negros?c. ambas sean cartas altas (as, rey, reina, jota y diez)?

Sugerencia: Utilice la regla de la multiplicación. Además, tome en cuenta (en el primer inciso) que la segunda as está condicionada por que ya se sacó una as. Si logra hacer el primer inciso, el resto tiene un tratamiento similar.

7. Un embarque de 10 focos contiene 2 defectuosos. Si se escogen al azar los focos, ¿cuál es la probabilidad de que:

a. los dos primeros sean buenos?b. el primer foco defectuoso se extraiga en tercer lugar?c. el primer foco defectuoso no se extraiga sino hasta el sexto intento?

Sugerencia: Utilice la regla de la multiplicación. Usted debe ir analizando un foco a la vez.

8. Se realizó una encuesta a estudiantes de licenciaturas en cierta universidad, se les preguntó sobre el área de principal interés para ellos y la información obtenida se resume a continuación

Sexo Contabilidad Psicología EnfermeríaHombre 100 150 50Mujer 100 50 50

a. ¿Cuál es la probabilidad de seleccionar a alguien que tenga como área de interés enfermería, dado que es mujer?

b. ¿Cuál es la probabilidad de seleccionar a un estudiante cuya área de interés sea Psicología, dado que es hombre?

c. ¿Cuál es la probabilidad de que sea hombre o tenga como área de interés Contabilidad?

23

Page 24: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

d. ¿Cuál es la probabilidad de que sea mujer y sea de Psicología?

VI. TEOREMA DE BAYES

Teorema de Bayes.El teorema de Bayes permite calcular la probabilidad de un evento A i cualquiera, perteneciente a una familia de eventos exhaustivos y mutuamente excluyentes, si sabemos que ha ocurrido un evento B del espacio muestral. Siempre que P(Ai) y P(B/Ai) sean conocidos. Este teorema se expresa

P(Ai/B) = P(B/Ai) · P(Ai)

P(B/Ai) · P(Ai)

La expresión P(B/Ai) · P(Ai) se conoce como el teorema de probabilidad total.

Ejemplos 1.En una universidad de la capital, en que sólo hay estudiantes de arquitectura, ciencias y letras; terminan la carrera, el 5% de arquitectura, el 10% de ciencias y el 20% de letras. Se sabe que el 20% estudian arquitectura, el 30% ciencias y el 50% letras. Eligiendo un estudiante al azar, hallar lo siguiente:

a. La probabilidad de que sea de arquitectura y haya terminado la carrera.b. Ha terminado la carrera. ¿Cuál es la probabilidad de que sea de arquitectura?

Solución:Sea A: Estudiante de arquitectura. C: Estudiante de ciencias. L: Estudiante de letras. T: El suceso “el estudiante ha terminado la carrera”.

Así, P(A) = 0.20, P(C) = 0.30, P(L) = 0.50, P(T/A) = 0.05, P(T/C) = 0.10 y P(T/L) = 0.20.

a. Podemos dar respuesta al inciso a este inciso utilizando la regla de la multiplicación; es decir

P(A T) = P(A) · P(T/A) = (0,20)(0.05) = 0.01

Esto implica que la probabilidad de que el estudiante escogido sea de arquitectura y haya terminado la carrera, es del 1%.

b. Para calcular la probabilidad establecida utilizamos el teorema de Bayes

P(A/T) = . P(T/A) · P(A) . P(T/A) · P(A) + P(T/C) · P(C) + P(T/L) · P(L)

24

Page 25: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

P(A/T) = 0.05 · 0.2 / (0.05 · 0.2 + 0.1 · 0.3 + 0.2 · 0.5) = 1/14.

¿Cuál es el significado de dicho cálculo?

Ejemplo 2.A medida que ciertos artículos llegan al final de una línea de producción, un inspector elige aquellos que serán sometidos a una inspección completa. 10% de todos los artículos producidos son defectuosos. Sesenta por ciento de todos los artículos defectuosos y 20% de todos los artículos buenos son sometidos a una inspección completa. Dado que un artículo es sometido a una inspección completa, ¿cuál es la probabilidad de que sea defectuoso?

Solución:Sea D: El artículo producido es defectuoso. D´; El artículo producido no es defectuoso. I: El artículo es sometido a una inspección completa.

Así, P(D) = 0.10, P(D´) = 0.90, P(I/D) = 0.60 y P(I/D´) = 0.20

Como se pide calcular P(D/I)

P(D/I) = . P(I/D) · P(D) . P(I/D) · P(D) + P(I/D´) · P(D´)

Sustituyendo valores en la expresión:

P(D/I) = 0.6 · 0.1 / (0.6 · 0.1 + 0.2 · 0.9) = 0.25

Por tanto, se sabe que de todos aquellos artículos que recibieron una inspección completa, el 25% de estos artículos es defectuoso.

3. El gerente de mercadeo de una firma fabricante de juguetes, planea la introducción de un nuevo juguete al mercado. En el pasado, 40% de los juguetes introducidos por esta firma han tenido éxito y 60% no lo han tenido. Antes de lanzar el juguete al mercado, se lleva a cabo una investigación y se elabora un informe, favorable o desfavorable. En el pasado, 80% de los juguetes con éxito también recibieron informes favorables y 30% de los juguetes sin éxito también recibieron informes favorables. El gerente de mercadeo quería conocer la probabilidad de que el nuevo juguete tendrá éxito si recibe un informe favorable.

Solución:Sea A: Los juguetes con éxito. A´: Juguetes sin éxito.

25

Page 26: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño B: Juguetes que recibieron informes favorables. B´: Juguetes con informes desfavorables.

Agrupando la información expresada en el problemaP(A) = 0.40, P(A´) = 0.60, P(B/A) = 0.80 y P(B/A´)

Del teorema de probabilidad total P(B/A) · P(A) + P(B/A´) · P(A´) = 0.8 · 0.4 + 0.3 · 0.6 = 0.5

Del teorema de Bayes

P(A/B) = 0.8 · 0.4 / 0.5 = 0.64

La probabilidad con que cuenta el gerente, la cual quería conocer, para lanzar el nuevo juguete al mercado es de 0.64. Esto implica que el juguete tiene el 64% de posibilidad de tener éxito si recibe un informe favorable.

EjerciciosEs probable que se sienta agotado(a) y no desee avanzar más, ¡regálese la oportunidad de alcanzar la cima, aun cuando parece no poder más!

1. Los miembros de una firma de consultoría rentan automóviles en tres agencias: 60% de la agencia 1; el 30% de la agencia 2; y el 10% de la agencia 3. Si el 9% de los vehículos de la agencia 1 necesitan afinación, el 20% de las unidades de la agencia 2 necesitan también afinación y el tres por ciento de los autos de la agencia 3 necesitan asimismo afinación. Encuentre la probabilidad:

a. De que un automóvil rentado a la firma necesitará afinación.b. Si el automóvil rentado a la firma necesita afinación. ¿Cuál es la probabilidad de

que este vehículo provino de la agencia 2?

2. Dos fábricas producen lámparas eléctricas. La primera proporciona el 70% de la producción total y la segunda el 30%; por otra parte, se sabe que el 83% de las lámparas suministradas por la primera fábrica se ajusta a las normas establecidas, mientras que sólo el 63 % de las producidas por la segunda fábrica se ajustan a las normas establecidas.

a. Encuentre la probabilidad de que las lámparas entregadas a un consumidor se ajusten a las normas establecidas.

b. Encontrar la probabilidad de que una lámpara haya sido producida por la primera fábrica, si se sabe que se ajusta a las normas.

3. El director de publicaciones de una editorial de libros, trata decidir si se debe publicar un nuevo texto de Estadística para Psicología. Los libros anteriores indican que 10% son

26

Page 27: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceñograndes éxitos, 20% tienen un éxito moderado, 40% apenas cubren los costos y 30% producen pérdidas. No obstante, antes de tomar una decisión para publicarlo, se someterá la obra a una revisión de críticos. En el pasado, 99% de los grandes éxitos recibieron críticas favorables; 70% de los éxitos moderados recibieron críticas favorables y, 40% de los que apenas cubrieron los costos recibieron críticas favorables y 20% de los que produjeron pérdidas recibieron críticas favorables.

a. ¿Cuál es la probabilidad de que el libro tenga una crítica favorable?b. Si el texto recibe una crítica favorable, ¿cómo debe el director de publicaciones

revisar las probabilidades de los diversos resultados para tener en cuenta esta información?

4. Un joyero compra relojes a dos casas proveedoras. La primera le sirve el 60% de los relojes, de los cuales el 0.4% son defectuosos; la segunda le proporciona el resto, siendo defectuosos el 1.5%. Un día el joyero, al vender un reloj, observa que este no funciona. Hallar la probabilidad de que el reloj proceda de la primera casa proveedora.

5. Un escritorio es producido en tres diferentes fábricas: F1, F2 y F3, a razón de 100, 140 y 160 unidades diarias. Además, se sabe que un 30%, 45% y 20% de las cantidades producidas son para exportar, respectivamente.

a. Si se elige un escritorio al azar, ¿qué probabilidad hay de que sea para exportación?b. ¿Qué probabilidad hay de que lo haya fabricado F1?

6. El volumen de producción de tres plantas diferentes de una fábrica es de 500 unidades en la primera, 1000 unidades en la segunda y 2000 unidades en la tercera. Sabiendo que el porcentaje de unidades defectuosas producidas en cada planta es de 1%, 0.8% y 2%, respectivamente. Calcular la probabilidad de que al seleccionar una unidad al azar, sea defectuosa.

7. Suponga que en una población de trabajadores el 40% son graduados de escuela primaria, 50% de secundaria y 10% de la Universidad. Entre los trabajadores que tienen educación primaria, hay un 5% de desempleo; y entre los que tienen educación secundaria, un 2%. 0.1% para los profesionales.

Si se elige un trabajador al azar y se encuentra que es un desempleado, ¿cuál es la probabilidad de que hubiera terminado sus estudios secundarios?

VII. INDEPENDENCIA DE EVENTOS

Independencia de eventos:

27

Page 28: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

Se dice que un evento F es estadísticamente independiente de un evento E si sólo si p(F/E) = p(F). Esto quiere decir que el conocimiento de E no modifica de ninguna forma la probabilidad de F.

A continuación, desarrollamos las consecuencias de la independencia de F con respecto a E. De la regla de la multiplicación

p(E F) = p(E) · p(F/E)

Cuando sustituimos lo dicho en la definición, se obtiene

Para sucesos independientesp(E F) = p(E) · p(F)

Esto implica a su vez

P(E) = p(E F)/p(F)

Es decirp(E/F) = p(E)

Nótese que utilizamos la frase “independencia estadística”, a fin de distinguirla de otras formas de independencia: Filosófica, lógica, etc. Ahora que comprendemos la independencia estadística y que hay acuerdo sobre el hecho de que es la única especie de independencia que se considerará, no hay peligro de confusión si omitimos la palabra “estadística”.

Ejercicios

1. Se arrojan honestamente tres monedas de un córdoba y se define:A: las dos primeras son escudo.B: la última moneda es escudo.C: las tres monedas salen escudo.

a. ¿Son A y B, independientes? Justifique.b. ¿Son A y C, independientes? Justifique.c. Calcule p(A B)

2. Cierto mecanismo electrónico tiene dos luces y conoce que se encienden o se apagan con las siguientes frecuencias relativas a largo plazo:

Luz 2 Luz 1

Si No

Si 0.15 0.45

28

Page 29: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

No 0.10 0.30

Por ejemplo, esa tabla significa que ambas luces estaban simultáneamente apagadas en un 30% del tiempo.

a. Encuentre la probabilidad de ambas luces estén encendidas.b. Encuentre la probabilidad de que luz 1 esté encendida y luz 2 apagana.

VIII. VARIABLES ALEATORIAS

Variable aleatoria discretaEn el caso de la planificación de una familia de 3 niños, suponga que la pareja se interesa fundamentalmente por el número de varones. Este es un ejemplo de variable aleatoria discreta y se acostumbra representarla con letra mayúscula

X: el número de varones.

Nota: Elabore una tabla de todos los resultados posibles que resultan en la planificación de una familia de 3 niños.

Usted entenderá que los valores posibles de X son: 0 (ningún varón), 1 (un varón), 2 (dos varones) y 3 (tres varones); sin embargo, no son igualmente probables. A efecto de determinar sus respectivas probabilidades, es necesario examinar el espacio de muestra original, así

Tabla de distribución de probabilidadesX P(X)0 1/81 3/82 3/83 1/8

Podemos ahora inferir el concepto de variable aleatoria discretaVariable aleatoria: Es una función con valores numéricos y definida sobre un espacio muestral.

Variable aleatoria discreta: Es aquella variable aleatoria que adopta sólo valores claramente separados, especificados por su distribución de probabilidades. Esta distribución de probabilidad p(x) - considere que X = x, donde x es cada valor que adquiere X- también puede representarse por medio de cualquiera de las 3 formas habituales usadas para representar una función:

En forma de tabla, como la anterior

29

Page 30: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

En forma de diagrama. Mediante fórmula.

La utilidad de la variable aleatoria es que el espacio muestral original se reduce a un espacio muestral más pequeño y conveniente, de naturaleza numérica. Además, el espacio de muestra original se introduce para permitir el cálculo de la distribución de probabilidades para el nuevo espacio; una vez cumplido este objetivo, se olvida el antiguo espacio difícil de manejar. Por lo tanto, es fácil responder a las interrogantes relativas a este nuevo espacio.

Importante: Todos los teoremas acerca de variables aleatorias discretas son igualmente válidos para variables aleatorias continuas, donde las integrales reemplazan a la suma. Para evitar una duplicación onerosa, solamente trato lo concerniente a la variable aleatoria discreta.

Por ejemplo: ¿Cuál es la probabilidad de un varón o menos?Para responder a esta interrogante, simplemente sumamos las probabilidades que hay en el nuevo espacio muestral, es decir:

P(X 1) = p(0) + p(1) = 1/8 + 3/8 = 1/2

Si se hubiera utilizado el espacio muestral original, también se podríamos haber encontrado la respuesta; pero sería más difícil encontrarla. Intente usted alcanzar el mismo resultado, utilizando el espacio muestral original.

Media, Varianza y desviación típica de una variable aleatoria discreta.A la media x, la varianza S2 y la desviación típica S de la muestra se pueden calcular a partir de la distribución de frecuencias. Es natural que se calculen los valores análogos a partir de la distribución de probabilidad y que se denominen media , varianza 2 y desviación típica de la distribución de la probabilidad p(x), o de la variable aleatoria X misma. Incluso, se las puede llamar , 2 y , de la población.

Media de población = x · p(x)

Varianza 2 = (x - )2 · p(x)

El cálculo de la varianza puede simplificarse mediante la expresión 2 = x2 · p(x) - 2

Ejemplo.Dada la siguiente distribución de probabilidad. Calcule su media y varianza poblacional.

x P(x)1 1/102 2/10

30

Page 31: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

3 3/104 4/10

Solución:Construimos una tabla para facilitar la observación de los cálculos

x p(x) x · p(x) (x - )2 (x - )2 · p(x)

1 1/10 1/10 4 4/102 2/10 4/10 1 2/103 3/10 9/10 0 04 4/10 16/10 1 4/10 1 3 1

Por lo tanto, podemos ver que = 3 y 2 = 1

Ejercicios¡Ánimo! No es el momento de flaquear.

1. A un importador le ofrecen un cargamento de máquinas por C$ 140 000 y las probabilidades de que las venda en C$ 180 000, C$ 170 000, o C$ 150 000 son: 0.32, 0.55 y 0.13, respectivamente. ¿Cuál es la utilidad esperada y la desviación estándar del importador?

2. Un propietario y gerente de una empresa restaurantera ofrece repeticiones gratis en todos los servicios de café. Reunió la siguiente información a cerca del número de repeticiones

Repeticiones Porcentajes0 301 402 203 10

a. ¿Cuál es la cantidad media para el número de repeticiones?b. Determine la desviación estándar.

3. El director de admisión de una universidad, estimó, como sigue, la admisión de estudiantes para el semestre de verano con base en pasadas experiencias

Admisiones Probabilidad1000 35%1200 25%

31

Page 32: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

1500 15%1800 15%2000 10%

a. ¿Cuál es el número de estudiantes admitidos para el semestre de verano?b. Evalúe la desviación estándar.

4. Un individuo, vende automóviles nuevos para una empresa. Generalmente negocia el mayor número de autos los sábados. Ha establecido la siguiente distribución de probabilidades para el número de autos que espera vender en un sábado particular.

Autos vendidos Probabilidad0 0.101 0.202 0.303 0.304 0.10

a. En un sábado común, ¿cuántos autos espera vender?b. Cuál es la desviación típica?

5. Al planificar una familia de 4 niños, encuentre la distribución de probabilidad de:a. X: el número de varones.b. Y: el número de cambios en la secuencia.

6. Cuando se arrojan dos dados no cargados, ¿cuál es la distribución de probabilidad de:a. la diferencia (valor absoluto) entre los números, D = X1 - X2?b. el número total de puntos, S = X1 + X2?

7. Calcule y para la distribución de probabilidad del problema 1.

8. Demuestre la expresión 2 = x2 · p(x) - 2 y utilícela para calcular la varianza del problema 2.b.

9. Escriba una expresión que permita calcular la desviación típica.Unidad II. ALGUNAS DISTRIBUCIONES ESPECIALES

Contenido:

1. La distribución normal.

32

Page 33: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

2. Distribución Binomial

3. Distribución de Poisson.

4. Distribución de la T de estudent.

5. Distribución ji-cuadrada.

I. DISTRIBUCION NORMAL

Distribución normalPara muchas variables aleatorias, la distribución de probabilidad es una curva específica y bien delineada que recibe el nombre de curva normal o de Gauss, la cual se muestra en la figura y, es la distribución de probabilidad más útil en estadística. Así, por ejemplo, los errores emanados en las mediciones físicas (fenómenos) y económicos útiles, a menudo están normalmente distribuidos.

Distribución normal estándarLa distribución de probabilidad de la variable normal estándar Z se define como:

P(z) = 1 e -(1/2)z √2

El valor Z, fue el estudiado en el curso de Estadística I, con la salvedad que la media y desviación estándar son poblacionales. Los números e y designan constante matemáticas conocidos por todos.

P(z)

z

En el gráfico anterior podemos ver que el máximo se alcanza en z = 0. La fórmula anterior confirma tal argumento: a medida que nos vamos más hacia la derecha o izquierda de 0, z 2 aumenta en el exponente negativo; en consecuencia p(z) disminuye, y se acerca a cero en ambos extremos. Además, esta curva es simétrica: dado que z aparece solamente en forma cuadrática (-z genera la misma probabilidad en p(z) que +z). Esto establece la forma de esta curva normal estándar.

Utilizando el cálculo integral podemos demostrar quez = 0 y z = 1

Por ésta razón, que z se denomina variable normal estándar. La probabilidad (área bajo la curva) comprendida por la curva normal por encima de cualquier valor especificado también requiere del manejo del cálculo integral para una evaluación exacta, pero se puede representar gráficamente sin dificultad. La evaluación de las integrales está en la Tabla I del apéndice.

33

Page 34: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño¿Cómo utilizar la tabla I?Ejemplo 1.Digamos que nos piden calcular la siguiente probabilidad P(z 0.6).

Solución:Nos ubicamos en el valor correspondiente 0.6 de la tabla I, como le corresponde 0.2743; podemos decir que

P(z 0.6) = 0.2743

Ejemplo 2.Supongamos que se necesitamos establecer p(0.6 z 1.3)

Solución:Si hacemos un análisis de las desigualdades en la campana de Gauss, fácilmente nos daremos cuenta que

P(0.6 z 1.3) = p(z 0.6) - p(z 1.3) = 0.2743 - 0.0968 = 0.1775

Ejemplo 3.Supongamos que necesitamos determinar p(-1 z 2).

Solución:Esto equivale a: 1 - p(z 2) + p(z 1)De esta manera la respuesta será p(-1 z 2) = 1 - (0.0228 + 0.1587) = 0.8185

Distribución normal generalSi una variable aleatoria X está normalmente distribuida, con media y desviación , su distribución de probabilidad tiene la forma

P(x) = 1 e-1/2(x-)/ 2 ·

Cabe aclarar que, en el caso especial en que la media es cero y la varianza uno, ésta se reduce a la distribución normal estándar. En fin, no olvide que para estandarizar utilizamos la expresión

Z = (X - )/

Con el objeto de evaluar cualquier variable normal X hay que transformar X en Z y después evaluar esta última en la tabla I del apéndice.

Ejemplo.Suponga que X es normal, con = 100 y = 5. ¿Cuál es la probabilidad de obtener un valor X de 110 o más?

Solución:

34

Page 35: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoComo se nos está pidiendo p(X 100), primero estandarizamos X, es decir Z = (110 - 100)/5 = 2Así, tenemos que p(Z 2).Ahora utilizamos la tabla I y vemos que

P(Z 2) = 0.0228.

La forma estandarizada permite una interpretación más clara de la pregunta original; es decir, que al fin y al cabo, lo que se preguntó fue: ¿Cuál es la probabilidad de obtener por lo menos un valor normal de dos desviaciones estándar por arriba de la media?. La respuesta es: muy pequeña -alrededor de uno en cincuenta-.

Ejercicios¡A trabajar! La recompensa se verá en el futuro.

1. Si z es una variable normal estándar, utilice la tabla I para evaluara. p(-1 z 1)b. p(- z 1.64)c. p(-2.33 z +)d. p(-2 z)e. p(z 2).

2. Si p(-zo z zo) = 0.95, ¿qué es zo? Y si p(-zo z zo) = 0.99, zo =?

3. Si X es normal, calcule:a. p(4.5 x 6.5) donde x = 5 y x = 1b. p(x 800) donde x = 400 y x = 200c. p(800 x) donde x = 400 y x = 200.

4. Suponga que se elige al azar un tornillo de una línea de producción y que éste tiene una longitud X que es una variable aleatoria normal con 10 cm y desviación estándar 0.2 cm. ¿Cuál es la probabilidad de que su longitud esté entre 9.9 y 10.1 cm?

5. Suponga que la población de las estaturas de los hombres están normalmente distribuidas con una media de 68 in, y con una desviación estándar de 3 in: Encuentre la proporción de hombres que:

a. tienen más de 6 ft;b. tienen menos de 5 ft y 6 in;c. están entre 5 ft 6 in y 6 ft.

35

Page 36: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño6. Sea h una variable aleatoria distribuida normalmente con media 26.7 y desviación típica 3.4. Halle la probabilidad que un valor individual de h, seleccionado aleatoriamente, se encuentra en los intervalos siguientes:

a. entre 26.7 y 31.7b. entre 20.0 y 24.0c. entre 28.0 y 30.0d. entre 20.0 y 30.0

7. Las lecturas del colesterol (en mg/dl) correspondientes a personas adultas de un grupo de edad particular, están distribuidas normalmente con media 210 y desviación típica 15. ¿Qué porcentaje de esta población tiene lecturas:

a. mayores que 250?b. Mayores que 150?

8. La vida útil de de una lámpara fluorescente, utilizada en invernaderos, está distribuida normalmente con media de 600 horas y desviación estándar de 40 horas. Determine la probabilidad de que:

a. Una lámpara elegida al azar tenga una vida útil entre 620 y 680 h.b. Tal lámpara dure más de 740 h.

9. Por lo general, los promedios finales distribuidos de manera normal, aproximadamente, con media 72 y desviación estándar 12.5. Un profesor afirma que el 8% superior de un grupo recibirá MB (muy bueno); el siguiente 20%, B (bueno); el siguiente 42%, M (mediano); el siguiente 18%, S (suficiente); y el 12% inferior, I (insuficiente). ¿Qué promedio debe

a. excederse para obtener MB?b. excederse para obtener una calificación mejor que M?c. obtener para aprobar el curso?

II. DISTRIBUCION BINOMIAL

Existen diversos tipos de variable aleatoria discreta. Sólo estudiaremos un tipo: el binomial.El ejemplo clásico de variable binomial es el siguiente:

S = cantidad de escudos en n lanzamientos de una moneda (de un córdoba).

Para generalizar nos referiremos a n “intentos” independientes, cada uno de los cuales resulta en “éxito” o “fracaso”, con probabilidades respectivas de p y q (q = 1 - p). Entonces, el número de éxitos S se denomina variable aleatoria binomial.

36

Page 37: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoAhora deduciremos una fórmula sencilla para la distribución de probabilidad p(s). Como ejemplo, consideremos el caso especial en el que se calcula que será probable obtener 3 caras al arrojar 5 veces una moneda sesgada, tal como muestra el siguiente espacio muestral:

E E E E E E E E…………E EE E E E U Conjunto de resultados E E E………....E UE E E U E .E E U E E .E E U U U 5 ensayos n ensayos .E U E E E .E E U U E E E E…E U….U UU E E E U .E E E U U .E E U E U .E U E E U S = 3 S = s .E U E U E .E U U E E .U E E U E .U E U E E .U U E E E U U…U E E E…EE U E U U .E U U E U .E U U U E .E U U U U .U E E E E .U E E U U .U E U E U .U E U U E .U E U U U .U U E E U .U U E U E .U U E U U .U U U E E .U U U E U .U U U U E .U U U U U U U…………..U

Concentrémonos en el evento “tres caras” (S = 3), y desarrollamos todos los resultados comprendidos por él. En cada uno de ellos, E aparece tres veces y U dos. Dado que la probabilidad de E es p y de U es (1 - p),

Por ejemplo, la secuencia entonces, en general, la secuencia

E E E U U E E…E U U…U 3 2 s veces (n - s) veces

Tiene probabilidad tiene probabilidadp · p · p · (1 - p) · (1 - p) = p · p ·…·p · (1-p) · (1-p) ·…· (1-p) =

p3 · (1 - p)2 ps · (1 - p)n-s

donde esta multiplicación simple se justifica por la independencia de los intentos. Además, cabe notar que todos los otros resultados en este evento tienen la misma probabilidad.

Ahora sólo resta determinar cuántas secuencias de este tipo (resultados) están incluidas en el evento analizado. Esto corresponde precisamente a la cantidad de formas en las que se pueden ubicar los tres escudos y los dos unos. Lo cual podemos hacer por medio de una combinación y la expresión que define una distribución binomial queda determinada por:

37

Page 38: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

p(s) = nCs · ps (1 - p)n-s

Ahora calculemos la probabilidad de obtener s = 3 caras en n = 5 lanzamientos.

Primero calculamos 5C3 = 10 y ya vimos que p3 · (1 - p)2 = (1/2)3 · (1/2)2 = 1/32Así, la probabilidad es:

p(3) = p(X = 3) = 10 · 1/32 = 10/32.

Este resultado podíamos obtenerlo usando la tabla II del apéndice, basta conocer n y s = x, para observa que nos da el mismo 0.3125. Es conveniente utilizar esta tabla cada vez que sea posible para evitar tediosos cálculos, aunque su uso es opcional.

Media y varianza de una distribución binomial.La media la podemos calcular por medio de la expresión

= n · p

La varianza la podemos calcular, utilizando la expresión2 = n · p · q

EjerciciosUsted es un ser pensante, logrará cosas importantes, éstos ejercicios sólo son para tener un momento diferente a los cotidianos. ¡Vamos!, ¡adelante!.

1. Elabore un diagrama de árbol para obtener la distribución de probabilidad para el número de unos cuando se arrojan 4 monedas. Controle la concordancia de su respuesta con la fórmula de la p(s).

a. Calcule y .b. Calcule la probabilidad de obtener 2 unos.

2. De un recipiente que contiene 2 fichas rojas 1 azul y 7 negras se extrae una. Se repone la ficha y se extrae otra, y así sucesivamente hasta que se hayan extraído 5 fichas.

a) Sea S: el número total de fichas rojas extraídas. Calcule y .b) Calcule la probabilidad de sacar 4 fichas rojas.c) Calcule la probabilidad de sacar 2 azules.

3. En cierta ciudad la incompatibilidad se da como la razón o motivo legal en 70% de todos los casos de divorcio. Obtenga la probabilidad de que 5 de los 6 divorcios siguientes de esta ciudad, argumenten incompatibilidad como motivo principal.

38

Page 39: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

4. Si el 40% de los ratones que se utilizan en un experimento se volvieran muy agresivos, en un minuto después de una administración de droga experimental. Determine la probabilidad de que exactamente 6 de 15 ratones a los que se les aplicó la droga, se vuelvan muy agresivos en un período de un minuto.

III DISTRIBUCION DE POISSON

La distribución de Poisson es una distribución de probabilidad que en muchas ocasiones prácticas es muy importante. Un proceso de Poisson no sólo representa números de fenómenos discretos, sino que el modelo de Poisson se usa para proporcionar aproximaciones a la distribución binomial.

Como ejemplos de fenómenos que dan distribución de Poisson, son: Número de llegadas de carros, en el día, en un peaje. Número de manchas en una yarda cuadrada de tela. Número de accidentes industriales por unidad de tiempo.

La distribución de probabilidad para una variable aleatoria de Poisson está dada por:

P(x, ) = (x e-)/x! x = 0, 1, 2….

X es el número de eventos raros por unidad tiempo, distancia, espacio, etc.

Ejemplo.En el puerto de corinto llegan 5 barcos semanalmente. ¿Cuál es la probabilidad de que un día determinado lleguen al menos 2 barcos?

Solución:Sea x: Número de barcos que llegan un día determinado.

p = 1/7n = 5

Por lo tanto = 5 · 1/7 = 5/7El ejercicio lo podemos evaluar desde dos puntos de vista equivalentes; es decir, que cualquiera podemos utilizar:

P(x 2) = p(x = 2) + p(x = 3) + p(x = 4) + p(x = 5)

Ó

P(x 2) = 1 - p(x 2) = 1 - p(x=0) + p(x=1)

Por tener el procedimiento más corto, utilizamos el último

39

Page 40: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoP(x=0) = (5/7)0 · e-5/7 / 0! = 0.4895

P(x=1) = (5/7)1 · e-5/7 / 1! = 0.3496

P(x 2) = 1 - (0.4895 + 0.3496) = 0.1609

La probabilidad de que lleguen al menos dos barcos es muy baja. Por lo tanto, es muy remoto que lleguen dos barcos al puerto.

IV. DISTRIBUCION DE LA T DE student

Supondremos que las poblaciones originales son normales; de otro modo la distribución “t” sólo sería aproximadamente válida.

Al calcular una media de población con una media muestral x, por lo general el estadígrafo no dispone de información acerca de la desviación estándar de población . Por lo tanto, se debe usar la desviación estándar muestral “s”.

Como x tiene una distribución normal; cuando se conoce , se construye la variable normal estandarizada

Z = (x - )/(/n )

Por analogía, se introduce la variable “t de student”. Cabe señalar que la siguiente expresión tiene una deducción matemática.

t = x - n s

La similitud entre estas dos variables (Z y t) se hace evidente de inmediato. La única diferencia es que Z implica la desviación estándar poblacional, que generalmente se ignora; pero “t” implica la desviación estándar muestral, que casi siempre se puede calcular a partir de la muestra.

La distribución de t se compara con Z en la tabla III del apéndice.

La distribución de “t” no se tabula de acuerdo con el tamaño de la muestra n, sino más bien conforme al divisor que aparece en s2, el cual ahora recibe el nombre de grados de libertad. Al calcular la varianza se utiliza el divisor

Grados de libertad d.f. = n - 1Por ejemplo, para una muestra con n = 3, entonces d.f. = 2, y se determina -al consultar la tabla III- que el valor crítico de t que deje 2.5% de probabilidad en el extremo superior es

t0.025 = 4.30

40

Page 41: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

Por lo que debemos inferir que cualquier t observada

P(-4.3 t 4.3) = 95%

Es probable que el 95% le confunda, pero recuerde la campana de Gauss, y por la expresión de la “t de student”, ésta distribución debe ser más extendida que la normal, mientras para Z = 2 esperamos un 95%, para “t” debemos inferir que le corresponde un valor semejante.

Sustituyendo t de acuerdo a la t de student

P(-4.3 (x - )/(s/n ) 4.3) = 95%

Ahora esta deducción se puede invertir, para producir una inferencia: para un tamaño de muestra 3, el intervalo de confianza del 95% para la media poblacional es

= x 4.3s/n

Por ejemplo, que de un grupo numeroso se extrae una muestra de 3 calificaciones, de la tabla de abajo. Sustituyendo en la fórmula anterior se obtiene el intervalo de confianza del 95% para la media del curso completo

= 60 4.393/3 = 60 24

Tabla: Análisis de t de student de una muestraCalificaciones observadas (xi - x) (xi - x)2

56 -4 1671 11 12153 -7 49180 0 186

Vemos que x = 180/3 = 60 y s2 = 186/2 = 93

Para un tamaño de muestra general n, se tiene el intervalo de confianza del 95% para la media de población:

= x t0.025 · s/n

Donde t0.025 es el valor crítico “t” que deje 2.5% de probabilidad en el extremo superior, con n - 1 grados de libertad.

Si el tamaño de la muestra es grande, la normal es una aproximación bastante exacta de t. En la práctica, la distribución t sólo se utiliza para pequeñas muestras cuando se desconoce , en los otros casos se emplea la normal.

41

Page 42: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoA medida que disminuye el tamaño de la muestra n, el valor estimado pierde precisión. Esto se hace evidente cuando observamos el divisor n por que éste se hace más pequeño.

Ejercicios¡¿Quién dijo miedo?!

1. Dieciséis estaciones meteorológicas de un estado -de lugares escogidos al azar- miden las precipitaciones. En 1967 se registró un promedio de 10 pulg. y una desviación estándar de 1.5 pulg. Para la precipitación media del estado construya un intervalo de confianza del 95%.

2. Se controló la velocidad promedio de 110 km/h de 100 automóviles en una autopista (desviación estándar de 6 kilómetros por hora). Construya un intervalo de confianza del 95% para la velocidad media de todos los autos en dicha autopista.

3. Una muestra aleatoria de 4 estudiantes de un grupo numeroso de estudiantes de Estadística obtuvo las siguientes calificaciones: 56, 70, 55, 59. Construya un intervalo de confianza del 95% para la calificación promedio de todos los estudiantes del curso.

V. DISTRIBUCION JI CUADRADA

Ahora analizaremos otro ejemplo de intervalo de confianza; este ejemplo es importante, no tanto por su valor práctico, sino por los conocimientos que aporta.

Sea una distribución normal N(, 2) donde se desconocen tanto como 2. hasta ahora, la variancia de muestra y población se calcularon como medio para determinar un intervalo de confianza para la media muestral. Suponga que la atención recae en y no en . Por ejemplo, se podría preguntar: ¿Qué varianza tiene la balanza de pagos de Japón? El propósito de esta pregunta es obtener alguna indicación de los requerimientos del Japón en cuanto a reservas de moneda extranjera. También se puede preguntar: ¿Cuál es la varianza del ingreso agrícola?, para evaluar una política de estabilización del Japón, de ser necesaria. Para calcular la varianza se supondrá que la población está normalmente distribuida.

Para saber cómo está distribuido el indicador s2 entorno a 2, generalmente se utiliza la definición de la variable denominada “ji cuadrada”

C2 = s2/2

42

Page 43: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoEs evidente que cuando s2/2, esta razón es 1; de modo que la pregunta ahora sería ¿Cómo está distribuida C2 en torno a 1? Los valores críticos se presentan en la tabla IV del apéndice, tabulados de acuerdo a d.f. = n - 1, como la t de student. Para usar la tabla de C2 ajustada se utiliza

C2 = x2 / d.f.

Donde x2 es la ji-cuadrada ordinaria.

Como tanto el numerador como el denominador son positivos en C2; por lo tanto, la variable C2 también lo es, con su distribución situada a la derecha de cero. Advierta que la distribución es asimétrica hacia la derecha en valores de muestra pequeña. Sin embargo, a medida que se agranda n, este sesgo desaparece y la distribución de C2 se aproxima a la normalidad.

Dado que s2 es un estimador no sesgado de 2, el valor esperado de cada una de eestas distribuciones C2 es 1. Además, a medida que aumenta el tamaño de la muestra, C2 se encuentra cada vez más cerca de 1, indicando que s2 se convierte cada vez más en un estimador preciso de 2.

Ahora podemos inferir un intervalo de confianza del 95% para 2. según la técnica utilizada en la t de student.

Por ejemplo, supongamos que tenemos una muestra de n = 11 (d.f. = 10). A partir de la tabla IV, se establecen los puntos críticos que cortan 2.5% de la distribución en cada extremo, así

P(0.325 s2/2 2.05) = 95%

Despejando 2, obtenemos el enunciado equivalente

P(s2/2.05 2 s2/0.325) = 95%

Si por ejemplo, el valor observado de s2 es 3.6. Entonces el intervalo de confianza para 2

es1.76 2 11.1

Este es un nuevo caso de intervalo de confianza asimétrico.

En general, los valores críticos superior e inferior de C2 se designan mediante C0.025 y C0.975 y el intervalo de confianza para 2 se escribe

s2/C20.025 2 s2/C2

0.975

Ejercicios

43

Page 44: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño1. Si una muestra de 25 puntajes de cociente intelectual de cierta población tiene s2 = 120, construya un intervalo de confianza del 95% para la población 2.

2. Se tomaron muestras independientes de dos cursos y se registraron las siguientes calificaciones:

Muestra 175706075

Muestra 252604258

Construya un intervalo de confianza del 95% para:a) La primera muestra del problema.b) La segunda muestra del problema.c) La muestra combinada (utilice s2 promedio y d.f. = n1 + n2 - 2)

3. Se tiene una muestra del ritmo cardíaco de cierta población que visita una unidad médica. La muestra contempla 6 individuos con s2 = 69.Construya un intervalo de confianza del 95% para la varianza de población.

Unidad III. TECNICAS DE MUESTREO

Contenido:

1. Introducción.

2. Diferencia entre dos media.

3. Hipótesis.

4. Análisis de varianza.

I. INTRODUCCION

En las unidades anteriores analizamos la probabilidad y las variables aleatorias, de modo que ahora estamos en condiciones de resolver la cuestión deductiva básica en Estadística: ¿Qué podemos esperar de una muestra aleatoria extraída de una población?

Ya hemos visto algunos ejemplos de muestreo: la encuesta de votantes -cuya muestra se extrae de la población de todos los votantes-, la muestra de focos extraída de una población total de focos, una muestra de estatura de hombres tomada de la población total, una

44

Page 45: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceñomuestra de 2 fichas de un recipiente con fichas. Existen diversas formas de llevar a cabo el proceso físico del muestreo aleatorio. Por ejemplo, suponga que se quiere extraer una muestra aleatoria de una población de estudiantes en el aula.

1. El método más gráfico consiste en registrar a cada persona en una ficha de cartón, mezclar todas estas fichas en un recipiente grande y luego extraer la muestra.

2. Un método más práctico es el de asignar un número a cada persona y posteriormente extraer una muestra aleatoria de números.

Observación importante:En población grande, como en el caso de millones de personas, el hecho de que reemplacemos o no cada ficha antes de extraer la siguiente, prácticamente no establece ninguna diferencia. Después de todo, ¿qué es una ficha en un millón? Sustancialmente, no modifica las frecuencias relativas, p(x).Sin embargo, en poblaciones pequeñas, el reemplazo de cada ficha muestreada es una cuestión importante.

Suma muestralAhora estamos en condiciones de poner en práctica la teoría desarrollada anteriormente. Al extraer una muestra aleatoria de una población, considere la suma muestral:

S = X1 + X2 + … + Xn (por definición)

Como S es la suma de variables aleatorias, también será una variable aleatoria. ¿Cómo fluctúa? En particular, ¿cuál es su media y cuál su varianza?Como ya conocemos las propiedades de las funciones, podemos decir que:

E(S) = E(X1) + E(X2) + … + E(Xn) Utilizo E (valor esperado) para evitar confusión.

Como el valor esperado de cada Xi es , tal que:

E(S) = + +…+ E(S) = n

La varianza de S se puede determinar análogamente, por que todos sus componentes variables son independientes, podemos decir que:

var(S) = var(X1) + var(X2) + … + var(Xn) var(S) = 2 + 2 +…+ 2

var(S) = n2

s = n · Esta es una deducción importante: hemos inferido el comportamiento de una suma muestral a partir del conocimiento de la población original.

45

Page 46: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoPor ejemplo, suponga una muestra de n = 4 observaciones que se extrae de una población de estaturas Densidad de = 3.2 probabilidad

60 =69 78 altura (pulg.)

La suma muestral oscilará alrededor de: E(S) = 4

Con desviación estándar s = 2

No es extraño que s sea n veces . Más ¿Por qué s debía ser sólo n veces ? Lo característico es que una suma muestral incluya algunos individuos (alturas, por ejemplo) de tamaño mayor que el ordinario y otros de tamaño menor, de modo que se produzca cierta cancelación.

La media muestralA partir de lo anterior es fácil deducir la media muestral:

X = (1/n) · (X1 + X2 +…+Xn) Por definición

X = (1/n) · S

Así obtenemos lo que se conoce como esperanza matemática

E(X) = (1/n)·E(S) = (1/n) (n)

E(X) = Esperanza matemática

Cuestión que ya habíamos advertido con anticipación y, que ya se veía venir.

Análogamente se obtiene la varianza, también conocido como error estándarvar(X) = (1/n)2 · var(S)

var(X) = (1/n)2 ·n2

var(X) = 2/n

x = /n Error estándar de la media

46

Page 47: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

Por ejemplo, consideremos una vez más la muestra de cuatro observaciones extraída de una población de estaturas representada en el gráfico de la página anterior. La media muestral X oscila alrededor de:

E(X) = Con desviación estándar

x = /2

Teorema del límite centralA medida que aumenta el tamaño de la muestra n, la distribución de la media, X, de

una muestra aleatoria extraída de prácticamente cualquier población se aproxima a la distribución normal (con media y desviación estándar /n).

Observación: la media muestral se vuelve normalmente distribuida a medida que n crece independientemente de lo que sea la población original (no normal)

Ejemplo.Considere las calificaciones que en un grupo numeroso de estudiantes obtuvo en un examen de Estadística. Si las calificaciones tienen una distribución normal con una media de 72 y desviación estándar de 9, comparemos (1) -la probabilidad de que cualquier estudiante obtenga más de 78- con (2) -la probabilidad de que una muestra de 10 estudiantes alcance un promedio superior a 78.

1. La probabilidad de que un solo estudiante tenga 79 se determina estandarizando la población normal

p(X 78) = p(X-)/ (78-72)/9 =p(Z 0.67) = 0.2514 (usando tabla I)

2. Ahora consideremos la distribución de la media muestral. Del teorema del límite central sabemos que esa distribución es normal ( = 72 y /n = 9/10). Estandarizamos nuevamente, para calcular la probabilidad de que una media muestral exceda 78.

p(X 78) = p(X-)/(/n) (78-72)/(9/10) = p(Z 2.11) = 0.0174

En consecuencia, auque existe una probabilidad razonable (alrededor de ¼) de que un estudiante obtenga más de 78, es muy pequeña la probabilidad (cerca de 1/60) de que un promedio muestral de diez estudiantes tengan buen rendimiento.

Ejercicios

47

Page 48: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

1. En cierto edificio de oficinas, la población de empleados tiene pesos distribuidos en torno a una media de 150 lb, con una desviación estándar de 20 lb. Un grupo de 25 empleados, escogidos al azar, utiliza el ascensor todas las mañanas. Encuentre la media y la varianza de:

a) El peso total S.b) El peso promedio.

2. Un recipiente contiene seis fichas numeradas del 1 al 6. Se extrae con reemplazo una muestra de 2 fichas.

a) Calcule la distribución de S = X1 + X2 tabulando la distribución conjunta de X1 y X2.b) Determine la media y la varianza de S

3. El peso de los paquetes llenados por una máquina están normalmente distribuidos en torno a una media de 25 onzas, con una desviación típica de 2 onzas. ¿Cuál es la probabilidad de que n paquetes de la producción de la máquina tenga un peso promedio menor de 24 onzas si:

a) n = 4b) n = 16c) n = 64

4. La cantidad de dinero que las personas de cierta ciudad llevan en sus bolsillos tiene una distribución no normal con una media de C$30 y una desviación estándar de C$8.30. ¿Cuál es la probabilidad de que un grupo de 225 individuos lleve un total mayor a 2100?

Intervalo de confianzaYa sabemos que la media y varianza de población, y 2, son constantes (a pesar que generalmente son desconocidos) y reciben el nombre de parámetros de población.

Por el contrario, la media muestral X y la varianza muestral s2 son variables aleatorias que cambian de muestra a muestra con cierta distribución de probabilidad. De acuerdo al teorema del límite central X N (, 2/n).

Partamos del siguiente ejemplo: suponga que se quiere estimar la estatura promedio de los hombres en una gran universidad de la capital. Esta media de población es un parámetro fijo, pero desconocido. Se calcula tomando una muestra de 25 hombres, por ejemplo. Suponga que la media muestral X resulta de 68 pulgadas. Gracias a la teoría del muestreo sabemos que, a menos que seamos muy afortunados, este valor estimado X no estará totalmente ajustado, sino que más bien será un poco más alto o un poco bajo (X está distribuida en torno a ). Si se quiere tener confianza en la corrección de la inferencia, no

48

Page 49: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceñose puede pretender que sea precisamente igual a la X observada; debemos hacer una concesión -conocida como intervalo de confianza- en la siguiente forma:

= X error de muestreo

En primer término hay que decidir qué grado de confianza buscamos para la corrección de nuestro valor estimado de intervalo; ciertamente, se espera que ese valor incluya a , lo usual es elegir un intervalo de confianza del 95%. Esto implica que nos queda fuera un 2.5% (0.025) por el extremo superior de la distribución normal. Considerando la distribución t de student, el error estándar de la media y la tabla III (observe que también lo verifica la tabla I). Formulamos:

p( - 1.96·/n X + 1.96·/n) = 95%

Podemos también pensar en la equivalencia siguiente

p(X - 1.96·/n X + 1.96·/n) = 95%

Le dejo a usted justifique esa “inversión”. No olvide las propiedades de las desigualdades.

Una forma abreviar la expresión anterior es a partir de

= X Z0.025 /n

EjerciciosQuerer, es poder.

1. Se seleccionaron al azar 40 calificaciones de las obtenidas por un grupo numeroso de estudiantes de Estadística

71 74 65 72 64 42 62 62 58 8249 83 58 65 68 60 76 86 74 5378 64 55 87 56 50 71 58 57 7558 86 64 56 45 73 54 86 70 73

Construya un intervalo de confianza del 95% para la calificación promedio de la totalidad del curso.2. Los tiempos de reacción de 150 conductores escogidos al azar tienen una media de 0.83 segundos y una desviación estándar de 0.20 segundos. Encuentre un intervalo de confianza para el tiempo medio de reacción de la población total de conductores.

3. para el ejercicio 1 de la pág. 42 (el que trata sobre las estaciones meteorológicas). Construya un intervalo de confianza del 99%.

49

Page 50: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

4. Un antropólogo midió (en pulgadas) las estaturas de una muestra aleatoria de 100 hombres de cierta población y, estableció que la media y varianza muestrales eran 71 y 9, respectivamente.

a) Encuentre un intervalo de confianza del 95% para la estatura media de la población total.

b) Determine un intervalo de confianza del 99%.

II. DIFERENCIA DE DOS MEDIAS

Diferencia de dos mediasPara comparar dos medias de población podemos hacerlo calculando su diferencia:

1 - 2

Del teorema del límite central y por las consideraciones expresadas en tópicos anteriores

E(X1 - X2) = E(X1) - E(X2) =1 - 2

var(X1 - X2) = (+1)2 varX1+ (-1)2 varX2

= 21/n1 + 2

1/n1

Y como la distribución será aproximadamente normal y, la combinación lineal existente

(X1 - X2) (1 - 2, 21/n1 + 2

2)

Considerando el análisis hecho antes, obtenemos:

Intervalo de confianza de 95% para la diferencia entre medias

1 - 2 = (X1 - X2) 1.96 (21/n1 + 2

2/n2)

Diferencia de dos medias ( 1 - 2), muestras independientes Se supondrá que, como ocurre con frecuencia, auque las dos poblaciones pueden tener medias diferentes, tienen una varianza común. Cuando se conoce 2, la expresión del intervalo de confianza de la página anterior es adecuada; cuando es desconocida hay que calcularla. La estimación apropiada consiste en sumar todas las desviaciones cuadráticas de ambas muestras y después dividirlas entre los grados de libertad (n1 - 1) + (n2 - 1), a efecto de obtener un estimador no sesgado que se denomina varianza muestral conjunta:

50

Page 51: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

S2p = 1 (X1i - X1)2 + (X2i - X2)2 Las sumatorias van hasta n1 y n2, respectivamente.

(n1+n2-2)Donde X1i (o X2i) es la i-ésima observación en la primera (o segunda) muestra. Además, la sustitución de por sp en la expresión del intervalo de confianza para la diferencia de medias, requiere el uso de la distribución t, y obtenemos

Intervalo de confianza del 95% para la diferencia de medias

1 - 2 = (X1 - X2) t0.025 sp (1/n1 + 1/n2)

Donde t0.025 es el valor crítico con d.f. = n1 + n2 - 2.

Como ejemplo, suponga que se extrajeron y analizaron dos muestras de grupos de calificaciones obtenidas por estudiantes de dos grupos numerosos, tal como se muestra en la tabla siguiente

Tabla. Análisis de 2 muestras independientesCurso 1 Curso 2

X1i observada X1i - X1 (X1i - X1)2 X2i observada X2i - X2 (X2i - X2)2

64668977

-10-8153

100642259

567153

-411-7

1612149

X1 = 74 0 398 X2 =60 0 186

S2p = 1 (398 + 186) = 584/5 = 117

(4+3-2)

d.f. = 5

Sustituyendo en la fórmula de muestras independientes, se obtiene el intervalo de confianza del 95% para la diferencia entre las dos medias del curso,

(1 - 2) = (74 - 60) 2.57117 (1/4 + 1/3) = 14 21.1

El valor 2.57 se obtiene de la tabla III.

En esta forma se ve que la gran diferencia en las medias muestrales queda oscurecida por una tolerancia de error de muestreo aún más grande; sobre todo, esa tolerancia es la consecuencia de la pequeñez de la muestra. Este procedimiento no sólo requiere que la varianza de las calificaciones sea la misma en los dos cursos, sino también que las muestras se hayan extraído de forma independiente. Por ejemplo, no se puede muestrear un par de individuos que estudien juntos, uno de cada grupo, puesto que podrían tener hábitos de estudio muy semejantes y, quizá, sus exámenes fueran muy parecidos

51

Page 52: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoDiferencia de dos medias ( 1 - 2), muestras apareadas Ahora supongamos que muestreamos dos grupos de estudiantes en un mismo grupo de la UML-San Carlos. En el caso de comparar las calificaciones obtenidas en los trimestres de invierno y verano, supóngase que se desea recurrir dos veces a los mismos estudiantes en ambas muestras; entonces, no cabe la aplicación de la fórmula de la página anterior que requiere que las muestras sean independientes.

El primer paso lógico es determinar de qué manera cambió cada estudiante; es decir, hay que calcular la diferencia D = X1 - X2 para cada uno (o lo que conduce a la misma conclusión X2 - X1). Una vez que se hayan calculado estas diferencias se pueden descartar los datos originales que ya cumplieron con su finalidad. Se procede a tratar la diferencia D como una muestra única y se analiza tl como se hace con cualquier muestra única (como la observada en la tabla analizada en la t de student). Primero se calcula la diferencia promedio D y luego se emplea adecuadamente el intervalo de confianza obtenido en la distribución “t”, a fin de obtener un intervalo de confianza del 95% para el parámetro de población equivalente; es decir,

Diferencia promedio entre las dos poblaciones,

= D t0.025 · sD/n

Utilicemos la tabla siguiente para realizar los cálculos

EstudiantesCalificaciones observadas Diferencia

D = X1 - X2

(D - D) (D - D)2

X1 verano X2 inviernoABCD

64668977

54547062

10121915

-4-251

164251

D = 56/4 = 14.0

0S2

D = 46/3 = 15.5

Observemos que la diferencia promedio es

= 14 3.18 15.3 4= 14 6.2

Por supuesto se acepta que es la diferencia entre los promedios de población, 1 - 2, de manera que el problema queda resuelto.

Ejercicios

1. Antes y después de cierto tratamiento, se mide la capacidad respiratoria de cinco personas elegidas al azar y se obtienen los datos que se consignan a continuación. Sea X (y Y) la capacidad media de toda la población antes (y después) del tratamiento. Construya un intervalo de confianza del 95% para (Y - X)

52

Page 53: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

Capacidadrespiratoria

PersonaAntes (X) Después (Y)

ABCDE

27502360295028302250

28502380293028602320

2. En una muestra aleatoria de 10 futbolistas la edad promedio fue de 27 y la suma de las desviaciones cuadráticas fue de 300. En una muestra aleatoria de 20 jugadores de jockey la edad promedio fue 25 y la suma de las desviaciones cuadráticas 450. Con un intervalo de confianza del 95%, calcule la diferencia entre las medias de población; suponga que 1 = 2

3. dadas las siguientes muestras aleatorias de dos poblaciones,

n1 = 25 X1 = 60 s1 = 12n2 = 15 X2 = 68 s2 = 10Y suponiendo 2 = 1

Encuentre un intervalo de confianza del 95% para (1 - 2).

Diferencia de proporciones a) Muestras grandes

Para comenzar, una proporción muestral P(S/n, suma muestral vs el tamaño de la muestra), es una media muestral X disfrazada que se extrae de una población en el que la variable aleatoria tiene dos posibles resultados “1” (es, existe, etc.) o “0” (no es, no existe, etc.).

Un ejemplo de este tipo de variable esX: cantidad de votos emitidos a favor del FSLN

De esto podemos decir que se vota a favor o en contra; así, la variable toma los siguientes valores

X = 0 si no es FSLN = 1 si es FSLN

Por ejemplo, si se observa 4 “Sandinistas” en una muestra de 10, entonces:P = X = 1/10 · (1 + 1 + 0 + 0 + 0 + 1 + 0 + 1 + 0 + 0) = 4/10.

Análogamente, la proporción de población es la media disfrazada en el mismo tipo de población. Por lo tanto, para construir un valor estimado de intervalo para una proporción podemos transformar la expresión obtenida en el intervalo de confianza (pág. 49). Así, con una muestra grande se tiene el intervalo de confianza del 95% para

53

Page 54: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

Intervalo de confianza del 95% para la proporción, n grande

= P z0.025P (1 - P)/n

Donde z0.025 es el valor crítico que deja 2.5% de probabilidad en el extremo superior.

a) Muestras moderadamente grandes

En el caso de muestras moderadamente grande (alrededor de 50 n 100). Aun cuando existen diversas opciones, utilizaremos la más conservadora, el intervalo de confianza del 95% podría ser

= P 0.98/n

Note que esto se debe a que el máximo valor del producto (1 - ) es ¼ y, z0.025 = 1.96

Ahora ya podemos obtener la diferencia de proporciones, 1 - 2

Tal y como se obtuvo el intervalo de confianza para la diferencia de las medias, se puede inferir el intervalo de confianza para comparar las dos proporciones de población

Intervalo de confianza del 95% para la diferencia de proporciones, n1 y n2 grandes (1 - 2) = (P1 - P2) 1.96P1(1-P1)/n1 + P2(1-P2)/n2

Ejercicios

1. En una encuesta realizada en 1970 sobre 1063 estudiantes universitarios, en USA, se determinó que el 49% de los entrevistados pensaba que se produciría un cambio en Estados Unidos en los siguientes 25 años; además, afirmaban que ese cambio se realizaría pacíficamente y no por medio de una revolución.

a) Construya un intervalo de confianza del 95% para la proporción de población .b) Repita (a) suponiendo que se observó la misma proporción muestral de 0.49en una

muestra de 100. Compare.

2. Como respuesta a la pregunta de la encuesta anterior, el 50% de los estudiantes de 18 años de edad o menos dio la misma respuesta que el 69% de aquellos de 24 años y mayores a ella.

54

Page 55: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

a) Si se supone que se muestrearon 300 estudiantes en cada grupo, ¿cuál es el intervalo de confianza para la diferencia en las proporciones de población?

b) Suponga que se observaron las mismas muestras P1 y P2 en una muestra de 500 del grupo (18 años o menos) y otra de 100 del segundo grupo (24 años y más). Construya otra vez un intervalo de confianza del 99% para la diferencia de las proporciones de población.

3. En la misma encuesta, 7% de los estudiantes se ubicaron así mismos en la extrema izquierda de la política. Construya un intervalo de confianza del 95% para la proporción de población de la extrema izquierda.

4. En una muestra aleatoria de neumáticos, fabricados por cierta compañía, 20% no satisfizo las normas de calidad. Construya un intervalo de frecuencia del 95% para la proporción de población total de neumáticos que satisfacen las normas de calidad.

5. En dos ciudades se tomaron muestras de automóviles; cada muestra era de 100 automóviles. En una ciudad, 72 automóviles pasaron con éxito la prueba de seguridad; en la segunda, únicamente lo hicieron 66. Construya un intervalo de confianza del 95% para la diferencia entre las proporciones de autos seguros en las dos ciudades.

III. HIPOTESIS

De nuevo tomemos el ejemplo concerniente a las calificaciones obtenidas por estudiantes (analizado en los datos apareados, pág.52). En este ejemplo, el intervalo de confianza para la diferencia entre los promedios obtenidos en los trimestres de verano e invierno aproximadamente era:

= 14 6es decir,

8 20Esto significa que calculamos , con 95% de confianza, entre 8 y 20.

Las hipótesis se hacen a través de intervalos de confianza, los cuales deberán indicar cuáles valores deben ser rechazados y cuales aceptados (los que aceptaremos serán los que estén en el intervalo de confianza). Por lo tanto:

Un intervalo de confianza se puede considerar como el conjunto de las hipótesis aceptables.

De particular interés es el valor = 0. Como representa la falta de diferencia (entre las calificaciones promedio), se denomina hipótesis nula Ho. Esa hipótesis se encuentra fuera del intervalo de confianza ( = 14 6), por lo tanto se rechaza. Al rechazarla se establece que efectivamente existe una diferencia entre las calificaciones correspondientes a los

55

Page 56: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceñocursos de invierno y verano; en consecuencia, estos resultados se califican como estadísticamente significativos .

La significación estadística implica que se recabaron datos suficientes para afirmar la existencia efectiva de una diferencia. No se pretende que dicha diferencia sea necesariamente importante. Por ejemplo, en otra prueba fundada en muestras muy grandes de población casi idénticas, el intervalo de confianza del 95% en vez de = 14 6, podría ser:

= 0.014 0.006

Esta diferencia es tan pequeña que cabría omitirla, pues carece de un verdadero interés; sin embargo, desde el punto de vista estadístico es tan significativa como = 14 6.

Ejercicios

Para cada uno de los siguientes ejercicios, establezca si los resultados son estadísticamente significativos al nivel de confianza del 95% (nivel de significación del 5%)

1. Para determinar la efectividad de cierta vitamina se obtuvieron los siguientes resultados:Aumentos de peso en dos grupos de ratas

Grupo de control Grupo tratado121914

1816232023

Suponga que 1 = 2 y construya un intervalo de confianza del 95% para el “efecto de la vitamina”, 2 - 1.

2. Para medir el efecto de un tratamiento de fumigación aérea en contra de cierto insecto, se seleccionaron al azar 300 árboles de un monte. Se midió cada árbol antes y después del tratamiento y entonces fueron clasificados en las cuatro células de la siguiente tabla.

DespuésAntes

No infectado Infectado

No infectado 220 3Infectado 32 45

Si x es la proporción infectada en la población de árboles antes del tratamiento y y

después del tratamiento, encuentre un intervalo de confianza del 95% para (y - x) el cambio en las tasas de infección (sugerencia: para cada uno de los 300 árboles, sea X una variable de conteo que sirva para medir si un árbol está o no infectado antes del tratamiento y, Y una variable de conteo que sirva para hacer la medición después del tratamiento. Por lo tanto, se pueden registrar los datos como en la siguiente tabla

56

Page 57: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

Tabla. Detalle de la tabla anterior, árbol por árbolÁrbol X Y

1234...

1001...

0001...

Adviértase que los árboles nº 2, 3… se encontrarán entre los 220 árboles clasificados en la célula superior izquierda de la tabla; los árboles nº 1,4… se encontraran entre los 32 clasificados en la célula inferior izquierda, etc. Al estar comparando podemos utilizar la diferencia promedio entre las poblaciones)

3. Supongamos que para ingresar a la UML se requiera tener una entrevista con la sede de Nueva Guinea o sede San Carlos. A fin de probar que ambas sedes manejan las mismas normas, la universidad somete a 100 candidatos a una entrevista con ambas sedes. Además, se trata de una muestra, extraída al azar, de la población grande de todos los candidatos. El siguiente cuadro de frecuencia sintetiza el resultado

Sede N/GSede S/C

Aceptado Rechazado Totales

Aceptado 48 5 53Rechazado 12 35 47

Totales 60 40 100A primera vista, parece que la sede S/C tiene normas más estrictas por que su tasa de rechazo en la muestra es 47%, mientras que la correspondiente a la sede N/G sólo es 40%.

a) Haga otro análisis.Pruebas de hipótesisTodas las estrategias estudiadas hasta el momento nos permiten hacer pruebas de hipótesis. Consideremos en forma de resumen algunos complementos sobre este tipo de pruebas. Para ello consideremos la siguiente situación:

Mediante un proceso de manufactura, durante muchos años, se produjeron tubos para televisores, con una vida media = 1200 horas, y una desviación estándar = 300 horas. Se somete a prueba un nuevo proceso sobre una muestra de 100 tubos; el proceso da un nuevo promedio muestral de 1245 horas (se supone que la desviación estándar permanece invariable) ¿Tiene la media muestral significación estadística (es decir, difiere notablemente del valor Ho de 1200) a un nivel de confianza de:

1. 95%2. 90%3. 50%4. 80%5. 90%

57

Page 58: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

Solución:Haré el numeral 3, (el resto queda de tarea)Primero encontraré la media de población para el nuevo proceso, con un intervalo de confianza 50%, por medio de la expresión

´ = X Z0.25 /nObserve que el subíndice de Z es 0.25 y no 0.025 ¿por qué?

´ = 1245 0.67 · 300/100 = 1245 20Por lo que obtengo 1´= 1225 y 2´= 1265 (recuerde que este intervalo es para el nuevo proceso)Para comparar utilizaremos la diferencia promedio de población

= D t0.25 · sD/n

Pero nos encontramos con la dificultad de que el d.f = 99 no lo tiene la tabla III, pero lo solucionamos interpolando linealmente, tal y como sigue:Como el 99 se encuentra entre el 60 y 120, hacemos lo siguiente 1/d.f t0.25

1/60 0.0167 0.679

1/99 0.0101 0.677 + 0.677(0.0101-0.0083)/(0.0167-0.0083)/100 0.678

1/120 0.0083 0.677

Valor (t0.25 = 0.678) que era evidente y como la muestra en grande podemos aproximar s. Así, podemos comparar los valores1. 1´= 1225

1 = 25 0.678 · 300/10 5 1 45

2. 2´= 12652 = 65 0.678 · 300/10 45 2 85

Como podemos ver, la media de muestra no tiene una significación estadística en un intervalo de confianza del 50%, por que su diferencia con la media de población no se encuentra en ninguno de los intervalos. Observemos el gráfico siguiente

Ho X observada o = 1200 1225 = 1245 1265

Intervalo de confianza del 95%

Intervalo de confianza del 50%

58

Page 59: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

Nivel de confianza críticoLo importante no es que se alcance o no la significación estadística, sino a qué nivel se alcanza. El nivel al que trasponemos la carencia de significación para afirmar la significación se puede denominar nivel de confianza crítico. Veamos como se calcula

Consideremos la expresión conocida por nosotros

= X z /nun valor estimado de intervalo implica

z /nque está interrumpido a uno y otro lado de la X observada, en el ejemplo anterior el intervalo de confianza crítico implica fijar su longitud igual a 1245 - 1200 = 45; es decir

z /n = 45En esta ecuación z es desconocida. Pero podemos conocer al resolverla

z = 45· 10/300 = 1.5La probabilidad contenida entre los valores z = 1.5 se encuentran según la tabla I, al

Nivel de confianza crítico = 87%

Y al nivel de significación crítico = 13%. Cuando se resuelve de esta manera el valor crítico de , con frecuencia se denomina valor de probabilidad.

Prueba clásica de hipótesis:El método clásico de aceptación o rechazo, que implica una preespecificación arbitraria del nivel de significación que generalmente es de 5%. Aunque esto esclarecerá cuestiones importantes, entraña serios inconvenientes.

Con el ejemplo anterior del control de calidad ilustramos ahora tres pasos comprendidos en la prueba clásica de hipótesis:

1. Se establece formalmente la hipótesis nula (Ho: - 1200) y la alternativa (H1: 1200, por ejemplo = 1240). Al mismo tiempo se fijan el tamaño de la muestra (por ejemplo 100) y el nivel de significación de la muestra (por ejemplo = 5%).

2. Después se supone temporalmente que la hipótesis nula es verdadera, y se pregunta qué se puede esperar de un estadístico de muestra extraído de este tipo de sistema. Su distribución específica se muestra en la figura de la página siguiente. Como podemos apreciar, existe una diferencia importante entre estos dos diagramas: El área sombreada se fija arbitrariamente (y con ella la amplitud crítica para el rechazo de la hipótesis nula), incluso antes de observar cualquier dato.

3. A continuación se extrae la muestra; si la X observada queda dentro del área de rechazo en la figura, entonces se considera que está en conflicto con la hipótesis nula Ho; este conflicto es tan grande que se puede rechazar a favor de H1. En los otros casos Ho es aceptable.

Si Ho es verdadera

59

Page 60: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

Ho = 5% 1200

X observada 1245 1249 X Valor crítico

Si H1 es verdadera

1240 X H1

Figura. Si Ho es verdadera, entonces es igual a la probabilidad de error cuando se rechaza la hipótesis verdadera Ho. Si Ho es falsa (es decir, H1 es verdadera), es igual a la probabilidad de error cuando se acepte la hipótesis falsa Ho.

El valor crítico para esta prueba de significación del 5% es X = 1249, calculado al observar la tabla I que un valor de z de 1.64 corta un extremo de 5% de la distribución normal; es decir,

z crítico = (x - )/(/n ) = 1.64

Despejando la media de muestra, obtenemos Xcrítico = 1249En el ejemplo, la X observada, igual a 1245, permite considerar que Ho es aceptable (Para formular de nuevo esto debemos recordar que el valor de probabilidad es una medida de la credibilidad de Ho: si la credibilidad desciende por debajo de , entonces se rechaza Ho).

En resumen, existe otra forma de analizar este procedimiento de prueba. Si se obtiene una X observada mayor a 1249, caben dos explicaciones:

1. Ho es verdadera, pero se tuvo muy mala suerte y una muestra X improbable. (Se nació para perder; incluso, cuando se apuesta 19 a 1 en nuestro favor se pierde. Ja, j aja.)

2. Después de todo, Ho no es verdadera; de ahí que no debe causar sorpresa que X observada sea tan grande.

Errores de tipo I y IIEn el proceso de toma de decisión estudiado antes se corre el riesgo de cometer dos distintos tipos de error. El primero: rechazar erróneamente la verdadera Ho. El rechazo de Ho verdadera se denomina error de tipo I; su probabilidad es , el nivel de significación de la prueba.

Ahora bien, supóngase que la hipótesis nula es falsa (es decir, es verdadera la alternativa H1). Entonces, estamos en un sistema diferente; la distribución de X en torno a H 1 -bastante distinta-. En este caso la decisión correcta sería rechazar la Ho falsa; se incurriría en error si X cayera dentro de la región de aceptación de Ho. Cuando Ho es falsa, tal aceptación de Ho

60

Rechazar HoAceptar Ho

Page 61: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoRecibe el nombre de error de tipo II; su probabilidad se llama .

EjerciciosYa hemos avanzado mucho, sólo son unos pasos más y…

1. Complete los espacios en blanco.Considere el problema con el que se enfrenta un operador de radar cuya tarea es detectar aviones enemigos. Cuando aparece algo irregular en la pantalla debe decidir entre:Ho: todo está en orden; sólo hay una pequeña interferencia en la pantalla.H1: habrá un ataque.

En este caso, el error de tipo es una “falsa alarma” y error de tipo es “una alarma omitida”. A fin de reducir tanto como , el equipo electrónico se construyó lo más sensible y digno de confianza que fuera posible.

2. Una cafetería expende un promedio de 320 tazas de café diarias, con una desviación estándar de 40. Después de hacer propaganda se comprobó que se habían vendido 350 tazas durante 7 días.

a. ¿Influyó la propaganda en el negocio? Calcule el valor de probabilidad.b. Si el propietario de la cafetería especifica que el error de tipo I de la prueba (nivel

de significación) tiene que ser 5%, ¿rechazaría la hipótesis de que el negocio no se modificó?

3. Los registros informan que en una muestra aleatoria de 100 horas una máquina produjo un promedio horario de 678 artículos con una desviación estándar de 25. Después de instalar un dispositivo de control, la máquina produjo un promedio de 674 artículos por hora, con una desviación estándar de 5, en una muestra aleatoria de 500 horas. Al señalar la disminución de 4 artículos por hora en la media muestral, el gerente sostuvo que el dispositivo de control reducía la producción. Por el contrario, el gremio afirmó que esa disminución era “mera fluctuación estadística”. Para resumir objetivamente la evidencia acerca del cambio verdadero o no de la producción, calcule el valor de probabilidad.

Pruebas bilaterales de la hipótesisComo ejemplo, supongamos lo siguiente: una firma ha estado produciendo focos con una vida promedio de 800 horas. Ahora, desea probar una nuevo tipo de foco. Una muestra de 25 focos nuevos tiene una vida media X de 810 horas, con una desviación estándar s = 30 horas. Puesto que es desconocida y la muestra es pequeña, se debería emplear la distribución “t” en lugar de la normal. Hay dos alternativas:Probar la hipótesis

Ho: = 800Frente a la alternativa bilateral (que el foco nuevo es mejor o peor)

H1: 800

61

Page 62: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoAhora necesitamos un valor crítico bilateral, que corte 2.5% en cada extremo. Entonces, si

t observada = x - o t0.025

s/nse rechaza o. Por otro lado

t observada = x - o t0.025

s/no es aceptable. Esta condición puede formularse de nuevo: Ho es aceptable al nivel de significación del 5% si

o - t0.025·s/n X o + t0.025 ·s/nCompruebe usted ésta última expresión.Dada la muestra “s”, junto con la hipótesis o, esta condición se convierte en Ho es aceptable si

788 X 812Como la X observada (810) queda dentro de este intervalo, o es aceptable.

2. Alternativamente, la muestra podría utilizarse para construir un intervalo de confianza para . Al utilizar el mismo nivel de confianza del 95%, este intervalo de confianza es, sabemos que es

= X t0.025 ·s/n

798 822Lo que muestro en la siguiente figura, donde comparo la prueba de hipótesis bilateral con el intervalo de confianza (usamos una muestra con media de muestra 810 y desviación estándar de muestra 30) Si X está en este ámbito, aceptar o

a) 798 800 810 x Valor valor hipotético observado o X

Intervalo de confianza

b) 798 810 822 o

Para resumir la figura anterior se diría que en la prueba de hipótesis expuesta en el panel (a), la X observada = 810 queda en la región requerida para aceptar a o. Al mismo tiempo, en el panel (b), o cae dentro del intervalo de confianza.

Este es el punto clave: o será una hipótesis aceptable si y sólo si cae dentro de este intervalo de confianza. Esto resulta claro a partir del diagrama, dado que el intervalo utilizado tiene la misma longitud en ambos casos: por que fue construido por adición y sustracción de precisamente la misma tolerancia de error (t0.025 ·s/n = 12). Siempre y cuando la media muestral X y o difieran en algo menor que t0.025 ·s/n, o quedará dentro del intervalo de confianza y será asimismo una hipótesis aceptable. Esto es válido para cualquier o.

62

Page 63: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoEn general, puede demostrarse que:

Ho es aceptable si y sólo si el intervalo de confianza pertinente contiene a Ho.

Observación: El nivel de confianza debe concordar con el nivel de error de tipo I.

Pruebas unilaterales de hipótesisEl enunciado anterior, sobre Ho, también es válido para el caso de una prueba unilateral de hipótesis, con tal que se utilice el apropiado intervalo de confianza unilateral del 95%

X - t0.05·s/n

Que precisamente es el equivalente unilateral del intervalo bilateral. Al sustituir 810 - 1.71 · 30/25

799.7Esto se presenta en la figura de abajo. En el panel (b) se muestra este intervalo de confianza con o = 800; esa o apenas queda dentro de ese intervalo. Simultáneamente, en el panel (a) se define la prueba unilateral de hipótesis equivalente, con o considerada aceptable (por que X está dentro de la región de aceptación). Esto ilustra una vez más que Ho es aceptable si y sólo si el intervalo de confianza lo contiene.

El intervalo de confianza unilateral (expresado en la fórmula de arriba) sería apropiado si se trata de establecer que el nuevo foco es mejor que el antiguo (no sólo diferente). Este intervalo de confianza unilateral se aproxima un poco más al extremo inferior, pero se vuelve totalmente vago (abierto) en el extremo superior. Si X está en este ámbito, aceptar o

a) 800 810.3 x Valor valor hipotético observado o X

Intervalo de confianza

b) 799.7 810 o

EjerciciosNada es bueno o malo, salvo por comparación.

1. Tres fuentes distintas afirman que el ingreso promedio de determinada profesión es de C$ 7200, C$ 6400 y C$ 6400, respectivamente. A partir de una muestra de 16 profesionales, usted determina que su salario medio es de C$ 6030 y la desviación estándar es C$ 570.

a. Al nivel de significación del 5%, pruebe cada una de las tres hipótesis.b. Construya un intervalo de confianza del 95% para . Pruebe entonces cada

hipótesis; para hacerlo basta con que simplemente observe si está incluida en el intervalo de confianza. ¿Es esto más sencillo que (a)?

63

Page 64: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

2. Una muestra de 8 estudiantes obtuvo las siguientes calificaciones: 3, 9, 6, 6, 8, 7, 8, 9. Suponga que la población de calificación es normal. ¿Cuál de las siguientes hipótesis acerca de la calificación promedio () rechasaría usted al nivel de significación del 5%?

a. o = 8b. o = 6.3c. o = 4d. o = 9.

IV. ANALISIS DE VARIANZA

Ya hicimos inferencia acerca de una media de población y comparamos dos medias. Mediante el uso de técnicas llamadas análisis de variación ahora compararemos “r” medias.

Análisis de varianza de un factorSuponga que se compara tres máquinas. Debido a que estas tres máquinas son manejadas por hombres la producción por ahora está sujeta a una fluctuación aleatoria. Con la esperanza de “promediar” y reducir así el efecto de esta fluctuación, se extrajo una muestra aleatoria de 5 horas de cada una de las máquinas.

Tabla. Producción de tres máquinasNúmero de muestra Muestra de la máquina i Xi

i = 1 = 2 = 3

48.4 49.7 48.7 48.5 47.756.1 56.3 56.9 57.6 55.152.1 51.1 51.6 52.1 51.1

48.656.451.6

Promedio x = x = 52.2

Prueba de hipótesisDe las numerosas preguntas que podrían plantearse, una de las más sencillas sería: ¿Son las máquinas realmente distintas? O sea, ¿son distintas las medias muestrales de la tabla debido a diferencias de las medias de la población fundamental i (donde i representa el funcionamiento de la máquina durante el período de vida de la máquina)? ¿O pueden atribuirse exclusivamente esas diferencias en Xi a las fluctuaciones aleatorias? Para ejemplificar supongamos que se extrajo de tres muestras similares, pero ahora de una sóla máquina

Tabla. Tres muestras de la producción de una máquinaNúmeros de muestra Valores muestrales Xi

i = 1 = 2 = 3

51.7 53.0 52.0 51.8 51.052.1 52.3 52.9 53.6 51.152.8 51.8 52.3 52.8 51.8

51.952.452.3

x = 52.2

Como era de esperarse, las fluctuaciones estadísticas de muestra ocasionan pequeñas diferencias en Xi, aunque en este caso las i son idénticas.

64

Page 65: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

La prueba de no diferencia en las medias de población es, como de costumbre, la hipótesis nula,

Ho: 1 = 2 = 3

Una prueba convincente de esta hipótesis antes que nada requiere una medida numérica del grado en que difieren las medias muestrales. Por lo tanto, se toman las tres medias muestrales que aparecen en la última columna del cuadro en la página anterior y se calcula su varianza. Usamos la fórmula de la varianza para muestra -no olvidemos que se calcula la varianza de las medias muestrales, y no las varianzas de todos los valores de la tabla- se tiene:

s2x = 1/(r-1) (X - X)2 la sumatoria va desde la primera, hasta la r-ésima muestra.

= (1/2)·(48.6 - 52.2)2 + (56.4 - 52.2)2 + (51.6 - 52.2)2 = 15.5Donde r es la cantidad de medias muestrales y

X = (1/r) Xi = 52.2

Sin embargo, s2x no proporciona toda la información. Por ejemplo, analice los datos del

cuadro siguienteTabla. Muestra de la producción de tres máquinas

Máquina Producción de muestra de la máquina i Xi

i = 1 = 2 = 3

54.6 45.7 56.7 37.7 48.353.4 57.5 54.3 52.3 64.556.7 44.7 50.6 56.5 49.5

48.856.451.6

x = 52.2

Al calcular la varianza de las medias obtenemos el mismo valor de la primera tabla, pero en este caso se trata de máquinas cuyo funcionamiento es irregular y que producen grandes fluctuaciones aleatorias en cada hilera.

¿Cómo se puede medir esta fluctuación? Intuitivamente, parecería que esa fluctuación se interpreta como la extensión (o varianza) de los valores observados dentro de la muestra. Entonces se calcula la varianza dentro cada una de las muestras en la primera tabla. Y obtenemos:

S21 = 0.52; S2

2 = 0.87 y S23 = 0.25

Y el promedio simple de éstasS2

p = (0.52 + 0.87 + 0.25)/3 = 0.547se convierte en la medida de la fluctuación aleatoria -y se denomina varianza conjunta-. De casa una de las “r” muestras se tiene una varianza muestral con (n-1) grados de libertad, de manera que la varianza conjunta S2

p tiene r·(n-1) d.f.

Ahora se puede formular la pregunta fundamental: ¿Es S2x grande en relación con S2

p? En la práctica se examina la razón,

65

Page 66: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin Briceño

F = n · S2x / S2

p

llamada “razón de varianza”. Se introduce n en el numerador de manera que esta razón tenga, por término medio, un valor cercano a 1 toda vez que Ho sea verdadera. Sin embargo, debido a la fluctuación estadística, ese valor a veces estará por encima de 1 y otras por debajo de 1.

Si Ho no es verdadera (y las no son iguales) n · S2x será relativamente grande en

comparación con S2p, y el valor “F” será mayor que 1. Formalmente, cuando el valor

calculado de F es significativamente mayor que 1, se rechaza Ho.

Ejercicios

1. Doce parcelas de terreno se dividen aleatoriamente en tres grupos. El primero se toma como grupo de control y los otros dos grupos se tratan con los fertilizantes A y B. Se observa que la producción es:

Control, C 60 64 65 55 A 75 70 66 69 B 74 78 72 68

a. Calcule la razón de varianza.b. ¿Tienen los dos fertilizantes efectos diferentes?

2. Se extrajo una muestra aleatoria de 4 trabajadores, cada uno de ellos de industrias distintas, con su ingreso anual (en cientos de pesos) registrado de la siguiente manera:

Industria A 66 62 65 63Industria B 58 56 53 61

a. Calcule el valor de probabilidad para la hipótesis nula (no hay diferencia entre las industrias); use primero una prueba t y luego una prueba F.

b. ¿Son exactamente equivalentes las pruebas t y F?

BIBLIOGRAFIA

66

Page 67: Estadistica II Contabilidad

El disfrute por la matemática, radica en no temerle de antemano Franklin BriceñoWonnacott, Thomas H.; Wonnacott, Ronald J. Introducción a la Estadística. 1990. Editorial LIMUSA, México.

Hoel, Paul G. Estadística Elemental. Segunda edición. 1965. Compañía Editorial Continental, México.

Enciclopedia temática: Gran Consultor Estudiantil.2001. Educar Cultural y Recreativa S.A. Colombia.

Genet B, William. Estadística, Probabilidad y su Tratamiento Metodológico. MINED-PASEN BM, crédito 3978-NI; 2009. Nicaragua.

67