estadistica solucionarios

181

Click here to load reader

Upload: raul-locumber

Post on 29-Dec-2015

498 views

Category:

Documents


27 download

TRANSCRIPT

Page 1: estadistica solucionarios
Page 2: estadistica solucionarios

UNIVERSIDAD TECNOLÓGICA DEL PERÚ

Vicerrectorado de Investigación

"ESTADÍSTICA APLICADA"

TINS Básicos

ADMINISTRACIÓN DE EMPRESAS, ADMINISTRACIÓN DE NEGOCIOS INTERNACIONALES, MARKETING EMPRESARIAL

TEXTOS DE INSTRUCCIÓN BÁSICOS (TINS) / UTP

Lima - Perú

Page 3: estadistica solucionarios

ESTADÍSTICA APLICADA

2

© ESTADÍSTICA II Desarrollo y Edición: Vicerrectorado de Investigación Elaboración del TINS: Ing. Estadístico Nilton Horacio Machicao Bejar

Diseño y Diagramación: Julia Saldaña Balandra

Soporte académico: Instituto de Investigación

Producción: Imprenta Grupo IDAT

Queda prohibida cualquier forma de reproducción, venta, comunicación pública y transformación de esta obra.

Page 4: estadistica solucionarios

ESTADÍSTICA APLICADA

3

“El presente material contiene una compilación de

contenidos de obras de Estadística publicadas lícitamente,

resúmenes de los temas a cargo del profesor, constituye un

material auxiliar de enseñanza para ser empleado en el

desarrollo de las clases de nuestra institución.

Este material es de uso exclusivo de los alumnos y docentes

de la Universidad Tecnológica del Perú, preparados para

fines didácticos en aplicación del artículo inc. C y el Art.43

inc. A; del Decreto Legislativo 822; Ley sobre Derechos de

Autor”

Page 5: estadistica solucionarios

ESTADÍSTICA APLICADA

4

Page 6: estadistica solucionarios

ESTADÍSTICA APLICADA

5

PRESENTACIÓN

La Matemática, ciencia de la más alta jerarquía, en el concierto de las Ciencias, desde los albores de la civilización sigue siendo la base del desarrollo científico, tecnológico y humanístico de nuestro mundo. La Estadística como conjunto de conocimientos de la Matemática, se erige en el espacio del pensamiento probabilístico, permite la sistematización análisis de datos y la síntesis de resultados en el tratamiento de datos; conduce a la validación de resultados y facilita la producción de informes paramétricos, obtenidos en diferentes sucesos ocurridos en el acontecer de los actos del hombre. De allí que, en la formación académica de profesionales, se debe demandar el estudio de la Estadística en la convicción de dotar a sus estudiantes con un instrumento matemático analítico pertinente a la necesidad que plantea un determinado ejercicio, problema o proyecto en el campo de la política, la economía, la antropología de una sociedad, envueltos en la dinámica de la naturaleza y la cultura. En este marco, se ha desarrollado el presente texto de instrucción, dirigido a estudiantes de Administración; para la Asignatura de Estadística Aplicada, basado en una selección de temas, contenidos en diferentes fuentes bibliográficas, apropiados para la formación de profesionales en tecnología blanda. El texto en mención plasma la preocupación institucional de innovación de la enseñanza-aprendizaje en educación universitaria, que en acelerada continuidad promueve la producción de materiales educativos, actualizados en concordancia a las exigencias de estos tiempos. Comprende 6 unidades de instrucción de carácter aplicativo, matizado por ejercicios y problemas: La unidad I comienza con una exposición sobre las técnicas de conteo o análisis combinatorio que es la base para entender a las probabilidades y sus propiedades y luego se expone acerca de la independencia de eventos y los teoremas de probabilidad total y de Bayes. En la unidad II trata de las variables aleatorias discretas y continuas, función de probabilidad, esperanza matemática, variancia y sus propiedades.

Page 7: estadistica solucionarios

ESTADÍSTICA APLICADA

6

La unidad III trata de las principales distribuciones de probabilidades tanto discretas y continuas, como Bernoulli, Binomial, Hipergeométrica, Poisson, Normal y Normal Estándar. La unidad IV trata de las distribuciones muestrales, el teorema del límite central, distribución Chi-cuadrado, “t” de Student y “F” de Snedecor. La unidad V trata de la inferencia estadística, tema importante para la toma de decisiones en medio de incertidumbre, se divide en dos partes como son la estimación de parámetros y las pruebas de hipótesis. La unidad VI trata del análisis de regresión lineal múltiple, el análisis de variancia y el coeficiente de determinación que nos permitirá saber si nuestros datos se adecuan o no a nuestro modelo. Además al final se presenta un apéndice con las principales tablas estadísticas y la bibliografía. Al finalizar estas líneas, el reconocimiento institucional al profesor Nilton Machicao Bejar, que habiendo trabajado con denuedo ha hecho posible éste texto de instrucción, como expresión de su destacada labor profesional y académica.

VICERRECTORADO DE INVESTIGACIÓN

Page 8: estadistica solucionarios

ESTADÍSTICA APLICADA

7

ÍNDICE GENERAL Unidad I TEORÍA DE PROBABILIDADES...................................................... 11 Unidad II VARIABLES ALEATORIAS ............................................................. 37 Unidad III DISTRIBUCIÓN DE PROBABILIDADES ......................................... 61 Unidad IV DISTRIBUCIONES MUESTRALES .................................................. 79 Unidad V INFERENCIA ESTADÍSTICA ........................................................... 107 Unidad VI ANÁLISIS DE REGRESIÓN MÚLTIPLE .......................................... 135 TABLAS ESTADÍSTICAS…………………………………………………. 163 BIBLIOGRAFÍA ................................................................................ 183

Page 9: estadistica solucionarios

ESTADÍSTICA APLICADA

8

Page 10: estadistica solucionarios

ESTADÍSTICA APLICADA

9

DISTRIBUCIÓN TEMÁTICA CLASE

N° TEMA SEMANA

1 Técnicas de conteo, Principio de Multiplicación y Adición, Variaciones, Permutaciones y Combinaciones

1

2 Probabilidades: Definiciones básicas . Experimento, Experimento Aleatorio, Espacio Muestral, Evento o Suceso Aleatorio, Definición de probabilidad de un evento. Propiedades.

2

3 Reglas de Probabilidades de la Unión , suceso complementario. Probabilidad Condicional, Multiplicación de probabilidades, Independencia de eventos.

3

4 Partición de eventos, Probabilidad Total y Teorema de Bayes. 4

5 Probabilidad Total – Teorema de Bayes. PRÁCTICA CALIFICADA Nº1 5

6 Variable aleatoria. Función de Probabilidad. Función de Distribución. Distribución de variable Discreta . Distribución de Variable Continua.

6

7 Esperanza Matemática o valor esperado, Propiedades . Varianza, Propiedades. 7

8 Distribución de probabilidades. Distribuciones Discretas: Distribución Bernoulli, Distribución Binomial. PRÁCTICA CALIFICADA Nº 2

8

9 Distribución de Poisson y Distribución Hipergeométrica. 9

10 EXAMEN PARCIAL 10

11 Distribuciones Continuas: Distribución Normal. Distribución Normal Estandar. Manejo de la Tabla Z . PD: Distribución Muestral: T. Límite Central.

11

12 Distribuciones Muestrales: Distribución de Promedios Muestrales, Teorema del Limite Central PRÁCTICA CALIFICADA Nº 3

12

13 Distribución de Proporciones Muestrales. Distribución Chi-Cuadrado, Manejo de la Tabla χ2 13

Page 11: estadistica solucionarios

ESTADÍSTICA APLICADA

10

CLASE

N° TEMA SEMANA

14 Distribución “t” de Student, Distribución “F” de Snedecor. Manejo de las tablas “t” y “F”. PRÁCTICA CALIFICADA Nº4

14

15 Inferencia Estadística. Estimación de Parámetros y Estimación por Intervalos para la Media y la Variancia Poblacional.

15

16

Prueba de Hipótesis. Tipos de Errores. Error Tipo I yError Tipo II. Prueba de Hipótesis para la Media y Variancia Poblacional PRÁCTICA CALIFICADA Nº 5

16

17 Análisis de Regresión Lineal Múltiple. Coeficiente de Determinación Múltiple. 17

18 Análisis de varianza (ANVA). Repaso 18

19 EXAMEN FINAL 19

Page 12: estadistica solucionarios

ESTADÍSTICA APLICADA

11

UNIDAD I

TEORÍA DE PROBABILIDADES

En la asignatura anterior se ha definido a la ESTADÍSTICA como la ciencia del conocimiento humano, que se ocupa de la colección, representación, análisis y extracción de conclusiones para toda una población, en base a datos proporcionados por muestras aleatorias. La ESTADÍSTICA es una matemática aplicada, que nace de la preocupación de los gobernantes y es base de toma de decisiones en medio de incertidumbre. La Estadística, como un método de toma de decisiones, debe evaluar la confiabilidad y riesgos existentes en todo proceso de estimación. Esto es posible gracias a la teoría de probabilidades, base de la teoría Estadística, que permite generar indicadores de confiabilidad o riesgo. El término probabilidad frecuentemente es relacionado con posibilidad y azar, es decir, probabilidad es la posibilidad de que ocurra algo, por ejemplo, si la probabilidad que un estudiante elegido al azar apruebe Estadística es 0.02, esto significaría que es bien remota o poco posible que apruebe. Para entender bien a la teoría de probabilidades o cálculo de probabilidades es importante tener un buen dominio de las técnicas de conteo o análisis combinatorio, es por ello que comenzare exponiendo este tema. TÉCNICAS DE CONTEO O ANÁLISIS COMBINATORIO PRINCIPIO DE MULTIPLICACIÓN Si un experimento puede ocurrir de “n” maneras diferentes y otro experimento puede ocurrir de “m” maneras diferentes, el número total de maneras diferentes en que pueden ocurrir ambas simultáneamente es:

“nxm”

Page 13: estadistica solucionarios

ESTADÍSTICA APLICADA

12

EJEMPLOS 1. Se lanzan 2 monedas simultáneamente. ¿Cuántos resultados

posibles hay? SOLUCIÓN: La primera moneda tiene 2 posibilidades de caer: cara(c) o sello(s) La segunda moneda tiene 2 posibilidades de caer c o s Entonces por el principio de multiplicación hay, 2x2 = 4, resultados

posibles, es decir: cc, cs, sc y ss. 2. Al lanzar simultáneamente un dado y una moneda. ¿Cuántos

resultados posibles hay? SOLUCIÓN: El dado tiene 6 posibilidades: 1,2,3,4,5 ó 6 La moneda tiene 2 posibilidades: c ó s Entonces por el principio de multiplicación hay, 6x2 = 12, resultados

posibles. COROLARIO Si se ejecutan “n” experimentos con m1 , m2 , m3 , . . . , mn resultados posibles respectivamente, entonces, el número total de resultados posibles es:

EJEMPLO ¿De cuántas maneras diferentes pueden caer si lanzamos 3 monedas? SOLUCIÓN: Como cada moneda puede caer de 2 maneras diferentes, entonces las tres pueden caer de 2x2x2 = 23 = 8 maneras diferentes. Es decir: ccc, ccs, csc, css, scc, scs, ssc y sss

m1 x m2 x m3 x … x mn

Page 14: estadistica solucionarios

ESTADÍSTICA APLICADA

13

PRINCIPIO DE ADICIÓN Si un experimento puede ocurrir de “n” ó “m” maneras diferentes, entonces dicho experimento puede ocurrir de: “n + m” maneras diferentes. EJEMPLO Un estudiante para ir a la UTP puede hacerlo en la combi A, combi B, combi C o a pie. ¿De cuántas maneras diferentes puede asistir a la UTP? SOLUCIÓN: Como puede tomar cualquiera de las 3 combis, tiene 3 posibilidades o puede ir a pie, tiene una posibilidad, entonces por el principio de adición, tiene 3 + 1 = 4 maneras diferentes de ir a la UTP. VARIACIÓN Dado “n” objetos una variación de estos “n” objetos tomados de “r” en “r”, es un arreglo de “r” de estos objetos, en el cual el orden tiene importancia. El número total de variaciones esta dado por:

Donde “n” y “r” son enteros y positivos; r ≤ n Recordar: 1) n! = nx(n-1)!x(n-2)!x(n-3)!x · · · X3x2x1 , ∀ n entero y positivo 2) 0! = 1 EJEMPLO Hallar el número de formas que se puede confeccionar una bandera de franjas de 3 colores, si se tiene tela de 5 colores distintos. SOLUCIÓN: Si consideramos franjas verticales, tenemos: n = 5 y r = 3, como el orden importa, entonces, nos piden:

6012

12345)!35(

!553 ==

−=

xxxxxV

Page 15: estadistica solucionarios

ESTADÍSTICA APLICADA

14

PERMUTACIÓN (Pn) Cuando n=r la variación recibe el nombre de permutación de “n” elementos, es decir:

!!0!

)!(! nnnn

nVP nnn ==

−== , puesto que 0! = 1, entonces:

EJEMPLO ¿De cuántas maneras diferentes pueden sentarse 5 personas en una banca? SOLUCIÓN: Siempre que en un arreglo se use la totalidad de elementos a la vez se trata de una permutación, como en este caso.

P5 = 5! = 120

PERMUTACIONES CIRCULARES (PC) En este tipo de agrupaciones no hay primero, ni último elemento, por encontrarse todos en una línea cerrada. El número de permutaciones de “n” elementos tomados alrededor del círculo es:

EJEMPLO ¿De cuántas maneras diferentes se pueden sentar 5 personas en una meza redonda? SOLUCIÓN:

Pc = (5 – 1)! = 4! = 24 PERMUTACIONES CON REPETICIÓN El número total de permutaciones de “n” elementos repetidos

n1 , n2, n3, . . . ,nk veces es:

Page 16: estadistica solucionarios

ESTADÍSTICA APLICADA

15

Donde: n1 + n2 + n3 + . . . + nk = n EJEMPLO ¿Cuántas palabras diferentes pueden formarse con las letras de la palabra MISSISSIPPI? SOLUCIÓN: Como M=1, I=4, S=4, P=2 y n = 11, entonces:

34650!2!·4!·4!·1

!11112,4,4,1 ==P

COMBINACIÓN Dados “n” objetos, una combinación de los “n” objetos tomados de “r” en “r” es un arreglo de “r” de estos objetos, en el cual el orden no es importante. El número total de combinaciones esta dado por:

Donde “n” y “r” son enteros y positivos; r ≤ n EJEMPLO ¿Cuántos comités de 3 personas pueden formarse de un grupo de 9 personas?

Page 17: estadistica solucionarios

ESTADÍSTICA APLICADA

16

SOLUCIÓN: Como n = 9 y r = 3 y el orden no importa, entonces:

64123!6!6789

!3)!39(!99

3 ==−

=xxx

xxxx

C

El número total de comités de 3 personas que pueden formarse con 9 personas es 64. EJERCICIOS RESUELTOS 1. De entre 5 ejemplares de un texto de Matemática, 3 de

Administración y 2 de Contabilidad; hay que escoger un ejemplar de cada texto. Calcular el número de formas diferentes para hacerlo.

SOLUCIÓN: El texto de Matemática puede escogerse de 5 maneras diferentes. El texto de Administración puede escogerse de 3 maneras

diferentes. El texto de Contabilidad puede escogerse de 2 maneras diferentes. Entonces, por el principio de multiplicación hay, 5x3x2 = 30 formas

diferentes de escoger un ejemplar de cada texto. 2. ¿De cuántas maneras diferentes pueden caer si lanzamos 2 dados

y una moneda? SOLUCIÓN: Por el principio de multiplicación: Cada dado puede caer de 6 formas diferentes y la moneda de 2

formas diferentes; entonces: 6x6x2 = 72. 3.- En el último campeonato mundial de fútbol participaron 32 países

donde los premios fueron medallas de oro, plata y bronce. ¿De cuántas formas pueden distribuirse las medallas?

SOLUCIÓN: Número de países = n = 32 Número de medallas = r= 3 Como el orden es importante, se trata de una variación, entonces

existen

Page 18: estadistica solucionarios

ESTADÍSTICA APLICADA

17

29760303132"29

!29303132!29!3232

3 ==== xxxxxV formas diferentes de

distribuirse las 3 medallas entre los 32 países. Observe que también puede usarse el principio de multiplicación. 4. ¿Cuántos collares diferentes se pueden formar con 7 perlas

diferentes? SOLUCIÓN: Como los collares tienen forma circular, es decir no hay ni primer ni

última perla, se trata de una permutación circular, entonces:

Pc = 3602

7202!6

2)!17(

===−

Observe que: A, B, C, D, E, F, G es igual a: G, F, E, D, C, B, A Por este motivo se ha dividido entre 2. 5. Una sociedad científica está formada por 25 personas y es

necesario elegir al presidente, al vicepresidente, al secretario y al tesorero. ¿De cuántas formas se puede efectuar esta elección si cada miembro de la sociedad puede ocupar sólo un cargo?

SOLUCIÓN: Número de científicos = 25 El presidente puede ser cualquiera de los 25 científicos, el

vicepresidente cualquiera de los 24 restantes, el secretario cualquiera de los 23 restantes y el tesorero cualquiera de los 22 científicos que quedan, entonces por el principio de multiplicación, hay 25x24x23x22 = 303600 formas diferentes de realizar esta elección.

6. Kattia, Dajana y 10 amigos se encuentran reunidos. ¿De cuántas

maneras diferentes pueden sentarse en una banca si las 2 amigas siempre deberán permanecer juntas?

SOLUCIÓN: Una primera forma seria: Katty-Dajana A1 A2 A3 A4 A5 A6 A7 A8 A9

A10 , esto es: P11 = 11!, como las dos amigas pueden intercambiar posiciones se tiene que multiplicar por 2, es decir el resultado seria: 2!x 11! = 79833600.

Page 19: estadistica solucionarios

ESTADÍSTICA APLICADA

18

7. Se encuentran reunidos 16 cachimbos en la UTP de los cuales 10

son varones. Se desea formar un comité de 9 cachimbos. ¿De cuántas maneras se puede formar el comité, si debe haber necesariamente 4 damas en el comité?

SOLUCIÓN: Como hay 6 damas, entonces pueden integrar el comité 4, 5 y hasta

6 damas. 1º Cuando integran 4 damas habrá 5 varones en el comité:

3780105

64 =xCC

2º Cuando integran 5 damas habrá 4 varones en el comité:

1260104

65 =xCC

3º Cuando integran 6 damas habrá 3 varones en el comité:

120103

66 =xCC

El número total de maneras será: 3780 + 1260 + 120 = 5160. Observación: Se trata de combinación puesto que el orden no importa.

8. Los ingleses suelen dar varios nombres a sus hijos. ¿De cuántas

formas se puede dar un nombre a un niño si el número total de nombres es 300 y le dan no más de 3 nombres?

SOLUCIÓN: En este caso el orden importa, entonces se tratará de variaciones,

como le dan no mas de 3 nombres, esto significa que el nombre puede estar compuesto de uno, dos ó tres nombres, esto es:

26820600300

3300

2300

1 =++ VVV

Page 20: estadistica solucionarios

ESTADÍSTICA APLICADA

19

EJERCICIOS PROPUESTOS 1. De entre 10 ejemplares de un texto de Matemática, 8 de

Administración y 5 de Contabilidad; hay que escoger un ejemplar de cada texto. Calcular el número de formas diferentes para hacerlo.

2. ¿De cuántas maneras diferentes pueden caer si lanzamos 2 dados

y 3 monedas? 3. En el último campeonato mundial de fútbol que participó Perú fue el

año 1982, en el cual participaron 24 países donde los premios fueron medallas de oro, plata y bronce. ¿De cuántas formas pueden distribuirse las medallas?

4. ¿Cuántos collares diferentes se pueden formar con 10 perlas

diferentes? 5. Una sociedad científica está formada por 20 personas y es

necesario elegir al presidente, al vicepresidente y al secretario. ¿De cuántas formas se puede efectuar esta elección si cada miembro de la sociedad puede ocupar sólo un cargo?

6. Lizbeth, Rocío, Zaida y 9 amigos se encuentran reunidos. ¿De

cuántas maneras diferentes pueden sentarse en una banca si las 3 amigas siempre deberán permanecer juntas?

7. Se encuentra reunidos 20 cachimbos en la UTP de los cuales 15

son varones. Se desea formar un comité de 8 cachimbos. ¿De cuantas maneras se puede formar el comité, si debe haber necesariamente 4 damas en el comité?

8. Los ingleses suelen dar varios nombres a sus hijos. ¿De cuántas

formas se puede dar un nombre a un niño si el número total de nombres es 50 y le dan no más de 4 nombres?

9. Vanesa, Juanita y 8 amigos se encuentran reunidos. ¿De cuántas

maneras diferentes pueden sentarse en una banca si las 2 amigas nunca deberán permanecer juntas?

10. Yovana, Pamela, Lizeth y 12 amigos se encuentran reunidos. ¿De

cuántas maneras diferentes pueden sentarse en una banca si las 3 amigas nunca deberán permanecer juntas?

Page 21: estadistica solucionarios

ESTADÍSTICA APLICADA

20

11. ¿De cuántas maneras diferentes pueden sentarse los 2 primeros estudiantes que llegan a un aula de 20 carpetas?

12. Un estudiante posee 10 monedas de distintos valores. ¿Cuántas

sumas diferentes de dinero puede formar con las 10 monedas? 13. Sarita tiene seis amigos. ¿De cuántas maneras puede invitar a por

lo menos uno de ellos a cenar? 14. Los números de las placas de los automóviles, están formados por 2

letras y 4 cifras. Hallar el número total de placas que se puedes confeccionar.

15. Un comité estudiantil de 12 personas debe ser formado, entre 100

cachimbos(60 hombres y 40 mujeres), 80 estudiantes intermedios(50 hombres y 30 mujeres), 70 estudiantes avanzados(46 hombres y 24 mujeres) y 40 graduados(28 hombres y 12 mujeres). Encuentre el número total de diferentes comités que se pueden formar bajo cada una de los siguientes requerimientos:

a) No se imponen restricciones a la formación del comité. b) Siete estudiantes deben ser hombres y 5 mujeres. c) El comité debe contener el mismo número de estudiantes de

cada clase. d) El comité debe contener 2 hombres y una mujer de cada clase. e) El presidente del comité debe ser graduado y hombre. 16. En la siguiente figura se representa el plano de una ciudad : Un caminante desea trasladarse del punto A hasta el punto B por el

camino más corto, es decir, desplazarse todo el tiempo o bien de izquierda a derecha, o bien de abajo hacia arriba . ¿Por cuántos caminos puede llegar desde A hasta B?.

B A

Page 22: estadistica solucionarios

ESTADÍSTICA APLICADA

21

17. Una contraseña para acceder a una computadora consiste de 6 caracteres que pueden ser letras (26) o números (10).

a) ¿Cuántas contraseñas distintas se pueden formar? b) ¿Cuántas contraseñas distintas se pueden formar conteniendo

sólo números? c) ¿Cuántas contraseñas distintas se pueden formar si deben

tener por lo menos una letra?. 18. Ocho atletas compiten en la final olímpica de los 110 metros con

vallas. Asumiendo que ellos cruzan la meta en distintos instantes. ¿Cuántas maneras distintas hay para entregar las medallas de oro, de plata y de bronce?.

19. Una señora tiene 8 amigas y desea invitar a 5 de ellas a una fiesta.

¿De cuántas maneras puede hacerlo si dos de ellas están enojadas entre sí y no pueden ser invitadas juntas?.

20. Suponga que un artículo es comercializado por dos empresas A y B.

La empresa A tiene 5 tiendas y la empresa B tiene 8 tiendas, a través de las cuales se vende dicho artículo. ¿De cuántas maneras diferentes puede un cliente comprar un artículo?.

21. Un grupo de 7 personas deben participar en una serie de charlas a

llevarse a cabo en dos días sucesivos. En el primer día deben participar 3 personas, y en el segundo día las 4 personas restantes. ¿ De cuántas maneras diferentes se puede organizar las charlas del primer día?.

22. En el siguiente diagrama A, B, C, D, E y F denotan islas y las líneas

de unión son puentes. Un hombre empieza en A y camina de isla en isla, se detiene para almorzar cuando no puede continuar caminando sin tener que cruzar el mismo puente dos veces. Hallar el número de maneras de cómo puede hacer su recorrido antes de ir a almorzar.

Page 23: estadistica solucionarios

ESTADÍSTICA APLICADA

22

PROBABILIDADES EXPERIMENTO Un experimento es cualquier proceso de ensayo y observación. EXPERIMENTO ALEATORIO Es cualquier experimento real o hipotético que pueda dar lugar a varios resultados sin que sea posible anunciar con certeza cuál de estos resultados va a ser observado. A estos experimentos también se les conoce como no determinísticos. EJEMPLOS 1. Lanzamiento de una moneda balanceada. En este caso los resultados posibles serán: cara ( c ) o sello ( s ). 2. Lanzamiento de un dado no cargado (insesgado). En este caso los resultados posibles serán: 1, 2, 3, 4, 5 ó 6. CARACTERÍSTICAS DEL EXPERIMENTO ALEATORIO (O ESTOCÁSTICO) 1. Se tiene varios resultados posibles. 2. Estos resultados tienen cierta incertidumbre de aparecer, es decir,

no podemos afirmar con certeza cual de los resultados va a ser observado.

ESPACIO MUESTRAL ( S ) Es el conjunto de todos los resultados posibles de un experimento aleatorio. Para los ejemplos anteriores, tenemos: S = ⎨c , s ⎬ ⇒ n(S) = 2 y S = ⎨1, 2, 3, 4, 5, 6 ⎬ ⇒ n(S) = 6 EVENTO ( E ) Es un subconjunto del espacio muestral. EJEMPLO Si se lanza un dado, un evento seria que salgan números pares, es decir:

E = ⎨2, 4, 6 ⎬ ⇒ n(E) = 3

Page 24: estadistica solucionarios

ESTADÍSTICA APLICADA

23

PROBABILIDAD La probabilidad de un evento es la razón entre el número de casos favorables y el número total de casos posibles; es decir: número de elementos del evento entre número de elementos del espacio muestral. Es decir:

EJEMPLOS 1. ¿Cuál es la probabilidad de que salga cara al lanzar una moneda? SOLUCIÓN:

P = 21

)()(=

SnEn

2. ¿Cuál es la probabilidad de que salga el 2 al lanzar un dado? SOLUCIÓN:

P = 61

)()(=

SnEn

PROPIEDADES Sean los eventos A , B Y C , entonces: 1. 0 ≤ P(A) ≤ 1 2. P(S) = 1 3. P(∅) = 0 4. P(AUB) = P(A) + P(B) Si: A ∩ B = ∅ 5. P(AUB) = P(A) + P(B) – P(A ∩ B) Si: A ∩ B ≠ ∅ 6. P(AUBUC) = P(A) + P(B) + P(C) – P(A ∩ B) – P(A ∩ C) – P(B ∩ C)

+ P(A ∩ B ∩ C) 7. P(A′)= 1 – P(A)

Page 25: estadistica solucionarios

ESTADÍSTICA APLICADA

24

EJERCICIOS RESUELTOS 1. Se lanzan dos monedas. ¿Cuál es la probabilidad de que ambas

salgan cara?

SOLUCIÓN: Como S = {(C,C), (C,S), (S,C), (S,S) } y hay un solo caso

favorable: ( C,C), entonces: P = 41

2. Se lanzan 2 dados al azar y se quiere hallar la probabilidad de que

la suma de los puntos obtenidos sea igual a 10.

SOLUCIÓN: Por el principio de multiplicación: n(S) = 6x6 = 62 = 36 y sea el evento, suma de puntos igual a 10, es decir, (4,6), (6,4) y (5,5) entonces: n(E) = 3 Luego:

p = 121

363=

3. Se tiene una baraja de 52 cartas. ¿Cuál es la probabilidad de que la

primera que se saque sea de espadas?

SOLUCIÓN: Como n(s) = 52 y hay 13 espadas, es decir: n(E) = 13, entonces:

P = 5213

4. El vicerrector académico informa que de 200 desaprobados, 30 son

de Matemática, 50 de Estadística y 10 de Métodos Cuantitativos. ¿Cuál es la probabilidad de que un estudiante elegido azar desapruebe Estadística?

SOLUCIÓN: En este caso: n(S) = 200 y hay 50 casos favorables, entonces:

P = 41

20050

=

Page 26: estadistica solucionarios

ESTADÍSTICA APLICADA

25

5. Una urna contiene bolillas numeradas del 1 al 5. Se sacan

sucesivamente al azar las 5 bolillas (sin reposición). Hallar la probabilidad de que juntando los números de cada bolilla según el orden de extracción resulte el número 53412.

SOLUCIÓN: El espacio muestral es: n(S) = 5! = 120 y hay un solo caso favorable, entonces:

P = 120

1!5

1=

6. Una urna contiene 8 bolillas rojas y 10 bolillas verdes. Se sacan al

azar y de una vez 6 bolillas, ¿cuál es la probabilidad de que todas ellas sean verdes?

SOLUCIÓN: Como el orden no importa se trata de combinaciones, entonces:

P = 011312217,04425

186

106 ==

CC

7. Se tiene 5 pares de zapatos mezclados y cada par es distinto de los

demás. Si se eligen 2 zapatos al azar, hallar la probabilidad de que correspondan a un mismo par.

SOLUCIÓN: Como el orden no importa, se trata de una combinación, es decir: n(S) = 4510

2 =C y hay 5 casos favorables, entonces:

p = 91

455=

8. Los eventos A y B son mutuamente excluyentes, si P(A) = 0.25 y

P(B) = 0.15. ¿Cuál es la probabilidad de que ocurra A o B? SOLUCIÓN: Sabemos que P(AUB) = P(A) + P(B) Si: A ∩ B = ∅ , entonces: P(AUB) = 0.25 + 0.15 = 0.40.

Page 27: estadistica solucionarios

ESTADÍSTICA APLICADA

26

EJERCICIOS PROPUESTOS 1. Se lanzan tres monedas. ¿Cuál es la probabilidad de que todas

salgan sello? 2. Se lanzan 2 dados al azar y se quiere hallar la probabilidad de que

la suma de los puntos obtenidos sea igual a 8. 3. Se tiene una baraja de 52 cartas. ¿Cuál es la probabilidad de que la

primera que se saque sea el as de corazones? 4. El vice-rector académico informa que de 500 desaprobados, 80 son

de Matemática, 125 de Estadística y 30 de Métodos Cuantitativos. ¿Cuál es la probabilidad de que un estudiante elegido azar desapruebe Matemática?

5. Una urna contiene 10 bolillas numeradas del 0 al 9. Se sacan sucesivamente al azar 5 bolillas (sin reposición). Hallar la probabilidad de que juntando los números de cada bolilla según el orden de extracción resulte el número 20957.

6. Una urna contiene 10 bolillas negras y 12 bolillas rojas. Se sacan al

azar y de una vez 5 bolillas, ¿cuál es la probabilidad de que todas ellas sean negras?

7. Se tiene 8 pares de zapatos mezclados y cada par es distinto de los

demás. Si se eligen 2 zapatos al azar, hallar la probabilidad de que correspondan a un mismo par.

8. Los eventos A y B son mutuamente excluyentes, si P(A) = 0.40 y

P(B) = 0.35. ¿Cuál es la probabilidad de que no ocurra ni A ni B? 9. Se desea entrevistar a un grupo de empleados de la UTP con

respecto a un plan de pensiones, se efectuaran entrevistas detalladas a cada uno de los empleados seleccionados en una nuestra aleatoria. Estos se clasificaron como sigue:

CLASIFICACIÓN Nº DE EMPLEADOS

Vigilantes 16 Mantenimiento 14 Docentes 50 Secretarias 20

Page 28: estadistica solucionarios

ESTADÍSTICA APLICADA

27

¿Cuál es la probabilidad de que la primera persona seleccionada: a) sea docente o secretaria? b) sea vigilante o de mantenimiento? c) no sea vigilante?

10. El directorio de la empresa MACHI SAC está formado por seis

hombres y tres mujeres. Se desea seleccionar un comité de tres miembros, en forma aleatoria, para que recomienden a un nuevo presidente de la empresa. a) ¿Cuál es la probabilidad de que sean mujeres los tres

miembros del comité? b) ¿Cuál es la probabilidad de que sean hombres los tres

miembros del comité?

11. Se lanzan cuatro monedas. ¿Cuál es la probabilidad de que todas salgan cara?

12. Se lanzan cuatro monedas. ¿Cuál es la probabilidad de que salgan

dos sellos? 13. Se lanzan 2 dados al azar y se quiere hallar la probabilidad de que

la suma de los puntos obtenidos sea a lo más 10. 14. Se lanzan 2 dados al azar y se quiere hallar la probabilidad de que

la suma de los puntos obtenidos sea por lo menos 4. 15. Una urna contiene 8 bolillas numeradas del 1 al 8. Se sacan

sucesivamente al azar 4 bolillas. Hallar la probabilidad de que juntando los números, de cada una, en el orden de extracción resulte el número 7656.

16. Una urna contiene 6 bolillas blancas y 10 bolillas rojas. Se sacan al

azar 7 bolillas de una vez, hallar la probabilidad de que todas sean rojas.

17. En una carrera de autos participan los competidores A, B, C y D. Se

sabe que uno de ellos necesariamente debe de ganar. Si la probabilidad de que gane A es el doble de la de B, la de B es la mitad de C y la de D es el triple de A, ¿Cuál es la probabilidad que gane D?.

Page 29: estadistica solucionarios

ESTADÍSTICA APLICADA

28

18. De 100 estudiantes, 48 llevan Matemática, 32 Estadística y 40 Administración; 16 Matemática y Estadística ,13 Administración y Estadística , 20 Matemática y Administración, y 22 ninguno de los 3 cursos . Si se elige un estudiante al azar, ¿Cuál es la probabilidad de que lleve?: a) Solo Estadística. b) Solamente Matemática o Administración. c) Solamente Estadística y Administración.

19. Se tienen 6 libros, de los cuales uno es de economía y otro es de

estadística. Si los libros se ordenan aleatoriamente de izquierda a derecha, hallar la probabilidad que: a) Los libros de economía y estadística estén juntos. b) Uno de los libros (economía y estadística) esté al inicio

(primera posición desde la izquierda) o que los libros de economía y estadística no estén juntos.

20. En una reunión de 30 personas, ¿cuál es la probabilidad de que, por

lo menos dos de ellas, cumplan años el mismo día? 21. Suponga que en una clase de 50 estudiantes, 30 alumnos opinan

que el profesor es claro, 8 alumnos opinan que el material bibliográfico es deficiente, 35 alumnos opinan que el sistema de evaluación es exigente, 5 alumnos opinan que el profesor es claro y que el material bibliográfico es deficiente, 22 alumnos opinan que el profesor es claro y que el sistema de evaluación es exigente, 3 alumnos opinan que el material bibliográfico es deficiente y que el sistema de evaluación es exigente, y 5 alumnos opinan que el profesor no es claro, que el material bibliográfico no es deficiente y que el sistema de evaluación no es exigente. Si se elige al azar un alumno, hallar la probabilidad que: a) El alumno opine que el sistema de evaluación es exigente o

que el material bibliográfico es deficiente. b) El alumno opine que el sistema de evaluación es exigente o

que: el profesor es claro y el material bibliográfico es deficiente. 22. Una empresa tiene dos maneras A y B de presentar un nuevo

producto al mercado. Si presenta el producto de la manera A la probabilidad de que el producto sea exitoso es 0.44 y si lo presenta de la manera B la probabilidad de éxito se reduce a 0.29. La probabilidad de que el producto fracase con ambas maneras de presentación es 0.37. ¿Cuál es la probabilidad de que el producto sea exitoso con ambas formas de presentación?

Page 30: estadistica solucionarios

ESTADÍSTICA APLICADA

29

23. Se desea hallar la probabilidad de sacar por lo menos una vez el 6 al lanzar un dado 4 veces.

24. Se desea hallar la probabilidad de sacar dos seis por lo menos una

vez al lanzar dos dados 24 veces.

25. Se tiene una baraja de 40 cartas, donde hay 4 ases. Se reparten éstas entre 4 personas, ¿qué probabilidad hay de que a cada una le toque un as?

26. En una reunión de 30 personas,¿Cuál es la probabilidad de que, por

lo menos dos de ellas, cumplan años el mismo día?

PROBABILIDAD CONDICIONAL Si A y B son dos eventos de un espacio muestral S; entonces, la probabilidad condicional de que ocurra el evento A dado que el evento B ya ocurrió esta dado por:

∀ P(B) ≠ 0 También se cumple que:

∀ P(A) ≠ 0 MULTIPLICACIÓN DE PROBABILIDADES Si A, B y C son tres eventos de un espacio muestral S; entonces, se cumple que:

1. P(A∩B) = P(A) P(B/A) P(A∩B) = P(B) P(A/B)

Page 31: estadistica solucionarios

ESTADÍSTICA APLICADA

30

2. P(A∩B∩C) = P(A)P(B/A)P(C/A∩B) P(A∩B∩C) = P(B)P(A/B)P(C/A∩B) P(A∩B∩C) = P(C)P(A/C)P(B/A∩C) P(A∩B∩C) = P(A)P(C/A)P(B/A∩C) P(A∩B∩C) = P(B)P(C/B)P(A/B∩C) P(A∩B∩C) = P(C)P(B/C)P(A/B∩C) P(A∩B∩C) = P(A∩B)P(C/A∩B) P(A∩B∩C) = P(A∩C)P(B/A∩C) P(A∩B∩C) = P(B∩C)P(A/B∩C)

INDEPENDENCIA DE EVENTOS INDEPENDENCIA DE DOS EVENTOS Dos eventos A y B son independientes si:

Dos eventos son independientes si la ocurrencia de uno de ellos no afecta la ocurrencia del otro evento. Es decir, también se cumplen que: P(A/B) = P(A) y P(B/A) = P(B)

INDEPENDENCIA DE TRES EVENTOS Tres eventos A, B y C de un espacio muestral S son mutuamente independientes si cumplen las siguientes condiciones: 1. P(A ∩ B) = P(A)P(B) 2. P(A ∩ C) = P(A)P(C) 3. P(B ∩ C) = P(B)P(C) 4. P(A∩B∩C) = P(A)P(B)P(C)

PARTICIÓN DE EVENTOS Los eventos A1 , A2 , A3 , · · · , AK forman una partición del espacio muestral S, si cumplen las siguientes condiciones: 1. Ai ≠ ∅ ∀ i = 1, 2, 3, · · · , k 2. Ai ∩ Aj = ∅ ∀ i ≠ j , i , j = 1, 2, 3, · · · , k 3. A1 ∪ A2 ∪ A3 ∪ · · · ∪ AK = S

Page 32: estadistica solucionarios

ESTADÍSTICA APLICADA

31

TEOREMA DE PROBABILIDAD TOTAL Sean los eventos A1 , A2 , A3 , · · · , AK , los cuales forman una partición del espacio muestral S, y sea B otro evento cualquiera de S; entonces, se cumple que:

TEOREMA DE BAYES Sean los eventos A1 , A2 , A3 , · · · , AK , los cuales forman una partición del espacio muestral S, y sea B otro evento cualquiera de S; entonces, se cumple que:

EJERCICIOS RESUELTOS 1. Suponga que P(A) = 0.35 y P(B/A) = 0.25 . Hallar P(A ∩ B). SOLUCIÓN: Sabemos que P(A∩B) = P(A) P(B/A) entonces, P(A∩B) = (0.35)(0.25) = 0.0875 2. En un lote de 15 artículos se tiene 4 defectuosos. Si se eligen al

azar y sin reemplazo tres artículos, hallar la probabilidad que los 3 artículos elegidos sean defectuosos.

SOLUCIÓN: Sea Di = {el i-ésimo artículo es defectuoso}, entonces: P(D1∩ D2∩D3) = P(D1)P(D2)P(D3)

P(D1∩ D2∩D3) = 00879121.04554)

132)(

143)(

154( ==

Page 33: estadistica solucionarios

ESTADÍSTICA APLICADA

32

3. Una urna contiene 10 bolillas rojas, 8 negras y 12 azules. Si se eligen al azar y sin reemplazo 3 bolillas, hallar la probabilidad que las 3 bolillas sean negras.

SOLUCIÓN: Sea Ni = {la i-ésimo bolilla es negra}, entonces: P(N1∩ N2∩N3) = P(N1)P(N2)P(N3)

P(N1∩ N2∩N3) = 013793103.0145

2)286)(

297)(

308( ==

4. En una urna hay 15 bolillas numeradas del 1 al 15. Si se van

sacando una a una al azar sin reposición, ¿cuál es la probabilidad de que la bolilla número 5 salga precisamente en la quinta extracción?

SOLUCIÓN: La probabilidad de que la bolilla Nº 5 no salga en la primera vez es

14/15; la probabilidad de que tampoco salga la segunda vez es 13/14; tampoco la tercera vez es 12/13; tampoco la cuarta vez es 11/12 y la probabilidad de que si salga en la quinta vez es 1/11. Luego la probabilidad buscada es:

P = 066666666.0151

111·

1211·

1312·

1413·

1514

==

5. Se lanza una moneda 3 veces. Sea el evento A de que caiga cara

en cada uno de los dos primeros lanzamientos, B es el evento de que caiga sello en el tercer lanzamiento y C de que caigan exactamente dos sellos en los tres lanzamientos, compruebe que los eventos A y B son independientes mientras que B y C son dependientes.

SOLUCIÓN: El espacio muestral para este experimento seria: S = {ccc, ccs, csc, css, scc, scs, ssc, sss} De acuerdo al enunciado los eventos serian: A = {ccc, ccs } B = {ccs, css, scs, sss} C = {css, scs, ssc}

Page 34: estadistica solucionarios

ESTADÍSTICA APLICADA

33

Para que A y B sean independientes debe cumplirse: P(A∩B) = P(A)P(B) Como A∩B = {ccs}, entonces: P(A∩B) = 1/8 ; P(A) = 2/8 = ¼ y

P(B) = 4/8 = ½ Luego: P(A∩B) = P(A)P(B)

21·

41

81= ⇒

81

81= es decir A y B son independientes.

Para que B y C sean dependientes debe cumplirse:

P(B∩C) ≠ P(B)P(C) Como B∩C = {css, scs}, entonces: P(B∩C) = 1/4 ; P(B) = 1/4 y P(C) = 3/8 Luego; como: P(B∩C) ≠ P(B)P(C)

83·

21

41≠ ⇒

163

41≠ es decir B y C son dependientes.

6. El equipo de la UTP juega el 70% de sus partidos en la noche, y el

30% durante el día. El equipo gana el 50% de sus partidos nocturnos y el 90% de los diurnos. De acuerdo con un diario de hoy día, la UTP ganó ayer. ¿Cuál es la probabilidad de que el partido se haya jugado en la noche?. SOLUCIÓN: De acuerdo a los datos se tiene que: P(juegue de noche) = 0.70 P(juegue de día) = 0.30 P(gane/juegue de noche) = 0.50 P(gane/juegue de día) = 0.90 Entonces por el teorema de Bayes: P(juegue de noche/gane) =

)/()·()·/()·()/()·(

ajueguedediganePajueguedediPchejueguedenoganePchejueguedenoPchejueguedenoganePchejueguedenoP

Page 35: estadistica solucionarios

ESTADÍSTICA APLICADA

34

Reemplazando:

P(juegue de noche/gane) = 564516129.062.035.0

90.0·30.050.0·70.050.0·70.0

==+

EJERCICIOS PROPUESTOS 1. Suponga que P(A) = 0.50 y P(B/A) = 0.40 . Hallar P(A ∩ B). 2. En un lote de 18 artículos se tiene 5 defectuosos. Si se eligen al

azar y sin reemplazo tres artículos, hallar la probabilidad que los 3 artículos elegidos no sean defectuosos.

3. Una urna contiene 6 bolillas rojas, 8 negras y 10 azules. Si se eligen

al azar y sin reemplazo 3 bolillas, hallar la probabilidad que las 3 bolillas sean azules.

4. En una urna hay 25 bolillas numeradas del 1 al 25. Si se van

sacando una a una al azar sin reposición, ¿cuál es la probabilidad de que la bolilla número 10 salga precisamente en la décima extracción?

5. Se lanza una moneda 3 veces. Sea el evento A de que caiga sello

en cada uno de los dos primeros lanzamientos, B es el evento de que caiga cara en el tercer lanzamiento y C de que caigan exactamente dos caras en los tres lanzamientos, analice si los eventos A y B y B y C son independientes y/o dependientes.

6. El equipo de la “U” juega el 20% de sus partidos en la noche, y el

80% durante el día. El equipo gana el 60% de sus partidos nocturnos y el 90% de los diurnos. De acuerdo con un diario de hoy día, la “U” ganó ayer. ¿Cuál es la probabilidad de que el partido se haya jugado de día?.

Page 36: estadistica solucionarios

ESTADÍSTICA APLICADA

35

7. El profesor MACHI esta enseñando Estadística en la UTP durante varios años. Se sabe que el 80% de los estudiantes terminaron los ejercicios propuestos por el profesor. Determino que de los estudiantes que cumplen con sus trabajos , 90% aprueban el curso. De aquellos estudiantes que no lo hacen así, 60% será aprobado. Juanita tomó Estadística durante el último semestre con el profesor MACHI y aprobó el curso. ¿Cuál es la probabilidad de que si haya hecho sus trabajos?

8. El vice-rector de investigación de la UTP necesita rentar

automóviles en tres agencias: el 60% de la agencia A, el 30% de la agencia B y el 10% de la agencia C. Si el 9% de los vehículos de la agencia A necesitan afinación, el 20% de las unidades de la agencia B necesitan también afinación y el 6% de los autos de la agencia C necesitan asimismo afinación. ¿Cuál es la probabilidad de que un automóvil rentado al vice-rector de investigación de la UTP necesitará afinación?

9. Suponga que en un lote de 20 artículos se tiene 5 defectuosos. Si

se eligen al azar y sin reemplazo 3 artículos, hallar la probabilidad que:

a) Los 3 artículos elegidos no sean defectuosos. b) El segundo articulo elegido sea defectuoso y que el tercero no

sea defectuoso. c) El tercer artículo elegido sea defectuoso, si el primero no fue

defectuoso.

10. Suponga que 3 máquinas A, B y C producen respectivamente, el 50%, 30% y 20% del número total de artículos producidos por una empresa, y que los porcentajes de unidades defectuosas producidas por estas máquinas son: 3%, 4% y 5% respectivamente. Si se elige un artículo al azar y es no defectuoso, hallar la probabilidad que haya sido producido por la máquina A.

Page 37: estadistica solucionarios

ESTADÍSTICA APLICADA

37

UNIDAD II

VARIABLES ALEATORIAS En el análisis estadístico de una variable casi siempre se desea conocer el valor que tomaría en el futuro, este valor no siempre se puede predecir con certeza; por ejemplo al rector de la UTP le interesa saber el número de estudiantes que abandonan la universidad por ciclo o semestre, en estos casos, el análisis resulta mas sencillo si se establece cual es el comportamiento probabilístico de dicha variable para así poder establecer una metodología para estimar su comportamiento futuro. VARIABLE ALEATORIA Una variable aleatoria es una función que tiene como dominio a un espacio muestral y como rango a un subconjunto de los números reales. Una variable aleatoria es una función “X” que le asigna un número real a cada uno de los elementos del espacio muestral. VARIABLE ALEATORIA DISCRETA Cuando el número de posibles valores de la variable es un número finito o infinito numerable. FUNCIÓN DE PROBABILIDAD Sea “X” una variable aleatoria discreta, la función f(x) es llamada función de probabilidad si cumple las siguientes condiciones: 1. f(xi) = P(X= xi) ≥ 0 2. 0 ≤ f(xi) ≤ 1 3. ∑ =1)( ixf EJEMPLO Sea el experimento aleatorio que consiste en lanzar una moneda 2 veces. Analice si la variable aleatoria número de caras constituye una función de probabilidad. SOLUCIÓN: Sea el espacio muestral del experimento:

S = {cc, cs, sc, ss}

Page 38: estadistica solucionarios

ESTADÍSTICA APLICADA

38

Sea la variable aleatoria: x = número de caras Entonces x = 0, 1 y 2 X1 = 0, x2 = 1 y x3 = 2 f(x1) = P(X=x1) = P(X=0) = P(ss) = ¼ f(x2) = P(X=x2) = P(X=1) = P(cs) + P(sc) = 1/4 +1/4 = 2/4 = ½ f(x3) = P(X=x3) = P(X=2) = P(cc) = 1/4 Como los f(xi) están comprendidos entre 0 y 1; y además:

∑=

==++

=++=++=3

1321 1

44

4121

41

42

41)()()()(

ii xfxfxfxf

Entonces f(xi) si es una función de probabilidad; esto es:

F(x)⎩⎨⎧

==

1;22/10;4/1

xyx

Gráfica de f(x):

FUNCIÓN DE PROBABILIDAD ACUMULATIVA Sea “x” una variable aleatoria discreta con función de probabilidad f(x); luego, la función de probabilidad acumulativa o función de distribución de la variable aleatoria “x” es:

F(x) = P(X ≤ xi) = ∑ )( ixf

Page 39: estadistica solucionarios

ESTADÍSTICA APLICADA

39

PROPIEDADES 1. F(X) = 0 ∀ x < m, donde m es el menor valor de los xi 2. F(X) = 1 ∀ x ≥ M, donde M es el mayor valor de los xi 3. 0 ≤ F(X) ≤ 1 4. F(X) es una función creciente Del ejemplo anterior:

F(x)=

⎪⎪⎩

⎪⎪⎨

≥<≤<≤

<

2;121;4/310;4/1

0;0

xxx

x

Gráfica de F(x):

ESPERANZA MATEMÁTICA Sea “x” una variable aleatoria discreta con función de probabilidad f(x); entonces, la Esperanza Matemática o valor esperado o media de la variable aleatoria “x” es: PROPIEDADES 1. E(c) = 0 ; ∀ c = constante 2. E(cx) = cE(x) ; ∀ c = constante 3. E(cx + m ) = cE(x) + m ; ∀ c y m = constantes 4. E(ax + by) = aE(x) + bE(y) ; ∀ a y b = constantes

E(x) = ∑ )( ii xfx

Page 40: estadistica solucionarios

ESTADÍSTICA APLICADA

40

Del ejemplo anterior: E(X) =

144

4220

41·2

42·1

41·0)()()()( 332211

3

1==

++=++=++=∑

=

xfxxfxxfxxfxi

ii

VARIANCIA O VARIANZA Sea “x” una variable aleatoria discreta con función de probabilidad f(x); entonces, la Variancia o Varianza de la variable aleatoria “x” es:

Es decir: También:

PROPIEDADES 1. V(c) = 0 ; ∀ c = constante 2. V(cx) = c2V(x) ; ∀ c = constante 3. V(ax + b) = a2V(x) ; ∀ a y b = constantes 4. Si “x” e “y” son variables aleatorias independientes V(ax + by) = a2V(x) + b2V(y) ∀ a y b = constantes Del ejemplo anterior:

V(X) = ∑ − )())(( 2ii xfxEx ; se sabe que E(X) = 1

V(X) = (x1 – E(X))2f(x1) + (x2 – E(X))2f(x2) + (x3 – E(X))2f(x3)

V(X) = (0 – 1)2 · 41 + ( 1 – 1 )2 ·

42 + ( 2 – 1 )2 ·

41 =

21

Var(X) = V(X) = 2xσ = E[xi –E(X)]2

V(X) = ∑ − )())(( 2ii xfxEx

V(X)= E(x2) – [E(x)]2

Page 41: estadistica solucionarios

ESTADÍSTICA APLICADA

41

También:

V(X) = E(x2) – [E(x)]2 E(X2) =

23

46

41·2

42·1

41·0)()()()( 222

3232

221

21

3

1

2 ==++=++=∑=

xfxxfxxfxxfx ii

i

Entonces: V(X) = 211

231

23 2 =−=−

EJERCICIOS RESUELTOS 1. Se lanzan 3 monedas y se desea analizar la variable aleatoria

número de sellos. Obtenga su función de probabilidad y su grafica.

SOLUCIÓN: El espacio muestral S para este caso es: S = {ccc, ccs, csc, css, scc, scs, ssc, sss} La variable aleatoria: x = número de sellos X = 0, 1, 2, 3 x1 = 0 ; x2 = 1 ; x3 = 2 ; x4 = 3

f(x1) = P(X = x1) = P(X = 0) = P(ccc) = 81

f(x2) = P(X = x2) = P(X = 1) = P(ccs) + P(csc) + P(scc) = 83

f(x3) = P(X = x3) = P(X = 2) = P(css) + P(scs) + P(ssc) = 83

f(x4) = P(X = x4) = P(X = 3) = P(sss) = 81

Se observa que cumple las condiciones de una función de

probabilidad.

f(x) =⎩⎨⎧

==

2,1;8/33,0;8/1

xx

Page 42: estadistica solucionarios

ESTADÍSTICA APLICADA

42

Gráfica de f(x):

2. Una urna contiene 12 bolillas numeradas del 1 al 12. Se saca una

bolilla al azar y se quiere analizar la variable aleatoria número de divisores del número obtenido. Encuentre su función de probabilidad.

SOLUCIÓN: Sea la variable aleatoria: x = número de divisores del número

obtenido. El espacio muestral S consta de cualquiera de las 12 bolillas, es

decir: S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}

Como la bolilla 1 tiene 1 divisor, la bolilla 2 tiene 2 divisores, la

bolilla 3 tiene 2 divisores, la bolilla 4 tiene 3 divisores, la bolilla 5 tiene 2 divisores, la bolilla 6 tiene 4 divisores, la bolilla 7 tiene 2 divisores, la bolilla 8 tiene 4 divisores, la bolilla 9 tiene 3 divisores, la bolilla 10 tiene 4 divisores, la bolilla 11 tiene 2 divisores y la bolilla 12 tiene 6 divisores; entonces:

X = 1, 2, 3, 4, 6

f(1) = 1/12 , f(2) = 5/12 , f(3) = 2/12 , f(4) = 3/12 , f(6) = 1/12

⎪⎪⎩

⎪⎪⎨

====

=

4;4/13;6/1

2;12/56,1;12/1

)(

xxxx

xf

Page 43: estadistica solucionarios

ESTADÍSTICA APLICADA

43

3. Una urna contiene 12 bolillas numeradas del 1 al 12. Se saca una

bolilla al azar y se quiere analizar la variable aleatoria número de divisores del número obtenido. Encuentre su función de probabilidad acumulativa y su gráfica.

SOLUCIÓN: Del ejercicio anterior ya conocemos su función de probabilidad,

entonces:

⎪⎪⎪⎪

⎪⎪⎪⎪

≥<≤<≤<≤<≤

<

=

6;164;12/11

43;12/832;12/6

21;12/11;0

)(

xx

xx

xx

xF

Gráfica de F(x):

4. Se lanza una moneda 3 veces y se desea analizar la variable

aleatoria número de sellos. Calcule e interprete su esperanza matemática y varianza.

Page 44: estadistica solucionarios

ESTADÍSTICA APLICADA

44

SOLUCIÓN: Del ejercicio 1 su función de probabilidad es:

⎩⎨⎧

==

=2,1;8/33,0;8/1

)(xx

xf

Entonces: E(x) = ∑ )( ii xfx

E(x)=

23

812

83630

81·3

83·2

83·1

81·0)()()()()( 44332211

4

1==

+++=+++=+++=∑

=

xfxxfxxfxxfxxfxi

ii

Si este experimento lo repetimos varias veces, esperamos que en promedio el número de sellos sea 3/2. Cálculo de la varianza: V(X) = E(x2) – [E(x)]2 E(X2)=

3824

81·3

83·2

83·1

81·0)()()()()( 2222

4243

232

221

21

4

1

2 ==+++=+++=∑=

xfxxfxxfxxfxxfx ii

i

Entonces: V(x) = 3 – ( 3/2 )2 = 3 - 49 =

43

Este valor nos indica que hay poca dispersión cuando se analiza el número de sellos al lanzar una moneda 3 veces.

5. Sea “x” una variable aleatoria discreta con función de

probabilidad: f(x) = c(x + 2) ; x = 1, 2, 3, 4, 5 Hallar el valor de “c”. SOLUCIÓN: Como f(x) es una función de probabilidad, entonces se cumple que: ∑ =1)( ixf f(1) + f(2) + f(3) + f(4) + f(5) = 1 c(3) + c(4) + c(5) + c(6) + c(7) = 1

25c = 1 ⇒ c = 251

Page 45: estadistica solucionarios

ESTADÍSTICA APLICADA

45

EJERCICIOS PROPUESTOS 1. Se lanzan 4 monedas y se desea analizar la variable aleatoria

número de caras. Calcule y grafique f(x) y F(x), además halle e interprete a su esperanza matemática y varianza.

2. Una urna contiene 15 bolillas numeradas del 1 al 15. Se saca una

bolilla al azar y se quiere analizar la variable aleatoria número de divisores del número obtenido. Calcule y grafique f(x) y F(x), además halle e interprete a su esperanza matemática y varianza.

3. Se lanzan 3 monedas y se desea analizar la variable aleatoria

número de sellos. Obtenga su función de probabilidad acumulativa y su gráfica. Además halle a su coeficiente de variabilidad.

4. Una urna contiene 12 bolillas numeradas del 1 al 12. Se saca una

bolilla al azar y se quiere analizar la variable aleatoria número de divisores del número obtenido. Calcule e interprete su esperanza matemática, varianza y coeficiente de variabilidad.

5. Se lanzan dos dados y se desea estudiar la variable aleatoria

suma de resultados. Calcule y grafique f(x) y F(x), además halle e interprete a su esperanza matemática y varianza.

6. Sea “x” una variable aleatoria discreta con función de

probabilidad: f(x) = cx ; x = 1, 2, 3, 4, 5 Hallar el valor de “c”. 7. Sea “x” una variable aleatoria discreta con función de

probabilidad: f(x) = cx2 ; x = 1, 2, 3, 4, 5 Hallar el valor de “c”. 8. Sea “x” una variable aleatoria discreta con función de

probabilidad: f(x) = c · 2x ; x = 1, 2, 3, 4 Hallar el valor de “c”. 9. Se lanzan dos dados y se desea estudiar la variable aleatoria “x”

suma de resultados. Si además se cumple que: z = 2x + 5. Calcule E(z) y V(z).

Page 46: estadistica solucionarios

ESTADÍSTICA APLICADA

46

10. Dado que la variable aleatoria discreta “x” tiene por función de probabilidad acumulativa:

F(x)=

⎪⎪⎪⎪⎪

⎪⎪⎪⎪⎪

<≤

<≤

<≤

<

10;1

106;65

64;21

41;31

1;0

x

x

x

x

x

Hallar: a) P(2< x ≤ 6); b) P(x = 4); c) Su función de probabilidad. 11. Dado que la variable aleatoria discreta “x” tiene por función de

probabilidad acumulativa:

F(x)=

⎪⎪⎪⎪⎪

⎪⎪⎪⎪⎪

<≤

<≤

<≤−

−<

5;1

53;43

31;21

11;41

1;0

x

x

x

x

x

Hallar: a) P(x ≤ 3); b) P(x = 3); c) P(x < 3); d) P(x ≥ 1); e) P(-0.4< x < 4); f) P(x = 5). 12. Una urna contiene cuatro bolillas con los números 1, 2, 3 y 4,

respectivamente. Si se toma dos bolas de la urna sin sustitución y se define la variable aleatoria “x” como la suma de los números de las dos bolillas extraídas, determine:

a) La función de probabilidad de “x” y su gráfica. b) La función de distribución de “x” y su gráfica.

Page 47: estadistica solucionarios

ESTADÍSTICA APLICADA

47

13. Una moneda está cargada y de este modo hay tres veces mayor probabilidad de que caigan caras que sellos. En tres lanzamientos independientes de la moneda determine:

a) La distribución de probabilidad de x, el número total de caras; b) La probabilidad de que cuanto mucho caigan dos caras. 14. Una caja contiene 10 artículos, de los cuales 2 son defectuosos.

Si se eligen al azar y sin reemplazo 3 artículos y se define la variable aleatoria número de artículos buenos elegidos, hallar f(x) y F(x) y sus gráficas, además calcule e interprete a su esperanza matemática y varianza.

15. Suponga que se han recibido 3 cajas (A, B y C) con 4 artículos

cada una. La caja A contiene un artículo defectuoso, la caja B contiene 2 artículos defectuosos y en la caja C no hay artículos defectuosos. Si se elige al azar un artículo de cada caja y se define la variable aleatoria “x” como el número de artículos buenos elegidos. Hallar f(x) y F(x) y sus gráficas, además calcule e interprete a su esperanza matemática y varianza.

VARIABLE ALEATORIA CONTINUA Si el número de valores posibles de la variable en estudio es un conjunto no numerable. Es decir, la variable toma infinitos valores. FUNCIÓN DE PROBABILIDAD Sea “X” una variable aleatoria continua, la función f(x) es llamada función de probabilidad o de densidad si cumple las siguientes condiciones: 1. 0 ≤ f(x) ≤ 1 ; ∀ x ∈ ℜ 2. 1)( =∫

∞−dxxf

Nota: Sea el evento: A = {x / a ≤ x ≤ b} ; entonces: P(A) = P(a ≤ x ≤ b) = ∫

b

adxxf )(

Page 48: estadistica solucionarios

ESTADÍSTICA APLICADA

48

EJEMPLO Suponga que el tiempo de producción de un artículo (minutos) es una variable aleatoria “x” que tiene como función de densidad:

18x ; 0 ≤ x ≤ 6

f(x) = 0 ; de otro modo (d.o.m.) Verificar si f(x) es una función de densidad y hallar la probabilidad de que el tiempo de producción de un artículo elegido al azar sea menor de 4 minutos. SOLUCIÓN: Debe de cumplirse que: 1)( =∫

∞−dxxf

6

0

26

0

6

0 2181

181

18xxdxdxx

== ∫∫ = 1)18(181)

20

26(

181 22

==−

Lo cual verifica que f(x) si constituye una función de densidad. La probabilidad pedida equivale a:

P( x < 4 ) = P( 0 < x < 4) = 4

0

24

0 2181

18xdxx

=∫ =

44444444.094

3616

24

181 2

===

Gráfica de f(x):

Page 49: estadistica solucionarios

ESTADÍSTICA APLICADA

49

FUNCIÓN DE PROBABILIDAD ACUMULATIVA Sea “x” una variable aleatoria continúa con función de densidad f(x); luego, la función de probabilidad acumulativa o función de distribución de la variable aleatoria “x” se define como: PROPIEDADES 1. F(-∝) = 0 2. F(+∝) = 1 3. 0 ≤ F(X) ≤ 1 ; ∀ x ∈ ℜ 4. F(X) es una función creciente

5. f(X) = dx

xdF )(

6. P(a ≤ x ≤ b) = F(b) – F(a) Del ejemplo anterior: F(x) = P(X ≤ x) = ∫ ∞−

xdxxf )(

F(x) = xx xdxx0

2

0 2181

18=∫ =

362181 22 xx

=

⎪⎪⎩

⎪⎪⎨

>

≤≤

<

=

6;1

60;36

0;0

)(2

x

xxx

xF

Gráfica de F(x):

F(x) = P(X ≤ x) = ∫ ∞−

xdxxf )(

Page 50: estadistica solucionarios

ESTADÍSTICA APLICADA

50

ESPERANZA MATEMÁTICA Sea “x” una variable aleatoria continua con función de densidad f(x); entonces, la Esperanza Matemática o valor esperado o media de la variable aleatoria “x” es: PROPIEDADES 1. E(c) = 0 ; ∀ c = constante 2. E(cx) = cE(x) ; ∀ c = constante 3.- E(cx + m ) = cE(x) + m ; ∀ c y m = constantes 4. E(ax + by) = aE(x) + bE(y) ; ∀ a y b = constantes Del ejemplo anterior: E(x) = ∫

∞−dxxxf )(

E(x) = 6

0

36

0

26

0 3181

181

18· xdxxdxxx == ∫∫ = 4

54216

36

181 3

==

VARIANCIA O VARIANZA Sea “x” una variable aleatoria continua con función de probabilidad f(x); entonces, la Variancia o Varianza de la variable aleatoria “x” es:

Es decir: También:

E(x) = ∫∞

∞−dxxxf )(

Var(X) = V(X) = 2xσ = E[x – E(X)]2

V(X) = ∫∞

∞−− dxxfxEx )()]([ 2

V(X)= E(x2) – [E(x)]2

Page 51: estadistica solucionarios

ESTADÍSTICA APLICADA

51

PROPIEDADES 1.- V(c) = 0 ; ∀ c = constante 2. V(cx) = c2V(x) ; ∀ c = constante 3. V(ax + b) = a2V(x) ; ∀ a y b = constantes 4. Si “x” e “y” son variables aleatorias independientes V(ax + by) = a2V(x) + b2V(y) ∀ a y b = constantes Del ejemplo anterior: V(x) = E(x2) – [E(x)]2 Como E(x) = 4

Entonces: E(x2) = 6

0

46

0

36

0

2

4181

181

18xdxxdxxx == ∫∫ = 18

721296

41864

==x

Luego: V(x) = 18 – ( 4 )2 = 18 – 16 = 2 EJERCICIOS RESUELTOS 1. Suponga que el tiempo de producción de un artículo (minutos) es

una variable aleatoria “x” que tiene como función de densidad:

⎪⎩

⎪⎨⎧ ≤≤

−=

...;0

42;4

5)(

mod

xxxf

Hallar la probabilidad de que el tiempo de producción de un

artículo elegido al azar sea menor de 3 minutos. SOLUCIÓN: Sea la variable aleatoria: x = tiempo de producción de un artículo Nos piden:

P(x < 3) = P( 2 ≤ x < 3) = 3

2

23

2

3

2)

25(

41)5(

41

45 xxdxxdxx

−=−=−

∫ ∫

P(x < 3 ) = 625.085)

25(

41)

255(

41)

24

29(1015[

41

===−=−−−

Page 52: estadistica solucionarios

ESTADÍSTICA APLICADA

52

2. Sea “x” una variable aleatoria continua con función de densidad:

⎩⎨⎧ ≤≤

=...;0

60;)(

modxcx

xf

Si además se cumple que: y = 20 + 4x Hallar:

a) El valor de “c”. b) La mediana de “x”. c) E(y) y V(y)

SOLUCIÓN:

a) Debe de cumplirse que: 1)( =∫∞

∞−dxxf

1)018(2

·6

0

26

0=−==∫ cxccxdx ⇒ 18c = 1 ⇒ c =

181

b) Para calcular al valor de la mediana debe de cumplirse:

21)( =∫ ∞−

medxxf en nuestro caso:

21

2181

2181

18

2

0

2

0===∫

mexdxx meme ⇒

me2 = 18 ⇒ me = 18 = 3 2 c) Del ejemplo sabemos que: E(x) = 4 y V(x) = 2 Entonces, por propiedades: E(y) = E(20+4x) = E(20)+E(4x) = 20+4E(x) = 20 + 4(4) = 36 V(y) = V(20+4x) = V(20)+V(4x) = 0+ 42 V(x) = 16(2) = 32 3. Si la función de distribución del ejercicio 1 es:

F(x) = 81016 2xx −+− (compruébalo)

Page 53: estadistica solucionarios

ESTADÍSTICA APLICADA

53

Determine: P( x < 3 ) SOLUCIÓN: Por la propiedad 6 de F(X):

P( x < 3 ) = P( 2 < x < 3 ) = F(3) – F(2) = 85 - 0 =

85

* F(3) = 85

893016=

−+− y F(2) = 08

42016=

−+−

EJERCICIOS PROPUESTOS 1. Suponga que el tiempo de producción de un artículo (minutos) es

una variable aleatoria “x” que tiene como función de densidad:

⎪⎩

⎪⎨⎧ ≤≤

−=

...;0

42;4

5)(

mod

xxxf

Verificar si f(x) es una función de densidad y hallar la probabilidad

de que el tiempo de producción de un artículo elegido al azar sea por lo menos de 3 minutos.

2. Sea “x” una variable aleatoria continua con función de densidad:

⎩⎨⎧ <<+

=...;0

42);1()(

modxxc

xf

Si además se cumple que: y = 10 + 5x Hallar:

a) El valor de “c”. b) E(x) y V(x) c) E(y) y V(y)

Page 54: estadistica solucionarios

ESTADÍSTICA APLICADA

54

3. Si la función de distribución del ejercicio 1 es:

F(x) = 81016 2xx −+−

Determine: P( x > 3 ) 4. La función de densidad de la variable aleatoria continua “x” está

dada por:

⎪⎩

⎪⎨⎧ <<

=...;0

72;51

)(mod

xxf

a) Demuestre que el área situada debajo de la curva (sobre el

eje x) es igual a 1. b) Determine P(3< x < 5).

5, Si la función de densidad de la variable aleatoria continua “x” está

dada por:

⎪⎩

⎪⎨⎧ <<+

=...;0

42);1(81

)(mod

xxxf

Hallar: a) P(x < 3.2); b) P(2.9 < x < 3.2).

6. Si la función de densidad de la variable aleatoria x está dada por:

⎩⎨⎧ <<−

=...;0

10);1(6)(

modxxx

xf

Hallar: a) P(x > ½); b) La función de distribución de esta variable aleatoria; c) El valor de la mediana de la variable x.

7. Si la función de densidad de la variable aleatoria “x” está dada

por:

⎩⎨⎧ <<+

=...;0

10;)(

2

modxxcx

xf

Page 55: estadistica solucionarios

ESTADÍSTICA APLICADA

55

Hallar: a) El valor de “c”. b) La función de distribución de esta variable aleatoria “x” y

trace su gráfica; c) P(0 ≤ x ≤ ½).

8. Si la función de densidad de la variable aleatoria “x” está dada por:

⎪⎩

⎪⎨

⎧<≤

<<−−=

...;010;

01;.)(

modxkx

xkxxf

Hallar: a) El valor de “k”. b) La función de distribución de esta variable aleatoria “x” y

trace su gráfica; c) P(- ½ < x < ½).

9. Si la función de densidad de la variable aleatoria “x” está dada por

⎪⎩

⎪⎨

⎧<≤−

<<=

...;01;2

10;)(

modcxx

xxxf

Hallar: a) El valor de “c” b) La función de distribución de “x”. c) P(0.8 < x < 0.6c).

10. Obtenga la función de distribución de la variable aleatoria “x” cuya

función de densidad está dada por:

⎪⎪⎪⎪

⎪⎪⎪⎪

<<−

≤<

≤<

=

...;0

32;2

3

21;21

10;2

)(

mod

xx

x

xx

xf

Trace asimismo las gráficas de las funciones de densidad y de distribución.

Page 56: estadistica solucionarios

ESTADÍSTICA APLICADA

56

11. Si la función de distribución de la variable aleatoria “x” está dada

por:

⎪⎪⎩

⎪⎪⎨

<≤−+

−<

=

1;1

11;2

11:0

)(

x

xxx

xF

Hallar: a) P(- ½ < x < ½); b) P(2 < x < 3), c) La densidad de probabilidad de esta variable aleatoria “x” y

utilícela para volver a determinar la probabilidad del inciso a). 12. Si la función de distribución de la variable aleatoria “x” está dada

por:

⎪⎪⎪

⎪⎪⎪

<≤−

<≤

<

=

5.1;1

5.11;21

10;2

0;0

)(

x

xx

xxx

xF

Hallar:

a) P(0.4 < x ≤ 1.3) b) P( x > 0.5) c) La función de densidad de la variable “x”.

13. Si la función de distribución de la variable aleatoria “x” está dada

por:

⎪⎪⎩

⎪⎪⎨

<≤−+

−<

=

2;1

22;8

42;0

)(

x

xxx

xF

Hallar: a) P(x = -2); b) P( x = 2); c) P(-2 < x <1); d) P(0 ≤ x ≤ 2).

Page 57: estadistica solucionarios

ESTADÍSTICA APLICADA

57

14. La cantidad real de café (en gramos) en un recipiente de 230

gramos llenado por cierta máquina es una variable aleatoria cuya función de densidad está dada por:

⎪⎪⎩

⎪⎪⎨

<<

=

5.232;0

5.2325.227;51

5.227;0

)(

x

x

x

xf

Determine la probabilidad de que un recipiente de 230 gramos

llenado por esta máquina contendrá: a) Cuanto mucho 228.65 gramos de café. b) Entre 229.34 y 231.66 gramos de café. c) Cuanto menos 229.85 gramos de café.

15. El retraso o adelanto (en minutos) de un vuelo de Lima a Juliaca

es una variable aleatoria “x” cuya función de densidad está dada por:

⎪⎩

⎪⎨⎧ <<−−

=...;0

66);36(2881

)(2

mod

xxxf

donde los valores negativos son indicativos de que el vuelo llega

adelantado y los valores positivos señalan que el vuelo llega retrasado.

Determine las probabilidades de que uno de estos vuelos llegará

a) Cuando menos dos minutos antes. b) Cuando menos un minuto retrasado. c) Entre uno y tres minutos antes. d) Exactamente cinco minutos tarde.

Page 58: estadistica solucionarios

ESTADÍSTICA APLICADA

58

16. Suponga que las ventas diarias de un establecimiento (decenas de miles de soles) es una variable aleatoria “x” con función de densidad:

f(x)=

⎪⎪⎪

⎪⎪⎪

<≤−

<≤−

omd

xx

xx

.;0

64;6

6

42;3

2

Si se elige aleatoriamente un día:

a) Hallar la probabilidad de que las ventas del establecimiento sea mayor de 22,000 soles pero no mayor de 45,000 soles

b) Hallar la media, variancia y el coeficiente de variabilidad de las ventas diarias.

c) Si la utilidad neta diaria es definida por la función Y=0.2X–0.5, hallar la media y la variancia de la utilidad neta diaria.

d) Hallar la función de probabilidad acumulativa de “x”. 17. Suponga que el tiempo de vida (en miles de horas) de los tubos

fluorescentes de 30 w. de cierta marca, es una variable aleatoria “x” que se distribuye según la siguiente función de densidad:

⎪⎩

⎪⎨

⎧≤≤−<≤−

=...;0

63);210(31);22(

)(mod

xxkxxk

xf

a) Determine el valor de “k” y la función de probabilidad

acumulativa . b) Utilizando la función de distribución acumulativa hallada en

(a), halla la probabilidad que un fluorescente que haya durado dos mil horas, dure no más de 2500 horas adicionales.

c) Determine el tiempo de vida esperado y el coeficiente de variabilidad de la distribución del tiempo de vida. ¿Qué nos indican?

d) Halle el valor del percentil 70. Interprete.

Page 59: estadistica solucionarios

ESTADÍSTICA APLICADA

59

18. El tiempo total, medido en unidades de 100 horas, que un adolescente escucha un estéreo durante un año, es una variable aleatoria “x” cuya función de densidad de probabilidad es:

⎪⎩

⎪⎨

⎧<≤−

<<=

...;021;2

10;)(

modxx

xxxf

a) Halla la función de probabilidad acumulativa. b) Para un año en particular, ¿cuál es la probabilidad que un

adolescente utilice entre 50 a 125 horas?. Utilizar lo determinado en la pregunta anterior.

c) Si se eligen aleatoriamente 4 adolescentes, ¿cuál es la probabilidad que por lo menos 2 escuchen su estéreo menos de 25 o más de 175 horas anuales?

d) Halla el coeficiente de variabilidad. ¿Qué nos indica? e) Si y = 60x + 40, halle la variancia de y.

Page 60: estadistica solucionarios

ESTADÍSTICA APLICADA

61

UNIDAD III

DISTRIBUCIONES DE PROBABILIDADES En esta unidad estudiaremos algunas de las distribuciones de probabilidades que son usadas con mayor frecuencia en estudios estadísticos. DISTRIBUCIONES DISCRETAS PRUEBA DE BERNOULLI Una prueba o ensayo de Bernoulli es aquella en la que su espacio muestral consta sólo de 2 resultados posibles; éxito (E) y fracaso (F), donde a la probabilidad de éxito denotaremos “p” y a la probabilidad de fracaso “q” o “1 – p”, ya que p + q = 1. Si esta prueba la repetimos varias veces, la probabilidad de éxito se mantiene constante y las pruebas son independientes. EJEMPLO: Lanzamiento de una moneda balanceada. Observe que su espacio muestral consta de solo dos resultados posibles: cara(c) o sello(s). Si nos interesa el número de caras, su probabilidad de éxito será 1/2, es decir p = 1/2 y q = 1 – p = 1/2. DISTRIBUCIÓN DE BERNOULLI Una variable aleatoria discreta “x” sigue una distribución de Bernoulli si su función de probabilidad está dada por:

Donde “x” es el número de éxitos. Además su media y variancia están dadas por:

f(x) = pxq1-x ; x = 0 , 1

E(x) = μx = p V(x) = 2xσ = pqy

Page 61: estadistica solucionarios

ESTADÍSTICA APLICADA

62

Note que esta distribución es usada para una sola prueba de Bernoulli o cuando elegimos al azar un solo elemento de una población. Para dos o mas pruebas de Bernoulli o para una muestra al azar con reemplazo usamos: DISTRIBUCIÓN BINOMIAL Una variable aleatoria discreta “x” tiene una distribución binomial si su función de probabilidad está dada por: Donde “x” es el número de éxitos en “n” pruebas de bernoulli o el tamaño de una muestra aleatoria con reemplazo. Además su media y variancia están dadas por: EJEMPLO Se lanza una moneda 10 veces y se desea hallar la probabilidad de obtener exactamente 4 caras. SOLUCIÓN: Sea la variable aleatoria: x = número de caras Para un solo lanzamiento la probabilidad de éxito es 1/2, esta probabilidad se mantiene constante en los otros lanzamientos, como “n” es 10, entonces: f(x) = xnxn

x qpC − ; x = 0, 1, 2, 3, · · · , n f(x) = 10101010 )5.0()5.0()5.0( x

xxx CC =− ; x = 0, 1, 2, 3, · · · , 10

Nos piden: P(x = 4) = f(4) = 205078125.0)5.0( 1010

4 =C

f(x) = xnxnx qpC − ; x = 0, 1, 2, 3, · · · , n

E(x) = μx = np V(x) = 2xσ = npqy

Page 62: estadistica solucionarios

ESTADÍSTICA APLICADA

63

DISTRIBUCIÓN HIPERGEOMÉTRICA Una variable aleatoria discreta “x” tiene una distribución hipergeométrica si su función de probabilidad está dada por: Donde “x” es el número de éxitos de una muestra aleatoria de tamaño “n” sin reemplazo, tomado de una población de tamaño N. A es el número de elementos que tienen una determinada característica, definida como éxito, y B los elementos que no tienen dicha característica, definida como fracaso, donde A + B = N. Además su media y variancia están dadas por:

IMPORTANTE

Si el tamaño de la población(N) es grande y 05.0<Nn , entonces se

puede aproximar a la distribución binomial, en donde p = NA

EJEMPLO Como parte de un estudio de la contaminación del aire, un inspector decide examinar la emisión de gases de seis de los 24 camiones de carga de una compañía. Si cuatro de los camiones de la compañía emiten cantidades excesivas de contaminantes, ¿cuál es la probabilidad de que ninguno de ellos sea incluido en la muestra del inspector? SOLUCIÓN: Sea x = número de camiones que contaminan N = 24, A = 4, B = 20 y n = 6

Nn

Bxn

Ax

CCCxf −=·)( ; x= 0, 1, 2, 3, · · · , n

E(x) = μx = NnA y V(x) = 2

xσ = )1

(2 −−

NnN

NnAB

Page 63: estadistica solucionarios

ESTADÍSTICA APLICADA

64

Entonces: f(x) = 246

206

4 ··CCC

CCC xxNn

Bxn

Ax −− =

Nos piden: f(0) = 288.0·246

206

40 =C

CC

DISTRIBUCIÓN DE POISSON Una variable aleatoria discreta “x” tiene una distribución de Poisson si su función de probabilidad está dada por:

Donde: x = número de éxitos obtenidos en un periodo de tiempo o unidad de evaluación.

λ = razón media de ocurrencia por periodo de tiempo o unidad de

evaluación. t = periodo de tiempo o unidad de evaluación. Además su media y variancia están dadas por: IMPORTANTE La probabilidad de éxito es pequeña y constante, los números de éxitos son independientes. Se puede aproximar la distribución binomial a la Poisson cuando el tamaño de la muestra “n” es grande y la probabilidad de éxito “p” pequeña ( p < 0.1); es decir cuando np < 5; para esto considere:

!·)(x

exfxμμ−

= ; x = 0,1, 2, 3,

μ = λt

E(x) = μx = μ

μ = np (t = n y λ = p)

V(x) = 2xσ = μ y

Page 64: estadistica solucionarios

ESTADÍSTICA APLICADA

65

EJEMPLO Se sabe que durante ciertas horas las llamadas telefónicas a la UTP están distribuidas al azar según un proceso de Poisson, con un promedio de 3 llamadas por minuto. Se desea hallar la probabilidad de que transcurran 4 minutos sin llamadas. SOLUCIÓN: Sea x = número de llamadas λ = 3 t = 4 μ = 3·4 = 12

Entonces: f(x) = !12·

!· 12

xe

xe xx −−

=μμ

Nos piden: f(0) = 000006144.0!012· 12

012

== −−

ee

EJERCICIOS PROPUESTOS 1. Demuestre que la media y la varianza de la distribución de

Bernoulli son “p” y “pq” respectivamente. 2. Se lanza una moneda 15 veces y se desea hallar la probabilidad

de obtener: a) Exactamente 7 caras.

b) Por lo menos 2 caras. c) A lo mas 14 caras. 3. Como parte de un estudio de la contaminación del aire, un

inspector decide examinar la emisión de gases de cinco de los 20 camiones de carga de una compañía. Si tres de los camiones de la compañía emiten cantidades excesivas de contaminantes, ¿cuál es la probabilidad de que dos camiones estén contaminando?

Page 65: estadistica solucionarios

ESTADÍSTICA APLICADA

66

4. Se sabe que durante ciertas horas las llamadas telefónicas a la UTP están distribuidas al azar según un proceso de Poisson, con un promedio de 5 llamadas por minuto. Se desea hallar la probabilidad de que en 2 minutos haya exactamente 3 llamadas y de que en 2 minutos haya 8 llamadas.

5. Suponga que el 30% de los créditos otorgados por un banco

tienen cuotas vencidas. Si se eligen al azar y con reemplazo 10 créditos, determinar: a) La probabilidad que por lo menos dos créditos tengan cuotas

vencidas. b) La media y el coeficiente de variabilidad.

6. Una urna contiene 9 bolillas verdes y 11 azules. Si se sacan al

azar 5 bolillas sin reemplazo, hallar: a) La probabilidad de que una sea de color verde. b) La probabilidad de que al menos 2 sean de color verde. c) La probabilidad de que a lo mas 4 sean de color verde.

7. Una urna contiene 8 bolillas blancas, 10 negras y 12 rojas. Se

sacan al azar y sin reemplazo 7 bolillas, determinar: a) La probabilidad que a lo mas 6 sean rojas. b) La probabilidad que por lo menos 2 sean negras.

8. Suponga que “x” tiene una distribución de Poisson si P(x = 3) = 2/3 P(x = 1). Calcular P( x > 1). 9. En una población grande el 16 % de los miembros son zurdos. En

una muestra aleatoria de tamaño 10, encontrar la probabilidad de que exactamente dos o más sean zurdos.

10. En un estudio sobre la efectividad de un insecticida contra cierto

insecto, se roció en un área grande de tierra. Posteriormente, se examinó el área en relación con los insectos vivos, seleccionando lotes cuadrados al azar y contando el número de insectos vivos por lote cuadrado. Experiencias anteriores han demostrado que el número promedio de insectos vivos por lote cuadrado después de haber rociado el insecticida es de 0.5. Si el número de insectos vivos por lote se distribuye según Poisson, hallar:

Page 66: estadistica solucionarios

ESTADÍSTICA APLICADA

67

a) ¿Cuál es la probabilidad de que un lote cuadrado contenga uno o más insectos vivos?.

b) Si la evaluación se hizo en unos 10000 lotes, ¿cuántos lotes tendrían un insecto vivo?.

c) ¿Cuál es la probabilidad de encontrar tres insectos en dos lotes?.

11. Los resultados de una encuesta a un aula de 30 alumnos indica

lo siguiente : - 10 alumnos aceptaron dar el examen el día sábado. - 5 alumnos aceptaron dar el examen el día domingo. - 7 alumnos aceptaron dar el examen en Navidad. - Al resto le era indiferente cuando dar el examen. Si se elige una muestra de 10 alumnos, ¿Cuál es la probabilidad de elegir más de 6 alumnos que le sean indiferente la fecha del examen?.

12. En una estación telefónica se recepcionan llamadas a una razón

promedio de 4 llamadas cada 5 minutos. Si se elige al azar un periodo de 2 minutos, hallar la probabilidad que se recepcionen por lo menos 3 llamadas.

13. El gerente de crédito de un banco recibe 12 solicitudes de crédito,

de las cuales 3 tienen documentación incompleta, por lo que serán devueltas a los clientes. Si se eligen 5 solicitudes al azar y sin reemplazo, hallar: a) La probabilidad de devolver por lo menos 3 solicitudes de

crédito. b) La media, varianza y coeficiente de variabilidad.

14. El gerente de crédito de un banco recibe 10 solicitudes de crédito,

de las cuales 4 tienen documentación incompleta, por lo que serán devueltas a los clientes. Si se eligen 5 solicitudes al azar y con reemplazo, hallar:

a) La probabilidad de devolver por lo menos 3 solicitudes de crédito.

b) La media, varianza y coeficiente de variabilidad.

Page 67: estadistica solucionarios

ESTADÍSTICA APLICADA

68

15. Un fabricante de piezas de automóviles garantiza que una caja de sus piezas contendrá como máximo 2 defectuosos. Si la caja contiene 20 piezas y la experiencia ha demostrado que ese proceso de fabricación produce 5% de piezas defectuosas. ¿Cuál es la probabilidad de que una caja satisfaga la garantía?.

16. Un estudiante no se ha preparado absolutamente nada para un

examen (cosa muy corriente en algunos estudiantes) el cual contiene 20 preguntas de verdadero, falso. Decide lanzar al aire una moneda para responder, anota verdadero si la moneda sale cara y falso si la moneda sale sello. Hallar:

a) La probabilidad de que apruebe el examen, si para ello debe contestar correctamente el 70% de las preguntas.

b) La probabilidad de que conteste por lo menos la mitad de las preguntas correctamente.

17. Una empresa fabrica mesas de billar y sospecha que el 2% de su

producción está defectuosa en alguna firma. Si ésta sospecha es correcta. Encuentre la probabilidad de que en una muestra de 9 mesas:

a) Haya por lo menos una defectuosa. b) A lo mas 2 mesas sean defectuosas. 18. Si el 3% de los focos fabricados por una empresa son

defectuosas. Hallar la probabilidad de que en una muestra de 50 focos:

a) No resulte ningún defectuoso. b) Resulte 5 defectuosos. c) Resulte a lo más 2 defectuosos. d) Resulte por lo menos 3 defectuosos. 19. A una construcción llegan camiones de carga a una razón media

de 2.8 camiones/hora. Hallar la probabilidad de tener por lo menos 3 camiones que llegan en: a) Un lapso de 30 minutos. b) Un lapso de 45 minutos. c) Un lapso de una hora. d) Un lapso de dos horas. e) Un lapso de tres horas.

Page 68: estadistica solucionarios

ESTADÍSTICA APLICADA

69

20. Una compañía de seguros contra accidentes de tránsito sabe que el 0.005% de la población fallece por accidente de tránsito. ¿Cuál es la probabilidad de que la compañía tenga que pagar a sus 10000 asegurados que tiene este año? a) A mas de 3 asegurados. b) A lo mas a 3 asegurados. c) Exactamente a 3. d) A por lo menos 2 asegurados.

Page 69: estadistica solucionarios

ESTADÍSTICA APLICADA

70

DISTRIBUCIONES CONTINUAS DISTRIBUCIÓN NORMAL Una variable aleatoria continua “x” tiene una distribución normal con media μ y varianza σ2, si su función de probabilidad es: GRÁFICA:

CARACTERÍSTICAS: 1. Tiene una forma acampanada. 2. Es asintótica con respecto al eje horizontal. 3. Es simétrica con respecto a su media μ. DISTRIBUCIÓN NORMAL ESTÁNDAR Sea “x” una variable aleatoria continua que tiene una distribución normal

con media μ y varianza σ2, entonces la variable aleatoria Z = σμ−x

tiene una distribución normal con media cero ( 0 ) y varianza uno ( 1 ) y su función de probabilidad está dada por:

f(x) = 2)(

21

21 σ

μ

σπ

−−

x

e ; -∝ < x < ∝

f(z) = 2

2

21 z

e−

π ; -∝ < z < ∝

Page 70: estadistica solucionarios

ESTADÍSTICA APLICADA

71

GRÁFICA:

CARACTERÍSTICAS: 1. Tiene una forma acampanada. 2. Es asintótica con respecto al eje horizontal. 3. Es simétrica con respecto a su media 0. USO DE LA TABLA Z Haciendo uso de la tabla “z” compruebe las siguientes probabilidades: 1. P(z < 2.37) = 0.9911

2. P(z > 3.24) = 1 – 0.9994 = 0.0006

Page 71: estadistica solucionarios

ESTADÍSTICA APLICADA

72

3. P(z < - 1.53) = 0.0630

4. P(z > - 2.08) = 1 – 0.0188 = 0.9812

5. P(1.66 < z < 2.69) = 0.9964 – 0.9515 = 0.0449

Page 72: estadistica solucionarios

ESTADÍSTICA APLICADA

73

6. P(-0.45 < z < 3.25) = 0.9994 – 0.3264 = 0.6730

7. P(-1.23 < z < 0) = 0.5 – 0.1093 = 0.3907

8. P(-2.76 < z < -1.94) = 0.0262 – 0.0029 = 0.0233

Page 73: estadistica solucionarios

ESTADÍSTICA APLICADA

74

EJERCICIOS RESUELTOS 1. El costo de producción de un determinado artículo tiene una

distribución normal con una media de 20 soles y una varianza de 4 soles2. Si se elige al azar un artículo, ¿cuál es la probabilidad de que su costo de producción sea a lo más de 18 soles?

SOLUCIÓN: Sea x = costo de producción Donde: x ∼ N( μ = 20 ; σ2 = 4 ) por lo cual σ = 2 Nos piden:

P( x ≤ 18 ) como z = σμ−x ∼ N(0,1)

P( x ≤ 18 ) = )18(σμ

σμ −≤

−xP , reemplazando:

P( x ≤ 18 ) = 1587.0)1()2

2018( =−≤=−

≤ zPzP

2. Las llamadas que se registran en la UTP tienen una distribución

normal con una media de 2 minutos y una variancia de 1 minuto. Hallar la probabilidad de que una llamada tenga una duración comprendida entre 3 y 4 minutos.

SOLUCIÓN: Sea x = número de llamadas Donde: x ∼ N( μ = 2 ; σ2 = 1 ) por lo cual σ = 1 Nos poden:

P(3 < x < 4) = )1

241

23()43( −<<

−=

−<

−<

− zPxPσμ

σμ

σμ

P(3 < x < 4) = P(1< z < 2) = 0.9772 – 0.8413 = 0.1359

Page 74: estadistica solucionarios

ESTADÍSTICA APLICADA

75

3. El tiempo que le dedican los estudiantes para aprender Estadística es una variable aleatoria que tiene una distribución normal con una media de 20 horas y una varianza de 9 horas2. Si se elige al azar a un estudiante, ¿cuál es la probabilidad de que haya estudiado a lo más 14 horas?.

SOLUCIÓN: Sea x = tiempo de estudio o número de horas. Donde: x ∼ N( μ = 20 ; σ2 = 9 ) por lo cual σ = 3 Nos piden:

P(x ≤ 14 ) = 0228.0)2()3

2014( =−≤=−

≤− zPxPσμ

4. Suponga que el costo de producción de una calculadora tiene una

distribución normal con una media de 50 soles y una varianza de 16 soles2. Si se elige una calculadora al azar, hallar la probabilidad que su costo de producción sea por lo menos de 45 soles.

SOLUCIÓN: Sea x = costo de producción de una calculadora Donde: x ∼ N( μ = 50 ; σ2 = 16 ) por lo cual σ = 4 Nos piden:

P(x ≥ 45) = 8944.01056.01)25.1()4

5045( =−=−≥=−

≥− zPxPσμ

5. El tiempo de incapacidad por enfermedad de las secretarias de la

UTP en un mes, tiene una distribución normal con una media de 120 horas y una desviación estándar de 25 horas. Si Rosita se enferma, hallar la probabilidad de que el tiempo de ausencia a la UTP esté comprendida entre 60 y 90 horas.

SOLUCIÓN: Sea x = tiempo de incapacidad Donde: x ∼ N( μ = 120 ; σ = 25 )

Page 75: estadistica solucionarios

ESTADÍSTICA APLICADA

76

Nos piden: P(60 < x < 90) =

)20.140.2()25

1209025

12060( −<<−=−

<−

<− zPxP

σμ

P(60 < x < 90) = 0.1151 – 0.0082 = 0.1069 EJERCICIOS PROPUESTOS 1. Use la tabla Z para calcular las siguientes probabilidades:

a) P(z < -3.96) b) P(z < 1.77) c) P(z > 3.04) d) P(z > -2.88) e) P(1.43 < z < 3.69) f) P(-2.34 < z < 1.71) g) P(-3.07 < z < -1.68)

2. Use la tabla Z para hallar el valor de “m” en: a) P(z < m) = 0.9

b) P(z > m) = 0.1 c) P(-1.24 < z < m) = 0.8 d) P(-m < z < m) = 0.99 e) P(-m < z < m) = 0.68

3. Si “x” se distribuye en forma normal con una media de 12 y una

desviación estándar de 3, calcule las siguientes probabilidades: a) P(x < 15)

b) P(x > 10) c) P( 9 < x < 13) d) P(2 < x < 5) e) P( -3 < x < 10)

4. Si “x” se distribuye en forma normal con una media de 10 y una

desviación estándar de 2, calcule el valor de “m” si: a) P(x > m) = 0.95

b) P(m < x < 10) = 0.2 c) P(-m < x – 10 < m) = 0.99

5. El costo de producción de un determinado artículo tiene una

distribución normal con una media de 30 soles y una varianza de 9 soles2. Si se elige al azar un artículo, ¿cuál es la probabilidad de que su costo de producción sea por lo menos de 27 soles?

Page 76: estadistica solucionarios

ESTADÍSTICA APLICADA

77

6. Las llamadas que se registran en la UTP tienen una distribución

normal con una media de 4 minutos y una variancia de 2 minutos. Hallar la probabilidad de que una llamada tenga una duración comprendida entre 2 y 5 minutos.

7. El tiempo que le dedican los estudiantes para aprender

Estadística es una variable aleatoria que tiene una distribución normal con una media de 25 horas y una varianza de 4 horas2. Si se elige al azar a un estudiante, ¿cuál es la probabilidad de que haya estudiado por lo menos 20 horas?.

8. Suponga que el costo de producción de una calculadora tiene una

distribución normal con una media de 40 soles y una varianza de 9 soles2. Si se elige una calculadora al azar, hallar: a) La probabilidad que su costo de producción sea por lo

menos de 42 soles. b) La probabilidad que su costo de producción sea a lo más de

36 soles. c) La probabilidad que su costo de producción difiera de la

media poblacional en menos de 5 soles. 9. El tiempo de incapacidad por enfermedad de las secretarias de la

UTP en un mes, tiene una distribución normal con una media de 100 horas y una desviación estándar de 16 horas. Si Yuli se enferma, hallar la probabilidad de que el tiempo de ausencia a la UTP esté comprendida entre 80 y 95 horas.

10. Si el largo de una varilla se distribuye en forma normal con una

media de 10 y una varianza de 2. Y una varilla se considera aceptable si tiene una longitud mayor de 11 pulgadas.

a) Hallar el porcentaje de varillas aceptables. b) ¿Cuál es la probabilidad de que si se seleccionan al azar 4

varillas, 3 de ellas presenten una longitud aceptable? 11. El número de horas que un estudiante necesita para aprender un

tema de estadística es una variable aleatoria que tiene una distribución normal. Si el 84.13% de los estudiantes emplean mas de 3 horas y sólo el 2.28% mas de 9 horas. Calcule usted la media y la varianza.

Page 77: estadistica solucionarios

ESTADÍSTICA APLICADA

78

12. Una fábrica se dedica al llenado de botellas de un agua de mesa. La capacidad de las botellas se distribuyen en forma normal con una media de un litro y una desviación estándar de 1.1litros. Se rechazan las botellas con capacidad inferior a 0.99litros o superior a 1.1litros. La fábrica realiza una inspección consistente en elegir 20 botellas al azar y si encuentra más de 2 botellas rechazables, despiden al jefe de producción. ¿Qué probabilidad tiene el jefe de producción de perder su puesto de trabajo?

Page 78: estadistica solucionarios

ESTADÍSTICA APLICADA

79

UNIDAD IV

DISTRIBUCIONES MUESTRALES La estadística trabaja con datos que fueron obtenidas de muestras aleatorias y de éstas obtenemos valores estadísticos o estimadores de las cuales necesitamos saber cuál es su comportamiento probabilístico para poder realizar un análisis estadístico y a su vez nos permitirá establecer los niveles de confiabilidad y de riesgo. DISTRIBUCIÓN MUESTRAL Es una función de probabilidad asociada a un estimador, que se genera con todas las muestras aleatorias de tamaño “n” que se puedan obtener de una población. Por ejemplo x , 21 xx − y S2 son estimadores o valores estadísticos, mas cada una de ellas tiene una determinada distribución de probabilidad particular. DISTRIBUCIÓN DE PROMEDIOS MUESTRALES Es una función de probabilidad que se forma con los promedios muestrales que se obtienen a partir de todas las muestras aleatorias de tamaño “n” que se puedan extraer de una población. TEOREMA Si de una población de tamaño “N” que tiene una media μx y varianza σ2

x se extraen muestras aleatorias de tamaño “n” y en cada muestra

calculamos su promedio n

xx

n

ii∑

== 1 , entonces la media y varianza de la

variable x son: a) Si las muestras son con reemplazo o la población es infinita:

xx μμ = y n

xx

22 σ

σ =

Page 79: estadistica solucionarios

ESTADÍSTICA APLICADA

80

b) Si las muestras son sin reemplazo:

xx μμ = y )1

(2

2

−−

=N

nNn

xx

σσ

OBSERVACIÓN:

Si Nn < 0.05 entonces

nx

x

22 σ

σ = con o sin reemplazo.

DISTRIBUCIÓN DE PROMEDIOS MUESTRAES SI LA VARIABLE EN ESTUDIO SE DISTRIBUYE EN FORMA NORMAL Sea “x” una variable aleatoria que tiene una distribución normal con media μx y varianza σ2

x. Si de esta distribución se extraen muestras aleatorias de tamaño “n” y en cada muestra calculamos su promedio

n

xx

n

ii∑

== 1 , entonces la variable x se distribuye en forma normal con una

media xμ y varianza 2xσ .

Entonces:

TEOREMA DEL LÍMITE CENTRAL Sea “x” una variable aleatoria que tiene una distribución con media μx y varianza σ2

x. Si de esta distribución se extraen muestras aleatorias de

tamaño “n” y en cada muestra calculamos su promedio n

xx

n

ii∑

== 1 ,

entonces si el tamaño de muestra es grande ( n ≥ 30 ), la variable aleatoria x se distribuye en forma aproximadamente normal con una media xμ y varianza 2

xσ .

Z = x

xxσμ−

∼ N(0,1).

Page 80: estadistica solucionarios

ESTADÍSTICA APLICADA

81

Entonces:

DISTRIBUCIÓN DE DIFERENCIAS DE PROMEDIOS MUESTRALES

TEOREMA Si de 2 poblaciones de tamaños N1 y N2 normales e independientes que se distribuyen con medias μ1 y μ2 , y varianzas σ2

1 y σ22 , se extraen

muestras aleatorias de tamaños n1 y n2 , respectivamente; entonces, la variable aleatoria 21 xx − tiene una distribución normal con media

21 xx −μ y

varianza 221 xx −σ .

a) Si las muestras son con reemplazo:

21 xx −μ = μ1 - μ2 y 221 xx −σ =

2

22

1

21

nnσσ

+

b) Si las muestras son sin reemplazo:

21 xx −μ = μ1 - μ2 y

2

21 xx −σ = )1

()1

(2

22

2

22

1

11

1

21

−−

+−−

NnN

nNnN

nσσ

Entonces:

OBSERVACIÓN: Si las poblaciones no tienen distribuciones normales, entonces se puede usar el teorema del límite central siempre y cuando n1 y n2 sean mayores o iguales que 30.

Z = x

xxσμ−

∼ aproximadamente N(0,1)

21

2121

xx

xxxxZ

−−−=

σ

μ∼ N(0,1)

Page 81: estadistica solucionarios

ESTADÍSTICA APLICADA

82

DISTRIBUCIÓN DE PROPORCIONES MUESTRALES Si de una población distribuida Binomialmente con probabilidad de éxito p, se extrae una muestra aleatoria de tamaño n, entonces se puede mostrar que la media de X: número de éxitos en la muestra, es μ = np y que su varianza es σ2 = npq. En consecuencia la proporción muestral tiene media

p, y varianza npq . Entonces: por el Teorema del Limite Central, cuando n

es grande se tiene:

Fórmulas de aproximación Normal a la Binomial. Si X es una Binomial con parámetros n y p, entonces: i) ii) iii)

EJERCICIOS RESUELTOS 1. Suponga que una empresa produce un determinado artículo de

acuerdo a un proceso con una media de 950 gramos y una varianza de 1600 gramos2. Si se eligen al azar y con reemplazo 36 artículos, hallar la probabilidad que el promedio muestral sea por lo menos 965 gramos.

SOLUCIÓN: Sea la variable aleatoria: x = peso de los artículos (gramos) x ∼ ?(μx = 950 , σ2

x = 1600) y n = 36

( ) )5.5.()5.5.(npq

npkZnpq

npkPkXkPkXP −+<<

−−=+<<−≅=

( ) )5.5.()5.5.(npq

npbZnpq

npaPbXaPbXaP −−<<

−+=−<<+=<<

( ) )5.5.()5.5.(npq

npbZnpq

npaPbXaPbXaP −+<<

−−=+<<−=≤≤

npq

ppnpq

npXz −=

−= ˆ

Page 82: estadistica solucionarios

ESTADÍSTICA APLICADA

83

Entonces, como el muestreo es con reemplazo:

xx μμ = = 950 y n

xx

22 σ

σ = = 36

1600 ⇒ 640

361600

==xσ

Nos piden: )965( ≥xP Como n ≥ 30 , aplicamos el Teorema del Límite Central. Esto es:

)965( ≥xP = )965

(x

x

x

xxP

σμ

σμ −

≥−

, reemplazando:

)965( ≥xP = )25.2()

640

950965( ≥=−

≥ zPzP , haciendo uso de la

tabla “z”: )965( ≥xP = 1 - P(z ≤ 2.25) = 1 – 0.9878 = 0.0122

2. Las estaturas de 1000 estudiantes tienen una media de 170 centímetros y una varianza de 16 centímetros2. Si se eligen al azar y sin reemplazo una muestra de tamaño 32, hallar la probabilidad que el promedio muestral sea a lo mas 172 centímetros.

SOLUCIÓN: Sea la variable aleatoria: x = estatura de los estudiantes

(centímetros) x ∼ ?(μx = 170 , σ2

x = 16) y n = 32

Entonces, como el muestreo es sin reemplazo:

xx μμ = = 170 y 484484484.0)11000321000(

3216)

1(

22 =

−−

=−−

=N

nNn

xx

σσ

⇒ 696049196.0=xσ Nos piden: )172( ≤xP Como n ≥ 30 aplicamos el Teorema del Límite Central.

Page 83: estadistica solucionarios

ESTADÍSTICA APLICADA

84

Esto es:

)172( ≤xP = )172

(x

x

x

xxP

σμ

σμ −

≤−

reemplazando:

)172( ≤xP = 9979.0)87.2()696049196.0

170172( =≤=−

≤ zPzP (ver tabla z)

3. El tiempo de duración de un foco se distribuye en forma normal con una media de 10000 horas y una varianza de 100 horas2. Si se selecciona una muestra al azar con reemplazo de tamaño 16, hallar la probabilidad que su promedio esté comprendido entre 9980 y 10010 horas.

SOLUCIÓN: Sea la variable aleatoria: x = tiempo de duración de los focos

(horas)

x ∼ N(μx = 10000, σ2x = 100) y n = 16

Entonces, como el muestreo es con reemplazo:

xx μμ = = 10000 y n

xx

22 σ

σ = = 16

10000 , entonces:

254

10016

10000===xσ

Nos piden: P(9980 < x < 1010) estandarizando:

P(9980 < x < 1010) = )25

100001001025

100009980( −<

−<

x

xxP

σμ

P(9980 < x < 1010) = P(-0.80 < z < 0.40) = 0.6554 – 0.2119 = 0.4435

Page 84: estadistica solucionarios

ESTADÍSTICA APLICADA

85

4. Suponga que dos máquinas A y B producen bolsas de azúcar de iguales características. La máquina A produce bolsas con una media de 970 gramos y una varianza de 256 gramos2, y la máquina B produce bolsas con una media 980 gramos y una varianza 144 gramos2. Si se eligen al azar y con reemplazo 36 bolsas producidas por A y 64 bolsas producidas por B, hallar la probabilidad que la diferencia de los promedios muestrales sea a lo más 8 gramos.

SOLUCIÓN: Sean las variables aleatorias: xA = peso de las bolsas producidas por la máquina A (gr.) xB = peso de las bolsas producidas por la máquina B (gramos) xA ∼ ?(μA = 970 , σ2

A = 256) y nA = 36 xB ∼ ?(μB = 980 , σ2

B = 144) y nB = 64 Entonces, como el muestreo es con reemplazo:

BA xx −μ = μA - μB = 970 – 980 = -10 y

21 BA xx −σ = 361111.9

64144

3625622

=+=+B

B

A

A

nnσσ , entonces:

059593.3=− BA xxσ Nos piden: P = )88()8( ≤−≤−=≤− BABA xxPxxP Como nA ≥ 30 y nB ≥ 30, aplicamos el Teorema del Límite Central. Esto es:

P = )059593.3

)10(8/)(059593.3

)10(8( −−≤−−≤

−−−−− BABA xxxxBA xxP σμ

P = P(0.65 ≤ z ≤ 5.88) = 1 – 0.7422 = 0.2578

5. Según reportes del centro nacional para estadísticas de salud, alrededor del 20 % de la población masculina adulta de los Estados Unidos es obesa.

Se elige al azar una muestra de 150 hombres adultos en los

Estados Unidos. ¿Cuál es la probabilidad de que:

Page 85: estadistica solucionarios

ESTADÍSTICA APLICADA

86

a) Haya a lo más 25 personas obesas? b) Haya más de 22 pero menos de 35 obesos?

c) Haya por lo menos un 25% de obesos en la muestra? SOLUCIÓN: Sea X el número de personas obesas en la muestra. Usando aproximación normal a la Binomial se tiene que:

a) b) c) P( = P(Z>1.53) = 1-P(Z<1.53) = 1 - 0.9730 = 0.0630.

EJERCICIOS PROPUESTOS 1. Suponga que una empresa produce un determinado artículo de

acuerdo a un proceso con una media de 500 gramos y una varianza de 49 gramos2. Si se eligen al azar y con reemplazo 50 artículos, hallar la probabilidad que el promedio muestral sea a lo mas 505 gramos.

2. Las estaturas de 1200 estudiantes tienen una media de 168

centímetros y una varianza de 20 centímetros2. Si se eligen al azar y sin reemplazo una muestra de tamaño 40, hallar la probabilidad que el promedio muestral esté comprendido entre 166 y 175 centímetros.

3. El tiempo de duración de un foco se distribuye en forma normal

con una media de 100000 horas y una varianza de 80 horas2. Si se selecciona una muestra al azar con reemplazo de tamaño 25, hallar la probabilidad que su promedio esté comprendido entre 99985 y 100025 horas.

( ) ( ) ( ) 1814.091.024

305.255.2525 =−<=⎟⎠⎞

⎜⎝⎛ −

<=<≅≤ ZPZPXPXP

( ) ( ) =⎟⎠⎞

⎜⎝⎛ −

<<−

=<<≅<<24

305.3424

305.225.345.223522 ZPxPXP

( ) 8123.00063.08186.091.053.1 =−=<<− ZP

)24

305.37()5.37()25.ˆ−

>=≥=≥ ZPXPp

Page 86: estadistica solucionarios

ESTADÍSTICA APLICADA

87

4. Suponga que dos máquinas A y B producen bolsas de azúcar de iguales características. La máquina A produce bolsas con una media de 980 gramos y una varianza de 200 gramos2, y la máquina B produce bolsas con una media 990 gramos y una varianza 100 gramos2. Si se eligen al azar y con reemplazo 40 bolsas producidas por A y 50 bolsas producidas por B, hallar la probabilidad que la diferencia de los promedios muestrales sea por lo menos 6 gramos.

5. Suponga que una máquina ha sido programada para producir

artículos cuyos pesos tienen una distribución con una media de 250 gramos y una varianza de 625 gramos2. Si se eligen al azar 49 artículos, hallar la probabilidad que su promedio sea por lo menos 255 gramos y la probabilidad que su promedio esté comprendido entre 243 y 256 gramos, considerando: a) Una muestra con reemplazo. b) Una muestra sin reemplazo tomada de un lote de 400

artículos. 6. En un estudio para comparar los pesos promedios de niños y

niñas de una escuela primaria, se tomó una muestra aleatoria de 40 niños y 45 niñas. Se sabe que los pesos tanto de niños como de niñas tienen una distribución normal con medias de 50 y 46 kilos, y con varianzas de 70 y 75 kilos2 respectivamente, hallar la probabilidad de que el promedio de los pesos de los niños sea al menos 5 kilos más grande que el peso de las niñas.

7. De dos máquinas que embolsan café automáticamente, se han

extraído 64 bolsas al azar de cada máquina. Ambas máquinas embolsan con idénticas medias y varianzas de 6 y 10 respectivamente, hallar la probabilidad que ambos promedios muestrales difieran en por lo menos 2.

8. Suponga que la UTP tiene 200 profesores, 50 de los cuales tienen

el grado de doctor. Dos muestras con reemplazo de tamaño 32 son elegidas al azar y en forma independiente, y se registran a los que tienen doctorado, hallar la probabilidad que las dos muestras difieran en por lo menos 6 doctorados.

9. Suponga que en un distrito de Lima hay aproximadamente 8000

adultos, donde el 20% compra usualmente una revista A. Si se elige una muestra aleatoria de tamaño 225, hallar la probabilidad

Page 87: estadistica solucionarios

ESTADÍSTICA APLICADA

88

que la proporción muestral de personas que compran la revista A, sea mayor de 0.17.

10. Suponga que en un establecimiento la proporción de clientes que

opinan que la atención ofrecida es buena es π. Determinar el mínimo tamaño de la muestra requerida, si se desea que:

a) La proporción muestral difiera de la proporción poblacional en no mas de una cantidad “d”, con una probabilidad “1 - α “.

b) La desviación estándar de la proporción muestral sea no mayor a “d”.

c) El coeficiente de variabilidad de “p” sea no mayor a “d”. DISTRIBUCIÓN CHI – CUADRADO [ ]2

)(mχ Una variable aleatoria “x” tiene una distribución Chi – Cuadrado con “m” grados de libertad, si su función de probabilidad o de densidad es: Donde: Γ(x) es la función gamma, definida por:

∫∞ −−=Γ

0

1)( dyeyx yx , x > 0

GRÁFICA: f(x) χ2(m) CARACTERÍSTICAS: 1. Su variable toma sólo valores positivos. 2. Presenta un sesgo o asimetría a la derecha. 3. Es asintótica con respecto al eje horizontal en su parte positiva.

f(x) = 21

2

22 )(2

1)(xm

mm exxf

−−

Γ= , x > 0

Page 88: estadistica solucionarios

ESTADÍSTICA APLICADA

89

4. A medida que los grados de libertad aumentan (m>30), la distribución presenta menor sesgo.

5. Para “m” grados de libertad su media y varianza son “m” y “2m” respectivamente.

TEOREMA Sea “x” una variable aleatoria que tiene una distribución normal con media μx y varianza 2

xσ , entonces se cumple que:

2)1(2

2

~)1(

−n

x

Snχ

σ

TABLA CHI – CUADRADO Compruebe las siguientes probabilidades: 1. 975.0)023.19( 2

)9( =<χP

2. 70.030.01)267.7( 2

)10( =−=>χP

Page 89: estadistica solucionarios

ESTADÍSTICA APLICADA

90

3. 7.02.09.0)412.28578.14( 2)20( =−=<< χP

4. 6.01.07.0)656.10168.4( 2

)9( =−=<< χP

5. 4.05.09.0)256.40336.29( 2

)30( =−=<< χP

Page 90: estadistica solucionarios

ESTADÍSTICA APLICADA

91

DISTRIBUCIÓN “t” DE STUDENT [ ])(mt Una variable aleatoria “x” tiene una distribución “t” de Student con “m” grados de libertad, si su función de probabilidad es:

GRÁFICA: CARACTERÍSTICAS: 1. Tiene una forma ligeramente acampanada. 2. Es simétrica con respecto a su media cero. 3. Es asintótica con respecto al eje “x”. 4. Se aproxima cada vez mas a la distribución normal estándar, a

medida que los grados de libertad sean mayores de 30.

5. Para “m” grados de libertad su media y varianza son “0” y “2−m

m ”

respectivamente. TEOREMA Sea “x” una variable aleatoria que tiene una distribución normal con media μx y varianza σ2

x. Si de la distribución de “x” se extrae una

muestra aleatoria de tamaño “n”; entonces la variable aleatoria x

x

Sxt μ−

=

tiene una distribución “t” de Student con (n – 1) grados de libertad, donde:

a) Si la muestra es con reemplazo: n

SS xx

22 =

b) Si la muestra es sin reemplazo: )1

(2

2

−−

=N

nNn

SS xx

212

)1(

1

)2

(

)2

1()( +

= m

mxmm

m

xfπ

; -∝ < x < ∝

Page 91: estadistica solucionarios

ESTADÍSTICA APLICADA

92

TEOREMA Sean “x1” y “x2” dos variables aleatorias independientes con distribuciones normales de medias μ1 y μ2 y varianza común σ2. Si de estas distribuciones se extraen muestras aleatorias de tamaños “n1” y “n2” , respectivamente; entonces la variable aleatoria

21

)()( 2121

xxSxxt

−−−=

μμ tiene una distribución “t” de Student con (n - 2)

grados de libertad, donde: a) Si el muestreo es con reemplazo:

⎟⎟⎠

⎞⎜⎜⎝

⎛+=−

21

22 1121 nn

SS pxx

b) Si el muestreo es sin reemplazo:

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛−−

+⎟⎟⎠

⎞⎜⎜⎝

⎛−−

=− 11

11

2

22

21

11

1

2221 N

nNnN

nNn

SS pxx y

2)1()1(

21

222

2112

−+−+−

=nn

SnSnS p

es la varianza ponderada, que es el estimador de la varianza común σ2

. TABLA “t” DE STUDENT Compruebe las siguientes probabilidades: 1. P( t(8) < 2.306) = 0.975

Page 92: estadistica solucionarios

ESTADÍSTICA APLICADA

93

2. P( t(20) > -1.325) = 1 – 0.1 = 0.9

3. P( -1.310 < t(30) < 2.457 ) = 0.99 – 0.10 = 0.89

4. P( -0.527 < t(75) < 0.846) = 0.8 – 0.3 = 0.5

Page 93: estadistica solucionarios

ESTADÍSTICA APLICADA

94

5. P(0.849 < t(50) < 1.299) = 0.9 – 0.8 = 0.1

DISTRIBUCIÓN F DE SNEDECOR [ ]),( mnF Una variable aleatoria “x” tiene una distribución “F” con “n” y “m” grados de libertad, si su función de probabilidad es: GRÁFICA:

CARACTERÍSTICAS: 1. Su variable está definida sólo para valores positivos. 2. Presenta un sesgo o asimetría positiva o a la derecha. 3. Es asintótica en su parte positiva con respecto al eje positivo. 4. A medida que los grados de libertad aumentan ( n > 30 , m > 30 ) la

distribución presenta menor sesgo, es decir la distribución se hace mas simétrica.

f(x)

F(n,m)

2

22

)1)(()(

))(()(

22

12

mn

nn

mnxmn

mnmn x

xf +

+ΓΓ

Γ=

−+ ; si: x > 0

Page 94: estadistica solucionarios

ESTADÍSTICA APLICADA

95

5. Para “n y m” grados de libertad su media y varianza son:

2−m

m para m > 2 y )4()2(

)2(22

2

−−−+

mmnmnm para m > 4

PROPIEDAD RECÍPROCA Si “x” es una variable aleatoria que tiene una distribución “F” con “ n y m” grados de libertad, se cumple que:

TEOREMA Sean “x1” y “x2” dos variables aleatorias independientes distribuidas en forma normal con medias: μ1 y μ2 y varianzas: 2

1σ y 22σ respectivamente. Si de

ambas poblaciones “x1” y “x2” se extraen muestras aleatorias de tamaños “n1” y “n2” ; entonces, la variable:

21

22

22

21

σσ

SSF = tiene una distribución F con “n1 – 1” y “n2 – 1” grados de

libertad TABLA “F” DE SNEDECOR Compruebe las siguientes probabilidades: 1. P[F(6 , 13) < 2.92] = 0.95

),,(1),,1(

nmFmnF

αα =−

Page 95: estadistica solucionarios

ESTADÍSTICA APLICADA

96

2. P[F(14, 10) > 4.60 ] = 1 – 0.99= 0.01

3. P[F(27, 4) <13.88 ] = 0.99

4. P[F(9, 5) > 4.77 ] = 1 – 0.95 = 0.05

Page 96: estadistica solucionarios

ESTADÍSTICA APLICADA

97

5. P[F(32, 15) < 3.19 ] = 0.99

EJERCICIOS RESUELTOS 1. Suponga que el tiempo de atención por cliente en una tienda tiene

una distribución normal con una desviación estándar de 4 minutos. Si se elige una muestra aleatoria de 25 clientes: a) Hallar la probabilidad que su variancia sea menor de 12

minutos2. b) Hallar la probabilidad que su variancia sea mayor de 10

minutos2. c) Hallar el valor de “m” tal que P( S2 < m ) = 0.7

SOLUCIÓN:

Sea x = tiempo de atención por cliente(minutos) x ∼ N(μx = ?, σx = 4) y n = 25

a) )12)1()1(()12( 22

22

σσxnSnPSP −

<−

=< , reemplazando:

= 1970.0)18()16

1224( 2)24(

2)24( =<=< χχ PxP

b) )10)1()1(()10( 22

22

σσxnSnPSP −

>−

=>

= 9208.0)15()16

1024( 2)24(

2)24( =>=> χχ PxP

Page 97: estadistica solucionarios

ESTADÍSTICA APLICADA

98

c) P(S2 < m) = 0.7

7.0))1()1(( 22

2

=−

<−

σσmnSnP

7.0)16

24( 2)24( =<

mP χ

7.0)5.1( 2

)24( =< mP χ de la tabla: 1.5m = 27.096, entonces: m = 18.064 2. Suponga que los pesos de las calculadoras producidas por una

empresa tienen una distribución normal con una variancia de 16 gramos2. Si se elige una muestra aleatoria de 20 calculadoras, hallar: a) La probabilidad que su desviación estándar sea por lo menos

de 3 gramos. b) La probabilidad que la desviación estándar sea a lo mas de 5

gramos. c) El valor de m tal que P ( S2 < m ) = 0.8

SOLUCIÓN: Sea x = peso de una calculadora(gramos) x ∼ N(μx = ?, σ2

x = 16) y n = 20

a) )9)1()1(()9()3( 22

22

σσxnSnPSPSP −

≥−

=≥=≥ , reemplazando:

= 9339.0)6875.10()16

919( 2)19(

2)19( =≥=≥ χχ PxP

b) )25)1()1(()25()5( 22

22

σσxnSnPSPSP −

≤−

=≤=≤

= 9441.0)6875.29()16

2519( 2)19(

2)19( =≤=≤ χχ PxP

Page 98: estadistica solucionarios

ESTADÍSTICA APLICADA

99

c) P(S2 < m) = 0.8

8.0))1()1(( 22

2

=−

<−

σσmnSnP

8.0)16

19( 2)19( =<

mP χ

8.0)1875.1( 2

)19( =< mP χ de la tabla: 1.1875m = 23.9, entonces: m = 20.1263 3. Suponga que los pesos de los alumnos de la UTP tienen una

distribución normal con una media de 70 kg. y una variancia de 10 kg2. Si se eligen al azar 50 alumnos, hallar:

a) la probabilidad que su variancia esté comprendida entre 8 y

12 kg2. b) el valor de “m” tal que: P( s2 > m) = 0.3

SOLUCIÓN:

Sea x = peso de un alumno de la UTP(kilogramos) x ∼ N(μx = 70, σ2

x = 10) y n = 50

a) )12)1()1(8)1(()128( 22

2

22

σσσxnSnxnPSP −

<−

<−

=<<

reemplazando: =

681.01596.08406.0)8.582.39()10

124910

849( 2)49(

2)49( =−=<<=<< χχ PxxP

b) P(S2 > m) = 0.3

3.0))1()1(( 22

2

=−

>−

σσmnSnP

3.0)10

49( 2)49( =>

mP χ

3.0)9.4( 2)49( => mP χ de la tabla: 4.9m = 53.67, entonces:

m = 10.9531

Page 99: estadistica solucionarios

ESTADÍSTICA APLICADA

100

4. Suponga que para analizar el tiempo de atención por cliente en un establecimiento con 1000 clientes, se tomó una muestra aleatoria sin reemplazo de 24 atenciones con la cual se obtiene un tiempo promedio de 10 minutos y una variancia de 2 minutos2. Si se toma otra muestra sin reemplazo de tamaño 24 hallar la probabilidad que el promedio muestral difiera de su media poblacional en menos de un minuto.

SOLUCIÓN: Sea x = tiempo de atención (minutos) N = 1000, n = 24, 10=x y S2 = 2 )1( <− μxP = )11( <−<− μxP

= )11(xxx SS

xS

P <−

<− μ

Como el muestreo es sin reemplazo, entonces:

)1

(2

2

−−

=N

nNn

SS xx , reemplazando:

081414748.0)11000241000(

2422 =

−−

=xS , entonces: 285333.0=xS , luego:

)285333.0

1285333.0

1()1( )23( <<−

=<− tPxP μ

9981.000095.099905.0)5047.35047.3( )23( =−=<<−= tP 5. Suponga que una maquina produce diariamente 5000 artículos, y

que para analizar los pesos de tales artículos se eligieron al azar y sin reemplazo 25 unidades producidas en un día, obteniéndose un peso promedio de 450 grs y una variancia de 20 grs2 . Si se toma otra muestra sin reemplazo de tamaño 25, hallar la probabilidad que el promedio muestral difiera de su media poblacional en mas de 6 grs.

SOLUCIÓN: Sea x = peso de los artículos (gramos) N = 5000, n = 25, 450=x y S2 = 20

Page 100: estadistica solucionarios

ESTADÍSTICA APLICADA

101

)6( >− μxP = )6(1 ≤−− μxP = )66(1 ≤−≤−− μxP

= )66(1xxx SS

xS

P ≤−

≤−

−μ

Como el muestreo es sin reemplazo, entonces:

)1

(2

2

−−

=N

nNn

SS xx , reemplazando:

796159231.0)15000255000(

25202 =

−−

=xS , entonces: 89228.0=xS , luego:

)89228.0

689228.0

6(1)6( )24( <<−

−=>− tPxP μ

00000059.0)7243.67243.6(1 )24( =<<−−= tP

6. Suponga que dos máquinas A y B producen un mismo artículo y que los tiempos de producción (minutos) tienen distribuciones normales con medias: μA = 1430, μB =1410 y variancias

6252 =Aσ , 9002 =Bσ , respectivamente. Si se eligen al azar 31 artículos producidos por la máquina A y 25 artículos producidos por la máquina B, hallar la probabilidad que la variancia de B sea a lo mas 2.7216 veces la variancia de A.

SOLUCIÓN: Sean xA = tiempo de producción de la máquina A XB = tiempo de producción de la máquina B

XA ∼ N(μx = 1430, σ2

x = 625) y nA = 31 XB ∼ N(μx = 1410, σ2

x = 900) y nB = 25 Entonces:

)7216.2()7216.2( 2

222 <=<

A

BAB S

SPSSP

Page 101: estadistica solucionarios

ESTADÍSTICA APLICADA

102

Como 21

22

22

21

σσ

SSF = , entonces:

2

2

2

2

2

2

625900

B

A

A

B

B

A

SS

SSF ==

σσ ~F(30,24) y 2

2

2

2

2

2

900625

A

B

B

A

A

B

SS

SSF ==

σσ ~F(24,30)

)900

7216.2625900625()7216.2()7216.2( 2

2

2

222 x

SSP

SSPSSP

A

B

A

BAB <=<=<

= 95.0)89.1( )30,24( =<FP EJERCICIOS PROPUESTOS 1. Hallar las siguientes probabilidades, para 30 grados de libertad:

a) P ( χ2 > 18.493 ) b) P ( 20.599 < χ2 < 43.773 )

2. Hallar las siguientes probabilidades, para 12 grados de libertad:

a) P ( χ2 > 9.034 ) b) P ( 7.807 < χ2 < 18.549 )

3. Calcular:

a) P( χ2(10) < 7.267 )

b) P( χ2(29) > 42.557 )

c) P( 36.755 < χ2(42) < 54.090 )

4. Hallar las siguientes probabilidades, para 11 grados de libertad :

a) P ( χ2 > 19.675 ) b) P ( 3.816 < χ2 < 21.92 ) c) m si P ( m < χ2 < 12.899 ) = 0.25

5. Hallar “m” tal que : P( 2

)29(χ > m ) = 0.8 6. Suponga que el tiempo de atención por cliente en una tienda tiene

una distribución normal con una desviación estándar de 2 minutos. Si se elige una muestra aleatoria de 21 clientes: a) Hallar la probabilidad que su variancia sea menor de 5

minutos2.

Page 102: estadistica solucionarios

ESTADÍSTICA APLICADA

103

b) Hallar la probabilidad que su variancia sea mayor de 2 minutos2.

d) Hallar el valor de m tal que P( S2 < m ) = 0.6 7. Suponga que los pesos de los alumnos de la UTP tienen una

distribución normal con una media de 70 kg. Y una variancia de 16 kg2. Si se eligen al azar 25 alumnos, hallar: a) la probabilidad que su variancia este comprendida entre 12

y 20 kg2. b) el valor de “k” tal que : P( s2 > k) = 0.4

8. Suponga que el tiempo de duración de los tubos fluorescentes

tienen una distribución normal con una media de veinte mil horas y una variancia de 5.76 horas2 . Si se elige al azar una muestra de 36 fluorescentes, hallar: a) La probabilidad que su variancia sea por lo menos de 3.69

horas2. b) La probabilidad que su variancia esté comprendida entre 3

y 7 horas2. c) La probabilidad que su desviación estándar sea a lo mas

4.53 horas. d) El valor de “k” tal que : P( s2 < k ) = 0.4

9. Si t es una variable aleatoria que tiene una distribución “t” de

Student con 29 g. l. , hallar : a) P ( t > -1.699 ) b) P ( -2.045 < t < 1.311 )

10. Hallar las siguientes probabilidades, para 19 grados de libertad:

a) P( -1.328 < t < 2.093) b) P( 0.861 < t < 1.729 )

11. Si: n = 15 a) Hallar P( -2.145 < t < 2) b) Hallar k si P( k < t < 1.761 ) = 0.875 12. Si: n = 15 a) Hallar P( -2.145 < t < 2) b) Hallar k si P( k < t < 1.761 ) = 0.875 13. Si: n = 49, calcular “m” tal que : P(t > m ) = 0.8

Page 103: estadistica solucionarios

ESTADÍSTICA APLICADA

104

14. Si “t” es una variable aleatoria que tiene una distribución “t” de Student con 29 g.l. , hallar : a) P ( t > -1.699 ) b) P ( -2.045 < t < 1.311 ) c) m si P ( m < t < 2.045 ) = 0.875

15. Suponga que una máquina produce diariamente 200 artículos, y

que para analizar los pesos de tales artículos se eligieron al azar 36 unidades producidas en un día, obteniéndose un peso promedio de 120 gramos y una desviación estándar de 5 gr. Si se toma otra muestra de tamaño 36, hallar la probabilidad que el promedio muestral supere a su media poblacional en menos de 3 gramos.

16. Suponga que una máquina produce diariamente 500 artículos, y

que para analizar los pesos de tales artículos se eligieron al azar y sin reemplazo 16 unidades producidas en un día , obteniéndose un peso promedio de 250 gr. y una variancia de 12 gr2. Si se toma otra muestra, sin reemplazo, de tamaño 16 , hallar la probabilidad que el promedio muestral supere a su media poblacional en menos de 3 gramos.

17. Suponga que una máquina produce diariamente 1000 artículos, y

que para analizar los pesos de tales artículos se eligieron al azar y sin reemplazo 25 unidades producidas en un día, obteniéndose un peso promedio de 450 grs y una variancia de 200 grs2. Si se toma otra muestra, sin reemplazo, de tamaño 25, hallar la probabilidad que el promedio muestral supere a su media poblacional en menos de 6 grs.

18. Calcular:

a) P(F(31,4) < 13.83) b) P(F(28,14) < 2.32) c) P(F(52,8) < 5.06) d) P(F(26,20) < 2.07) e) P(F(35,25) < 1.89)

19. Suponga que dos máquinas A y B producen un mismo artículo y

que los tiempos de producción (minutos) tienen distribuciones normales con medias μA = 1430, μB =1410 y variancias 6252 =Aσ ,

9002 =Bσ , respectivamente. Si se eligen al azar 31 artículos producidos por la máquina A y 25 artículos producidos por la máquina B, hallar:

Page 104: estadistica solucionarios

ESTADÍSTICA APLICADA

105

a) )7216.2( 22AB SSP <

b) )5568.37216.2( 2

2

<<A

B

SSP

c) “m” tal que: 98.0)5568.3( 2

2

=<<A

B

SSmP

20. Suponga que dos máquinas A y B producen un mismo artículo y

que los pesos por artículo (gramos) tienen distribuciones normales con medias: μA = 550, μB = 565 y variancias 1442 =Aσ ,

2562 =Bσ , respectivamente. Si se eligen al azar 21 artículos producidos por la máquina A y 31 artículos producidos por la máquina B, hallar:

a) )6267.3( 22AB SSP <

b) )4344.108563.1( 2

2

<<B

A

SSP

c) “m” tal que: 94.0)9245.4( 2

2

=<<A

B

SSmP

Page 105: estadistica solucionarios

ESTADÍSTICA APLICADA

107

UNIDAD V

INFERENCIA ESTADÍSTICA La inferencia estadística es la parte de la estadística que se ocupa del análisis, interpretación de resultados y de la generalización de los resultados para toda una población en base a datos tomados de una muestra aleatoria extraída de esa población. La inferencia estadística se divide en dos partes, la estimación de parámetros y las pruebas de hipótesis. ESTIMACIÓN DE PARAMETROS Son las aproximaciones de los parámetros a partir de datos captados en muestras aleatorias y de acuerdo a ciertos procedimientos establecidos por indicadores que son llamados “estimadores, valores estadísticos o estadígrafos” ESTIMADOR O VALOR ESTADÍSTICO O ESTADIGRAFO Un estimador es cualquier función de las observaciones de una muestra aleatoria, cuya finalidad es obtener una estimación o aproximación del valor de un parámetro. Por ejemplo el promedio muestral x estima a su parámetro poblacional μ y la variancia muestral S2 estima a su parámetro poblacional σ2. Es decir x ∼ μ y S2 ∼ σ2. PROPIEDADES DE LOS ESTIMADORES Para que los estimadores sean buenos, es decir confiables, se deben de cumplir las siguientes propiedades: ESTIMADORES INSESGADOS Un estimador es insesgado si su esperanza matemática es igual a su parámetro. Si el estimador no es insesgado, entonces a la diferencia entre la esperanza matemática y el parámetro se le llama sesgo o error del estimador. Por ejemplo x es un estimador insesgado ya que E( x ) = μ también S2 es un estimador insesgado ya que E(S2) = σ2.

Page 106: estadistica solucionarios

ESTADÍSTICA APLICADA

108

ESTIMADORES CONSISTENTES Un estimador es consistente si al tomar un tamaño de muestras aleatorias cada vez más grandes, su valor se aproxima cada vez más a su parámetro. ESTIMADORES EFICIENTES Un estimador insesgado es eficiente con respecto a otros estimadores insesgados si su variancia es más pequeña. ESTIMADORES SUFICIENTES Un estimador es suficiente si es una función de todas las observaciones de la muestra aleatoria, la cual se capto para estimar a su parámetro. TIPOS DE ESTIMACIÓN ESTIMACIÓN PUNTUAL La estimación es puntual cuando el parámetro es estimado por un único valor. ESTIMACIÓN POR INTERVALOS La estimación es por intervalos cuando el parámetro no es estimado por un único valor, sino por un conjunto de valores contenidos en un intervalo. La técnica de la estimación por intervalos consiste en asociar a cada muestra aleatoria un intervalo que se sospecha que debe contener al parámetro, a este se le denomina intervalo de confianza. INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCIÓN NORMAL A) Si la variancia poblacional σ2 es conocida: Donde: Ztab =

)2

1( α−

Z

B) Si la variancia poblacional σ2 no es conocida: Donde: ttab =

)1,2

1( −− nt α

ασμσ −=+<<− 1)( xtabxtab ZxZxP

αμ −=+<<− 1)( xtabxtab StxStxP

Page 107: estadistica solucionarios

ESTADÍSTICA APLICADA

109

PARA LA VARIANCIA DE UNA DISTRIBUCIÓN NORMAL A) Si la media poblacional μ es conocida: B) Si la media poblacional μ no es conocida: Donde: α = nivel de significación 1-α = nivel de confianza PARA LA DIFERENCIA DE MEDIAS DE DISTRIBUCIONES NORMALES A) Si las variancias poblacionales 2

1σ y 22σ son conocidas:

Donde: Ztab =

)2

1( α−

Z

B) Si las variancias poblacionales 2

1σ y 22σ no son conocidas pero

homogéneas: Donde: ttab =

)2,2

1( 21 −+− nnt α

αχσσ

χσ

αα

−=<<−

1)( 2

),2

(

22

2

),2

1(

2

NN

NNP

αχ

σχ αα

−=−

<<−

−−−

1))1()1(( 2

)1,2

(

22

2

)1,2

1(

2

nn

SnSnP

ασμμσ −=+−<−<−− −− 1))()((2121

212121 xxtabxxtab ZxxZxxP

αμμ −=+−<−<−− −− 1))()((2121

212121 xxtabxxtab StxxStxxP

Page 108: estadistica solucionarios

ESTADÍSTICA APLICADA

110

PRUEBAS DE HIPÓTESIS En muchos trabajos de investigación es necesario decidir si se acepta o se rechaza un enunciado o supuesto acerca de un parámetro; al enunciado o supuesto se le llama hipótesis y al procedimiento para tomar decisiones se le llama prueba de hipótesis. PRUEBA DE HIPÓTESIS Es un procedimiento de decisión estadística que establece la metodología a seguir para la aceptación o rechazo de una hipótesis, sobre la base de las evidencias contenidas en un conjunto de observaciones de una muestra aleatoria. Se plantean dos tipos de hipótesis, la hipótesis planteada (Hp) o hipótesis nula (H0) y la hipótesis alternante (Ha), ambas hipótesis no deben de tener nada en común, es decir son mutuamente excluyentes. Los investigadores generalmente enuncian como sus hipótesis nulas lo contrario de lo que creen que es verdad, con la esperanza de que los procedimientos de demostración los conduzcan a rechazarlas. Por ejemplo, si deseamos probar que el rendimiento académico promedio de los estudiantes de la UTP es mejor que el de otra universidad u otras universidades, podríamos formular en la hipótesis nula de que no hay diferencias en los rendimientos académicos. TIPOS DE ERRORES Como para realizar una prueba de hipótesis, nos basamos en muestras aleatorias, al tomar nuestras decisiones podríamos cometer algunos errores, es decir podríamos tomar decisiones incorrectas. Error Tipo I Este error lo cometemos cuando rechazamos una hipótesis nula siendo esta verdadera. A la probabilidad de cometer el error tipo I se le denomina nivel de significación (α), es decir:

Al complemento de α se le denomina nivel de confianza, es decir:

1-α = nivel de confianza.

P(Error Tipo I) = α

Page 109: estadistica solucionarios

ESTADÍSTICA APLICADA

111

Error Tipo II Este error lo cometemos cuando aceptamos una hipótesis nula siendo esta falsa. A la probabilidad de cometer el error tipo II se le simboliza por β, es decir:

El valor de β se determina en base a la distribución real o verdadera de la variable en estudio. Al complemento de β se le denomina potencia de la prueba, es decir: 1-β = potencia de la prueba. SUPUESTOS PARA REALIZAR UNA PRUEBA DE HIPÓTESIS 1. Las observaciones son extraídas de poblaciones que tienen

distribuciones normales 2. Las muestras aleatorias pertenecen a poblaciones independientes. 3. Los tamaños de las muestras son grandes. PROCEDIMIENTO PARA REALIZAR UNA PRUEBA DE HIPÓTESIS A) Prueba de hipótesis para la media poblacional μ I) Plantear las hipótesis Puede haber tres posibilidades:

H0 : μ = μ1 ; μ ≥ μ1 ; μ ≤ μ1 Ha : μ ≠ μ1 ; μ < μ1 ; μ > μ1

II) Establecer el nivel de significación (α) y tamaño de la muestra(n)

III) Elección de la prueba estadística Existen dos posibilidades:

Si la variancia poblacional σ2 es conocida, se usa: x

xZσμ−

=

Si la variancia poblacional σ2 no es conocida, se usa: xS

xt μ−=

P(Error Tipo II) = β

Page 110: estadistica solucionarios

ESTADÍSTICA APLICADA

112

IV) Establecimiento de las zonas de aceptación de la hipótesis nula.

Estas zonas o regiones de aceptación de H0 dependen de la hipótesis alternante, es decir:

• Si la variancia poblacional σ2 es conocida Caso I : Prueba de 2 colas o bilateral.

cuando Ha : μ ≠ μ1

Caso II : Prueba de 1 cola o unilateral izquierda. cuando Ha : μ < μ1

Page 111: estadistica solucionarios

ESTADÍSTICA APLICADA

113

Caso III : Prueba de 1 cola o unilateral derecha. cuando Ha : μ > μ1

• Si la variancia poblacional σ2 no es conocida, entonces en lugar de Ztab se obtiene ttab

V) Calculo de la prueba estadística VI) Decisión estadística y conclusiones El valor de la prueba estadística calculada la ubicamos en la

grafica del cuarto paso y dependiendo donde se ubique aceptaremos o rechazaremos a la hipótesis nula.

B) Prueba de hipótesis para la variancia poblacional σ2 I) Plantear las hipótesis Puede haber tres posibilidades:

H0 : σ2 = 21σ ; σ2 ≥ 2

1σ ; σ2 ≤ 21σ

Ha : σ2 ≠ 2

1σ ; σ2 < 21σ ; σ2 > 2

1σ II) Establecer el nivel de significación (α) y tamaño de la muestra(n) III) Elección de la prueba estadística Existe solo una posibilidad:

2

22 )1(

σχ Sn −

=

Page 112: estadistica solucionarios

ESTADÍSTICA APLICADA

114

IV) Establecimiento de las zonas de aceptación de la hipótesis nula Estas zonas o regiones de aceptación de H0 dependen de la

hipótesis alternante, es decir: Caso I : Prueba de 2 colas o bilateral. cuando Ha : σ2 ≠ 2

Caso II: Prueba de 1 cola o unilateral izquierda. cuando Ha : σ2 < 2

Page 113: estadistica solucionarios

ESTADÍSTICA APLICADA

115

Caso III: Prueba de 1 cola o unilateral derecha. cuando Ha : σ2 > 2

V) Calculo de la prueba estadística VI) Decisión estadística y conclusiones El valor de la prueba estadística calculada la ubicamos en la

grafica del cuarto paso y dependiendo donde se ubique aceptaremos o rechazaremos a la hipótesis nula.

C) Prueba de hipótesis para la homogeneidad de variancias

poblacionales

Los pasos a seguir son los mismos que los casos anteriores, donde el estadístico a usar es la prueba:

D) Prueba de hipótesis para la diferencia de medias poblacionales

Los pasos a seguir son los mismos que los casos anteriores, donde el estadístico a usar es la prueba:

• Si las variancias poblacionales son conocidas

21

22

22

21

σσ

SSF =

21

2121

xx

xxxxZ

−−−=

σ

μ

Page 114: estadistica solucionarios

ESTADÍSTICA APLICADA

116

• Si las variancias poblacionales no son conocidas pero

homogéneas:

• Si las variancias poblacionales no son conocidas pero heterogéneas:

Donde:

2

22

1

212

21 nS

nSS xx +=− ; si el muestreo es con reemplazo

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛−−

+⎟⎟⎠

⎞⎜⎜⎝

⎛−−

=− 11 2

22

2

22

1

11

1

212

21 NnN

nS

NnN

nSS xx ; si el muestreo es sin

reemplazo

21

)()( 2121

xxSxxt

−−−=

μμ

21

)()( 2121*

xxSxxt

−−−=

μμ

Page 115: estadistica solucionarios

ESTADÍSTICA APLICADA

117

EJERCICIOS RESUELTOS 1. Con la finalidad de estudiar el tiempo que necesita una cajera

para atender a los clientes de una tienda de auto-servicios, se tomó una muestra de 16 clientes, encontrándose un tiempo promedio de servicios de 4.2 minutos, con una desviación estándar de 1.2 minutos. a) Calcular e interpretar un intervalo del 95% de confianza para

el tiempo medio de servicios a los clientes. b) Calcular e interpretar un intervalo del 90% de confianza para

la variancia de los tiempos de servicios de caja. SOLUCIÓN: Sea x = tiempo de atención a los clientes (minutos) Tenemos que: n = 16, 2.4=x , S = 1.2 a) Se tiene que: 1 - α = 0.95, entonces: α = 0.05 Como la variancia poblacional σ2 no es conocida, usaremos:

αμ −=+<<− 1)( xtabxtab StxStxP Donde: ttab =

)1,2

1( −− nt α = t(0.975,15) = 2.131

09.016

)2.1( 222 ===

nSSx , entonces: 3.0=xS

Reemplazando:

95.0)3.0131.22.43.0131.22.4( =+<<− xxP μ

P(3.5607 < μ < 4.8393) = 0.95

Tenemos un 95% de confianza de que la verdadera media poblacional del tiempo de atención al cliente esta comprendido entre 3.5607 y 4.8393 minutos.

Page 116: estadistica solucionarios

ESTADÍSTICA APLICADA

118

b) En este caso: 1 - α = 0.90, entonces: α = 0.10 Como la media poblacional μ no es conocida:

Para α = 0.10 los chi-cuadrados tabulares para 15 g.l. son:

996.242)15,95.0( =χ y 261.72

)15,05.0( =χ Reemplazando:

90.0)261.7

44.115996.24

44.115( 2 =<<xxP σ

P(0.8641< σ2 < 2.9748) = 0.90

Tenemos un 90% de confianza de que la verdadera variancia poblacional de los tiempos de atención al cliente esta comprendido entre 0.8641 y 2.9748 minutos2.

2. Una compañía produce focos pequeños de 1.5 voltios y desea

analizar la variabilidad del proceso de producción. Se tomo una muestra aleatoria de 16 focos, y se obtuvo una media de la duración igual a 120 horas y un coeficiente de variabilidad igual al 25%. Halle el intervalo de confianza del 98% para la variancia poblacional.

SOLUCIÓN: Sea x = duración de los focos de 1.5 voltios (horas) Tenemos que: n = 16, 120=x , c.v. = 25%

Como 1 - α = 0.98, entonces: α = 0.02 Como la media poblacional μ no es conocida:

αχ

σχ αα

−=−

<<−

−−−

1))1()1(( 2

)1,2

(

22

2

)1,2

1(

2

nn

SnSnP

αχ

σχ αα

−=−

<<−

−−−

1))1()1(( 2

)1,2

(

22

2

)1,2

1(

2

nn

SnSnP

Page 117: estadistica solucionarios

ESTADÍSTICA APLICADA

119

Para α = 0.02 los chi-cuadrados tabulares para 15 g.l. son:

Sabemos que: c.v. = 100xxS = 25% = 0.25 ⇒ S = 30 y S2 = 900

Reemplazando:

98.0)229.590015

578.3090015( 2 =<<

xxP σ

P(441.4939< σ2 < 2581.7556) = 0.98 Tenemos un 98% de confianza de que la verdadera variancia poblacional de la duración de los focos de 1.5 voltios esta comprendido entre 441.4939 y 2581.7556 horas2.

3. Suponga que las notas de los alumnos de Administración se

distribuyen en forma normal con una desviación estándar de 3; se seleccionaron al azar 20 alumnos, registrándose una nota promedio de 14 y una variancia de 4. Calcule e interprete:

a) Un intervalo del 98% de confianza para su verdadera media. b) ¿Con un riesgo del 1%, se puede concluir que la nota media

de los alumnos es superior de 12?

SOLUCIÓN: Sea x = nota de los alumnos Tenemos que: σ = 3, n = 20, 14=x , S2 = 4 ⇒ S = 2

a) Se tiene que: 1 - α = 0.98, entonces: α = 0.02 Como la variancia poblacional σ2 es conocida, usaremos:

ασμσ −=+<<− 1)( xtabxtab ZxZxP Donde: Ztab =

)2

1( α−

Z = Z(0.99) = 2.325

45.020)3( 22

2 ===nxσσ , entonces: 6708.0=xσ

229.52)15,01.0( =χ 578.302

)15,99.0( =χ y

Page 118: estadistica solucionarios

ESTADÍSTICA APLICADA

120

Reemplazando:

98.0)6708.0325.2146708.0325.214( =+<<− xxP μ

P(12.44 < μ < 15.56) = 0.98

Tenemos un 98% de confianza de que la verdadera media poblacional de las notas de los alumnos de Administración esta comprendido entre 12.44 y 15.56.

b) Nos piden que realicemos una prueba de hipótesis para la

verdadera media de las notas con un nivel de significación de 0.01.

I) H0 : μ ≤ 12 Ha : μ > 12 II) α = 0.01 y n = 20 III) Como se conoce a la variancia poblacional, se usara:

IV) Como Ha : μ > 12 Se trata de una prueba de 1 cola o unilateral

derecha.

Page 119: estadistica solucionarios

ESTADÍSTICA APLICADA

121

V) Calculo del estadístico Z

xcal

xZσμ−

= = 9815.26708.0

1214=

VI) Como Z calculado esta en la zona de rechazo de la H0 , entonces no se acepta hipótesis nula.

En conclusión, existe evidencia estadística de que la verdadera nota media de los alumnos de Administración es mayor de 12, con un nivel de significación de 0.01.

4. La Dirección General de Transito del Perú usa decenas de focos

para semáforos cada año. La marca que ha sido usada hasta ahora tiene una vida media de 1000 horas y una desviación estándar de 90 horas. Es ofrecida una nueva marca a la Dirección a un precio muy inferior al que ha estado pagando. Se decide que se debe comprar la nueva marca, a menos que su vida media sea menor de 1000 horas. Posteriormente, son probadas 100 focos de esta nueva marca, dando un promedio de 990, suponiendo que la variancia de la nueva marca es la misma que la antigua:

a) Encuentre e interprete según enunciado un intervalo del 95%

de confianza para la vida media de la nueva marca. b) ¿Qué recomendaría a la Dirección General de Transito para

un nivel de significación del 5%?. SOLUCIÓN: Sea x = duración de los focos (horas) Para la marca antigua tenemos: μ = 1000 y σ = 90 Para la nueva marca tenemos: N = 100 , x = 990 y σ = 90

a) Se tiene que: 1 - α = 0.95, entonces: α = 0.05 Como la variancia poblacional σ2 es conocida, usaremos:

ασμσ −=+<<− 1)( xtabxtab ZxZxP

Page 120: estadistica solucionarios

ESTADÍSTICA APLICADA

122

Donde: Ztab = )

21( α−

Z = Z(0.975) = 1.96

81100

)90( 222 ===

nxσσ , entonces: 9=xσ

Reemplazando:

95.0)996.1990996.1990( =+<<− xxP μ P(972.36 < μ < 1007.64) = 0.95 Tenemos un 95% de confianza de que la verdadera media poblacional del tiempo de duración de los focos para semáforo esta comprendido entre 972.36 y 1007.64 horas.

b) Nos piden que realicemos una prueba de hipótesis para la

media de la duración de los focos con un nivel de significación de 0.05.

I) H0 : μ ≥ 1000 Ha : μ < 1000 II) α = 0.05 y n = 100 III) Como se conoce a la variancia poblacional, se usara:

x

xZσμ−

=

IV) Como Ha : μ < 1000 Se trata de una prueba de 1 cola o unilateral izquierda.

Page 121: estadistica solucionarios

ESTADÍSTICA APLICADA

123

V) Calculo del estadístico Z

xcal

xZσμ−

= = 11111.191000990

−=−

VI) Como Z calculado esta en la zona de aceptación de la H0, entonces se acepta hipótesis nula. En conclusión, existe evidencia estadística suficiente de que los focos tienen una duración media verdadera de por lo menos de 1000 horas, por lo tanto se recomendaría a la Dirección General de Transito que compren a la nueva marca de focos, con un nivel de significación del 5%.

5. Se diseña la dimensión de una determinada pieza de 5 cm. para

que dicha pieza encaje con otra. Por experiencia se sabe que la variancia del proceso es de 0.0064 cm2. Si una muestra aleatoria de 49 piezas presenta una media de 5.05 cm:

a) ¿Cuál es el intervalo de confianza del 99% para la verdadera

media de la longitud de las piezas? b) ¿Se debe aceptar que la media de la longitud de la pieza es

igual a 5 cm.? Use 1% de error.

SOLUCIÓN: Sea x = longitud de las piezas (centímetros) Tenemos que: σ2 = 0.0064 ⇒ σ = 0.08, n = 49, 05.5=x

a) Se tiene que: 1 - α = 0.99 ⇒ α = 0.01 Como la variancia poblacional σ2 es conocida, usaremos: ασμσ −=+<<− 1)( xtabxtab ZxZxP Donde: Ztab =

)2

1( α−

Z = Z(0.995) = 2.575

Page 122: estadistica solucionarios

ESTADÍSTICA APLICADA

124

0001306.0490064.02

2 ===nxσσ , entonces: 01143.0=xσ

Reemplazando: 99.0)01143.0575.205.501143.0575.205.5( =+<<− xxP μ P(5.0206 < μ < 5.0794) = 0.99

Tenemos un 99% de confianza de que la verdadera media poblacional de la longitud de las piezas esta comprendido entre 5.0206 y 5.0794 cm.

b) Nos piden que realicemos una prueba de hipótesis para la

verdadera media de la longitud de las piezas con un nivel de significación de 0.01.

I) H0 : μ = 5 Ha : μ ≠ 5 II) α = 0.01 y n = 49 III) Como se conoce a la variancia poblacional, se usara:

IV) Como Ha : μ ≠ 5 Se trata de una prueba de 2 colas o bilateral.

Page 123: estadistica solucionarios

ESTADÍSTICA APLICADA

125

V) Calculo del estadístico Z

xcal

xZσμ−

= = 37445.401143.0

505.5=

VI) Como Z calculado esta en la zona de rechazo de la H0 ,

entonces no se acepta hipótesis nula. En conclusión, existe evidencia estadística suficiente para afirmar que la verdadera media de la longitud de las piezas no es de 5 cm., con un nivel de significación del 1%.

EJERCICIOS PROPUESTOS

1. Con la finalidad de estudiar el tiempo que necesita una cajera

para atender a los clientes de una tienda de auto-servicios, se tomó una muestra de 25 clientes, encontrándose un tiempo promedio de servicios de 3.5 minutos, con una desviación estándar de 1.2 minutos. a) Calcular e interpretar un intervalo del 90% de confianza para

el tiempo medio de servicios a los clientes. b) Calcular e interpretar un intervalo del 95% de confianza para

la variancia de los tiempos de servicios de caja. 2. Una compañía produce focos pequeños de 1,5 voltios y desea

analizar la variabilidad del proceso de producción. Se tomo una muestra aleatoria de 20 focos, y se obtuvo una media de la duración igual a 100 horas y un coeficiente de variabilidad igual al 15%. Halle el intervalo de confianza del 95% para la desviación estándar poblacional.

Page 124: estadistica solucionarios

ESTADÍSTICA APLICADA

126

3. Suponga que las notas de los alumnos de Administración se distribuyen en forma normal con una desviación estándar de 5; se seleccionaron al azar 16 alumnos, registrándose una nota promedio de 15 y una variancia de 4. Calcule e interprete: a) Un intervalo del 99% de confianza para su verdadera media. b) Un intervalo del 98% de confianza para su verdadera

variancia. c) ¿Con un riesgo del 5%, se puede concluir que la nota media

de los alumnos es superior de 14? 4. La Dirección General de Transito del Perú usa decenas de focos

para semáforos cada año. La marca que ha sido usada hasta ahora tiene una vida media de 1000 horas y una desviación estándar de 90 horas. Es ofrecida una nueva marca a la Dirección a un precio muy inferior al que ha estado pagando. Se decide que se debe comprar la nueva marca, a menos que su vida media sea menor de 1000 horas. Posteriormente, son probadas 120 focos de esta nueva marca, dando un promedio de 990, suponiendo que la variancia de la nueva marca es la misma que la antigua: a) Encuentre e interprete según enunciado un intervalo del 98%

de confianza para la vida media de la nueva marca. b) ¿Qué recomendaría a la Dirección General de Transito para

un nivel de significación del 1%?. c) Si la verdadera vida media de la nueva marca es de 950

horas. ¿Se estaría cometiendo algún error en la prueba realizada en b)?. ¿De que tipo? Justifique su respuesta.

5. Se diseña la dimensión de una determinada pieza de 5 cm. para

que dicha pieza encaje con otra. Por experiencia se sabe que la variancia del proceso es de 0.0081 cm2. Si una muestra aleatoria de 49 piezas presenta una media de 4.95 cm.:

a) ¿Cuál es el intervalo de confianza del 98% para la verdadera media de la longitud de las piezas?

b) ¿Se debe aceptar que la media de la longitud de la pieza sea por lo menos de 3 cm.? Use 5% de error.

c) Si se selecciona una muestra de 36 piezas. ¿Qué valores debe tomar el estimador para aceptar la hipótesis nula en b)?

Page 125: estadistica solucionarios

ESTADÍSTICA APLICADA

127

6. Una fábrica que produce barras de acero está interesada en saber el contenido de carbono que existen en las barras. Se tomo una muestra al azar de 10 barras obteniéndose una variancia de 1296 y una media de 188. a) Halle un intervalo con un 95% de confianza para el contenido

promedio de carbono de las barras de acero de la fábrica. b) Halle un intervalo con un riesgo del 1% para la verdadera

variancia de carbono en las barras de acero de la fábrica. c) Con un riesgo del 10% se puede afirmar que la variancia del

contenido de carbono es diferente de 1290. 7. Un proceso de ensamblaje está planeado como una actividad que

demora 20 minutos. Estudios anteriores revelan una desviación estándar de 6 minutos para la ejecución del ensamble. Una muestra aleatoria de la realización de 9 ensambles dio como resultado un tiempo medio de 24.3 minutos por ensamble. Calcule e interprete: a) Un intervalo del 90% de confianza para la verdadera media

del tiempo de ejecución del ensamble. b) Un intervalo del 95% de confianza para la verdadera media

del tiempo de ejecución del ensamble. 8. Un saco de patatas fue muestreado para analizar su calidad y se

seleccionaron 11 patatas, registrándose el peso de cada una, con los siguientes resultados: 17, 15, 10, 11, 12, 15, 9, 19, 13, 11, 14. Calcule e interprete un intervalo del 98% de confianza para la media poblacional.

9. Puede mostrarse que las observaciones tomadas de cargamentos

de un cierto producto químico se distribuye normalmente alrededor de la densidad media verdadera y con una desviación estándar de 0.005 g/cm3. ¿Qué tamaño de muestra es necesario para estimar la verdadera densidad media, si se desea tener un error de estimación que no exceda a 0.002 g/cm3 para un intervalo de confianza del 95%?

10. En una muestra de 14 pernos la estimación de la desviación

estándar poblacional de la longitud del perno fue de 0.021 pulgadas. ¿Cuales son los límites del intervalo del 98% de confianza para la verdadera variancia poblacional? ¿Qué suposiciones deben hacerse para hallar el intervalo de confianza?

Page 126: estadistica solucionarios

ESTADÍSTICA APLICADA

128

11. Una fabrica que produce piezas de alta precisión y periódicamente chequea la longitud de las piezas producidas para analizar su variabilidad. Con tal fin se selecciono una muestra aleatoria simple de 9 piezas y se obtuvo los siguientes resultados maestrales:

∑ X1= 13, 05 y ∑ X2 = 24, 92

Sabiendo que la longitud se distribuye normalmente, halle e

interprete un intervalo de 90% para la verdadera variancia del proceso.

12. Un fabricante de pilas para linterna afirma que la vida media de su

producto excederá de 30 horas. Una compañía desea comprar una cantidad muy grande de pilas siempre y cuando la afirmación sea cierta. Se prueba una muestra al azar de 36 pilas, y se encuentra que la vida media de la muestra es de 31 horas. Si la población de pilas tiene una desviación estándar de 5 horas: a) Encuentre el intervalo del 99% de confianza para la

verdadera vida media de ese producto. Interprete según el enunciado.

b) A un nivel a = 0,10. ¿Qué recomendaría al Gerente de la compañía?

c) ¿Para que valores de a la compañía no adquirirá las pilas? 13. Un Agrónomo tiene semillas de una nueva variedad de maíz, las

cuales son sembradas en 6 parcelas de características homogéneas. Los rendimientos en toneladas por hectáreas fueron los siguientes:

361 =∑ X 32)( 21 =−∑ XX

a) Hallar los límites de confianza para el verdadero rendimiento

promedio de la variedad de maíz con el 95% de confianza. Interprete sus resultados.

b) Si el Agrónomo sostiene que la variedad de maíz sometida a experimentación tiene un rendimiento medio diferente de 4 ton/Ha.. y con la información obtenida se puede aceptar lo que afirma el Agrónomo? ( Use α = 0.05)

c) ¿Se puede afirmar que la variabilidad del rendimiento de la variedad de maíz en mención es a lo más 2 (Ton/Ha)?.

Use α = 0.01

Page 127: estadistica solucionarios

ESTADÍSTICA APLICADA

129

14. En una muestra de 25 paquetes distribuidos por una compañía se encontró un promedio de 350 Kg. y una variancia de 2500 Kg. ¿Existen bases para afirmar que el lote de 25 paquetes excederán la capacidad de los camiones de transporte que se sabe que es de 8000 Kg?

Use α = 0.05 15. Una empresa de transportes desconfía de la afirmación de que la

vida útil promedio de ciertos neumáticos es al menos de 28000. Para verificar la afirmación, se colocan 28 neumáticos en sus camiones y se obtiene una vida útil promedio de 27 250 millas, con una desviación estándar de 1 348 millas. ¿Qué puedes concluir con esos datos? a un nivel de significación de 0.01?.

16. Un fabricante de pernos ha tenido últimamente quejas de sus

clientes sobre las dimensiones de los pernos , ya que presentaban una excesiva variabilidad. El productor afirma que la desviación estándar es a lo más 0.3 y desea comprobar lo anterior mediante una muestra. Se selecciona una muestra aleatoria simple de 20 pernos y obtiene los siguientes resultados:

∑ = 362

ix 10=∑ ix

a) ¿ Es correcto lo que afirma el productor? . (Use α = 0.01). b) ¿Para qué valores del estimador se aceptará la hipótesis

planteada en la pregunta a? 17. Una máquina que produce tuercas es detenida periódicamente de

modo que el diámetro de las turcas producidas puede ser analizado . En este caso interesa la variabilidad de los diámetros de las tuercas. Suponga que una muestra aleatoria simple de 30 tuercas proporciona una variancia muestral del diámetro igual a 3.4 milímetros. Si la variancia del diámetro debe ser de 8 milímetros o menos para aceptar la producción de la máquina. a) ¿Existe evidencia significativa para rechazar dicha

producción?. (Use α = 0.02). b) Si la variancia verdadera es de 9 milímetros 2. ¿Qué tipo de

error se cometió?. Justifique su respuesta. 18. Se a propuesto dos métodos para determinar el contenido de

humedad de la semilla del fríjol y en ambos se han empleado muestra de tamaño 21. El método I es más fácil de aplicar , pero parece más variable que el II .

Page 128: estadistica solucionarios

ESTADÍSTICA APLICADA

130

Basándose en los siguientes resultados :

( ) 340221

111 =−∑

=jj xx ( ) 240

21

1

222 =−∑

=jj xx

a) Encuentre un intervalo de 90% de confianza para la

verdadera razón de variancias del modo : entre el método II. Interprete según el enunciado.

b) ¿A que conclusión llegaría Ud. a un nivel de significación α=0.05?

19. Se requiere determinar si existe menos variabilidad en el plateado

realizado por la compañía 1 que el efectuado por la compañía 2. Con tal motivo se tomaron una muestra de tamaño 12 de los trabajos efectuados por la compañía 1 y otra de tamaño 15 de los trabajos desempeñados de la compañía 2, los cuales produjeron las siguientes desviaciones estándares : S1=0.035 mil. y S2=0.062 mil. a) Encuentre un intervalo de confianza de 90% para la

verdadera razón de variancia 22

21

σσ . Interprete según

enunciado. b) ¿A qué conclusión llegaría Ud. a un nivel de significación

α=0.05? 20. Para probar la afirmación de que la resistencia de un alambre

eléctrico puede reducirse en más de 0.005 ohmios , mediante aleaciones, 32 valores obtenidos de alambre ordinario produjeron un promedio de 0.136 ohmios , y 32 valores obtenidos con el alambre fabricado a base de aleaciones produjeron un promedio de 0.083 ohmios . Suponiendo que la desviación estándar de la resistencia para ambos tipos de alambre son iguales a 0.005 ohmios. a) Halle un intervalo de confianza del 95% para la verdadera

diferencia de medias μ1-μ2. Interprete según enunciado. b) ¿Apoyaría Ud. la afirmación a un nivel de significación

α=0.05?. 21. Se utilizaron dos máquinas A y B, para llenar botellas que se

supone deben contener un volumen neto de 5.65 litros. El proceso de llenado de máquina A tiene una desviación estándar de 0.015 litros y el proceso de llenado de la máquina B tiene

Page 129: estadistica solucionarios

ESTADÍSTICA APLICADA

131

una desviación estándar de 0.016 litros . Ha surgido la preocupación de si las dos máquinas están realizando el mismo trabajo. El ingeniero de control afirma que debido al estrecho acuerdo entre las desviaciones estándar y en razón a otras mediciones las máquinas se están llenando con la misma cantidad. Se toma una muestra aleatoria de cada máquina obteniéndose los siguientes resultados:

Máquina A Máquina B nA = 20 nB = 25 6345.5=AX 634.5=BX

a) Encuentre un intervalo de 98% para la verdadera diferencia de medidas μx- μy. Interprete según enunciado.

b) ¿Está Ud. de acuerdo con el ingeniero de control a un nivel α=0.05?.

22. Una empresa ganadora desea comprar dos marcas de alimento: A

y B, y decide experimentar con ellos antes de realizar la compra definitiva. El alimento A fue proporcionado a 10 animales seleccionados aleatoriamente, mientras que el alimento B a 6 animales obteniéndose los siguientes resultados de incremento de pesos:

4=Ax 5=Bx

60)(!1

10

1=−∑

=AA

iA xxx 322

6

1

2 =−−∑=

BBi

xnx

a) Probar si existe diferencias significativas entre los

incrementos medios de pesos producidos por los alimentos a un nivel α=0.02. Sugerencia: pruebe si existe homogeneidad de variancias.

b) Si realmente μA- μg=2. ¿ está Ud. cometiendo algún tipo de error según la conclusión establecida en (a)?. ¿Cuál de los errores sería?

c) Encuentra un intervalo del 98% de confianza para la verdadera diferencia de media μA- μg.

Page 130: estadistica solucionarios

ESTADÍSTICA APLICADA

132

23. Un centro de investigación condujo un experimento para determinar los efectos de la marihuana sobre la sexualidad. Se seleccionaron 11 hombres jóvenes en buen estado de salud que habían fumado marihuana por lo menos 4 días a la semana un mínimo de 6 semanas, sin usar otra droga en ese período.

Se usó un grupo de control de otros 10 jóvenes que jamás habían

fumado marihuana, para hacer la comparación. La medida de la sexualidad fue el nivel de hormona masculina testosterona en la sangre (en unidades de hormona testosterona)

4201 =x 728310

12 =∑

=iix

S1 = 12.22 1.1822)( 22

10

12 =−∑

=

xxi

i

a) ¿Son homogéneas las varianzas? Use α=0.10 b) El uso de la marihuana desminuye en promedio, el impulso

sexual? Use α=0.10. (Considere el resultado de a). 24. Se sabe que la máquina de empacar de una firma de cereales de

secados verte el cereal seco en cajas de tamaño económico con una desviación estándar de 0.6 onzas. Se lleva a cabo verificaciones constantes de los pesos netos de las cajas para mantener el ajuste de la maquinaría que controla el peso neto. Dos muestras tomadas en dos días presentan la siguiente información:

n1=30 n2=35 onzasx 87.181 = onzasx 9.212 = Utilice α= del 5% en todos los siguientes casos:

a) ¿Se puede afirmar que en el primer día, la máquina estaba ajustada para llenar 20 onzas o más?.

b) ¿Se puede afirmar que en el segundo día la máquina estaba ajustada para llenar más de 20 onzas?.

Grupo que ha fumado marihuana (1)

Grupo que jamás ha fumado marihuana (2)

Page 131: estadistica solucionarios

ESTADÍSTICA APLICADA

133

c) Se puede verificar que no existe ningún cambio en el ajuste de la máquina en el primer y segundo día.

25. Un fabricante de motores desea determinar si los combustibles

que se distribuyen en el mercado cumplen con los requerimientos. Para ello se tomaron muestras de ambos combustibles los siguientes resultados para el impulso específico (en libras/seg)

Combustibles n Promedio Variancia A B

21 340.5 19.2 25 348.5 7.7

Uno de los requerimientos para que el fabricante acepte un

combustible es que la variancia del impulso específico sea a lo más de 11 ( lib/seg)2 a) ¿Cumplirá el combustible A con el requerimiento del

fabricante? Use α=0.05 b) ¿Para que valores del estimador no existirá evidencia para

rechazar la Hp. en (a)? c) ¿Con que nivel de significación se aceptaría la Hp. en (a)?

d) ¿Se puede concluir, para α= 10% que el impulso específico medio del combustible B es superior en 10 lib/seg o más que el impulso específico del combustible A?

e) Si la verdaderas medias del impulso específico de los combustibles A y B son μA = 350 lib/seg y μB = 360 lib/seg. ¿se cometió algún error en (d)?

26. Al analizar muestras de tejido hepático de 16 ratas se obtuvo que

tenia en promedio un contenido de 5.2 mgrs de glucógeno/100 mgrs de tejido)2. Si se asume que el contenido de carbohidratos (glicógeno) se distribuye normalmente. a) Calcule e interprete un intervalo del 90% de confianza para la

media del contenido de carbohidrato. b) ¿Se puede afirmar que la media del contenido de

carbohidrato es igual a 4.6 mgrs de glicógeno/100 mgrs de tejido? Use α = 0.10

27. Dos tipos de botellas de vidrio son adecuados para su utilización

en una embotelladora de bebidas gaseosas. La resistencia a la presión interna de un envase es una característica de calidad importante. Se sabe que las desviaciones estándar de las resistencias para cada tipo de botella de vidrio es igual a 3.0 psi.

Page 132: estadistica solucionarios

ESTADÍSTICA APLICADA

134

Se tomaron muestras de cada tipo y se obtuvieron los siguientes resultados:

Tipo 1 Tipo 2 n1 = 16 n2 = 16 psix 8.1751 = psix 3.1812 = La compañía no utilizará el tipo de botella 2 a no ser que su

resistencia a la presión en promedio exceda a la de tipo 1 en, por lo menos 5 psi . ¿Utilizará el tipo 2, con base en los datos muestrales? Use α = 0.05.

28. Una tienda tiene dos planes de crédito disponibles para sus

clientes con cuenta corriente. La administración de la tienda desea recopilar información acerca de cada plan y estudiar las diferencias entre los dos planes. Se seleccionó una muestra de 25 clientes del plan A y de 50 clientes del plan B, con los siguientes resultados en miles de unidades monetarias acerca del saldo mensual.

a) Halle e interprete un intervalo del 98% de confianza para la

desviación estándar del plan B. b) ¿Hay evidencias muestrales para afirmar que existen

diferencias entre los saldos mensuales promedio de los planes? Use α = 0.05.

Plan n Promedio Desviación estándar

A B

2550

202.5 297.0

40.500 38.178

Page 133: estadistica solucionarios

ESTADÍSTICA APLICADA

135

UNIDAD VI

ANÁLISIS DE REGRESIÓN MÚLTIPLE El análisis de regresión consiste en emplear métodos que nos permitan determinar la relación funcional entre las variables en estudio; de forma tal que nos permita predecir el valor de una variable utilizando los valores que correspondan a las otras variables. Por ejemplo al rector de la universidad le interesa conocer cual es el desempeño profesional de sus egresados, es decir, de que depende que los egresados de la UTP tengan éxito, al vice-rector de investigación le interesa saber que temas o trabajos son los que los estudiantes quieren realizar, al decano de la facultad de Administración le interesa saber de que depende, que sus alumnos tengan un buen rendimiento académico, a los profesores nos interesa saber por que motivos desaprueban los estudiantes, etc. Podemos observar que en estos ejemplos están involucradas varias variables, las cuales son estudiadas mediante el análisis de regresión, dejo a los profesores para que discutan con sus alumnos cuales serian las variables dependientes y cuales las independientes. REGRESIÓN LINEAL MÚLTIPLE El análisis de regresión se usa por explicar o modelar la relación funcional entre una variable Y , llamada respuesta, rendimiento o variable dependiente, y una o más variables predictoras, o independientes o explicativas 1, , kX XK . Cuando 1k = , se tiene el caso de regresión lineal simple, si 1k > , se tiene el caso de regresión múltiple. La respuesta debe ser una variable continua pero las variables explicativas pueden ser continuas, discretas o categóricas aunque se deja el manejo de variables explicativas categóricas para otro curso. Los análisis de la regresión tienen varios posibles objetivos los cuales incluyen: 1. La predicción de observaciones futuras. 2. La valoración del efecto de, o relación entre, variables explicativas y

la respuesta. 3. Una descripción general de estructura de los datos.

Page 134: estadistica solucionarios

ESTADÍSTICA APLICADA

136

Es importante entender cómo los datos fueron recogidos. ¿Son los datos de observación o experimentales? ¿Hay falta de respuesta? ¿Hay valores perdidos? ¿Qué representa los datos en cifras?, representadas las variables cualitativas. ¿Cuáles son las unidades de medida? Cuidado con errores en la entrada de datos. Modelo de Regresión Lineal Múltiple El modelo de regresión lineal múltiple con k variables predoctoras x1, x2 , … xk, es de la siguiente forma: Donde: x1, x2 , … xk , son variables independientes, fijadas y medidas sin error. β0 ,β1 ,β2 , . . . βk son parámetros desconocidos. A β0 se le conoce con el nombre de intercepto, y a los β1,β2, . . . βk se les llaman coeficientes de regresión poblacional. ε es una variable aleatoria no correlacionada y no observable tal que:

E(ε) = 0 y V(ε) = σ2

• β0 es la media de “y” cuando x1 = x2 = . . . = xk = 0 • βj , para j = 1, 2, . . . , k indica el cambio promedio en la variable

dependiente “y” por unidad de cambio de “x j” , cuando las demás variables independientes permanecen constantes.

ESTIMACIÓN DE LOS PARÁMETROS βJ Para encontrar los estimadores de los coeficientes de regresión se aplica el método de los mínimos cuadrados a partir de una muestra aleatoria de tamaño n. ECUACIÓN DE LA LINEA DE REGRESIÓN MÚLTIPLE MUESTRAL

y = β0 + β1x1 +β2x2 + . . . +βkxk +ε

Page 135: estadistica solucionarios

ESTADÍSTICA APLICADA

137

Donde: A b0 se le conoce con el nombre de intercepto muestral, y a los b1,b2, b3 , . . . bk se les llaman coeficientes de regresión muestral y e es el término del error o perturbación aleatoria. TEOREMA Las estimaciones de mínimos cuadrados de los coeficientes de regresión múltiple están dadas por: Donde XT es la transpuesta de X y (XTX)-1 es la inversa de XTX Además: 1 x11 x12 …x1k X= 1 x21 x22 …x2k . . . . . . 1 xn1 xn2 …xnk

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

=

ny

yy

YM

2

1

y

⎟⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜⎜

=

k

B

β

β

β

M

1

0

n ∑x1 ∑x2 … ∑xk

∑x1 ∑ 21x ∑x1x2 ... ∑x1 xk

XTX= ∑x2 ∑ x2x1 ∑ 22x ... ∑x2xk

. . . . . . . . . . . . . . . . . . . . . . . . . ∑xk ∑ xkx1 ∑xkx2 ... ∑ 2

kx

B = (XTX)-1XTY

Page 136: estadistica solucionarios

ESTADÍSTICA APLICADA

138

⎟⎟⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜⎜⎜

=

∑∑∑

yx

yx

yx

y

YX

k

T

L

2

1

COEFICIENTE DE DETERMINACION: R2 Mide la proporción de la variación total que es explicada por un modelo de regresión. El coeficiente de determinación se usa como un indicador del grado de bondad de ajuste, de un modelo de regresión, es decir si el modelo estimado proporciona una buena explicación del comportamiento de la variable en estudio o variable dependiente. Este coeficiente es calculado del siguiente modo:

Donde: SCR = suma de cuadrados de regresión SCT = suma de cuadrados total Donde: SCE = suma de cuadrados del error SCE = YTY - YX TTβ SCR = 2ˆ YnYX TT −β ESTIMACION DE σ POR MAXIMA VEROSIMILITUD

R2 = SCTSCR

SCT = SCR + SCE

nYXBYY TTT −

Page 137: estadistica solucionarios

ESTADÍSTICA APLICADA

139

Se debe de tener en cuenta que los resultados de las:

iβ ∀ i = 0, 1, 2, . . . , k son combinaciones lineales de las n variables aleatorias independientes yi , tales que las iβ tienen distribuciones normales. Además se cumple que:

iiE ββ =)ˆ( ∀ i = 0, 1, 2, . . . , k

2)ˆ( σβ iii cV = ∀ i = 0, 1, 2, . . . , k Donde: cij es el elemento del i-ésimo renglón y la j-ésima columna de la matriz

1)( −XX T donde i y j toman los valores 0, 1, 2, . . . , k

También: 2)1(2

2

~ˆ−−kn

n χσσ ; 2

2ˆσσn y iβ son independientes

Al combinar todos estos resultados, tenemos que la definición de la distribución “t” de Student nos conduce a: TEOREMA Con las suposiciones del análisis de regresión lineal múltiple:

Son valores de variables aleatorias que tienen la distribución “t” de Student con n - k -1 grados de libertad. PRUEBAS DE HIPÓTESIS Estas pruebas acerca de parámetros se realizan para medir la adecuación del modelo. Tal como se vio anteriormente, una prueba de hipótesis requiere que los términos del error εi del modelo de regresión tengan una distribución normal e independiente con media cero y variancia σ2.

ˆ

−−

−=

kncn

tii

ii

σ

ββ ∀ i = 0, 1, 2, . . . , k

Page 138: estadistica solucionarios

ESTADÍSTICA APLICADA

140

PRUEBA PARA LA SIGNIFICACION DE UNA REGRESION La prueba de la significación de una regresión sirve para determinar si existe una relación lineal entre la variable dependiente “y” y un conjunto de variables independientes x1 , x2 , x3 , . . . , xk . H0 : β1 = β2 = . . . = βk = 0 Ha : Al memos una de las βj es diferente de cero Rechazar H0 implica que al menos una de las variables independientes contribuye de manera significativa al modelo. El estadístico para probar esta hipótesis es el “ F” definido por: Donde: p = número de parámetros Se rechazara H0 si el valor calculado de F es mayor que el Ftabular = F(α, k, n-p) CUADRO DE ANALISIS DE VARIANCIA (ANVA)

Fuente de variación

Suma de cuadrados

Grados de libertad

Cuadrado medio Fc

Regresión SCR k CMR CMR/CME Error o residual SCE n - p CME Total SCT n - 1 • Cuando se rechaza H0 se tiene que realizar pruebas individuales

para los βj , estas pruebas se realizan con el estadístico “t” de Student.

pnSCE

kSCR

FC

=

Page 139: estadistica solucionarios

ESTADÍSTICA APLICADA

141

EJERCICIOS RESUELTOS 1. Los siguientes datos muestran el número de habitaciones, el

número de baños y los precios a los que se vendieron hace poco 8 casas de una muestra aleatoria de un distrito de Lima:

Nº de Habitaciones

(x1) Nº de Baños (x2) Precio (y) (en dólares)

3 2 4 2 3 2 5 4

2 1 3 1 2 2 3 2

78 800 74 300 83 800 74 200 79 700 74 900 88 400 82 900

a) Estime la ecuación de regresión lineal múltiple y prediga el precio

de venta de una casa de tres habitaciones con dos baños. b) Pruebe la hipótesis nula β1 igual a $ 3500 contra la hipótesis

alternante β1 mayor de $ 3500 para un nivel de significación de 0.05.

SOLUCIÓN: a) Sustituyendo ∑∑ ∑ ∑ ∑ ===== 36,55,87,16,25 2

2212121 xxxxxx

y n=8 en la matriz XTX, se obtiene:

8 25 16 XTX = 25 87 55 16 55 36

Después, la inversa de esta matriz puede obtenerse a través de cualquiera de las diferentes técnicas; aplicando una basada en el método de la adjunta, tenemos que:

107 -20 -17

(XTX) -1 = 841 . -20 32 -40

-17 -40 71

Page 140: estadistica solucionarios

ESTADÍSTICA APLICADA

142

donde 84 es el valor de XX T , el determinante de XTX.

Al sustituir ∑∑∑ === 12977002031100,637000 21 yxyyxy en XTY, se obtiene:

⎟⎟⎟

⎜⎜⎜

⎛=

12977002031100637000

YX T

y por último, reemplazando en: B = (XTX)-1XTY 107 -20 -17 637000

B =841 -20 32 -40 2031100

-17 -40 71 1297700 5476100

841

= 347200

63700 65191.7 = 4133.3 758.3 Entonces la ecuación de regresión lineal múltiple estimada es:

y = b0 + b1x1 + b2x2 Reemplazando:

y = 65191.7 + 4133.3x1 + 758.3x2

Page 141: estadistica solucionarios

ESTADÍSTICA APLICADA

143

Esta ecuación nos permite predecir el precio de venta de una casa de tres habitaciones(x1) con dos baños(x2).

Esto es: y = 65191.7 + 4133.3(3) + 758.3(2) = 79108.2

Es decir una casa con 3 habitaciones y dos baños tienen un precio de 79 100 dólares aproximadamente.

b) Para probar la hipótesis pedida procedemos del siguiente modo:

I) H0 : β1 = 3500 Ha : β1 > 3500 II) α = 0.05 y n = 8 III) El estadístico de prueba es el “t” de Student

ˆ

11

11

−−

−=

kncn

t

σ

ββ

Donde: n

YXBYY TTT −=σ

YTY = 0509070800082900...7430078800 2228

1

2 =+++=∑=i

iy

BTXTY = 50906394166

8.2928

6509063941605090708000ˆ =

−=σ

Entonces: 77.2

1288

8.292

35003.4133

ˆ

8432

11

11 =

−−

−=

−−

−=

kncn

t

σ

ββ

Como este valor es mayor al estadístico tabular(2.015), entonces debe de rechazarse hipótesis nula, por lo que concluimos que en promedio cada habitación adicional suma más de 3500 dólares al precio de venta de una casa de ese tipo, con un nivel de significación del 5%.

Page 142: estadistica solucionarios

ESTADÍSTICA APLICADA

144

2. Una embotelladora de bebidas gaseosas analiza las rutas de servicio de las máquinas expendedoras en su sistema de distribución. Le interesa predecir el tiempo necesario para que el representante de ruta atienda las máquinas expendedoras en una tienda. Esta actividad de servicio consiste en abastecer la máquina con productos embotellados y algo de mantenimiento o limpieza. El ingeniero industrial responsable del estudio ha sugerido que las dos variables mas importantes que afectan el tiempo de entrega “y” son la cantidad de cajas de producto abastecido “x1” y la distancia caminada por el representante “x2”. El ingeniero ha reunido 25 observaciones de tiempo de entrega, que se presentan a continuación:

Nº de

Observación Tiempo de

entrega(min) y Cantidad de

cajas x1 Distancia (pies)

x2 1 2 3 4 5 6 7 8 9

10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

16.68 11.50 12.03 14.88 13.75 18.11 8.00

17.83 79.24 21.50 40.33 21.00 13.50 19.75 24.00 29.00 15.35 19.00 9.50

35.10 17.90 52.32 18.75 19.83 10.75

7 3 3 4 6 7 2 7

30 5

16 10 4 6 9

10 6 7 3

17 10 26 9 8 4

560 220 340 80 150 330 110 210

1460 605 688 215 255 462 448 776 200 132 36 770 140 810 450 635 150

a) Estime la ecuación de regresión lineal múltiple b) Construya el cuadro de ANVA y calcule R2.

Page 143: estadistica solucionarios

ESTADÍSTICA APLICADA

145

SOLUCIÓN: a) Sustituyendo

∑∑ ∑ ∑ ∑ ===== 6725688,133899,3055,10232,219 2221

2121 xxxxxx

y n=25 en la matriz XTX, se obtiene

25 219 10232 XTX = 219 3055 133899 10232 133899 6725688

la inversa de esta matriz la obtenemos a través del método de la adjunta; esto es:

0.11321518 -0.00444859 -0.00008367

(XTX) -1 = -0.00444859 0.00274378 -0.00004786

-0.00008367 -0.00004786 0.00000123 Al sustituir

∑∑∑ === 00.33707244.7375,60.559 21 yxyyxy en XTY, se obtiene:

⎟⎟⎟

⎜⎜⎜

⎛=

00.33707244.7375

60.559YX T

y por último, reemplazando en:

B = (XTX)-1XTY = ⎟⎟⎟

⎜⎜⎜

01438483.061590712.134123115.2

Entonces la ecuación de regresión lineal múltiple estimada es:

y = b0 + b1x1 + b2x2

Page 144: estadistica solucionarios

ESTADÍSTICA APLICADA

146

Reemplazando:

y = 2.34123115 + 1.61590712x1 + 0.01438483x2 b) CUADRO DE ANALISIS DE VARIANCIA (ANVA)

Fuente de variación

Suma de cuadrados

Grados de libertad

Cuadrado medio Fc

Regresión 5550.8166 2 2775.4083 261.24 Error o residual 233.7260 22 10.6239 Total 5784.5426 24 Donde: R2 = 0.9596

• Efectúe las pruebas de hipótesis correspondientes.

EJERCICIOS PROPUESTOS 1. Los siguientes datos muestran el número de habitaciones, el

número de baños y los precios a los que se vendieron hace poco 10 casas de una muestra aleatoria de un distrito de Lima:

Nº de Habitaciones

(x1) Nº de Baños (x2)

Precio (y) (en dólares)

3 2 4 2 3 2 5 4 5 3

2 1 3 1 2 2 3 2 2 3

78 800 74 300 83 800 74 200 79 700 74 900 88 400 82 900 84 600 80 200

Estime la ecuación de regresión lineal múltiple y prediga el precio de venta de una casa de cuatro habitaciones con tres baños.

Page 145: estadistica solucionarios

ESTADÍSTICA APLICADA

147

2. Los siguientes datos constan del nivel de ventas que obtuvo la empresa “MACHI SAC” durante cuatro meses del presente año; los gastos de publicidad por televisión; y los gastos por publicidad en periódicos (todo en miles de dólares):

GASTOS PUBL.-TV GASTOS PUBL.-RADIO VENTAS 4 1 7 7 2 12 9 5 17 12 8 20

Determine la ecuación de regresión lineal múltiple estimada y prediga el nivel de ventas de un mes en el cual se piensa invertir 15 y 10 mil dólares en publicidad de televisión y radio respectivamente.

3. Los datos siguientes se refieren a las utilidades semanales (en miles de soles) de 5 restaurantes, sus aforos (en decenas) y el tránsito diario en promedio (en miles de automóviles) que pasan por sus ubicaciones:

AFORO TRANSITO DIARIO UTILIDAD NETA SEMANAL 2 1 3 3 2 4 1 1 2 4 3 5 4 2 2

Analice la información y calcule la línea de regresión múltiple

estimada.

Page 146: estadistica solucionarios

ESTADÍSTICA APLICADA

148

4. Los siguientes datos muestrales los proporciona una compañía de mudanzas sobre los pesos de seis envíos, las distancias que se desplazaron y el daño que se provocó:

Peso (1000 libras) x1

Distancia (1000 millas) X2

Daño (dólares) y

4.0 3.0 1.6 1.2 3.4 4.8

1.5 2.2 1.0 2.0 0.8 1.6

160 112 69 90 123 186

a) Suponiendo que la regresión es lineal, estime β0 , β1 y β2. b) Utilice los resultados del inciso a) para estimar el daño cuando

un cargamento que pesa 2400 libras es desplazado una distancia de 1200 millas.

5. Los datos siguientes se refieren a las utilidades semanales en

promedio (en miles de dólares) de cinco restaurantes, sus aforos y el tránsito diario en promedio (en miles de automóviles) que pasan por sus ubicaciones:

Aforo x1

Tránsitodiario

x2

Utilidad netaSemanal

y 120 200 150 180 240

19 8

12 15 16

23.8 24.2 22.0 26.2 33.5

a) Suponiendo que la regresión es lineal, estime β0 , β1 y β2. b) Utilice los resultados del inciso a) para predecir la utilidad

semanal neta en promedio de un restaurante son una capacidad de asientos de 210 en un sitio donde el tránsito diario promedio es de 14000 automóviles.

Page 147: estadistica solucionarios

ESTADÍSTICA APLICADA

149

6. Los siguientes datos constan de las calificaciones que obtuvieron 10 estudiantes en un examen, su coeficiente intelectual y el número de horas que estudiaron para el examen:

a) Suponiendo que la regresión es lineal, determine β0 , β1 y β2. b) Prediga la calificación de un estudiante con un coeficiente

intelectual de 108 que estudió seis horas para presentar el examen.

7. Los datos siguientes se recolectaron para determinar la relación

existente entre dos variables de proceso y la dureza de cierto tipo de acero:

Dureza (Rockwell 30-T) y

Contenido de cobre (porcentual) x1

Temperatura de recocido(0F) x2

78.9 55.2 80.9 57.4 85.3 60.7

0.02 0.02 0.10 0.10 0.18 0.18

1000 1200 1000 1200 1000 1200

Ajuste una línea recta por el método de mínimos cuadros y utilícela para determinar la dureza promedio de este tipo de acero cuando el contenido de cobre es del 0.14% y la temperatura de recocido es 11000F.

Coeficiente Intelectual

x1

Número de horasde estudio

x2

Calificaciones y

112 126 100 114 112 121 110 103 111 124

5 13 3 7

11 9 8 4 6 2

79 97 51 65 82 93 81 38 60 86

Page 148: estadistica solucionarios

ESTADÍSTICA APLICADA

150

8. Los que siguen son datos a cerca de la efectividad porcentual de un analgésico y las cantidades de tres medicamentos distintos (en miligramos) presentes en cada cápsula:

Suponiendo que la regresión es lineal, determine los coeficientes de regresión.

9. Supóngase que el gerente de ventas de una gran compañía

distribuidora de partes para automóviles, desea calcular desde abril las ventas anuales totales de una región. Según las ventas regionales, también pueden estimarse las ventas totales las ventas totales de la compañía. Si, con base en la experiencia, se encuentra que los estimados de abril de las ventas anuales son razonablemente exactos, entonces en los años futuros podría utilizarse el pronóstico de abril para revisar los planes de producción y mantener el inventario correcto en las tiendas al menudeo. Varios factores parecen estar relacionados con las ventas, incluyendo en número de tiendas al menudeo en la región que almacena las partes comercializadas por la compañía, el número de automóviles registrados en la zona hasta abril 1, y el ingreso personal total para el primer trimestre del año. Finalmente se seleccionaron cinco variables independientes como las más importantes (de acuerdo con el gerente de ventas). Después se recopilaron datos para un año reciente. También se registraron las

Medicamento A x1

Medicamento Bx2

Medicamento Cx3

Efectividad porcentual

y 15 15 15 15 30 30 30 30 45 45 45 45

20 20 30 30 20 20 30 30 20 20 30 30

10 20 10 20 10 20 10 20 10 20 10 20

47 54 58 66 59 67 71 83 72 82 85 94

Page 149: estadistica solucionarios

ESTADÍSTICA APLICADA

151

ventas anuales totales en ese año según cada región. Obsérvese en la tabla anexa que para la región 1 se tuvieron 1739 tiendas al menudeo que almacenan las partes de auto de la empresa, que hubo 9270000 automóviles registrados en la región hasta el 1 de abril, y que las ventas para ese año fueron por $ 37702000(dólares).

Ventas anuales (mdd)

y

Número de tiendas

de menudeos

x1

Número de

automóviles registrados (millones)

x2

Ingreso personal (mmdd)

x3

Antigüedad promedio

de los automóviles

(años) x4

Número de

supervi- sores

x5

37.702 24.196 32.055 3.611

17.625 45.919 29.600 8.114

20.116 12.994

1739 1221 1846 120

1096 2290 1687 241 649

1427

9.27 5.86 8.81 3.81

10.31 11.62 8.96 6.28 7.77

10.92

85.4 60.7 68.1 20.2 33.8 95.1 69.3 16.3 34.9 15.1

3.5 5.0 4.4 4.0 3.5 4.1 4.1 5.9 5.5 4.1

9.0 5.0 7.0 5.0 7.0 13.0 15.0 11.0 16.0 10.0

Nota: mdd indica millones de dólares, y mmdd, miles de millones de dólares. a) Estime la ecuación de regresión lineal múltiple. b) Realice la prueba de hipótesis para los coeficientes de

regresión con un nivel de significación de 0.05. c) Calcule e interprete al coeficiente de determinación.

10. El administrador de un nuevo programa paralegal en Seagate

Techinical Collage desea estimar el promedio de calificaciones en dicho programa. Consideró que el promedio de calificaciones en bachillerato (GPA, de grade Point Average), la puntuación en expresión oral en el examen de Aptitud Académica Superior (SAT, de Scholastic Aptitude Test), y las calificaciones de matemática en el SAT, serían buenos preeditores (o elementos de predicción) del GPA paralegal. Los datos para nueve estudiantes son:

Page 150: estadistica solucionarios

ESTADÍSTICA APLICADA

152

a) Estime la ecuación de regresión lineal múltiple. b) Realice la prueba de hipótesis para los coeficientes de

regresión con un nivel de significación de 0.05. c) Calcule e interprete al coeficiente de determinación.

11. El señor Mike Wilde es presidente de sindicato de profesores del

Distrito escolar de Otsego. Al prepararse para futuras negociaciones, a Mike le gustaría investigar la estructura de los sueldos de personal docente en el distrito. Considera que existen tres factores que afectan el pago laboral de un profesor, años de experiencia, una calificación de la efectividad en la enseñanza (asignada por el director) y si el profesor tiene o no grado de maestría. Una muestra aleatoria de 20 profesores dio como resultado los siguientes datos:

Estudiante GPA Bachillerato

Expresión oralSAT

Matemáticas SAT

GPA Paralegal

1 2 3 4 5 6 7 8 9

3.25 1.80 2.89 3.81 3.13 2.81 2.20 2.14 2.63

480 290 420 500 500 430 320 530 469

410 270 410 600 490 460 490 480 440

3.21 1.68 3.58 3.92 3.00 2.82 1.65 2.30 2.33

Page 151: estadistica solucionarios

ESTADÍSTICA APLICADA

153

Sueldos (mdd),

y

Años de Experiencia

x1

Calificación del director

x2

Maestría *x3

21.1 23.6 19.3 33.0 28.6 35.0 32.0 26.8 38.6 21.7 15.7 20.6 41.8 36.7 28.4 23.6 31.8 20.7 22.8 32.8

*1= si,0=no

8 5 2 15 11 14 9 7 22 3 1 5 23 17 12 14 8 4 2 8

35 43 51 60 73 80 76 54 55 90 30 44 84 76 68 25 90 62 80 72

0 0 1 1 0 1 0 1 1 1 0 0 1 0 1 0 1 0 1 0

Nota: mdd indica miles de dólares.

a) Determine la ecuación de regresión. ¿Qué sueldo estimaría usted para un profesor con cinco años de experiencia, una calificación de 60 dada por el director, y sin maestría?

b) Realice una prueba global de hipótesis para determinar si algunos de los coeficientes de regresión netos difieren de cero. Utilice el nivel de significación de 0.05.

c) Realice una prueba de hipótesis para los coeficientes de regresión. ¿Consideraría eliminar cualesquiera de las variables independientes? Use el nivel de significancia 0.05

d) Si su conclusión para la parte (c) fue suprimir una o más variables independientes, efectué de nuevo el análisis sin esas variables.

Page 152: estadistica solucionarios

ESTADÍSTICA APLICADA

154

12. El gerente de ventas distrital de un importante fabricante de automóviles está estudiando las ventas. Específicamente le gustaría determinar qué factores afectan el número de autos vendidos en una distribuidora. Para investigar, selecciona al azar 12 distribuidores. De ellos obtiene el número de vehículos vendidos el último mes, los minutos de publicidad radiofónica comprados en dicho periodo, el número de vendedores de tiempo completo empleados en la distribuidora, y si ésta se localiza en la ciudad o no. La información es la siguiente:

Automóviles vendidos

el último mes y

Publicidad x1

Fuerza de

ventas x2

Ciudad x3

Automóviles vendidos

el último mes y

Publicidad x1

Fuerza de

ventas x2

Ciudad x3

127 138 159 144 139 128

18 15 22 23 17 16

10 15 14 12 12 12

Si No Si Si No Si

161 180 102 163 106 149

25 26 15 24 18 25

14 17 7 16 10 11

Si Si No Si No Si

a) Determine la ecuación de regresión. ¿Cuántos autos

esperaría que se vendieran en una distribuidora con 20 vendedores, que paga 15 minutos de publicidad y se localiza en una ciudad?

b) Realice una prueba global de hipótesis para determinar si alguno de los coeficientes de regresión neta es diferente de cero. Sea α = 0.05.

c) Efectúe una prueba de hipótesis para los coeficientes de regresión individuales. ¿Consideraría eliminar alguna de las variables independientes? Sea α = 0.05.

d) Si su conclusión en la parte (c) fue suprimir una o más de las variables independientes, efectúe de nuevo el análisis sin esas variables

Page 153: estadistica solucionarios

ESTADÍSTICA APLICADA

155

13. Las tiendas de Fran's Convenience Marts están localizadas en el área metropolitana de Erie, Pennsylvania. A Fran, la dueña, le agradaría la extensión a otras comunidades del noroeste de Pennsylvania y el suroeste de NuevaYork, tales como Jamestown, Corry, Meadville y Warren. Como parte de su presentación al banco local, le gustaría entender mejor los factores que hacen que una tienda en particular sea lucrativa. La propietaria debe hacer todo el trabajo sola, así que no podrá analizar todos sus establecimientos. Selecciona al azar una muestra de 15 tiendas y registra el promedio de las ventas diarias (Y), la superficie de piso (área), el número de lugares de estacionamiento, y el ingreso económico medio de familias en esa región para cada establecimiento. La información de la muestra se presenta enseguida.

Tiendas en muestra

Ventas diarias

Área de tiendas

Lugares de estacionamiento

Ingreso (mdd)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

$1840 1746 1812 1806 1792 1825 1811 1803 1830 1827 1764 1825 1763 1846 1815

532 478 530 508 514 556 541 513 532 537 499 510 490 516 482

6 4 7 7 5 6 4 6 5 5 3 8 4 8 7

44 51 45 46 44 46 49 52 46 46 48 47 48 45 43

Nota : mdd indica miles de dólares.

a) Determine la ecuación de regresión. b) ¿Cuál es el valor de R2? Comente acerca de tal valor. c) Realice una prueba global de hipótesis para determinar si

alguna de las variables independientes es diferente de cero.

Page 154: estadistica solucionarios

ESTADÍSTICA APLICADA

156

d) Realice pruebas individuales de hipótesis para determinar si se pueden suprimir variables independientes.

e) Si se eliminan variables, vuelva a calcular la ecuación de regresión y R2.

14. El señor Steve Douglas fue contratado como gerente en

entrenamiento por una importante empresa financiera. Como primer proyecto, se le pidió que estudiara la utilidad bruta en la industria química.¿Qué factores afectan las utilidades en esa industria? Steve selecciona al azar una muestra de 16 compañías y obtiene datos respecto a la cantidad de empleados, el número de dividendos consecutivos pagados de acciones comunes, el valor total del inventario al inicio del presente año y la ganancia bruta de cada empresa. Sus descubrimientos son:

Compañía Ganancia

bruta (mdd)

y

Número deempleados

x1

Dividendos consecutivos

x2

InventarioInicial (mdd)

x3 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

2800 1300 1230 1600 4500 5700 3150 640

3400 6700 3700 6440 1280 4160 3870 980

140 65 130 115 390 670 205 40 480 810 120 590 440 280 650 150

12 21 42 80

120 64 43 14 88 98 44

110 38 24 60 24

1800 320 820 76

3600 8400 508 870 5500 9875 6500 9130 1200 890 1200 1300

Nota : mdd indica miles de dólares.

Page 155: estadistica solucionarios

ESTADÍSTICA APLICADA

157

a) Determine la ecuación de regresión. La Master Chemical Company emplea 220 personas, ha pagado 64 dividendos consecutivos de acciones comunes y tiene un inventario valuado en $1 500000 (dólares) al principio del año. ¿Cuál es la ganancia bruta calculada?

b) Realice una prueba global de hipótesis para determinar si alguno de los coeficientes de regresión neta es diferente de cero.

c) Efectúe una prueba de hipótesis para los coeficientes de regresión individuales. ¿consideraría eliminar alguna de las variables independientes?

d) Si su conclusión para la parte (c) fue eliminar una o más variables independientes, haga de nuevo el análisis sin considerar esas variables.

15.- El Times Observer es un diario en Metro City. Como muchos

periódicos de la ciudad, dicha publicación está pasando por difíciles tiempos financieros. La gerente de circulación está estudiando otros periódicos en ciudades semejantes de Estados Unidos y Canadá. Está particularmente interesada en saber qué variables se relacionan con el número de suscripciones al diario. Ha podido obtener la siguiente información de muestra acerca de 25 periódicos de ciudades similares. Se utilizó la siguiente notación:

Suscr = Número de subscripciones (en miles). Pobl = Población metropolitana (en miles). Public = Presupuesto de publicidad del periódico (en cientos de

dólares). Ingr = Ingreso familiar medio en el área metropolitana (en

miles de dólares)

Diario Suscr Pobl Public Ingr Diario Suscr Pobl Public Ingr 1 2 3 4 5 6 7 8 9

10 11 12 13

37.95 37.66 37.55 38.78 37.67 38.23 36.90 38.28 38.95 39.27 38.30 38.84 38.14

588.9 585.3 566.3 642.9 624.2 603.9 571.9 584.3 605.0 676.3 587.4 576.4 570.8

13.2 13.2 19.8 17.6 17.6 15.4 11.0 28.6 28.6 17.6 17.6 22.0 17.6

35.1 34.7 34.8 35.1 34.6 34.8 34.7 35.3 35.1 35.6 34.9 35.4 35.0

14 15 16 17 18 19 20 21 22 23 24 25

38.39 37.29 39.15 38.29 38.09 37.83 39.37 37.81 37.42 38.83 38.33 40.24

586.5 544.0 611.1 643.3 635.6 598.9 657.0 595.2 520.0 629.6 680.0 651.2

15.4 11.0 24.2 17.6 19.8 15.4 22.0 15.4 19.8 22.0 24.2 33.0

35.5 34.9 35.0 35.3 34.8 35.1 35.3 35.1 35.1 35.3 34.7 35.8

Page 156: estadistica solucionarios

ESTADÍSTICA APLICADA

158

a) Determine la ecuación de regresión. b) Realice una prueba global de hipótesis para determinar si

algunos coeficientes de regresión neta no son iguales a cero. c) Efectúe una prueba para los coeficientes individuales.

¿Consideraría eliminar algunos de ellos? 16. El Toledo Blade (Ohio) hizo recientemente una campaña

indicando que tenía vacantes para mensajeros. "Despierte ante las oportunidades", decía el anuncio. "Con una ruta Blade, usted trabajará cerca de sólo una hora al día en la mañana, cuando tenga tiempo". El anuncio continuaba con una lista de las siguientes rutas de mensajería. La ganancia semanal promedio (en dólares) es la variable dependiente, y el número de clientes diarios, así como el de clientes de domingo, son las variables independientes.

Ruta Ganancia semanal

promedio

Número de clientes

diarios

Número de clientes de domingo

Greenwood Oswald Neveda Forsythe Idaho Valleywood Oak Hill Burbank Burke Glen Penelope

$47.00 70.00 24.00 30.00 25.00 44.00 26.00 19.50 33.20 35.00

66 98 32 42 34 60 40 30 46 48

78 117 45 51 44 76 40 30 57 61

a) Determine la ecuación de regresión. ¿Cuánta ganancia

calcularía para una ruta que tiene 50 clientes diarios y 100 de domingo?

b) ¿Se puede concluir que las dos variables explican toda la variación en la utilidad semanal?

Page 157: estadistica solucionarios

ESTADÍSTICA APLICADA

159

17. Un departamento de hipotecas en un gran banco está estudiando sus préstamos recientes. De particular interés es conocer cómo factores tales como el valor de la casa (en miles de dólares), el nivel de educación y la edad de quien encabeza la familia, el pago actual de hipoteca al mes (en dólares) y el sexo de tal persona (masculino = 1, femenino =0), se relacionan con el ingreso familiar. ¿Son estas variables mecanismos efectivos de predicción del ingreso para el hogar? Se obtiene una muestra al azar de 25 préstamos recientes:

Ingreso (millones

de dólares)

Valor (millones

de dólares)

Años de

educación Edad Pago de

hipoteca Sexo

$40.3 39.6 40.8 40.3 40.0 38.1 40.4 40.7 40.8 37.1 39.9 40.4 38.0 39.0 39.5 40.6 40.3 40.1 41.7 40.1 40.6 40.4 40.9 40.1 38.5

$190 121 161 161 179 99

114 202 184 90

181 143 132 127 153 145 174 177 188 153 150 173 163 150 139

14 15 14 14 14 14 15 14 13 14 14 15 14 14 14 14 15 15 15 15 16 13 14 15 14

53 49 44 39 53 46 42 49 37 43 48 54 44 37 50 50 52 47 49 53 58 42 46 50 45

$230 370 397 181 378 304 285 551 370 135 332 217 490 220 270 279 329 274 433 333 148 390 142 343 373

1 1 1 1 0 0 1 0 0 0 1 1 0 0 1 1 1 0 1 1 0 1 1 0 0

Page 158: estadistica solucionarios

ESTADÍSTICA APLICADA

160

a) Determine la ecuación de regresión. b) ¿Cuál es el valor de R2? Comente acerca del mismo. c) Realice una prueba global de hipótesis para determinar si

algunas de las variables independientes son diferentes de cero.

d) Efectúe pruebas individuales de hipótesis para establecer si se pueden eliminar algunas de las variables independientes.

e) Si se suprimen variables, vuelva a formular la ecuación de regresión y R2.

18. El señor Fred G. Hire es el gerente de recursos humanos del

Centro Médico St. Luke. Como parte de su reporte anual al presidente de dicha institución se le pidió presentar un análisis de los empleados a sueldo. Debido a que hay más de 1000 trabajadores, no tiene e! personal para reunir información respecto a cada uno de los laborantes en cuestión, así que selecciona una muestra aleatoria de 30. Por cada trabajador registra el pago laboral mensual, los meses de servicio en St. Luke, el sexo (1= masculino, 0= femenino), y si el empleado tiene un puesto técnico ó de oficina. Los que hacen trabajos técnicos se codifican como 1, y los que realizan actividades de escritorio, como 0.

Page 159: estadistica solucionarios

ESTADÍSTICA APLICADA

161

Empleado

en la muestra

Salario mensual

(en dólares)

Tiempo de

servicio

Edad

Sexo

Trabajo

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

$1769 1740 1941 2367 2467 1640 1756 1706 1767 1200 1706 1985 1555 1749 2056 1729 2186 1858 1819 1350 2030 2550 1544 1766 1937 1691 1623 1791 2001 1874

93 104 104 126 98 99 94 96 124 73 110 90 104 81 106 113 129 97 101 91 100 123 88 117 107 105 86 131 95 98

42 33 42 57 30 49 35 46 56 23 67 36 53 29 45 55 46 39 43 35 40 59 30 60 45 32 33 56 30 47

1 1 1 1 1 1 1 0 0 0 0 0 0 0 1 0 1 0 1 1 1 1 0 1 1 0 0 0 1 1

0 0 1 1 1 1 0 1 0 1 1 1 0 0 0 1 1 1 1 1 0 0 0 1 1 1 0 1 1 0

a) Determine la ecuación de regresión usando el sueldo como

la variable dependiente, y las otras cuatro variables como variables independientes.

b) ¿Cuál es el valor de R2? Comente respecto a este valor.

Page 160: estadistica solucionarios

ESTADÍSTICA APLICADA

162

c) Realice una prueba global de hipótesis para determinar si algunas de las variables independientes son diferentes de cero.

d) Realice una prueba individual para determinar si se puede eliminar alguna de las variables independientes.

e) Vuelva a establecer la ecuación de regresión utilizando sólo las variables independientes que son significativas. ¿Cuánto más gana al mes un hombre que una mujer? ¿Hay alguna diferencia si el empleado tiene un puesto técnico o uno de oficina?

Page 161: estadistica solucionarios

ESTADÍSTICA APLICADA

163

TABLAS ESTADÍSTICAS

TABLA 1: DISTRIBUCIÓN NORMAL TABLA 2: DISTRIBUCIÓN t DE STUDENT TABLA 3: DISTRIBUCIÓN χ2 TABLA 4: DISTRIBUCIÓN F TABLA 5: PROBABILIDADES BINOMIALES TABLA 6: PROBABILIDADES DE POISSON TABLA 7: TABLA DE NÚMEROS AL AZAR

“Tus padres y tus profesores son tus fieles y desinteresados amigos: ¡Aprovéchalos! por que no

podrán acompañarte por mucho tiempo”.

Page 162: estadistica solucionarios

ESTADÍSTICA APLICADA

164

Page 163: estadistica solucionarios

ESTADÍSTICA APLICADA

165

Page 164: estadistica solucionarios

ESTADÍSTICA APLICADA

166

Page 165: estadistica solucionarios

ESTADÍSTICA APLICADA

167

Page 166: estadistica solucionarios

ESTADÍSTICA APLICADA

168

Z

Page 167: estadistica solucionarios

ESTADÍSTICA APLICADA

169

Page 168: estadistica solucionarios

ESTADÍSTICA APLICADA

170

Page 169: estadistica solucionarios

ESTADÍSTICA APLICADA

171

Page 170: estadistica solucionarios

ESTADÍSTICA APLICADA

172

Page 171: estadistica solucionarios

ESTADÍSTICA APLICADA

173

Page 172: estadistica solucionarios

ESTADÍSTICA APLICADA

174

Page 173: estadistica solucionarios

ESTADÍSTICA APLICADA

175

Page 174: estadistica solucionarios

ESTADÍSTICA APLICADA

176

Page 175: estadistica solucionarios

ESTADÍSTICA APLICADA

177

Page 176: estadistica solucionarios

ESTADÍSTICA APLICADA

178

Page 177: estadistica solucionarios

ESTADÍSTICA APLICADA

179

Page 178: estadistica solucionarios

ESTADÍSTICA APLICADA

180

Page 179: estadistica solucionarios

ESTADÍSTICA APLICADA

181

Page 180: estadistica solucionarios

ESTADÍSTICA APLICADA

182

Page 181: estadistica solucionarios

ESTADÍSTICA APLICADA

183

BIBLIOGRAFÍA

Devore, Jay (1999). Probabilidad para Ingeniería y Ciencias. México, D.F. Reprotló. S.A. de C.V. 697p. Freund, John; Walpole, Ronald (1990). Estadística Matemática con Aplicaciones. Prentice-Hall Hispanoamericana. S.A. EDITORIAL. 617p. Mason, Robert†; Lind, Douglas; Marchal, William (2001). Estadística para Administración y Economía. México, D.F. ALFAOMEGA GRUPO EDITOR, S.A. de C.V. 785p. Montgomery, Douglas; Runger, George (2002). Probabilidad y Estadística. México, D.F. EDITORIAL LIMUSA, S.A. de C.V. 819p. Montgomery, Douglas; Peck, Elizabeth; Vining Geoffrey (2002). Regresión Lineal. México, D.F. GRUPO PATRIA CULTURAL, S.A. de C.V. 567p. Miller, Irwin; Freund, John; Johnson, Richard (1992). Probabilidad y Estadística para Ingenieros. México, D.F. Prentice-Hall Hispanoamericana. S.A. 624p. Rubio Donet, Jorge. Estadística Aplicada. Perú. 179p. Dr. Edgar Acuna http://math.uprm.edu/~edgar UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ

“Estudia que la meta que te has trazado se logra estudiando”