cuadernillo problemas

25
GRADO EN ADE CURSO ADAPTACIÓN AL GRADO INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA (código 35819) CUADERNILLO DE PROBLEMAS CURSO ACADÉMICO 2011-12 CURSO: CURSO ADAPTACIÓN AL GRADO

Upload: solis-frank

Post on 29-Oct-2015

258 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Cuadernillo Problemas

GRADO EN ADE CURSO ADAPTACIÓN AL GRADO

INTRODUCCIÓN A LA INFERENCIA

ESTADÍSTICA (código 35819)

CUADERNILLO DE PROBLEMAS

CURSO ACADÉMICO 2011-12

CURSO: CURSO ADAPTACIÓN AL GRADO

Page 2: Cuadernillo Problemas

1

LIBRO DE PROBLEMAS: MURGUI, J.S.; y otros: Ejercicios de Estadística: economía y ciencias sociales. Tirant lo Blanch, Valencia, 2002. Material en Aula Virtual en “Recursos” del panel de navegación: http://aulavirtual.uv.es

TEMA 1 1ª PARTE: VARIABLES ALEATORIAS Y MODELOS DE

PROBABILIDAD 1.1.1 Según datos del CIS, el 40% de los votantes de un municipio tienen intención de votar a un determinado partido político en las próximas elecciones. Para un total de 5 votantes seleccionados al azar, indica la distribución de probabilidad de la variable aleatoria que representa el número de votantes de esos 5 que piensan votar a dicho partido. Calcula la probabilidad de que al menos 2 votantes vayan a votar a dicho partido. 1.1.2 Indicar la distribución de probabilidad más apropiada para la variable aleatoria que representa el número de unidades vendidas en un día en un comercio de un determinado electrodoméstico y cuya media es 1,1. ¿Qué valdría su varianza?

1.1.3 Sea X una variable aleatoria que representa el número de intentos para dejar de fumar. El comportamiento de esta variable se puede modelizar mediante una distribución de Poisson de media 2. Calcula las probabilidades de que: a) el número de intentos sea 0 b) el número de intentos sea 1 c) el número de intentos sea 2 d) el número de intentos sea 3 o más (Estas probabilidades sirven para resolver el ejercicio 6.2 pág.14 de este cuadernillo de problemas). Sol: a) 0,13534 b) 0,27067 c) 0,27067 d) 0,3233 1.1.4 Sea X una variable aleatoria que expresa los ingresos mensuales, en euros, de los hogares valencianos. Se supone que el comportamiento de dicha variable se puede modelizar mediante una distribución Normal con media 1700 € y su desviación típica 200€. a) Calcular la probabilidad de que los ingresos de un hogar superen los 1900 €. b) Calcular la probabilidad de que los ingresos de un hogar no lleguen a los 1300 €.

Page 3: Cuadernillo Problemas

2

c) Calcular la probabilidad de que los ingresos de un hogar estén entre 1600 y 1800 €. d) El 5% de los hogares con mayores ingresos se consideran como de nivel socio-económico alto. ¿A partir de qué nivel de ingresos se considera a un hogar de nivel socio-económico alto? 1.1.5 Estudios realizados a nivel provincial muestran que la renta familiar anual está bien representada por una distribución Normal, con media 21.000 euros y desviación típica de 3.550 euros. Calcula las probabilidades de que la renta anual de una familia: a) sea inferior a 14.500 euros b) se encuentre entre 14.500 y 17.000 euros c) se encuentre entre 17.000 y 22.000 euros d) se encuentre entre 22.000 y 27.500 euros e) sea superior a 27.500 euros (Estas probabilidades sirven para resolver el ejercicio 6.3 pág.14 de este cuadernillo de problemas). Sol: a) 0,0336 b) 0,0956 c) 0,4811 d) 0,3561 e) 0,0336

1.1.6 Un pequeño comerciante estima que el coste de mantenimiento de su negocio es el equivalente a 18 euros diarios. Los ingresos por la venta de cada artículo es de 1,2 euros y el número de artículos vendidos cada día es aleatorio con media 250 y desviación típica 5. Se admite la hipótesis de que la distribución del número de artículos vendidos diariamente es Normal. a) ¿Qué distribución tendrá la variable beneficios de un día? Calcula su media y su varianza. Indica qué propiedad has utilizado. b) Suponiendo independencia entre los beneficios de distintos días. ¿Qué distribución tendrá la variable beneficios de 10 días? Calcula su media y su varianza. Indica qué propiedad has utilizado. c) Suponiendo independencia entre los beneficios de distintos días. ¿Qué distribución tendrá la variable diferencia de los beneficios de dos días cualesquiera? Calcula su media y su varianza.

1.1.7 Un inversor tiene acciones de dos empresas. Sean X e Y las variables aleatorias que representan los rendimientos posibles (en porcentaje) de las acciones de cada una de esas dos empresas. La distribución de probabilidad conjunta de X e Y es:

X Y 0% 5% 10% 15% 0% 0,0625 0,0625 0,0625 0,0625

5% 0,0625 0,0625 0,0625 0,0625

10% 0,0625 0,0625 0,0625 0,0625

15% 0,0625 0,0625 0,0625 0,0625

a) Obtener las distribuciones marginales.

Page 4: Cuadernillo Problemas

3

b) ¿Son independientes X e Y? c) ¿Qué vale la covarianza de X e Y?

1.1.8 En un estudio sobre las preferencias de los habitantes de la ciudad de Valencia, sea X la variable que toma el valor 0 cuando el lugar de vacaciones elegido sea la playa y 1 si se elige la montaña y sea Y otra variable que, en euros, expresa la renta familiar. Como resultado del estudio se propone la siguiente distribución de probabilidad conjunta para las variables citadas:

X Y 6000 18000 36000 playa0= 0,15 0,35 0,15 montaña1= 0,15 0,15 0,05

a) Obtener las distribuciones marginales. b) ¿Son independientes X e Y?

GUÍA para los Ejercicios del Tema 1 (1ª parte) Define la variable o las variables que se consideran en el problema e indica el tipo de distribución de probabilidad y sus principales características (parámetros, función de probabilidad o función de distribución). Por ejemplo si la distribución es Normal, indicar el valor de la media y la varianza o la media y la desviación típica.

Cálculo de la probabilidad o valor pedido.

Page 5: Cuadernillo Problemas

4

TEMA 1 2ª PARTE: CONVERGENCIA ESTOCÁSTICA (TEOREMA CENTRAL DEL LÍMITE).

1.2.1 El peso de una persona que utiliza el ascensor del aulario es una variable aleatoria con media 75 kg y varianza 100 kg2. Si suben 33 personas, seleccionadas al azar, en el ascensor, calcular la probabilidad de que no se supere el peso máximo de 2500 kg.

1.2.2 Se sabe que el número de personas que visitan el IVAM a lo largo de cualquier semana sigue una distribución con media 4.750 personas y desviación típica 2.500 personas. Calcular la probabilidad de que el número de visitantes en un año (52 semanas) esté comprendido entre 250.000 y 275.000 personas. Indicar claramente que supuestos se deben asumir para calcular esa probabilidad.

1.2.3 El número de unidades vendidas diariamente en un comercio de un determinado electrodoméstico se puede representar mediante una variable aleatoria con distribución de Poisson de media 1,1. Calcular la probabilidad de que el número de unidades vendidas de este electrodoméstico a lo largo 110 días no supere la cifra de 143.

1.2.4 Según el titular de un periódico, el 33% de los inmigrantes llegados en 2003 a nuestro país consiguieron legalizar su situación. Calcula la probabilidad de que de 1000 inmigrantes recién llegados, al menos 300 consiguieran regularizar su situación. Indica claramente qué supuestos se deben asumir para calcular dicha probabilidad.

1.2.5 Se considera que el número diario de ejemplares vendidos de una determinada publicación en un quiosco es una variable aleatoria que se distribuye según una Poisson de media 30. El precio de venta de cada ejemplar es de 1,3 euros. Obtener, razonadamente, la probabilidad de que en los próximos 40 días los ingresos por la venta de ejemplares superen los 1625€. Indique todos los supuestos que sea necesario asumir para obtener dicha probabilidad.

1.2.6 La demanda diaria de cierta marca de refresco en litros, se puede representar mediante una variable aleatoria X de media 3000 litros y de varianza 8100 litros

2.

a) Obtén razonadamente, la probabilidad de que el total de litros demandados en 100 días éste entre 298000 y 301800 litros. Indique todos los supuestos que sea necesario asumir para obtener dicha probabilidad. b) Calcula la producción de litros de refresco en 100 días, para atender la demanda total con probabilidad 0,99.

1.2.7 EJERCICIO 6.1.1 libro p.221

Un almacén desea proveerse de un determinado artículo para la campaña de verano, que comprende 90 días. Si el promedio de artículos diarios que vende en dicho periodo del año es de 15 y la desviación típica de 5, hallar el número de artículos a comprar si pretende una garantía del 95% de que transcurrida la campaña no le queden artículos

Page 6: Cuadernillo Problemas

5

en el almacén.

1.2.8 Cincuenta alumnos del último curso del Grado de ADE decidieron vender camisetas para costear su viaje de fin de carrera. Como no estaban seguros del éxito que iban a tener, adquirieron pocas camisetas; sin embargo, vendieron las unidades en tan poco tiempo que optaron por vender más. Sabiendo que el promedio de las camisetas vendidas por alumno es de 30 y la desviación típica de 6: a) ¿Cuál es el número de camisetas a encargar de forma que las ventas totales de los cincuenta alumnos sean mayores o iguales a ese número con una probabilidad del 90%? (Indica claramente los supuestos que sea necesario asumir para calcular ese número). b) Si por cada camiseta se obtiene un beneficio de 3 €, ¿cuál es la probabilidad de que el beneficio total de esta remesa sea mayor a 4450 €?

1.2.9 El número de minutos que diariamente un estudiante está conectado a Internet en un cibercafé se puede representar mediante una variable aleatoria de media 90 y desviación típica 20. En el cibercafé cobran 0,5 € por cada día que se enganche a Internet y 0,02 € por minuto de conexión. Determinar un valor para el gasto en Internet del estudiante en el cibercafé durante los próximos 60 días de forma que no será superado con una probabilidad de 0,95. (Indica claramente los supuestos que sea necesario asumir para obtener ese valor).

1.2.10 Un estudiante utiliza diariamente el tranvía para ir y volver de la Universidad. Un bono-metro de 10 viajes cuesta 6,5 €. La sanción por viajar sin billete es de 60 €. El estudiante ha observado que sólo en un 4% de los viajes se efectúan revisiones. Determínese cuál sería la probabilidad de que el posible coste económico de viajar sin billete superase al de viajar con billete durante todos los días lectivos del próximo cuatrimestre (75 días=150 viajes). Indica todos los supuestos que sea necesario asumir para obtener esa probabilidad.

1.2.11 La encuesta sobre equipamiento y uso de Tecnologías de la Información y Comunicación en los hogares españoles publicada por el INE en octubre de 2008, aseguraba que el 49% de los hogares españoles carece de conexión a internet. El Ministerio de Industria lanza la iniciativa HCI (“Hogar Conectado a Internet”) utilizando a las empresas como intermediarios. Una de esas empresas colaboradoras decide financiar con 200 € la compra de un ordenador con conexión a internet a las familias que carezcan de la misma, de una muestra aleatoria de 500 hogares. Tomada dicha muestra: a) ¿Cuál es la probabilidad de que en más de 230 hogares no haya conexión a

internet? b) Calcúlese la probabilidad de que la cantidad total que tenga que pagar la

empresa colaboradora esté entre 46.700 € y 51.200 €.

Page 7: Cuadernillo Problemas

6

GUÍA para los Ejercicios del Tema 1 2ª PARTE: Teorema Central del Límite

Define la variable o las variables que se consideran en el problema e indica el tipo de distribución de probabilidad y sus principales características (media y varianza o desviación típica).

Indica razonadamente el tipo de distribución aproximada (con su media y varianza) de la variable para la que se pide una probabilidad o un valor. Indica claramente que se esa variable es la suma de un número grande de variables aleatorias que cumplen: enumera los supuestos que sea necesario asumir.

Cálculo de la probabilidad o valor pedido.

Page 8: Cuadernillo Problemas

7

TEMA 2: INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

2.1 CUESTIÓN 6.4.5 libro p.250 Un estudio recientemente publicado afirma que las viviendas de la ciudad de Valencia tienen una superficie media de 95 m2 y una desviación típica de 10 m2. Paralelamente, un gabinete estadístico afirma haber seleccionado una m.a.s de 90 viviendas, calculando para las mismas una superficie media superior a 100 m2. Calcula la probabilidad de que esto último sea posible.

2.2 EJERCICIO 6.3.1 libro p.242

Según un estudio efectuado el año anterior, el gasto de los estudiantes en la cafetería de la Facultad en un mes cualquiera sigue una distribución Normal, con una media de 48 euros y una desviación típica 12 euros.

Con el objetivo de actualizar estos datos, un estudiante ha entrevistado a 25 alumnos preguntando cuál ha sido su gasto en la cafetería en el último mes. De los resultados obtenidos se deduce que la media para los 25 alumnos es superior a 54 euros.

a) El estudiante que ha efectuado la encuesta afirma que la muestra utilizada es aleatoria simple. ¿Es coherente la información recogida por el estudiante con los resultados del estudio citado? (Para responder a la pregunta, calcula la probabilidad de de que el estudiante haya obtenido esos resultados) Justifica tus conclusiones.

b) Supóngase ahora que se desconociera la desviación típica poblacional, considerando los 12 euros como la desviación típica obtenida para los 25 alumnos que el estudiante ha entrevistado. ¿Se modificarían las respuestas al apartado anterior? (suponiendo que la media de la población es desconocida).

c) Volviendo a suponer que la desviación típica poblacional es conocida e igual a 12 euros, calcular la probabilidad de que la varianza del gasto mensual en la cafetería de los 25 estudiantes de la muestra sea mayor al valor de la varianza poblacional.

2.3 EJERCICIO 6.3.3 libro p.245

En la Agencia Valenciana de Turismo se ha efectuado un estudio sobre los turistas franceses e ingleses que vienen a España. Se ha obtenido que los franceses gastan en alimentación 21 euros de media por persona y día, con desviación típica de 6 euros. Para los ingleses se obtiene que el gasto es de 18 euros de media por persona y día, con desviación típica de 3 euros. Para confirmar esta información se pasa una encuesta en el retorno de las vacaciones a 300 turistas franceses y a 200 ingleses.

Page 9: Cuadernillo Problemas

8

Admitiendo que cada grupo de turistas encuestados constituye una muestra aleatoria simple, ¿cómo es de probable que la diferencia entre los gastos medios diarios en alimentación de los turistas franceses y los ingleses de las muestras sea inferior a 1'8 euros? 2.4 EJERCICIO PROPUESTO 6.4 libro p.253 Para la campaña de Navidad una empresa presenta una oferta a sus clientes de un determinado producto. El Departamento Comercial de la empresa estima que por las condiciones de la oferta y las características de sus clientes, dicha oferta la aceptarán el 80%. En cualquier caso, para estudiar la posible acogida, se va a efectuar un primer lanzamiento ofreciendo la oferta a 200 clientes escogidos al azar. a) ¿Cuál es la probabilidad de que la proporción de clientes de la muestra anterior que

aceptará la oferta no sea superior a 0,83?

b) La empresa distingue a los clientes que efectúan el pago al aplazado o al contado, y se plantea la posible acogida de la oferta en los dos grupos de clientes. El Departamento Comercial estima que el 90% de los clientes que pagan aplazado acepta la oferta, y de los de pago al contado la aceptará el 65%. Considerando que de los 200 clientes anteriores, 115 son del primer grupo y 85 del segundo, calcular la probabilidad de que la diferencia entre las proporciones de clientes con pago aplazado y al contado que aceptan la oferta sea superior en un 0,2. 2.5 Un fabricante A produce lámparas con duración media de 2200 horas y desviación típica de 200 horas. Otro fabricante B utiliza un método diferente que reduce la duración media a 2000 horas manteniendo la misma desviación típica. Se supone que la duración de las lámparas de ambos fabricantes sigue un modelo Normal. Si pretende seleccionar aleatoriamente 21 lámparas del fabricante A y 16 lámparas del fabricante B. a) Calcular la probabilidad de que la diferencia en la duración media de las lámparas seleccionadas del fabricante A y del fabricante B no supere las 200 horas. b) ¿Se podría calcular la probabilidad del apartado anterior si se desconociera el valor de las desviaciones típicas poblacionales, aunque se sigue suponiendo que éstas son iguales? ¿Qué estadístico tendríamos que utilizar ahora y qué información adicional necesitaríamos? c) ¿Cuál es la probabilidad de que la varianza de la duración de las lámparas seleccionadas del fabricante A supere en más de 1,96 veces a la de las lámparas seleccionadas del fabricante B?

2.6 De una población X se sabe que μ=8 y 2σ = 9 y se pretende extraer, mediante m.a.s., muestras de tamaño n=10. a) Calcula:

Media de X : ( ) ?=XE Varianza de X : ( ) ?=XVar Media de 2S : ( ) ?2 =SE

Page 10: Cuadernillo Problemas

9

Media de 2•

S (cuasivarianza muestral): ?2 =⎟⎠⎞

⎜⎝⎛ •

SE

b) Si para la población anterior se desconociera el valor del parámetro poblacional μ, ¿ cómo es de probable que a partir de esa población se extraiga una muestra aleatoria de tamaño n=10 cuya varianza muestral 2S sea mayor a 10,251 ? Para calcular esa probabilidad, ¿hay que establecer alguna hipótesis sobre la distribución de probabilidad de la población? En caso afirmativo, indica cuál.

2.7 Según el Instituto de la Juventud, el gasto mensual de los jóvenes en teléfono móvil se puede representar mediante una variable aleatoria poblacional con distribución Normal de media igual a 35 euros. Se ha seleccionado una muestra aleatoria simple del gasto mensual en móvil de 26 jóvenes, obteniendo un valor para la desviación típica muestral de 8 euros. Calcula la probabilidad de que la media de esa muestra no supere los 33,31 euros.

Page 11: Cuadernillo Problemas

10

Guía para los Ejercicios del Tema 2: Estadísticos muestrales y sus distribuciones asociadas

1) Define la variable aleatoria que representa a la Población e indica su distribución de probabilidad (en caso de que se conozca) y sus principales características (media y varianza o desviación típica). Haz lo mismo, en el caso de que se considere una segunda población, independiente de la anterior.

Población 1: Población 2: (sólo si hay otra población)

2) Escribe las variables aleatorias asociadas a la muestra aleatoria simple (m.a.s.), el tamaño de la muestra y el estadístico o estadísticos muestrales que se consideran en el problema. Haz lo mismo, en el caso de que se considere una segunda muestra a seleccionar de la segunda población.

Muestra aleatoria simple 1 Muestra aleatoria simple 2: (sólo si hay otra muestra)

3) Indica razonadamente (enumerando los supuestos que sea necesario asumir) el tipo de distribución (con su media y varianza) del estadístico muestral para el que se pide una probabilidad o un valor.

4) Cálculo de la probabilidad o valor pedido.

Page 12: Cuadernillo Problemas

11

TEMA 3: ESTIMACIÓN

3.1 Para estimar un mismo parámetro poblacional θ desconocido se dispone de dos estimadores 1 2

ˆ ˆyθ θ de los que se dispone de la siguiente información:

( ) ( )2

1 12

2ˆ ˆ;Var sesgon nθ θθ θ= = 2̂θ es insesgado; ( )

2

2 2

3ˆVarnθθ =

¿Cuál de los dos estimadores consideras que es más preferible para estimar θ ? ¿Por qué?

3.2 EJERCICIO 7.1.5 libro p.267

El director de un museo, preocupado por la escasa afluencia de público, decide analizar el número de personas que lo han visitado durante los últimos 30 días laborables. La cifra global obtenida fue de 270 personas. Admitiendo que las observaciones constituyen una muestra aleatoria simple y que la variable aleatoria que expresa el número de visitantes en un día laborable sigue un modelo de distribución de Poisson. a) Obtén la estimación máximo verosímil del número medio diario de personas que visitan el museo en un día laborable. b) ¿Cómo estimarías la varianza del número de visitantes en un día laborable?

3.3 En un barrio se quiere estimar la proporción de familias que poseen más de un automóvil. En una muestra aleatoria simple de 100 familias, se han encontrado 30 familias con más de un coche. a) Selecciona el estimador adecuado y calcular su valor muestral. b) A partir de los datos de la muestra, estimar el valor de la varianza del

estimador.

3.4 La Conselleria de Sanidad pretende efectuar un estudio sobre la contaminación producida por los vehículos en Valencia. El encargado del estudio admite que el grado de contaminación producido por un vehículo puede modelizarse por una variable aleatoria Normal, pero desconoce sus parámetros. Para calcular aproximaciones a estos valores selecciona 50 vehículos al azar y mide la contaminación de cada uno. Como resultado obtiene un grado medio de contaminación por vehículo de 2 y una desviación típica de 0'5. Indicar las estimaciones para los parámetros desconocidos y justificar su elección. (EJERCICIO libro 7.1.10 p.277)

3.5 Para estimar la media μ y la varianza 2σ de una población se dispone de un conjunto de 20 datos que se supone constituyen una m.a.s. Sobre ellos se ha calculado una media de 5’8 y una desviación típica de 6. En base a esta información y bajo los distintos supuestos contestar a las siguientes preguntas:

Page 13: Cuadernillo Problemas

12

a) Si no se admite ninguna hipótesis acerca de la distribución poblacional ¿qué cantidad debería darse como estimación para la media poblacional? Indicar alguna razón que justifique la propuesta.

b) Calcular la cuasivarianza muestral y valorar si, en ausencia de un modelo para la distribución poblacional, su valor sería preferible al de la varianza muestral como estimación de 2σ .

c) Si el estudio citado llegara a la conclusión de que el modelo es de Poisson pero sin especificar el valor del parámetro ¿en cuánto debería estimarse la media y la varianza poblacionales? Justifica la respuesta

3.6 De una población X con distribución Normal con media y varianza desconocidas se extrae una muestra aleatoria de tamaño n = 20, obteniendo un valor para la

cuasivarianza muestral, 2•

S , de 21,5. a) Calcula el valor de la varianza muestral 2S . b) ¿Qué valor seria preferible para estimar la varianza poblacional, 2σ ? ¿Por qué?

3.7 EJERCICIO 7.1.4 libro p.265

La Agencia Valenciana de Turismo va a realizar un estudio sobre las preferencias de los habitantes de la ciudad de Valencia respecto al lugar de vacaciones elegido. El encargado del estudio únicamente quiere distinguir entre montaña y playa. Realizada una encuesta a 100 personas elegidas al azar se ha obtenido que 30 de ellas prefieren la montaña y las 70 restantes han mostrado preferencia por la playa. a) ¿Cuál de los siguientes posibles valores para la proporción de ciudadanos que

prefieren la montaña tiene una mayor verosimilitud o es más compatible con los datos obtenidos de la encuesta: 25%, 30% o 35%. Justifica la respuesta.

b) Obtener razonadamente la estimación máximo-verosímil de la proporción de ciudadanos que prefieren la montaña.

c) ¿Qué valores, mínimo y máximo, se pueden proponer como aproximación a la proporción anterior con unas garantías del 95%?

d) ¿A cuántas personas se debería haber encuestado para conseguir un error del 4% en la estimación de dicha proporción con una confianza del 95%?

3.8 EJERCICIO 7.2.1 libro p.279

Una investigación desea obtener una aproximación de la renta media anual de las familias residentes en un barrio. Se dispone de información referente a 50 familias seleccionadas aleatoriamente, de forma que los ingresos totales de las mismas ascienden a 1 millón de euros y presentan una desviación típica de 1.500 euros. a) ¿Podría dar una estimación de la renta familiar media con unas garantías del 95%? b) ¿Habría alguna forma de conseguir, para una confianza del 90%, una estimación

Page 14: Cuadernillo Problemas

13

de 300 euros para el error asociado a la renta media anual estimada? 3.9 EJERCICIO 7.2.2 libro p.280 Un estudiante de grado curso pretende analizar el tiempo que los alumnos matriculados en primero durante el curso pasado dedicaron al estudio de Estadística I. Para ello, selecciona aleatoriamente una muestra de 15 estudiantes matriculados durante el curso pasado en dicha asignatura, de forma que el tiempo medio empleado por los 15 estudiantes ha sido de 70 horas, con una desviación típica de 10 horas. A partir de la información anterior y suponiendo que el tiempo dedicado al estudio de esta asignatura sigue una distribución Normal, dar respuesta a las siguientes cuestiones:

a) ¿Qué cantidades, mínima y máxima, se pueden proponer como estimación del número medio de horas empleado en el estudio de Estadística I por los alumnos matriculados durante el curso pasado, con unas garantías del 95%?

b) ¿Qué cantidades, mínima y máxima, se pueden proponer como estimación de la desviación típica del número de horas empleado en el estudio de Estadística I por los alumnos matriculados durante el curso pasado, con unas garantías del 90%?

3.10 El ministerio de Economía ha encargado un estudio para estimar la proporción de hogares que no saldrá de vacaciones como consecuencia de la crisis económica. Para ello, se va a entrevistar a una muestra aleatoria de hogares. a) Determinar el tamaño de la muestra a seleccionar si se pretende, para un nivel de confianza del 97%, que el error máximo en la estimación de dicha proporción sea del 3,5%. b) Finalmente, se selecciona una muestra aleatoria de 960 hogares de los cuales 384 piensa que tendrá que reducir gastos y no saldrá de vacaciones. Obtener un intervalo para la estimación de dicha proporción con un nivel de confianza del 97%. c) Si se desea que el nivel de confianza sea mayor que en el apartado anterior, ¿qué le ocurrirá al intervalo de confianza y al error de estimación? ¿Será la estimación ahora más precisa que en el apartado anterior? Razona las respuestas sin necesidad de efectuar ningún cálculo.

3.11 EJERCICIO 7.2.7 libro p.288

El consumo medio en gasolina de las familias de Barcelona en la última semana se ha estimado a través de una muestra aleatoria simple de 300 familias, obteniéndose para las mismas una media de 20 litros y una desviación típica de 5 litros. Análogamente, en Valencia se preguntó a 250 familias obteniéndose una media de 15 litros y una desviación típica de 8 litros. Calcular una estimación para la diferencia entre los consumos medios con una confianza del 90%. ¿Cuál es el error cometido con esta estimación?

Page 15: Cuadernillo Problemas

14

3.12 EJERCICIO 7.2.12 libro p.295

Cierto municipio está constituido por dos secciones electorales que en las pasadas elecciones mostraron comportamientos claramente diferenciados. Ante la proximidad de nuevas elecciones municipales, el partido gobernante desea realizar un sondeo acerca de la proporción de votos que puede obtener en cada una de estas secciones y analizar la diferencia entre ambas. Para ello se seleccionan dos muestras aleatorias de personas con derecho a voto, una de cada sección. En la primera sección se ha preguntado a 45 personas y 27 de ellas han declarado su intención de votar al partido del gobierno, mientras que en la segunda sección han mostrado esta intención 25 de las 50 personas a las que se ha preguntado. A partir de esta información, obtener un intervalo de estimación para la diferencia entre las proporciones de votos al partido del gobierno con una confianza del 90%.

3.13 Entre la población mayor de 18 años residente en una comunidad se pretende realizar una encuesta que permita estimar la proporción 1p de personas a favor de una iniciativa política A y la proporción 2p de personas a favor de una iniciativa política B, siendo ambas iniciativas independientes. Para la primera se pretende conseguir un error del 4% con una confianza del 95%. Para la segunda se pretende conseguir un error del 3% con una confianza del 90%. a) ¿A cuántas personas se deberá consultar para asegurar la precisión indicada

en ambas estimaciones? b) Una vez realizada la encuesta se obtiene que la proporción muestral de personas

favorables a la iniciativa A es del 20% y la de favorables a la iniciativa B del 85%. Asumiendo los mismos niveles de confianza anteriores, ¿cuáles son los errores asociados con estos resultados?

c) ¿Cómo se puede justificar el que la precisión realmente conseguida no coincida con la inicialmente deseada, si el tamaño muestral se había determinado precisamente con ese objetivo?

Page 16: Cuadernillo Problemas

15

Guía para los Ejercicios del Tema 3: Intervalos de Estimación 1) Define la variable aleatoria que representa a la Población e indica su distribución de probabilidad (en caso de que se conozca) y sus principales características o parámetros (media y varianza o desviación típica) indicando si estas características poblacionales son o no conocidas. Haz lo mismo, en el caso de que se considere una segunda población, independiente de la anterior.

Población 1: Población 2: (sólo si hay otra población)

2) Escribe los datos de la muestra aleatoria simple (m.a.s.), el tamaño de la muestra, el estadístico o estadísticos muestrales que se consideran en el problema y el valor que toman. Haz lo mismo, en el caso de que se considere una segunda muestra seleccionada de la segunda población.

Muestra aleatoria simple 1 Muestra aleatoria simple 2: (sólo si hay otra muestra)

(x1,x2,….,xn)

3) Indica el parámetro a estimar mediante un intervalo y el nivel de confianza que se ha fijado.

4) Indica el intervalo de estimación que se va a utilizar, justificando la elección de dicho intervalo.

5) Cálculo del intervalo de estimación (búsqueda de los valores en la distribución del estadístico entre los cuales hay una probabilidad de 1-α, cálculo del error de estimación y de los extremos del intervalo).

Page 17: Cuadernillo Problemas

16

TEMA 4: CONTRASTES DE HIPÓTESIS PARAMÉTRICAS

4.1 EJERCICIO 8.2.2 libro p.316 Con objeto de analizar la renta declarada por los contribuyentes domiciliados fiscalmente en una Administración de Hacienda, se ha tomado una muestra aleatoria de 400 declaraciones, obteniéndose una renta media de 10.542 euros y una desviación típica de 2.711 euros. La renta media declarada para todos los ciudadanos del país, se estima en 10.843 euros. a) ¿Puede aceptarse, para un nivel de significación del 5%, que la renta media de las

declaraciones presentadas en la Administración, es la misma que la global para todo el país?

b) Determinar, a partir de los datos suministrados, hasta qué nivel de significación debe aceptarse la hipótesis anterior.

4.2 EJERCICIO 8.2.4 libro p.319 El Ayuntamiento de una ciudad desea averiguar si el inicio de las obras del Metro ha repercutido de alguna forma en la fluidez del tráfico. Para ello, decide centrar el análisis en el servicio que realiza una línea de autobús urbano. Antes de iniciarse las obras, a las horas centrales del día, un autobús tardaba un tiempo medio de 60 minutos en completar su recorrido, con una desviación típica de 5 minutos. En la actualidad, después de medir el tiempo en 20 servicios, se calcula para los mismos una media de 65 minutos y una desviación típica de 8 minutos. a) ¿Puede asegurarse, para un nivel de significación del 10%, que las obras del metro

han modificado la fluidez del tráfico en la ciudad? b) ¿Se ha alterado la regularidad (dispersión = varianza) en las llegadas de los

autobuses de la línea citada a las paradas, para un nivel de significación del 5%?

4.3 EJERCICIO 8.2.5 libro p.321 Se desea investigar la proporción de electores que prefiere celebrar las elecciones en día festivo, preguntando a una muestra aleatoria de ciudadanos con más de 18 años. a) El Centro de Investigaciones Sociológicas afirma que el 65% de los electores

prefiere que las elecciones se celebren en día festivo. Suponiendo que la encuesta únicamente la han contestado 500 ciudadanos y que de ellos, 300 han contestado afirmativamente, ¿puede aceptarse la compatibilidad de la afirmación del C.I.S con los resultados de la encuesta, para un nivel de significación del 5%?

b) Determinar, a partir de los resultados de la encuesta, hasta qué nivel de significación debe aceptarse la afirmación del C.I.S.

Page 18: Cuadernillo Problemas

17

4.4 EJERCICIO 8.2.8 libro p.328 El equipo asesor de la alcaldía de una ciudad está diseñando una muestra representativa de mesas electorales. Con ello pretende disponer de una estimación de los resultados de las próximas elecciones municipales, antes de que termine el escrutinio de los votos. Se presentan dudas con respecto a la catalogación de dos mesas distintas. Unos afirman que en ambas se obtendrá la misma proporción de votos a favor del partido que gobierna, mientras que otros afirman lo contrario.

Con el fin de tomar una decisión, se consulta la última encuesta sobre intención de voto realizada. De los resultados obtenidos se deduce que en la mesa A optaron por el partido en el gobierno 150 de entre los 450 que aceptaron pronunciarse. Análogamente, de los 380 electores de la mesa B a los que se preguntó y manifestaron su intención de votar, 130 se mostraron favorables al partido en el gobierno.

¿Es indiferente que se tome una u otra mesa para elaborar la muestra representativa, para un nivel de significación del 5%?

4.5 EJERCICIO 8.3.2 libro p.333 Una empresa comercializa un producto envasado asegurando en la campaña publicitaria que el contenido medio de los envases es al menos de 240 gramos. Otra empresa de la competencia pretende denunciarla por engaño publicitario. Para ello, se apoya en la información que obtiene al pesar el contenido de 20 envases seleccionados al azar, obteniendo para los mismos un peso medio de 230,8 gramos y una desviación típica de 14,63 gramos.

¿Existen razones estadísticas para considerar que la empresa está cometiendo un engaño publicitario?

4.6 EJERCICIO 8.3.3 libro p.375 En la comarca de la Ribera, se pretende instalar un ecoparque. La ubicación del mismo en esta comarca y no en una vecina dependerá, entre otros factores, de la capacidad de reciclado mensual por familia. Los alcaldes de la citada comarca aseguran que la capacidad de reciclado de las familias es elevada y para demostrarlo a la Administración han encargado un estudio a un grupo de expertos estadísticos. Según la Administración sólo será rentable la instalación del ecoparque si la cantidad media de reciclado mensual por familia es al menos de 12 kg. Para una muestra aleatoria simple de 50 familias de la Ribera, se obtuvo que la media de reciclado mensual es de 11'8 kg. con una desviación típica de 0'7 kg. Con un nivel de significación del 1%, ¿puede aceptarse la rentabilidad del ecoparque?

4.7 EJERCICIO PROPUESTO 8.3 libro p.357 Una de las acciones que realiza la Inspección Fiscal de una Delegación de Hacienda en la lucha contra el fraude, consiste en la investigación de una muestra aleatoria de declaraciones del I.R.P.F. En el último ejercicio fiscal se seleccionaron 1.000

Page 19: Cuadernillo Problemas

18

declaraciones y se detectó que se había efectuado fraude en 100 de ellas. Si el Ministerio afirmara que la proporción de declaraciones con fraude, a escala nacional, no supera el 15%, ¿sería válida esta afirmación para la Delegación? 4.8 Se sospecha que una empresa multinacional practica una política de discriminación salarial respecto a sus empleadas. Un sindicato ha seleccionado dos muestras aleatorias del salario mensual de 300 trabajadores y de 250 trabajadoras de la empresa. Para los primeros se ha obtenido un salario mensual medio de 1050 € y una desviación típica de 450 €, mientras que para las segundas estos valores han sido de 921 € y 350 €, respectivamente. A partir de esta información, se pide: a) Contrastar la hipótesis de que en esa empresa no hay discriminación salarial por género, es decir, que no hay diferencias en los salarios mensuales medios de los trabajadores y las trabajadoras, para un nivel de significación del 1%. b) ¿Qué ocurriría si la hipótesis alternativa del contraste fuera que "el salario medio de los empleados es superior al de las empleadas", para un nivel de significación del 1%?

4.9 De una muestra aleatoria de 1.200 ciudadanos alemanes, 720 mostraron una actitud positiva hacia el Tratado de Lisboa. De una muestra aleatoria independiente de 1.000 ciudadanos franceses, 625 mostraron una actitud positiva hacia este mismo tratado. a) Un estudio publicado por una revista alemana afirma que el porcentaje de alemanes a favor del Tratado de Lisboa es superior o igual al 62,5%. ¿Podemos aceptar esta hipótesis nula en base a los datos de la muestra con un nivel de significación del 4%? b) Contrastar, al nivel de significación del 3%, la hipótesis nula que la proporción de alemanes a favor del Tratado de Lisboa no supera a la proporción de ciudadanos franceses.

4.10 Se sabe que las notas obtenidas por los alumnos del grado de ADE en una asignatura de Estadística en dos Universidades X e Y siguen una distribución Normal. Obtenidas dos muestras aleatorias e independientes de las notas de dicha asignatura y titulación en X e Y, de tamaños n1=101 y n2=120, respectivamente, se han obtenido los siguientes resultados:

4S;5'6Y;9S;7X 2Y

2X ====

a) Contrastar la hipótesis de que 102X ≥σ frente a la alternativa de

que 102X <σ , con un nivel de significación del 5%.

b) Contrastar la hipótesis de que las notas medias son iguales en ambas ciudades con un nivel de significación del 1%.

Page 20: Cuadernillo Problemas

19

4.11 La UVEG está interesada en analizar el porcentaje de apoyo de los estudiantes de las Facultades de Economía y de Sociales al proceso de Bolonia. Para ello, se han seleccionado sendas muestras aleatorias de estudiantes de cada una de las Facultades, obteniendo los siguientes resultados:

Facultad Tamaño Muestra

Nº estudiantes a favor del proceso de Bolonia

Economía 150 60 Sociales 100 35

a) Contrasta, para un nivel de significación del 3%, la hipótesis nula de que el porcentaje de apoyo de los estudiantes al proceso de Bolonia es el mismo en ambas Facultades.

b) Para los estudiantes de la Facultad de Sociales, contrasta, para un nivel de significación del 5%, la hipótesis nula de que el porcentaje de apoyo al proceso de Bolonia no supera el 30%.

En ambos apartados indica el tipo de contraste, así como las hipótesis a contrastar

4.12 Con el fin establecer si existen o no diferencias importantes en los precios de productos alimenticios según si estamos en una zona rural o una zona urbana, se ha confeccionado una cesta de la compra y se ha procedido a calcular el precio total de la misma en distintos comercios de productos de alimentación. En primer lugar se han seleccionado aleatoriamente 50 establecimientos ubicados en zonas urbanas y otros 45 en zonas rurales. El importe total de esta cesta de la compra en los establecimientos de las zonas urbanas da como resultado un valor medio de 175 € con una desviación típica de 55 €, mientras que en las zonas rurales estas cantidades son 143 € y 64 €, respectivamente. ¿Podría aceptarse, para un nivel de significación del 5%, que la diferencia de importes totales medios entre las zonas urbanas y las zonas rurales es al menos de 30 €?

4.13 Una empresa ofrece un servicio individual de traslado desde el centro de la ciudad al aeropuerto. La empresa considera dos rutas alternativas: una por la carretera C25 y otra por la autopista A21. Esta empresa midió los tiempos empleados en 7 traslados por la C25 y en 8 traslados por las A21, seleccionados al azar, obteniendo los siguientes resultados para esos datos muestrales:

Ruta Tamaño Muestra

Tiempo medio empleado por traslado en minutos

Desviación típica en minutos

C25 7 58,29 8,33 A21 8 59 4,09

Suponiendo que el tiempo empleado en un traslado al aeropuerto por cada una de las dos rutas sigue una distribución Normal, contrastar para un nivel de significación del 10% la hipótesis de que no hay diferencias en la variación (varianzas) del tiempo de traslado al aeropuerto de las dos rutas.

Page 21: Cuadernillo Problemas

20

Guía para los Ejercicios del Tema 4: Contrastes de Hipótesis Paramétricos

1) Define la variable aleatoria que representa a la Población e indica su distribución de probabilidad (en caso de que se conozca) y sus principales características o parámetros (media y varianza o desviación típica) indicando si estas características poblacionales son o no conocidas. Haz lo mismo, en el caso de que se considere una segunda población, independiente de la anterior.

Población 1: Población 2: (sólo si hay otra población)

2) Escribe los datos de la muestra aleatoria simple (m.a.s.), el tamaño de la muestra, el estadístico o estadísticos muestrales que se consideran en el problema y el valor que toman. Haz lo mismo, en el caso de que se considere una segunda muestra seleccionada de la segunda población.

Muestra aleatoria simple 1 Muestra aleatoria simple 2: (sólo si hay otra muestra)

(x1,x2,….,xn)

3) Formula las hipótesis a contrastar: H0 y H1 e indica el tipo de contraste.

4) Indica la expresión (bajo H0 cierta) del estadístico muestral del test que se va a utilizar para resolver el contraste, justificando su elección, así como su distribución de probabilidad.

5) Calcula el valor del estadístico muestral.

6) Indica la regla de decisión del test utilizado: indicando la región de aceptación y la región crítica o de rechazo de la Ho para el nivel de significación fijado α y sitúalas gráficamente.

7) En base a los resultados obtenidos en 5) y 6) toma una decisión respecto a la Ho para el nivel de significación fijado α

8) Calcula el nivel de significación crítico (o valor p), en caso de que se pida, y valora en base al valor obtenido (y desde una perspectiva más general) cuál es la decisión más conveniente a tomar respecto a la Ho.

Page 22: Cuadernillo Problemas

21

TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS

5.1 En una empresa se sabe que, históricamente, el 35% de los candidatos a los puestos de dirección son licenciados en Derecho, el 30% en Económicas, el 20% en Ingeniería, el 10% en Sociología y el 5% en Psicología. De una muestra aleatoria de 200 candidatos que se han presentado este año, 68 eran licenciados en Derecho, 54 en Económicas, 48 en Ingeniería, 23 en Sociología y 7 en Psicología. Contrastar la hipótesis nula, con un nivel de significación del 5%, que los candidatos de este año han seguido el mismo patrón que en años anteriores. Indicar el tipo de contraste, así como las hipótesis a contrastar. 5.2 En una encuesta a una muestra aleatoria de 90 fumadores que manifestaron su intención de dejar de fumar, se les preguntó por el número de veces que hasta el momento lo habían intentado. Los resultados fueron los siguientes:

nº de intentos fumadores 0 12 1 27 2 21 ≥3 30

¿Se puede aceptar un modelo Poisson de media igual a 2 para la variable aleatoria “número de intentos para dejar de fumar”?

5.3 EJERCICIO 9.1.4 libro p.366

En un municipio se ha seleccionado de forma aleatoria una muestra de 150 familias en las que se ha investigado la renta declarada en el último periodo impositivo. Los datos se presentan en la siguiente tabla:

Renta (en euros) Familias Probabilidades Esperadas

Menos de 14.500 12 0,0336 14.500-17.000 36 0,0956 17.000-22.000 63 0,4811 22.000-27.500 36 0,3561 Más de 27.500 3 0,0336

Estudios realizados a nivel provincial muestran que la renta familiar declarada está bien representada por una distribución Normal, con media 21.000 euros y desviación típica de 3.550 euros. Con la información proporcionada por la muestra anterior, ¿se puede aceptar el modelo

Page 23: Cuadernillo Problemas

22

propuesto para la distribución de la renta declarada por las familias en el municipio objeto de estudio?

5.4 Para ciertos trabajadores de la Comunidad Valenciana, elegidos al azar, se dispone de información sobre el nivel de estudios alcanzado y el sector de actividad de la empresa para la que trabajan. Dicha información se presenta en la siguiente tabla:

Sin estudios Primarios secundarios Universitarios construcción 50 100 40 10 Servicios 10 30 80 30

a) Contrastar la hipótesis de que no existe relación alguna entre el nivel de estudios alcanzado por los trabajadores y su sector de actividad. Indicar qué supuestos respecto a la obtención de esos datos muestrales hay que considerar y qué hipótesis hay que plantear.

b) Volver a plantear el apartado anterior si ahora lo que se pretende es contrastar la hipótesis de que no existen diferencias significativas entre los trabajadores del sector de la construcción y los trabajadores del sector servicios respecto al nivel de estudios alcanzado.

5.5 Una fábrica de grandes electrodomésticos desea analizar la demanda de determinado producto que es comercializado con dos marcas distintas. Con tal fin se selecciona una muestra de 200 compradores del producto a los que se les pregunta por la marca elegida y el grado de satisfacción con el mismo. Los resultados obtenidos se muestran en la siguiente tabla:

Muy satisfecho Satisfecho Insatisfecho 1ª marca 35 70 15 2ª marca 12 50 18

a) A partir de la información anterior, ¿puede aceptarse que la marca con la que se comercializa el producto no influye en el grado de satisfacción del cliente? Especifíquense claramente las hipótesis a contrastar. Indicar el tipo de contraste, así como las hipótesis a contrastar. b) Considerando el total de compradores, ¿podría aceptarse que la proporción de los que están satisfechos es el doble de la proporción de los que están muy satisfechos y que el 15% están insatisfechos? 5.6 El gobierno municipal de una determinada localidad va a realizar una campaña publicitaria en televisión con el fin de fomentar entre los jóvenes actividades culturales y deportivas para el tiempo libre. Dicha campaña consta de dos anuncios diferentes y, antes de su lanzamiento, se exhiben por separado a grupos de jóvenes para valorar su impacto. Cada persona sólo ve uno de los dos anuncios y después emite su opinión en el sentido de si está a favor de su emisión, si es indiferente o si está en contra. Los resultados son:

Page 24: Cuadernillo Problemas

23

A favor Indiferente En contra

Anuncio A 80 20 50 Anuncio B 75 15 60

a) ¿Existe alguna evidencia de que las distribuciones de opinión son diferentes para cada anuncio?

b) Un experto ha publicado en prensa que ante campañas de este tipo, el porcentaje de jóvenes que se muestran a favor de la emisión es el mismo porcentaje que el de los que se muestran en contra, resultándole indiferente al restante 10%. Considerando los resultados anteriores, ¿es posible aceptar para algún nivel de significación esta distribución de porcentajes para la opinión de los jóvenes en el conjunto de los dos anuncios que conforman la campaña publicitaria?

5.7 En una encuesta reciente del CIS se ha clasificado a 1000 ciudadanos adultos seleccionados al azar según su nivel de estudios y según su estatus socioeconómico o clase social. Los resultados obtenidos se muestran en la siguiente tabla:

Clase social Nivel de estudios

Clase alta/media-alta

Clases medias Obreros

Primarios o sin estudios 23 204 318

Secundarios 37 132 106

Universitarios 110 52 18 a) En base a la información anterior, indicar si para algún nivel de significación puede aceptarse que la clase social de los individuos no está relacionada con su nivel educativo. Indicar el tipo de contraste, así como las hipótesis a contrastar. b) En base a la tabla anterior pero considerando únicamente a los universitarios, ¿a partir de qué nivel de significación puede rechazarse la hipótesis de que el 60% pertenece a la clase alta o media alta, el 30% a las clases medias y el resto a la clase obrera? Basándote en ese resultado, razona qué decisión (aceptar o rechazar la hipótesis nula) sería la más conveniente a tomar. Indicar el tipo de contraste, así como las hipótesis a contrastar

Page 25: Cuadernillo Problemas

24

Guía para los Ejercicios del Tema 5: Contrastes de Hipótesis No Paramétricos

1) Define la o las variables aleatorias que representan a la Población o a las Poblaciones.

2) Indica los supuestos de partida respecto a la o a las muestras aleatorias (por ejemplo una muestra clasificada respecto a las k categorías de la variable categórica ). 3) Formula las hipótesis a contrastar: H0 y H1 e indica el tipo de contraste.

4) Indica la expresión (bajo H0 cierta) del estadístico del test que se va a utilizar para resolver el contraste, así como su distribución de probabilidad. (Por ejemplo expresión del estadístico Q del test de la chi-Cuadrado).

5) Calcula el valor del estadístico del test.

6) Indica la regla de decisión del test utilizado: indicando la región de aceptación y la región crítica o de rechazo de la Ho para el nivel de significación fijado α y sitúalas gráficamente.

7) En base a los resultados obtenidos en 5) y 6) toma una decisión respecto a la Ho para el nivel de significación fijado α

8) Calcula el nivel de significación crítico (o valor p), en caso de que se pida, y valora en base al valor obtenido (y desde una perspectiva más general) cuál es la decisión más conveniente a tomar respecto a la Ho.