tema1.2problemas_descriptiva
DESCRIPTION
Tema1.2problemas_descriptivaTRANSCRIPT
Exploracion de datos 1
Universidad Politecnica de Cartagena
Dpto. Matematica Aplicada y Estadıstica
Grado en Ingenierıa de Edificacion
Estadıstica Exploracion de datos
Problema 1
El Instituto Nacional de Estadıstica proporciona los datos siguientes sobre el crec-
imiento vegetativo, es decir la diferencia entre el numero de nacimientos y defunciones,
en las comunidades autonomas:
Comunidad crecimiento Comunidad crecimiento
Galicia -9865 Ceuta 455
Castilla y Leon -8825 Valencia 543
Asturias -5915 Melilla 599
Aragon -3853 Cataluna 779
Paıs Vasco -2040 Baleares 1230
Cantabria -1332 Murcia 3730
Cast.-La Mancha -837 Canarias 5668
Extremadura -553 Madrid 11152
La Rioja -384 Andalucıa 15489
Navarra 136
1. Calcular la mediana y los cuartiles de estos datos.
2. Realizar el diagrama de cajas y bigotes para estos datos. ¿Para que sirve este
diagrama? ¿Hay datos atıpicos? ¿Que representan estos ultimos?
Problema 2
A continuacion se presentan los diagramas de caja-bigotes para la emision total de
cuatro paises de la Union europea entre 1990 y 1997. ( ES=”Espana”, FR=”Francia”,
GB=”Gran Bretana”, y IT=”Italia”).
2 Exploracion de datos
1. ¿Como se construye un diagrama de caja-bigotes?
2. ¿Como clasificarıa estos cuatro paises en cuanto a contaminacion por CO2?
3. ¿Cual es el paıs que presenta mayor dispersion entre sus datos de contaminacion?
¿Que quiere decir?
Problema 3
En la siguiente tabla estan representados los datos referidos al alquiler pagado mensual-
mente por 45 familias que habitan pisos de alquiler en una determinada ciudad:
Alquiler en euros. Numero de familias
(0 − 150] 5
(150 − 300] 12
(300 − 600] 16
(600 − 900] 10
(900 − 1200] 2
Se pide:
Exploracion de datos 3
1. Representar graficamente la variable mediante un histograma. ¿Cuales son las car-
acterısticas de dicho histograma? ¿Que medidas de centralizacion y dispersion son
mas adecuadas para resumir los datos? Razonar la respuesta.
2. Calcular el alquiler medio pagado por las familias analizadas. ¿En que intervalo se
situa la mediana? ¿Cual es el intervalo modal?
3. ¿Cual es la proporcion de familias que pagan un alquiler menor o igual a seiscentos
euros?
Problema 4
Con el fin de determinar si existe relacion entre la cantidad de polımeros de latex incluida
durante el proceso de mezclado de cemento Portland y su resistencia adhesiva a tension,
una empresa encargada de realizar certificaciones de obras toma una muestra de tamano
10, obteniendo los siguientes resultados:
Polımeros latex (mgr/kg) 13.5 11.0 13.0 11.2 12.0 13.2 12.0 13.5 11.2 13.0
Resistencia (kgf/cm2) 17.5 16.6 17.2 16.6 17.0 17.3 16.9 17.3 16.8 17.1
(a) Calcular dos medidas de centro y dos medidas de dispersion para cada una de las
dos variables.
(b) Calcular el rango intercuartılico de la variable Resistencia
Problema 5
Se ha aplicado un test sobre capacitacion laboral a 90 empleados de una industria,
obteniendose los siguientes resultados:
PUNTUACIONES N o de EMPLEADOS
[38, 44) 7
[44, 50) 8
[50, 56) 15
[56, 62) 27
[62, 68) 18
[68, 74) 9
[74, 80] 6
Se pide:
4 Exploracion de datos
1. Representar graficamente la variable mediante un histograma. Comentar las car-
acterısticas mas relevantes de dicho histograma. ¿Que medidas de centralizacion y
dispersion son mas adecuadas para resumir los datos? Razona tu respuesta.
2. Calcular la puntuacion media obtenida en el test. ¿En que intervalo se situa la
mediana? ¿Cual es el intervalo modal?
3. ¿Que proporcion de empleados tiene una puntuacion mayor o igual a 62?