seminario vi
TRANSCRIPT
![Page 1: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/1.jpg)
Seminario VI: Variables, tablas de frecuencia y gráficas.CELIA GÁLVEZ LÓPEZ
![Page 2: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/2.jpg)
Ejercicio 1:
Selecciona dos variables cualitativas-factor del fichero “activossalud.RData”, descríbelas en tablas de frecuencias e interpreta al menos 3 aspectos en relación a la distribución de las mismas.
![Page 3: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/3.jpg)
En primer lugar carguemos los datos a R, en este caso están en formato R y por tanto le daremos a “Datos”, “Cargar conjunto de datos” y seleccionamos “activossalud2”.
![Page 4: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/4.jpg)
Para buscar las distribuciones de varias frecuencias de los datos cualitativos nos dirigimos a “Estadísticas”, “Resúmenes” y “Distribución de frecuencias”. En nuestro caso vamos a elegir la variable “botellón” y “cerveza”.
![Page 5: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/5.jpg)
Botellón.• Podemos observar como un 82,1% (234
individuos) han realizado botellón alguna vez en su vida, frente a un 17,9% (51 individuos) que no lo han hecho nunca.
• Lo más frecuente (moda) sería hacerlo durante los fines de semana con un 31,58% de los individuos.
Cerveza.• En este caso el porcentaje disminuye y es un
62,98$ (182 individuos) han bebido cerveza alguna vez, frente a un 37,02% (107 individuos) que no lo han hecho nunca.
• También en este caso lo más frecuente (moda) cambia y esel porcentaje de individuos que no ha bebido cerveza nunca lo que predomina 37,02%.
![Page 6: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/6.jpg)
Ejercicio 2
Selecciona dos variables numéricas del fichero “activossalud.RData”, y mediante resúmenes numéricos describe e interpreta la distribución de las mismas.
![Page 7: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/7.jpg)
Para este ejercicio nos dirigimos a “Estadísticos”, “Resúmenes”, “Resúmenes numéricos” y ahí elegimos las variables que deseemos, en nuestro caso “altura” y “horapracticadeportiva”
![Page 8: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/8.jpg)
Altura• La media es 1.667 y la desviación típica es de
0.08. Esto quiere decir que los valores de altura están entre 1.58 y 1.75.
• La mediana coincide con el segundo cuartil que en este caso sería 1.665.
• Esta variable es simétrica puesto que la media y la mediana tiene valores semejantes.
Hora practica deportiva• Tiene una media de 2.482759 cuya desviación
típica es de 3.138616.• La mediana coincide con el segundo cuartil, en
este caso la mediana sería 2.• Esta variable es simétrica puesto que la media y
la mediana tienen valores semejantes.
![Page 9: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/9.jpg)
Ejercicio 3
Debes realizar al menos un gráfico de cada tipo con variables adecuadamente seleccionadas del fichero, describe e interpreta la distribución los mismos.
![Page 10: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/10.jpg)
Para las variables cualitativas-factor tenemos el gráfico de barras y el gráfico de sectores. Vamos a realizar un gráfico de barras. Para ello vamos a “Gráficas”, “Gráfica de barras” y seleccionamos la variable que queremos, en nuestro caso “hachis”.
![Page 11: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/11.jpg)
Podemos interpretar que la mayoría nunca ha fumado hachis y que el valor menos significativo lo hace los fines de semana.
![Page 12: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/12.jpg)
En siguiente lugar vamos a realizar un gráfico de sectores, para ello le damos a “Gráficos”, ·”Gráficos de sectores” y en la ventana emergente podemos ponerle título al gráfico en nuestro caso
![Page 13: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/13.jpg)
En esta gráfica predominan el consumir dulces 1 o 2 veces en semana y el consumirlos menos de una vez en semana. Frente al dato menos representado que sería el de consumir dulces todos los días
![Page 14: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/14.jpg)
Para variables numéricas utilizamos el histograma y el diagrama de cajas. Comenzaremos con el histograma. Para ello le damos a “Gráficas” e “Histograma” y una vez ahí elegimos la variable que queramos, en mi caso “edad”.
![Page 15: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/15.jpg)
Tiene una distribución asimétrica centrada a la izquierda. El porcentaje más elevado de individuos se encuentran con un peso entre
50-60kg Muy pocos individuos tienen menos de 40kg o superan los 100kg
![Page 16: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/16.jpg)
Para el diagrama de cajas vamos a “Gráficos”, “Diagrama de cajas” y seleccionamos la variable deseada que será “medicalización”.
![Page 17: Seminario vi](https://reader035.vdocuments.co/reader035/viewer/2022070601/58889feb1a28ab264b8b5b37/html5/thumbnails/17.jpg)
Podemos decir que esta variable es simétrica puesto que la media y la mediana coinciden y los datos se distribuyen de igual forma a ambos lados.