semi6
TRANSCRIPT
![Page 1: Semi6](https://reader035.vdocuments.co/reader035/viewer/2022070510/58acba8c1a28abd3048b45c7/html5/thumbnails/1.jpg)
Seminario 6Carmen Vivas López
Grupo 16 Virgen del RocíoEstadística y TICs
![Page 2: Semi6](https://reader035.vdocuments.co/reader035/viewer/2022070510/58acba8c1a28abd3048b45c7/html5/thumbnails/2.jpg)
Primer ejercicio1º) Cambiamos directorio de trabajo, y a continuacion cargar datos “activossalud”. (291 fila y 38 columnas)2º) Seleccionamos dos variables cualitativas-factor del fichero. Seleccionamos distribución de frecuencias.
![Page 3: Semi6](https://reader035.vdocuments.co/reader035/viewer/2022070510/58acba8c1a28abd3048b45c7/html5/thumbnails/3.jpg)
3º) Describo en tablas de frecuencias e interpreto al menos 3 aspectos en relación a la distribución de las mismas.
Botellón:• El 31.58% ( es decir 90
individuos) realizan botellon solo los fines de semana
• 2 o 3 veces al mes seria el 25,61% (N=73)
• Y destaca que 51 individuos el (17,89%) nunca
En cuanto al consumo de cerveza:• Los fines de semana 60
(20,76%)• A diario solo el 1,38% (4)• Nunca 107 individuos
(37.02%)
![Page 4: Semi6](https://reader035.vdocuments.co/reader035/viewer/2022070510/58acba8c1a28abd3048b45c7/html5/thumbnails/4.jpg)
Segundo ejercicio1º) Seleccionamos dos variables numéricas del fichero “activossalud.RData”.
![Page 5: Semi6](https://reader035.vdocuments.co/reader035/viewer/2022070510/58acba8c1a28abd3048b45c7/html5/thumbnails/5.jpg)
2º) Mediante resúmenes numéricos describimos e interpretamos la distribución de las mismas.
Variable “comunicacionfamiliar”Media: 7.829932
Desviación típica: 2.824487La mediana coincide con el 2º cuartil (dejando
a su izqda el 50%), es por tanto: 7Concluimos por tanto que la variable es simétrica, ya que la mediana y la media
presentan valores muy cercanos
Variable “comunicacionpares”Media: 5.393728
Desviación típica: 1.585014La mediana (2ºcuartil): 5
Concluimos también que esta variable es simétrica
![Page 6: Semi6](https://reader035.vdocuments.co/reader035/viewer/2022070510/58acba8c1a28abd3048b45c7/html5/thumbnails/6.jpg)
Tercer ejercicio• Debemos realizar al menos un gráfico de cada
tipo con variables adecuadamente seleccionadas del fichero “activossalud.RData”, describimos e interpretamos la distribución los mismos.
![Page 7: Semi6](https://reader035.vdocuments.co/reader035/viewer/2022070510/58acba8c1a28abd3048b45c7/html5/thumbnails/7.jpg)
Comenzamos con variables cualitativas – factor: 1. Gráficos Gráficos de sectores
a diario
solo los fines de semana2 o 3 veces a la semana
2 o 3 veces al mes
Algunas veces anual
Nunca
botellon(Tenemos en cuenta que los gráficos de sectores no son
útiles cuando la variable tiene múltiples categorías)
- Llama la atención las personas que hacen botellón
(mayoría)Y el mínimo que sería a
diario- El porcentaje de los que
beben algunas veces , 2 o 3 veces al mes y los que nunca
son similares.> with(Datos, pie(table(botellon), labels=levels(botellon), xlab="", ylab="", main="botellon", col=rainbow_hcl(length(levels(botellon)))))
![Page 8: Semi6](https://reader035.vdocuments.co/reader035/viewer/2022070510/58acba8c1a28abd3048b45c7/html5/thumbnails/8.jpg)
2. Gráficos Gráficos de barras
El eje de las ordenadas (Y, vertical) informa de las frecuencias absolutas.- Destaca el porcentaje de personas que nunca beben cerveza (siendo el mayor).
- A diario sería el menor porcentajediario fines de semana 2 o 3 veces semana 2 o 3 veces mes alguna vez nunca
cerveza
Freq
uenc
y
020
4060
8010
0
En eje de las abscisas (X/ horizontal) obtenemos los valores de las 6 variables: diario, fines de semana, 2 o 3 veces semana, 2 o 3 veces mes, alguna vez, nunca.
> with(Datos, Barplot(cerveza, xlab="cerveza", ylab="Frequency"))
![Page 9: Semi6](https://reader035.vdocuments.co/reader035/viewer/2022070510/58acba8c1a28abd3048b45c7/html5/thumbnails/9.jpg)
(También podemos cambiar la gama de colores)
diario fines de semana 2 o 3 veces semana 2 o 3 veces mes alguna vez nunca
cerveza
Freq
uenc
y
020
4060
8010
0
> barplot(table(Datos$cerveza), xlab="cerveza",ylab="Frequency",col=c("red","blue","green","chocolate","yellow","grey"))
![Page 10: Semi6](https://reader035.vdocuments.co/reader035/viewer/2022070510/58acba8c1a28abd3048b45c7/html5/thumbnails/10.jpg)
3. En cuanto a las variables numéricas:Gráficas Histograma de frecuencias
Rectángulos unidos cuya área es proporcional a la frecuencia absoluta del intervalo correspondiente
- La mayor frecuencia es en los individuos con un peso de entre 50 y 60
- Hay un mínimo porcentaje entre los individuos de
> ó =100 y de <40.
peso
frequ
ency
40 60 80 100 120
020
4060
8010
0
![Page 11: Semi6](https://reader035.vdocuments.co/reader035/viewer/2022070510/58acba8c1a28abd3048b45c7/html5/thumbnails/11.jpg)
4. Gráficas Diagrama de cajas (Boxplot)
46
810
com
unic
acio
npar
es
97
103
- Los casos atípicos son observaciones con valores extremos- Diferentes de las restantes observaciones.- A veces, pueden convertirse en observaciones influyentes que distorsionan los resultados (relaciones entre variables, normalidad, etc.)