actividad p2p-parte 1

2
PARTE 1: Genere un breve informe estadístico descriptivo, a partir de la salida de ordenador que se adjunta (tómese el espacio que necesite pero sea breve), en el que señale: 1) el tamaño muestral: podemos apreciar que el tamaño muestral es 25. 2) cuál es la variable con mayor variabilidad: dado que la varianza o desviación típica como medida de dispersión nos indica que cuanto mayor sea la medida de dispersión mayor variabilidad y dispersión tiene la variable, por lo que la variable con un valor mayor tanto en la varianza como en la desviación típica, el alquitrán, es la que mayor variabilidad presenta. 3) cuál de las medias es más representativa de los datos: la media del alquitrán es la más representativa ya que este tiene una deviación típica mayor 4) cuál de las medias es más estable: es el peso puesto que la desviación típica y la varianza es menor. Parte 2. Analice los percentiles a partir de la tabla correspondiente que aparece debajo. Escriba un breve informe con los resultados más relevantes entre los que al menos debe estar la Mediana y el Recorrido intercuartílico (debe calcularlo a partir de la tabla) para todas y cada una de las variables. En el informe compare, además, los resultados obtenidos con la Media y su dispersión y la Mediana y su dispersión. P25=Q1 P50=Q2(Me) P75=Q3 R.I.=Q3-Q1 MONOX. C. 9,7500 130000 15,6500 5,9 ALQUITRAN 7,9000 12,4000 15,1500 7,25 NICOTINA 0,68000 0,90000 1,03000 0,35 PESO 0,920550 0,957300 1,016850 0,0963 En primer lugar seleccionamos el percentil 50 o cuartil 2 para indicar la mediana de cada variable, ya que son lo mismo; al igual que los percentiles 25 y 75 con el cuartil1 y el cuartil 3 respectivamente. Después añadimos el recorrido intercuantílico(R.I) de cada variable que se calcula con la formula R.I= Q3-Q1, es decir, el

Upload: luis-miguel-cabrera-g

Post on 15-Nov-2015

6 views

Category:

Documents


0 download

DESCRIPTION

p2p

TRANSCRIPT

PARTE 1: Genere un breve informe estadstico descriptivo, a partir de la salida de ordenador que se adjunta (tmese el espacio que necesite pero sea breve), en el que seale: 1) el tamao muestral: podemos apreciar que el tamao muestral es 25. 2) cul es la variable con mayor variabilidad: dado que la varianza o desviacin tpica como medida de dispersin nos indica que cuanto mayor sea la medida de dispersin mayor variabilidad y dispersin tiene la variable, por lo que la variable con un valor mayor tanto en la varianza como en la desviacin tpica, el alquitrn, es la que mayor variabilidad presenta. 3) cul de las medias es ms representativa de los datos: la media del alquitrn es la ms representativa ya que este tiene una deviacin tpica mayor 4) cul de las medias es ms estable: es el peso puesto que la desviacin tpica y la varianza es menor.Parte 2. Analice los percentiles a partir de la tabla correspondiente que aparece debajo. Escriba un breve informe con los resultados ms relevantes entre los que al menos debe estar la Mediana y el Recorrido intercuartlico (debe calcularlo a partir de la tabla) para todas y cada una de las variables. En el informe compare, adems, los resultados obtenidos con la Media y su dispersin y la Mediana y su dispersin.P25=Q1P50=Q2(Me)P75=Q3R.I.=Q3-Q1

MONOX. C.9,750013000015,65005,9

ALQUITRAN7,900012,400015,15007,25

NICOTINA0,680000,900001,030000,35

PESO0,9205500,9573001,0168500,0963

En primer lugar seleccionamos el percentil 50 o cuartil 2 para indicar la mediana de cada variable, ya que son lo mismo; al igual que los percentiles 25 y 75 con el cuartil1 y el cuartil 3 respectivamente.Despus aadimos el recorrido intercuantlico(R.I) de cada variable que se calcula con la formula R.I= Q3-Q1, es decir, el recorrido intercuantilico es el resultado de la resta del cuartil 1 o percentil 25 al cuartil 3 o percentil 75.En cuanto a la comparacin de la media y su dispersin y la mediana y su dispersin:MEDIAMEDIANA

MONX. C.0,09702840,90000

ALQUITRAN11,816013,0000

NICOTINA0,8760012,4000

PESO12,52800,957300

Dadas estas medidas de centralizacin que nos resumen todas las mediciones, tratando de ubicar la centralizacin, fijndonos en el recorrido intercuantilico, el cual el del peso es menor lo que nos indica que tienen menos dispersin y por el contrario, la nicotina presenta mayor recorrido intercuantilico por lo que presenta mayor dispersin.

Parte 3. Analice los Box plot(diagramas de caja) que se adjuntan y saque las conclusiones ms relevantes. Debe escribir, al menos, sobre la posible asimetra y la existencia, o no, de outliers Dados y observados los Box-Plot de todas las variables podemos interpretar que en ninguna de las variables la mediana (p50 que parte la caja en dos) se sita justo en el centro por lo que estas se alejan de la tpica campaa de Gauss, es decir, que ninguna presenta simetra de la distribucin, lo que tambin se pueda apreciar en la desigualdad de los bigotes de cada caja. Pero se puede decir que las menos dispersas son los box-plot de las variables peso del cigarro y nicotina por que el tamao de la caja es ms pequeo por lo que tienen menor variabilidad.Se da la presencia de outliers, datos que salen fuera de las cajas que son valores que no coinciden con lo normal, en todos los box-plot. En los box-plot de nicotina y peso del cigarro, en los cuales hay menor variabilidad se presentan dos outlier, uno por encima del bigote superior y otro por debajo del bigote inferior; y en los box-plot de monxido y alquitrn solo aparecen un outlier por debajo del bigote inferior y otro por encima del bigote superior, respectivamente.