tarea 1 estadistica para ing. ambiental

34
UNIVERSIDAD AUTONOMA DE CIUDAD JUAREZ Maestría En Ingeniería Ambiental Judith Cecilia Herrera Portillo Matricula: 144846 Estadística para Ingeniería Ambiental

Upload: judith-thatcher-herrera

Post on 18-Jan-2016

43 views

Category:

Documents


2 download

TRANSCRIPT

Reporte Final de Actividades del Proyecto Curso Taller de Instalaciones y Uso Eficiente de la Energa

UNIVERSIDAD AUTONOMA DE CIUDAD JUAREZ Maestra En Ingeniera AmbientalJudith Cecilia Herrera PortilloMatricula: 144846Estadstica para Ingeniera AmbientalTarea 1A 16 de Febrero de 2015Problemas de Estadstica. 1.8. En aplicaciones de tecnologas del agua, se saca una muestra aleatoria de concentraciones de sulfatos (SO4-) de una laguna de estabilizacin usada en la degradacin de las aguas negras procedentes de un poblado en particular. Usando el programa de computadora Minitab, EXCEL o una calculadora de bolsillo, encontrar:(a) La media aritmtica 92 (b) La desviacin estndar 19.56 (c) La varianza 382.70(d) El sesgo -0.014103 (e) La mediana 91.50(f) Es simtrica la distribucin de los datos? Justificar el argumento. Se considera simtrica dado que para que exista un sesgo el dato del mismo debe estar en 1 o -1 y en este problema en particular el sesgo tiende a cero as que es considerada como distribucin simtrica. Tabla mostrando los datos de este ejercicio.Concentraciones de sulfatosCont.Cont..

6286102

6885105

7087110

5490112

7493114

7696118

7898120

8299129

Nota: El sulfato es un polianin que tiene la frmula qumica SO4-2. Los sulfatos llegan al agua del subsuelo, debido a que el agua lo absorbe de las rocas. Adems, otras fuentes de sulfatos ocurren por la contaminacin de las minas, basureros, alcantarillas, etc. Las concentraciones lmites de sulfatos en el agua potable son de menos que 250 partes por milln (ppm). Niveles arriba de 600 ppm tienen efectos laxantes y causan diarrea.

1.11 Los datos de una muestra aleatoria de nitrgeno orgnico de las aguas de un ro se sealan en la tabla de abajo: Nitrgeno orgnico (mg/L)Nitrgeno orgnico (mg/L).

85.066.0

93.063.0

75.053.0

79.058.0

70.043.4

Contestar las siguientes preguntas:(a) Tienen los datos una distribucin oblicua hacia la derecha o hacia la izquierda? Justificar el argumento usando la relacin del promedio, la mediana y la moda. (b) Cul es el valor de la kurtosis? Es la kurtosis mesokurtica, leptokurtica o platikurtica?-0.019807 Observando la grfica y el dato es una kurtosis platikurtica ya que su campana no es muy alargada sino ms bien apachurrada, esto quiere decir que su kurtosis tiende a ser negativa.

1.13. La tabla de abajo describe las mediciones de 48 resultados de anlisis de una muestra aleatoria de oxgeno disuelto (O.D.), en una corriente de agua. Estimar todo lo concerniente a la estadstica descriptiva, es decir, el promedio aritmtico, la desviacin estndar, el error estndar del promedio, el intervalo de confianza para la moda, la mediana y la desviacin estndar, el valor de la mediana, la moda, el primer cuartil, el diagrama de caja, histograma, etc.Tabla mostrando los datos del problema.

Oxgeno disueltoFrecuencia

755

785

792

822

865

913

945

982

1024

1063

1104

1142

1181

1223

1262

Nota: El oxgeno disuelto (O.D.) es muy necesario para la flora y la fauna acutica. Las fuentes de O.D. pueden ser asociadas con la corrosividad del agua, actividad fotosinttica (fotosntesis de las plantas) y septicidad. La prueba del O.D. se usa en la determinacin de la demanda bioqumica de oxgenoDescriptive Statistics: Oxigeno disuelto X

TotalVariable Count N N* CumN Percent CumPct Mean SE MeanOxigeno disuelto X 48 48 0 48 100 100 95.54 2.27

Sum ofVariable TrMean StDev Variance CoefVar Sum SquaresOxigeno disuelto X 95.09 15.69 246.30 16.43 4586.00 449730.00

Variable Minimum Q1 Median Q3 Maximum Range IQROxigeno disuelto X 75.00 79.75 94.00 109.00 126.00 51.00 29.25

N forVariable Mode Mode Skewness Kurtosis MSSDOxigeno disuelto X 75, 78, 86, 94 5 0.37 -1.00 2.10

1.15. Se saca una muestra aleatoria y se hacen anlisis qumicos de bromuros (Br-) expresados en unidades de mg/L procedentes de una muestra de aguas residuales. Estos anlisis se hicieron usando el mtodo de nitrato de mercurio descrito en textos de qumica ambiental. La tabla con los valores de los bromuros se da abajo:Tabla mostrando de los anlisis de los bromuros de este problema, en unidades de mg/L.

Mediciones de (Br-) (mg/L)Mediciones de (Br-) (mg/L)

17.216.9

17.117.0

17.017.1

17.117.3

16.917.2

17.017.4

17.117.1

17.017.1

17.317.0

17.217.1

(a) Encontrar la media aritmtica, la varianza y la desviacin estndar. (b) Encontrar el rango intercuartil. 0.500 (c) Hacer un histograma de frecuencia.

(d) Encontrar el coeficiente de variacin. Sugerencia: usar la relacin Coeficiente de variacin (expresado en %) = V = s/ 0.77 77% (e) Qu tanta simetra hay en esta distribucin? (f) Encontrar el primer cuartil, el segundo cuartil, el tercer cuartil. Q1 17.000, Q2 17.100, Q3 17.200

Descriptive Statistics: Mediciones de (Br-) (mg/L)

TotalVariable Count N N* CumN Percent CumPct Mean SE MeanMediciones de (Br-) (mg/ 20 20 0 20 100 100 17.105 0.0294

Sum ofVariable TrMean StDev Variance CoefVar Sum SquaresMediciones de (Br-) (mg/ 17.100 0.132 0.0173 0.77 342.100 5851.950

Variable Minimum Q1 Median Q3 Maximum RangeMediciones de (Br-) (mg/ 16.900 17.000 17.100 17.200 17.400 0.500

N forVariable IQR Mode Mode Skewness Kurtosis MSSDMediciones de (Br-) (mg/ 0.200 17.1 7 0.51 0.03 0.0134

1.17. Se da la tabla de abajo con las siguientes mediciones de slidos suspendidos totales (SST) con el propsito de hacer una estadstica descriptiva y grficas de frecuencia relativa acumulada y de densidad, tcnicas de diagramas de tallo y hoja y as sucesivamente. La tabla de abajo muestra los datos. Para esto proceder de la siguiente manera:

Tabla mostrando los datos de los slidos supendidos totales (SST).

Slidos totales suspendidos (SST)Cont.Cont.Cont.Cont.

253.0182.0221.089.7101.0

173.4132.0158.095.6126.5

117.0162.0135.084.1142.8

191.2212.9124.4135.120.2

151.4155.968.9123.2119.0

(a) Hacer un resumen de estadstica descriptiva usando el programa Minitab. Descriptive Statistics: (SST) Varb. X

TotalVariable Count N N* CumN Percent CumPct Mean SE Mean TrMean(SST) Varb. X 25 25 0 25 100 100 139.0 10.1 139.2

Sum ofVariable StDev Variance CoefVar Sum Squares Minimum Q1(SST) Varb. X 50.7 2569.4 36.46 3475.3 544773.4 20.2 109.0

N forVariable Median Q3 Maximum Range IQR Mode Mode Skewness(SST) Varb. X 135.0 167.7 253.0 232.8 58.7 * 0 0.09

Variable Kurtosis MSSD(SST) Varb. X 0.65 1422.0

(b) Hacer un diagrama de caja sealando los valores extrnsecos. Hacer un diagrama de caja.

El valor extrnseco es el dato 20.2(c) Hacer una grfica de frecuencia relativa acumulada y estimar el nmero de observaciones que caen arriba y abajo del primer cuartil y del tercer cuartil. 6 datos son los que caen por debajo del primer cuartil y 6 del tercer cuartil.

1.25. Este es un ejercicio de hidrologa, el cual est relacionado con las medias de los flujos anuales (m3/seg) de cierto ro, por un periodo de 55 aos. La tabla de abajo muestra la informacin requerida para este ejercicio. Siendo as, hacer una estadstica descriptiva que incluya lo siguiente:(a) La media, la mediana, y el error estndar de la media.(b) La varianza, la desviacin estndar, el rango, el coeficiente de variacin(c) El sesgo, la kurtosis.(d) El primer cuartil, el segundo cuartil, el tercer cuartil, el rango intercuartlico.(e) Hacer un histograma con los datos.(f) Hacer un diagrama de tallo y hoja. (g) Hacer un diagrama de caja. Identificar los valores extrnsecosTabla mostrando los datos.Flujo de agua (m3/s)Cont.Cont.Cont.Cont.

20302320257020301520

17503140600031704010

14703170175085502460

20302880246020303340

27402740189018902460

23802170430047202460

11805710345021202320

16202170260033102460

20302170260021703220

50103310246031703221

232046003360

Descriptive Statistics: Flujo de agua (m3/s) Varb. X

TotalVariable Count N N* CumN Percent CumPct Mean SE MeanFlujo de agua (m3/s) Var 53 53 0 53 100 100 2887 178

Sum ofVariable TrMean StDev Variance CoefVar Sum SquaresFlujo de agua (m3/s) Var 2736 1296 1679411 44.89 153011 529072141

Variable Minimum Q1 Median Q3 Maximum Range IQRFlujo de agua (m3/s) Var 1180 2075 2460 3266 8550 7370 1191

N forVariable Mode Mode Skewness Kurtosis MSSDFlujo de agua (m3/s) Var 2460 6 2.17 6.47 1899320

DIAGRAMA TALLO-HOJAStem-and-Leaf Display: Flujo de agua (m3/s) Varb. X

Stem-and-leaf of Flujo de agua (m3/s) Varb. X N = 53Leaf Unit = 100

2 1 14 8 1 567788(20) 2 00000111113333444444 25 2 566778 19 3 11112233334 8 3 8 4 03 6 4 67 4 5 0 3 5 7 2 6 0 1 6 1 7 1 7 1 8 1 8 5

1. En aplicaciones de tecnologas del agua, se saca una muestra aleatoria de concentraciones de fosfatos de una laguna de estabilizacin usada en la degradacin de las aguas negras procedentes de un poblado en particular. Usando el programa de computadora Minitab, EXCEL o una calculadora de bolsillo, encontrar:(a) La media aritmtica 93.29 (b) La desviacin estndar 14.69 (c) La varianza 215.73 (d) El sesgo -0.09641 (e) La mediana 94.00 (f) Es simtrica la distribucin de los datos? Se considera simtrica, dado que el sesgo no se acerca ni al -0.1 tiende ms a cero. Justificar el argumento. Tabla mostrando los datos del problema. Concentraciones de fosfatos (X) Frecuencia

704

742

781

823

862

904

943

982

1024

1063

1101

1144

1181

__________________________

Descriptive Statistics: Concentraciones de fosfatos (X)

TotalVariable Count N N* CumN Percent CumPct Mean SE MeanConcentraciones de fosfa 34 34 0 34 100 100 93.29 2.52

Sum ofVariable TrMean StDev Variance CoefVar Sum SquaresConcentraciones de fosfa 93.33 14.69 215.73 15.74 3172.00 303048.00

Variable Minimum Q1 Median Q3 Maximum Range IQRConcentraciones de fosfa 70.00 82.00 94.00 106.00 118.00 48.00 24.00

N forVariable Mode Mode Skewness Kurtosis MSSDConcentraciones de fosfa 70, 90, 102, 114 4 -0.10 -1.07 2.91

2. La tabla de abajo describe las mediciones de 48 resultados de anlisis de una muestra aleatoria de oxgeno disuelto (O.D.), en el agua de una corriente. Estimar todo lo concerniente a la estadstica descriptiva, es decir, el promedio aritmtico, la desviacin estndar, el error estndar del promedio, el intervalo de confianza para la moda, la mediana y la desviacin estndar, el valor de la mediana, la moda, el primer cuartil, el diagrama de caja, histograma, etc.Tabla mostrando los datos del problema. __________________________________________________________________________Mediciones de | 75 78 79 82 86 91 94 98 102 106 110 114 118 122 126Oxgeno disuelto (X)Frecuencia (Y) | 5 5 2 2 5 3 5 2 4 3 4 2 1 3 2

Summary for Med. Oxigeno Disielto(X)

Descriptive Statistics: Med. Oxigeno Disielto(X)

TotalVariable Count N N* CumN Percent CumPct Mean SE MeanMed. Oxigeno Disielto(X) 48 48 0 48 100 100 95.54 2.27

Sum ofVariable TrMean StDev Variance CoefVar Sum SquaresMed. Oxigeno Disielto(X) 95.09 15.69 246.30 16.43 4586.00 449730.00

Variable Minimum Q1 Median Q3 Maximum Range IQRMed. Oxigeno Disielto(X) 75.00 79.75 94.00 109.00 126.00 51.00 29.25

N forVariable Mode Mode Skewness Kurtosis MSSDMed. Oxigeno Disielto(X) 75, 78, 86, 94 5 0.37 -1.00 2.10

3. Este es un estudio de conductividad hidrulica adaptado del texto Applied Hydrogeology de C. W. Fetter. En este ejemplo se demuestra que es preferible usar la media geomtrica en lugar de la media aritmtica. Esto se debe a que, los valores de la conductividad hidrulica, muy a menudo varan por ms de dos rdenes de magnitud dentro la misma unidad hidrogeolgica. Por esta razn es mejor usar la media geomtrica que involucra mediciones logartmicas. De esta manera, calcular la media aritmtica y, enseguida, calcular la media geomtrica y comparar los resultados. La tabla de abajo da las mediciones de las conductividades hidrulicas.Tabla mostrando los valores de la conductividad hidrulica (centmetros/segundo)

MEDIA ARITMETICA = 0.03235285714285714 MEDIA GEOMETRICA = 0.00879697123

Creo que si hay una diferencia considerable entre la media aritmtica y la media geomtrica. _____________________ 0.00217 0.02580 0.00255 0.16700 0.00095 0.01800 0.01000___________________

4. Este es un ejercicio de hidrologa con datos reales adaptado del texto de Kottegoda et. al. (1997), el cual est relacionado con los flujos anuales (m3/seg) del Ro Colorado en el Black Canyon, por un periodo de 53 aos. La tabla de abajo muestra la informacin requerida para este ejercicio. Siendo as, hacer una estadstica descriptiva que incluya lo siguiente:(a) La media, la mediana, y el error estndar de la media. Media= 2809.25, error estndar de la media = 179.167, mediana = 2410(b) La varianza, la desviacin estndar, el rango, el coeficiente de variacin(c) El sesgo, la curtosis.(d) El primer cuartil, el segundo cuartil, el tercer cuartel y el rango intercuartlico.(e) Hacer un histograma con los datos.(f) Hacer un diagrama de tallo y hoja. (g) Hacer un diagrama de caja. Identificar los valores extrnsecos

Los datos extrnsecos son 5660, 5950, 8500

Descriptive Statistics: flujos (X)

TotalVariable Count N N* CumN Percent CumPct Mean SE Mean TrMean StDevflujos (X) 53 53 0 53 100 100 2809 179 2654 1304

Sum ofVariable Variance CoefVar Sum Squares Minimum Q1 Median Q3flujos (X) 1701342 46.43 148890 506738300 1130 1980 2410 3215

N forVariable Maximum Range IQR Mode Mode Skewness Kurtosis MSSDflujos (X) 8500 7370 1235 2410 6 2.18 6.43 1893039

Tabla mostrando los datos._________________________________________________Flujos (Cont.) (Cont.) (Cont.)(Cont.)(m3/s)19802270252019801470

17003090595031203960

14203120170085002410

19802830241019803290

26902690184018402410

23302120425046702410

11305660340020702270

15702120255032602410

19802120255021203170

4960326024103120

2270455033101700

Fuente: Kottegoda, N. T., Rosso, R. (2008). Applied Statistics for Civil and Environmental Engineers. Second edition. New York: McGraw-Hill

Stem-and-Leaf Display: flujos (X)

Stem-and-leaf of flujos (X) N = 53Leaf Unit = 100

3 1 144 14 1 57778899999(15) 2 011112223444444 24 2 555668 18 3 0111122234 8 3 9 7 4 2 6 4 569 3 5 3 5 69 1 6 1 6 1 7 1 7 1 81 8 5

5. Supngase que el nmero de huracanes observados en cierta regin del Caribe durante un periodo tienen una media de = 7. Siendo as, calcular lo siguiente:(a) La probabilidad de que ocurran a lo mucho 3 huracanes. X 3 = 0.6472(b) La probabilidad de que ocurran exactamente 4 huracanes.X = 4 = 0.1680(c) La probabilidad de que ocurran cuando menos 3 huracanes. X 3 = 0.3528(d) Hacer grficas sealando las reas o probabilidades para cada uno de los incisos (a)-(c).

6. En estudios del agua, cuando se habla de contaminacin, por la industria del papel y la industria de la pulpa, los tipos de contaminantes arrojados al agua son varios. Para mencionar algunos son los hidrxidos de sodio (NaOH), cido sulfrico (H2SO4), cido clordico (HCl), cianuros (CN-), plomo (Pb), cromo (Cr), etc. De esta manera, supngase que el 50% de los ros de cierta regin industrial del hemisferio norte estn contaminados con descargas de NaOH. Hacer lo siguiente:(a) Si tomamos una muestra aleatoria de tamao n = 34, calcular que exactamente 15 ros estarn contaminados con esta base qumica.

Binomial with n = 34 and p = 0.5

x P(X=x)15 0.108032

P (X=15) = 0.108032

(b) Cuando menos 15 ros estarn contaminados con esa base en una muestra de n = 25.

P(X15) = 0.2122

(c) No ms de 10 ros, pero cuando menos de 5 ros estarn contaminados de una muestra aleatoria de n = 30.

P(5X10) = 0.04934

7. Este es un ejemplo adaptado del libro Estadstica para Ingeniera y Ciencias (2008) de Quevedo et al., relacionado con estudios del agua, el cual afirma que en un estudio de laboratorio bacteriolgico de usos de agua domstica, el 3.0% de las tomas domiciliarias contienen la bacteria E. Coli, en concentraciones arriba del lmite estipulado por las leyes ambientales. Si esta afirmacin es correcta, encontrar la probabilidad de que, el nmero de bacterias E. coli, en una muestra aleatoria de 25 tomas domiciliarias, se encontrar:(a) Ninguna bacteria (b) Cuando menos 10 bacterias(c) Entre 2 y 6 incluso y excluso(d) Ms de 5 pero cuando mucho 8 bacterias(e) Ms de 1, pero menos de 5 bacterias(f) Exactamente 5 bacterias.

8. En una investigacin de usos del agua se estudiaron cientos de industrias que descargan sus residuos a la caera municipal. Sea X el nmero de industrias que no cumplen con las regulaciones ambientales del agua, las cuales estn descargando desechos txicos a la lnea de drenaje, de una muestra al azar de 12 industrias. Si se sabe que el valor de la probabilidad es de p = 0.5, calcular las siguientes probabilidades. Cul es el modelo estadstico ms plausible que se aplica este problema?(a) La probabilidad de que, exactamente, 6 industrias cumplan con los lmites ambientales.(b) La probabilidad de que no ms de 3, cumplan con el reglamento.(c) La probabilidad de que cuando menos 8, lo cumplan.(d) La probabilidad de que menos de 5 industrias cumplan, pero cuando menos 3 si lo cumplan

9. En un estudio de hidrologa relacionada con la precipitacin pluvial del mes de junio, en cierta localidad ocurrieron 8 das de precipitaciones. Para esto, se sac una muestra aleatoria de 10 das y se analizaron los datos de precipitaciones. Responder a lo siguiente:(a) Cul distribucin se est usando?(b) Una vez que se identifique la distribucin del modelo usado calcular lo siguiente:(1) La probabilidad de que ocurran 2 precipitaciones. (2) La probabilidad de que ocurran a lo ms 2 precipitaciones. (3) La probabilidad de que ocurran cuando menos 4 precipitaciones. (4) Calcular la probabilidad de que ocurran a lo ms 4 das de lluvia, pero ms de 1 da de lluvia. (5) La probabilidad de que no ocurran ninguna precipitacin.(c) Hacer grficas de las probabilidades acumuladas y de densidad.(d) Calcular la media y la varianza de los datos.

10. En estudios de usos del agua, supngase que se saca una muestra aleatoria de industrias que descargan aguas residuales a la red del drenaje, y se descubre que el 12% estn descargando, ilegalmente, desechos txicos industriales. Encontrar la probabilidad de qu, en una muestra de 10 industrias seleccionadas, aleatoriamente, exactamente, 2 industrias estn descargando sustancias peligrosas a la tubera del dren. Hacer esto usando: (a) La distribucin de Poisson(b) La distribucin binomial.(c) Luego hacer grficas sobrepuestas de P(X x) de ambas distribuciones.

12