clase x analisis prob frec def

8
 Universidad Nacional Agraria La Molina Facultad de Ingeniería Agrícola – DRAT IA-4026 Hidrología Aplicada Ing. Eduardo A. Chávarri Velarde CLASE X ANÁLISIS PROBABILISTICO DE LAS VARIABLES PRECIPITACIÓN TOTAL ANUAL Y CAUDAL MEDIO ANUAL 1. Longitud necesaria de registro Diversos investigadores como Rubinstein et al, han estudiado el problema de encontrar el período más racional para obtener valores estables y mutuamente compara bles de los diversos elementos meteorológicos y concluyen que para el caso de la precipitación, un periodo de 30 años es aún insuficiente para obtener un promedio estable de precipitación total mensual, pero son suficientes para un promedio de precipitación total anual. Cuantitativamente se puede utilizar el parámetro estadístico: Coeficiente de Variación (Cv), definido como:  x S Cv  = , para indicar que valores menores a 0.20 indican para la mayoría de los propósitos una aceptable longitud de la serie y una moderada variabilidad. Valores de Cv mayores a 0.25 puede indicar que la serie de datos de lluvia anual es muy corta para obtener de ella estimaciones confiables. Shuh Chai Lee (1956), utilizó la estadística de la media para estimar la longitud de registro necesario para determinar el valor medio de los datos dentro de ciertos límites seleccionados de la media poblacional ( µ) , comúnmente el 5% o 10%, esto implicaría que  x estaría entre 0.95  x  y 1.05  x  o 0.90  x  y 1.1  x , respectivame nte. Para probar los anterior se puede utilizar la distribución t de Student, ν=n-2 grados de libertad, siendo n el tamaño de la muestra o también el valor buscado y un nivel de significancia α. El estadístico t está definido por la siguiente ecuación: n S  x t  µ =  Despejando n se obtiene 2 2 2 1              =  x  x S t n µ  ó ( ) 2 2 2 e Cv t  Donde Cv es el coeficiente de variación y 'e' es el límite de exactitud deseado y por lo tanto  x (1-e) y  x (1+e) son los llamados límites de confianza de µ. Como el valor de t es función de n, la ecuación anterior se resuelve por tanteos. Por otra parte el nivel de significancia α es función del nivel de confianza deseado, o la probabilidad adoptada para que la media del registro de tamaño 'n' este dentro del límite 'e'. 1 24/05/04

Upload: jessie-williams

Post on 07-Oct-2015

10 views

Category:

Documents


0 download

DESCRIPTION

Estadistica Probabilidad

TRANSCRIPT

IA-4026 Hidrología Aplicada
CLASE X
ANÁLISIS PROBABILISTICO DE LAS VARIABLES PRECIPITACIÓN TOTAL ANUAL Y CAUDAL MEDIO ANUAL
1. Longitud necesaria de registro
Diversos investigadores como Rubinstein et al, han estudiado el problema de encontrar el período más racional para obtener valores estables y mutuamente comparables de los diversos elementos meteorológicos y concluyen que para el caso de la precipitación, un periodo de 30 años es aún insuficiente para obtener un promedio estable de precipitación total mensual, pero son suficientes para un promedio de precipitación total anual.
Cuantitativamente se puede utilizar el parámetro estadístico: Coeficiente de Variación (Cv),
definido como:  x
S  Cv = , para indicar que valores menores a 0.20 indican para la mayoría de
los propósitos una aceptable longitud de la serie y una moderada variabilidad. Valores de Cv mayores a 0.25 puede indicar que la serie de datos de lluvia anual es muy corta para obtener de ella estimaciones confiables.
Shuh Chai Lee (1956), utilizó la estadística de la media para estimar la longitud de registro necesario para determinar el valor medio de los datos dentro de ciertos límites seleccionados
de la media poblacional (µ) , comúnmente el 5% o 10%, esto implicaría que  x estaría entre
0.95 x  y 1.05 x  o 0.90 x  y 1.1 x , respectivamente.
Para probar los anterior se puede utilizar la distribución t de Student, ν=n-2 grados de libertad,
siendo n el tamaño de la muestra o también el valor buscado y un nivel de significancia α. El estadístico t está definido por la siguiente ecuación:
n

2 2
 ó
( ) 2
22
e
Cvt   
Donde Cv es el coeficiente de variación y 'e' es el límite de exactitud deseado y por lo tanto
 x (1-e) y  x (1+e) son los llamados límites de confianza de µ.
Como el valor de t es función de n, la ecuación anterior se resuelve por tanteos. Por otra parte
el nivel de significancia α es función del nivel de confianza deseado, o la probabilidad adoptada para que la media del registro de tamaño 'n' este dentro del límite 'e'.
1 24/05/04
IA-4026 Hidrología Aplicada
Por ejemplo
Se desea conocer la longitud de registro necesario para que con una probabilidad del 90%, la media de la estación climatológica X, esté dentro del 10% de la media verdadera, si se sabe que para un periodo de registro de 38 años se tiene una media de 745 mm con una desviación estándar típica de 283.5 mm.
Reemplazando en la ecuación n =
( ) 2
22
e
2   y e = 0.10,
entonces n = 14.4808 t 2
Por lo tanto se requiere un registro de 41 años para obtener una media en la estación X, que difiera de la verdadera en 10% con una probabilidad del 90%.
n (años) 38
media (mm) 745.00
2. Funciones de distribución utilizadas en el análisis probabilístico de precipitaciones totales anuales y caudales medios anuales
2.1 Selección de la función de distribución más adecuada
 Aunque existe un número importante de distribuciones de probabilidad empleadas en hidrología, son sólo unas cuantas las comúnmente utilizadas, debido a que los datos hidrológicos de diversos tipos han sido probados en repetidas ocasiones ajustarse satisfactoriamente a ciertos modelos teóricos.
Pauta:
a. Las distribuciones de probabilidad más adecuadas para aproximar series anuales de precipitación o descargas son la normal y la log normal, según el siguiente criterio:
-1.5 a -0.2 -0.2 a 0.5
0.00 a 0.25 Normal
Normal Si Cs<0.2
Weibull Si Cs>0.2
0.25 a 2.00 Log-normal
IA-4026 Hidrología Aplicada
Coeficiente de asimetría, 3
n a  
2.2 Utilidad
Después de ajustar una cierta distribución de probabilidades a un registro de precipitación total anual o descarga media anual, ésta se utiliza para obtener la probabilidad de tener lluvias anuales o descargas medias anuales menores que un cierto valor previamente seleccionado y también valores mayores que otra determinada magnitud. Tales determinaciones son valiosas para el diseño de sistemas hidráulicos como por ejemplo en proyectos de irrigación.
Si por ejemplo los límites inferior y superior de lluvia de acuerdo a la tolerancia de un cultivo son conocidos, entonces puede ser evaluada la probabilidad de falla de tal cultivo debido a la sequía o al exceso de lluvia.
Los registros de precipitación de un determinado mes o época son bastante susceptibles de análisis probabilístico, semejante al descrito para las lluvias anuales, sin embargo, en este caso interesa por lo general construir gráficas que indiquen las lluvias mensuales para determinadas probabilidades de ocurrencia, por ejemplo para el 50%, 75% y 95%.
Es así que para proyectos de irrigación se utilizan valores de precipitación con probabilidad de ocurrencia o persistencia correspondiente al 75% y para proyectos hidroenergéticos se utiliza 95%.
Por ejemplo, para el río Santa, siendo evaluadas las descargas medias mensuales para diferentes niveles de probabilidad de ocurrencia o persistencia.
3 24/05/04
IA-4026 Hidrología Aplicada
Ing. Eduardo A. Chávarri Velarde
DESCARGAS MEDIAS AL 25%,50% y 75% DE PERSISTENCIA DEL RIO SANTA ESTACION CONDORCERRO
 1978/2000
0
50
100
150
200
250
300
350
400
450
TIEMPO (Meses)
   D    E    S    C    A    R    G    A    S    (  m    3    /  s    )
Q75% 122,104 158,507 173,923 140,745 77,821 47,963 38,808 38,355 41,212 53,213 70,605 87,796
Q50% 142,460 292,714 315,505 230,104 103,222 62,003 44,978 41,389 48,476 63,553 94,293 114,403
Q25% 219,999 350,225 391,206 312,688 124,017 64,729 51,588 45,040 53,962 96,195 114,259 176,884
Qmedio 183,297 295,233 313,978 231,253 104,270 59,422 45,641 42,178 48,379 72,191 101,835 139,925
  ENE FEB MAR ABR MAY JUN JUL AGO SET OCT NOV DIC
3. Concepto y selección del periodo de retorno
El objetivo primario del análisis estadístico de datos hidrológicos es la determinación del llamado periodo de retorno en un cierto evento hidrológico de una magnitud dada x. El periodo de retorno Tr se define como el lapso promedio entre la ocurrencia de un evento igual o mayor a una magnitud dada.
Como en hidrología se utilizan muestras integradas por los eventos hidrológicos anuales, se podrá plantear la siguiente ecuación basándose en el concepto de probabilidad.
( ) Tr 
=≥  
La ecuación anterior indica que si un evento hidrológico X igual o mayor que x, ocurre una vez en Tr años, su probabilidad de excedencia es 1/Tr, es decir que si una excedencia ocurre en promedio una vez cada 25 años, la probabilidad de que tal evento ocurra en cualquier año es 1/25.
4. Ecuación general del análisis hidrológico de frecuencias
Ven Te Chow (1951) propuso que toda variable X de una serie hidrológica puede ser expresada de la siguiente manera:
)(S  K  x X    +=  
)(1   Cv K   x
 x   : Valor medio de la serie
S : Desviación típica de la serie Cv : Coeficiente de variación de la serie K : Factor de frecuencia
4 24/05/04
IA-4026 Hidrología Aplicada
Ing. Eduardo A. Chávarri Velarde
La ecuación anterior es aplicable a casi todas las ecuaciones de probabilidad empleadas en hidrología.
La incertidumbre debida al desconocimiento de la distribución de probabilidades de los datos es un tema de controversia, sin embargo existen test o pruebas estadísticas para resolver este problema como son las pruebas de Kolmogorov-Smirnov y Chi-cuadrado.
 Asimismo el comparar gráficamente la distribución de probabilidades empíricas y la teórica propuesta, conjuntamente con el juicio ingenieril y la experiencia en hidrología, pueden conducir en forma más precisa y rápida a seleccionar la distribución teórica más adecuada a los datos.
5. Distribuciones de probabilidad adecuadas a lluvias y escurrimientos anuales
5.1 Distribución normal y Log-normal
La distribución normal es simétrica, con forma de campana; su distribución representa los errores accidentales alrededor de la media y por eso se conoce como Ley de Errores o de Gauss.
La distribución Log-normal es simétrica con sesgo hacia la derecha y equivale a una distribución normal en la cual la variable se reemplaza por su valor logarítmico. Al igual que la distribución normal, la log-normal es función de sólo dos parámetros estadísticos, la media y la desviación estándar.
La función de distribución de probabilidad normal se define como:
dxe x F 
Donde µ y σ son los parámetros de la distribución.
Para el cálculo numérico de las distribuciones normal y log-normal se utilizan las siguientes ecuaciones:
- Para la distribución normal )(S  K  x X    +=  
- Para la distribución log-normal )(loglog   Iv K  x X    +=  
El factor de frecuencia K es conocido también con el nombre de variable estandarizada para el caso de la distribución normal, está en función de la probabilidad P(X<=x) o del periodo de retorno Tr, mediante la siguiente tabla.
5 24/05/04
IA-4026 Hidrología Aplicada
P(X<=x) % Tr (años) K = Z
99.9 1000.00 3.0902
99.8 500.00 2.8782
99.0 100.00 2.3264
98.0 50.00 2.0538
95.0 20.00 1.6449
90.0 10.00 1.2816
80.0 5.00 0.8416
50.0 2.00 0
20.0 1.25 -0.8416
10.0 1.11 -1.2816
5.0 1.05 -1.6449
2.0 1.02 -2.0538
1.0 1.01 -2.3264
0.1 1.00 -3.0902
 
La metodología de aplicación consistirá en calcular  x   y S, cuando se quiere ajustar a una
distribución normal y  xlog   e Iv cuando se quiere ajustar a una distribución log-normal,
respectivamente.
 A continuación se calculan los valores de la variable X (lluvia anual) para los periodos de retorno de los factores de frecuencia o variable estandarizada.
6 24/05/04
IA-4026 Hidrología Aplicada
Ejemplo:
Consideremos la precipitación total anual registrada en la Estación Tacalaya, Cuenca del río Locumba, Departamento de Tacna.
 Año Pp.Total Anual (mm) Log(Pp.Total Anual)
1953 542.9 2.735
1954 603.8 2.781
1955 646.4 2.811
1956 225.3 2.353
1957 356.0 2.551
1958 310.2 2.492
1959 462.8 2.665
1960 345.9 2.539
1961 666.9 2.824
1962 503.2 2.702
1963 665.0 2.823
1964 427.7 2.631
1965 285.0 2.455
1966 325.2 2.512
1967 544.9 2.736
1968 615.0 2.789
1969 506.8 2.705
1970 420.2 2.623
1971 494.9 2.695
1972 700.2 2.845
1973 629.9 2.799
1974 562.5 2.750
1975 543.3 2.735
1976 454.7 2.658
1977 367.5 2.565
1978 361.4 2.558
1979 355.5 2.551
1980 308.3 2.489
1981 504.1 2.703
1982 351.8 2.546
1983 111.4 2.047
1984 657.6 2.818
1985 736.4 2.867
Estación : Tacalaya
Cuenca : Locumba
Departamento : Tacna
99.9 1000.00 3.0902 941.8 23.831
99.8 500.00 2.8782 909.6 22.990
99.0 100.00 2.3264 825.8 20.936
98.0 50.00 2.0538 784.4 19.991
95.0 20.00 1.6449 722.3 18.652
90.0 10.00 1.2816 667.2 17.537
80.0 5.00 0.8416 600.3 16.277
50.0 2.00 0 472.5 14.112
20.0 1.25 -0.8416 344.7 12.236
10.0 1.11 -1.2816 277.9 11.356
5.0 1.05 -1.6449 222.7 10.678
2.0 1.02 -2.0538 160.6 9.962
1.0 1.01 -2.3264 119.2 9.512
0.1 1.00 -3.0902 3.2 8.357
Mediante Factor de FrecuenciaFactor de Frecuencia
 
IA-4026 Hidrología Aplicada
N°Orden Prob.Empírica (%) Prob.Emp.Excedencia Distribución Distribución
Weibull P(X>=x) Pp.Total Anual Log(Pp.Total Anual) Normal Log-normal
1 3 97 736.4 2.867 759.5 19.442
2 6 94 700.2 2.845 710.2 18.400
3 9 91 666.9 2.824 677.8 17.747
4 12 88 665.0 2.823 652.8 17.258
5 15 85 657.6 2.818 631.8 16.860
6 18 82 646.4 2.811 613.6 16.519
7 21 79 629.9 2.799 597.2 16.219
8 24 76 615.0 2.789 582.1 15.949
9 26 74 603.8 2.781 568.0 15.700
10 29 71 562.5 2.750 554.7 15.469
11 32 68 544.9 2.736 542.0 15.251
12 35 65 543.3 2.735 529.8 15.045
13 38 62 542.9 2.735 518.0 14.847
14 41 59 506.8 2.705 506.4 14.656
15 44 56 504.1 2.703 495.0 14.471
16 47 53 503.2 2.702 483.7 14.290
17 50 50 494.9 2.695 472.5 14.112
18 53 47 462.8 2.665 461.3 13.937
19 56 44 454.7 2.658 450.0 13.762
20 59 41 427.7 2.631 438.6 13.589
21 62 38 420.2 2.623 427.0 13.414
22 65 35 367.5 2.565 415.2 13.237
23 68 32 361.4 2.558 403.0 13.058
24 71 29 356.0 2.551 390.3 12.874
25 74 26 355.5 2.551 377.0 12.685
26 76 24 351.8 2.546 362.9 12.487
27 79 21 345.9 2.539 347.8 12.279
28 82 18 325.2 2.512 331.4 12.056
29 85 15 310.2 2.492 313.2 11.812
30 88 12 308.3 2.489 292.3 11.540
31 91 9 285.0 2.455 267.2 11.222
32 94 6 225.3 2.353 234.9 10.824
33 97 3 111.4 2.047 185.5 10.244
Series ordenadas de mayor a menor 
 
0
100
200
300
400
500
600
700
800
Probabilidad (X<=x)
   P   p  .   T
   l    (  m   m
   L   o   g  .  n   o   r  m   a    l
Prob.Emp.No Excedencia P(X<=x) Distribución Normal Distribución Log-normal