Download - ESTADISTICA Y PROBABILIDAD EN LA HIDROLOGIA.docx

PROBABILIDAD APLICADA A LA HIDROLOGIA

Msc. Ing. Isidro Alberto Pilares Hualpa

MODELOS HIDROLÓGICOS

Según Chow. Maiduant y Mays (1984), un modelo de sistema hidrológico es una

aproximación al sistema real: sus entradas y salidas son variables hidrológicos mensurables

y su estructura es un conjunto de ecuaciones que conectan las entradas y salidas.

Los modelos hidrológicos pueden dividirse en dos categorías: modelos físicos y modelos

abstractos. Los primeros incluyen, modelos de escala que refrendan el sistema en una

escala reducida, tal como un modelo hidráulico del vertedero de una prosa. Los modelos

abstractos representan el sistema en forma matemática, la operación del sistema se describe

por medio de un conjunto de ecuaciones que relacionan los variables de entrada y salida.

Estas funciones pueden ser funciones de espacio y del tiempo y también pueden ser

variables probabilísticas y aleatorias, que no tienen un valor fijo en un punto particular del

espacio y tiempo, pero que están descritas a través de distribuciones de probabilidad.

MODELO MATEMATICO

Un modelo matemático es una simplificación de una situación real, expresada mediante una

serie de hipótesis o suposiciones, traducidas en lenguaje matemático y que conducen,

después de una adecuada manipulación, utilizando para ello las técnicas matemáticas

apropiadas, a una serie de resultados de cuyo análisis se espera sacar a la luz aspectos de la

situación original no fácilmente apreciables a simple vista.

CHOW (1964) señala que los modelos matemáticos son aplicados para simular el

fenómeno hidrológico natural, el cual es considerado como un proceso o sistema.

Cualquier fenómeno que esté sometido a cambios, particularmente con respecto al tiempo,

es llamado un proceso. Como prácticamente todos los fenómenos hidrológicos cambian con

el tiempo pueden ser llamados procesos hidrológicos. Si la oportunidad de ocurrencia de las

variables envueltas en tal proceso es ignorada y el modelo se considera que sigue una ley de

certeza pero ninguna ley de probabilidad, el proceso y el modelo son descritos como

determinísticos. De otra forma, si la oportunidad de ocurrencia de la variable es tomada en

consideración y el concepto de probabilidad es introducido en la formulación del modelo, el

proceso y el modelo son descritos como estocásticos o probabilísticos (CHOW, 1964).

Estrictamente hablando, un proceso estocástico es diferente a uno probabilístico en que el

primero es considerado dependiente del tiempo y el segundo independiente del tiempo.

Podría decirse, entonces, que los modelos Probabilísticos hacen predicciones, mientras que

los modelos estocásticos hacen pronósticos (CHOW et al., 1994).

En realidad, todos los procesos hidrológicos son más o menos estocásticos. Se asumen

determinísticos o probabilísticos sólo para simplificar su análisis.

Tipos de modelos matemáticos de cuencas

Un modelo matemático de cuenca consiste en varios componentes, cada uno describe cierta

fase o fases del ciclo hidrológico. Un modelo matemático puede ser de tres tipos: (1)

teórico, (2) conceptual, o (3) empírico. Los modelos teóricos y empíricos son exactamente

opuestos en significado, con modelos conceptuales que se ubican entre ellos. En suma, un

modelo matemático puede ser determinístico o probabilístico, lineal o no lineal, invariable

en el tiempo o variable en el tiempo, global o distribuido, continúo o discreto, analítico o

numérico, evento guiado o proceso continuo.

En la práctica del modelado de cuenca, cuatro tipos generales de modelos matemáticos se

reconocen comúnmente: (1) determinísticos, (2) probabilísticos, (3) conceptuales, y (4)

paramétricos.

Los modelos determinísticos

Son formulados siguiendo las leyes de los procesos físicos y procesos químicos descriptos

por ecuaciones diferenciales. Un modelo determinístico es formulado en términos de un

grupo de variables y parámetros y ecuaciones relacionadas a ellos. Un modelo

determinístico implica una relación causa-efecto entre los valores de los parámetros

elegidos y los resultados obtenidos de la aplicación de las ecuaciones. Idealmente, un

modelo determinístico debería proveer el mejor detalle en la simulación de los procesos

físicos o químicos. En la práctica, sin embargo, la aplicación de modelos determinísticos

está asociada frecuentemente a la incapacidad del modelo o del modelador de resolver la

variabilidad temporal y espacial del fenómeno natural en incrementos suficientemente

pequeños.

Los modelos conceptuales

Son representaciones simplificadas de los procesos físicos, obtenida por los variaciones

espacial y temporal y usualmente recaen sobre descripciones matemáticas (ya sean en

forma algebraica o por ecuaciones diferenciales ordinarias), que simulan procesos

complejos basándose en unas pocas claves de parámetros conceptuales. El uso extensivo de

los modelos conceptuales en la ingeniería hidrológica refleja la complejidad inherente del

fenómeno y la incapacidad práctica de considerar los componentes determinísticos en todas

las instancias. De allí que los modelos conceptuales son sustitutos útiles y prácticos para los

modelos determinísticos.

Los modelos paramétricos (esto es empírico o caja negra)

Son los más simples de todas las propuestas de modelado. Como su nombre indica, el

énfasis de los modelos paramétricos está en los parámetros empíricos en los que está basada

la solución. Usualmente, un modelo paramétrico consiste en una ecuación (o ecuaciones)

algebraica que contiene uno o más parámetros a ser determinados por el análisis de datos u

otro medio empírico. La aplicabilidad de los modelos paramétricos está restringida al rango

de datos utilizados en la determinación de los valores de los parámetros. Los modelos

paramétricos son útiles cuando los modelos conceptuales, determinísticos o probabilísticos

no son prácticos o son demasiado caros.

Los modelos probabilísticos

Son exactamente lo opuesto en significado a los modelos determinísticos. Un modelo

probabilístico se formula siguiendo las leyes del azar o probabilidad. Los modelos

probabilísticos son de dos tipo: (1) estadísticos, y (2) estocásticos. El desarrollo de los

modelos estadísticos es gobernado por las leyes de la probabilidad y aleatoriedad los

modelos estadísticos tratan con ejemplos observados, y requieren invariablemente el uso de

datos; mientras que los modelos estocásticos enfocan en las propiedades aleatorias o

estructura del azar observada en ciertas series de tiempo hidrológicas - por ejemplo, flujos

diarios de corriente en cuencas de tamaño medio. los modelos estocásticos enfatizan sobre

las características estocásticas de los procesos hidrológicos.

Primera conclusión.

Los fenómenos que se presentan en la ingeniería, pueden clasificarse desde el punto de

vista de la certeza de su ocurrencia, en determinísticos y probabilísticos. Si la

probabilidad de ocurrencia de las variables en proceso es cierta, es decir asegurar una

ley determinada no probabilístico. En cambio si se toma en cuenta la probabilidad de

ocurrencia y la falta de certeza existente entonces se habla de un proceso de

naturaleza probabilística en el campo de la ingeniería de la hidrológica pertenecen a la

categoría de los probabilísticos o estadísticos.

En rigor, existen diferencias entre los procesos probabilísticos y los estocásticos. Los

primeros son independientes del tiempo y los segundos son dependientes. Se denominan

proceso estadístico a un conjunto de variables aleatorias cuyas características varían en el

tiempo. En un proceso probabilístico, independiente de la variable del tiempo, la secuencia

de las variables no interesan y se supone que ellas siguen un determinado comportamiento

dado por el modelo probabilístico o distribución.

Relaciones precipitación-duración-frecuencia.

Uno de los primeros pasos que debe seguirse en muchos proyectos de diseño hidrológico es

la determinación del o los eventos de precipitación que deben usarse. La forma más común

de hacerlo es utilizar una lluvia de diseño o un evento que involucre una relación entre la

precipitación, la duración de esta, y las frecuencias o períodos de retorno apropiados para la

obra y el sitio. Estos eventos, por otra parte, pueden estar basados en análisis regionales o

de sitio específico (CHOW et al., 1994 y ZALINA et al., 2002).

Procedimiento de análisis.

AYALA y FERRER (1973) señalan que el procedimiento de análisis de frecuencia

comprende las siguientes etapas:

- Verificar la confiabilidad de los datos hidrológicos

- Suponer ciertos modelos probabilísticos

- Estimar los parámetros estadísticos de las funciones de distribución de

probabilidades de cada modelo elegido

- Realizar pruebas que permitan seleccionar el modelo probabilístico que mejor

describe el fenómeno que se intenta representar

- Estimar él o los valores de diseño correspondientes al período de retorno de interés.

Según BROWN y VARGAS (1986); JARA (1986); BOOY y LYE (1989); CHOW et al.

(1994) y VARAS y BOIS (1998), al estimar estos valores de diseño, existen varias fuentes

de incertidumbre hidrológica que pueden ser divididas en tres categorías:

- Incertidumbre natural o inherente con respecto al proceso de generación aleatoria

del fenómeno de interés

- Incertidumbre de modelo, al representar un proceso con un modelo inadecuado

- Incertidumbre de parámetro, asociada a la metodología usada en la estimación de

los parámetros del modelo

Estimación de parámetros.

AYALA y FERRER (1973) y KITE (1977), señalan que una vez que un modelo

probabilístico ha sido escogido, la segunda fuente de error es aparente: los parámetros

estadísticos de la función de distribución de probabilidades deben ser estimados desde la

muestra. Dado que la muestra está sujeta a errores, el método de estimación debe minimizar

estos errores.

Según OBREGÓN (1977) y YEVJEVICH (1978), un estimador es un estadígrafo cuyo

valor observado intentamos usar para estimar el valor de un parámetro desconocido de una

función de distribución de probabilidades. De este modo, pueden ser clasificados en

términos de sesgo, eficiencia, consistencia, suficiencia y eficiencia asintótica.

MÉTODOS PROBABILÍSTICOS

El procedimiento más eficiente para la predicción de ocurrencia de máximas avenidas es

realizarla en base a los registros de caudales o precipitaciones.

Es indiscutible que este método da estimados correctos con la condición de que existen

suficientes datos de caudales o precipitaciones, y que el régimen del río no haya sufrido

cambios importantes (inconsistencia de datos). Con este método se puede determinar no

solamente la magnitud de la avenida sino también la probabilidad de ocurrencia, con la

ventaja de que el valor es mucho más exacto que los métodos anteriores por basarse en

valores registrados.

Por lo general se recomienda, para que el método probabilístico sea digno de confianza, los

registros existentes cubran un periodo de alrededor de veinte años.

FENOMENO ALEATORIO

DIAZ (2010), Es aquel fenómeno que bajo las mismas condiciones experimentales se

presenta en mas de una manera o también se le denomina fenomeno que sucede al azar. En

el lenguaje de probabilidades las palabras: fenomeno, suceso, experimento, observación o

dato son términos que se usan indistintamente. Por ejemplo, todas las variables

hidrológicas como las precipitaciones, descargas etc. Son consideradas como fenómenos o

sucesos aleatorios, por que se consideran como sucesos al azar. El azar hace que algunas

cosas ocurran de manera fortuita e impredecible. Los fenómenos aleatorios se estudian a

través de la ley de probabilidades (posibilidades).

ELEMENTOS DE ESTADÍSTICA

Los procesos hidrológicos son de naturaleza estocástica, es decir, que su distribución en

el tiempo y en el espacio es tal que, en parte son determinísticos (predecibles) y en parte

aleatorios.

Algunas veces, la variabilidad aleatoria es muy grande comparada con la determinística,

de modo que se justifica un tratamiento de proceso aleatorio puro, tal como cuando una

magnitud de una observación del proceso no está correlacionada con la magnitud de una

observación adyacente, siendo las propiedades estadísticas de todas las observaciones, las

mismas.

Cuando no existe correlación entre observaciones adyacentes, la salida del sistema

hidrológico se considera estocástica, independiente en el espacio y en el tiempo. Este

comportamiento es típico de eventos hidrológicos extremos, tal como crecidas o sequías; y

de datos hidrológicos medios sobre intervalos de tiempo largos, como precipitación anual.

En este capítulo se describen los datos hidrológicos pertenecientes a un proceso aleatorio

puro, mediante el uso de parámetros y funciones estadísticas. Los métodos estadísticos se

basan en principios matemáticos que describen la variación de un conjunto de

observaciones de un proceso, centrando la atención, más bien en las mismas observaciones

en vez del proceso físico que las origina

ESPACIO MUESTRAL

Si el resultado de un proceso es aleatorio para el observador se puede hablar, entonces, de

un experimento.

Para describir el resultado de un experimento pueden definirse muchas variables, pero

interesara formular un modelo matemático simple del fenómeno físico que interesa.

Así, si el experimento consiste en analizar el resultado un dado, convendrá que la variable

que modela el problema sea el número que indica la cara superior del dado. Otras variables

como color, distancia recorrida, velocidad inicial etc. No serán relevantes en el

experimento.

Aun cuando en un experimento, no es posible determinar con seguridad su resultado, se

puede si, definir con precisión un listado de los resultados posibles de ocurrir. Esta lista

constituye el espacio muestral. “Espacio muestral es el listado más detallado de todos los

resultados posibles del experimento definidos por eventos mutuamente exclusivos y

colectivamente exhaustivos”

Por ejemplo, el espacio muestral del lanzamiento de un dado es el conjunto de números

enteros 1, 2, 3, 4,5 y 6. El espacio muestral al lanzar una moneda es cara y sello

ALGEBRA DE EVENTOS

Constituye una herramienta y una terminología precisa para manejar y utilizar los

conceptos de probabilidades.

Antes de establecer sus postulados es necesario definir los siguientes conceptos, para los

cuales se utilizan los llamados diagramas de VENN.

EVENTOS

Son colecciones de puntos o sub-conjuntos en un espacio que tienen características

comunes, los cuales quedaran más claramente especificadas al definir el espacio muestral.

La colección de todos los puntos del espacio se denomina Universo. Conjunto Universal o

Evento Universal. Se designara por U

Se denominara complemento de un evento, evento A´, a todos los puntos del universo que

no están incluidos en el evento A. Un caso especial es el evento nulo o vacío que es el

complemento del evento universal.

Intersección de dos eventos A y B es la colección de puntos que están incluidos en el

evento A y en el evento B. Se designa intersección de A y B.

U

Unión de dos eventos A y B es la colección de puntos que están en A o en B o en ambos.

La unión de dos eventos A y B se designaran por A+ B.

Dos eventos A y B son mutuamente excluyentes o exclusivos o disjuntos o ajenos, si

ningún punto del universo (espacio muestral) esta incluido en mas de un evento. Es decir A

y B no tienen elementos comunes, matemáticamente se representa mediante la siguiente

ecuación:

A ∩ B = ∅

ELEMENTOS DE PROBABILIDADES EN HIDROLOGIA.

Para completar la descripción de un modelo para un experimento, se requiere además,

asignar alguna medida que represente la posibilidad que ese evento ocurra. Esta medida es

la probabilidad, se tiene entonces que un modelo de un experimento físico debe contar con

una definición del espacio muestral, indicando los resultados posibles del experimento y de

una asignación de probabilidad en cada punto del espacio. Hecho esto, el modelo estará

completo.

Una variable aleatoria X es una variable que se describe mediante una función de

distribución de probabilidades. La distribución indica la probabilidad de que una

observación cualquiera x de la variable X obtenga un valor dentro de un rango específico

de X.

Supongamos por ejemplo que X sea la precipitación anual en un punto determinado, la

distribución de X especifica el chance que tiene un valor de precipitación anual observado

en un año dado de caer dentro de un rango previamente definido, tal como por ejemplo,

menos que 1.200 mm, o entre 1.200 y 1.500 mm.

A un conjunto de observaciones x1, x2,..., xn de la variable aleatoria se denomina

muestra. Se asume que las muestras se extraen de una población hipotéticamente infinita

de propiedades estadísticas constantes; mientras que las propiedades de las muestras

pueden variar de una a otra. El conjunto de todas las muestras posibles que se puedan

extraer de la población se denomina espacio muestral y un evento viene a ser un

subconjunto del espacio muestral, como se ilustra en la Figura 2.1.

Así por ejemplo, el campo muestral de la precipitación anual es teóricamente el rango

desde cero a infinito positivo (los limites prácticos, inferior y superior, son por supuesto

valores finitos pequeños); el evento A podría ser la ocurrencia de un valor de precipitación

anual menor que alguna magnitud especifica, tal como por ejemplo 1.200 mm.

PROBABILIDAD DE UN EVENTO

La probabilidad de ocurrencia de un evento, P(A), es el chance de ocurrencia de dicho

evento cuando se lleva a cabo una observación de la variable aleatoria. Si una muestra de n

observaciones posee nA valores en el rango del evento A, entonces la frecuencia relativa de

A es nA/n. La frecuencia relativa se constituye en un estimado progresivamente mejor de la

probabilidad de ocurrencia del evento a medida que el tamaño de la muestra se incrementa,

es decir:

P (A) = lim nA/n (2.1)

n ∞

A este tipo de probabilidades se denomina probabilidades objetivas o posteriores, debido

a que dependen totalmente de observaciones de la variable aleatoria.

En contraposición a ellas, tenemos las probabilidades subjetivas o a priori, es decir,

cuando se estima la ocurrencia de un evento sobre la base de juicios personales y

experiencia.

Es costumbre calcular la probabilidad futura de un evento sobre la base de las

observaciones de la muestra, por tanto la probabilidad de cualquier evento A que contenga

nA elementos de estos n puntos (tamaño de la muestra o del espectro muestral) es la razón

del número de elementos en A al número de elementos en la muestra. Matemáticamente

esta definición se expresa por:

P(A) ¿nA

n= casos faborables

casos posibles

nA es considerado como el número de resultados o puntos favorables o como los éxitos,

entonces la probabilidad de éxito (que ocurra A), está dada por esta ecuación. (El termino

favorable o éxito es meramente enunciativo).

La probabilidad de ocurrencia de los eventos hidrológicos se rige por los siguientes

principios:

1. Probabilidad Total: Si el espacio muestral Ω se divide en m áreas excluyentes o

eventos A1, A2,... Am, entonces:

P (A1) + P (A2) +.... + P (Am) = P (Ω) = 1 (2.2)

2. Complementariedad: Si sucede que A es el complemento de A, es decir, A = Ω - A,

entonces:

P(A) = 1 - P(A) (2.3)

3. Probabilidad Condicional: Supongamos que tenemos dos eventos A y B, como se

muestra en la Figura 2.1. Si P(B/A) es la probabilidad condicional de que ocurra B, dado

que A ya ha ocurrido, entonces, la probabilidad conjunta de que A y B ocurran P(A ∩ B),

es el producto de P(B/A) y la probabilidad de que ocurra A, es decir,

P(A ∩ B) = P (B/A) x P(A),

O

P( AB )=P( A ∩ B)

P( A)(2.4)

Si la ocurrencia de B no depende de la ocurrencia de A, se dice que los eventos son

independientes, y P (B/A) = P (B). Para eventos independientes, de la Ecuación (2.4)

tenemos

P(A ∩ B) = P(A) x P (B) (2.5)

Ejemplo.

Usando los datos del registro de caudales para el rio sondando, estimar la probabilidad

que un “caudal” pico que exceda los 100 m3 /seg; ocurra en dos sucesivos años en el rio

sondando.

Solución:

En el registro vemos que los caudales de 100 m3/seg. Han sido excedidos 3 veces en 66

años, la probabilidad que un caudal exceda en un año es 3/66 = 0.0455, y que exceda en dos

años consecutivos será:

P(A∩ B ¿= 0.0455 x 0.0455

P(A ∩ B ¿=0.0027

(Se asume que los eventos son independientes, lo cual se explica físicamente por la no

dependencia de año en las descargas máximas)

Sea A el evento de que en este año la precipitación sea menor que 1.600 mm; y B, el

evento de que en el próximo año la precipitación sea menor que 1.600 mm. La unión A ∩ B

o superposición de A y B indica que ambos eventos ocurren, es decir, dos años sucesivos

con una precipitación anual menor de 1.600 mm.

Retomando el ejemplo anterior, si los eventos de precipitación fuesen independientes de

año a año, entonces, la probabilidad de que la precipitación sea menor que 1.600 mm en

dos años sucesivos es simplemente el cuadrado de la probabilidad de que la precipitación

anual en cualquiera de los dos años sea menor que 1.600 mm.

La noción de eventos u observaciones independientes es muy importante para la

interpretación estadística correcta de una secuencia de datos hidrológicos, ya que los

eventos independientes se pueden analizar sin considerar el orden de su ocurrencia. En

cambio, cuando los datos son dependientes (auto correlacionados), los métodos de análisis

son más complejos debido a que la probabilidad conjunta P(A ∩ B) de even tos

sucesivos no es igual a P(A) x P(B).

Ejemplo:

En la Tabla 2.1 se dan los valores anuales de precipitación (R) registrados en la estación X

durante el período 1911-1979, los mismos que se han graficado en la Figura 2.2 (a).

Calcular la probabilidad de que la precipitación anual R en cualquier año sea menor que

889 mm, mayor que 1.143 mm; esté entre 889 mm y 1.143 mm.

Solución:

El conjunto de datos está constituido por 69 años, es decir n = 69. Hagamos que sea los

eventos

A sea R < 889 mm

B sea R > 1.143 mm

De los 69 valores de la Tabla 2.1, 23 caen en el evento A y 19 en el B; es decir, nA = 23; y

nB = 19. Luego,

P(A) ≡ 23/69 = 0.333

P(B) ≡ 19/69 = 0.275

De la Ecuación (2.3), la probabilidad de que la precipitación anual esté entre 889 y 1.143

mm se calcula como

P(889 ≤ R ≤ 1.143) = 1 - P(R<889) - P(R > 1.143) = 0.392

TABLA 2.1 PRECIPITACION ANUAL EN LA ESTACION X, 1991 – 1979 (mm).

Año 1910 1920 1930 1940 1950 1.960 1970

0 - 1.237 1.229 1.252 792 1.168 861

1 1.013 1.120 864 1.123 686 1.125 805

2 787 1.087 1.158 1.059 940 960 800

3 1.074 1.229 947 782 1.189 752 1.514

4 1.069 869 1.110 1.361 683 892 1.283

5 1.044 823 1.062 876 645 1.262 980

6 729 1.179 1.044 1.278 584 930 1.102

7 427 988 792 1.113 1.435 826 729

8 866 947 894 549 1.102 1.567 813

9 1.433 1.285 892 1.196 1.049 1.204 1.316

EJEMPLO 2.2:

Asumiendo que los datos de la Tabla 2.1 constituyen un proceso independiente, calcular la

probabilidad de que ocurra en dos sucesivos precipitaciones menores que 889 mm/año.

Compare esta probabilidad estimada con la frecuencia relativa de dicho evento en el en el

conjunto de valores de la Tabla 2.1.

Solución: Hagamos que C sea el evento para el cual R < 889 mm en dos año sucesivos.

Del ejemplo 2.1 tenemos que P (R <889 mm) = 0,333, asumiendo independencia tenemos:

P(C) ≡ [P(R<889mm)2 = (0,333)2 = 0,111

Observando el conjunto de valores de la Tabla 2.1, es encuentran nueve (9) pares de dos

años sucesivos con precipitación menor que 889 mm de un total de 68 pares posibles,

luego,

P(C) ≡ nc/n = 9/68 = 0.132

Que es aproximadamente igual al calculado (0.111) asumiendo independencia.

Las probabilidades estimadas como en los Ejemplos 2.1 y 2.2 dan resultados

aproximados, ya que dependen del tamaño de la muestra. Un método alterno consiste en

ajustar a los datos una función de distribución de probabilidades y luego determinar la

probabilidad de los eventos mediante dicha función.

VARIABLE ALEATORIA Y DISTRIBUCIONES. ESPERANZA MATEMATICA Y MOMENTOS DE LAS DISTRIBUCIONES

Como se ha indicado líneas arriba, las variables hidrometeorologicos como las descargas,

precipitaciones, temperaturas, horas de sol, etc., son consideradas como variables aleatorias

y por lo tanto se pueden describir mediante las distribuciones o modelos de probabilidades

de tipo discreto o continuo.

Díaz (2010), en una muestra es importante describir las curvas de frecuencias mediante las

estadísticas, de igual manera en el estudio de la variable aleatoria la descripción de la

distribución de probabilidades (curva que describe la población) se realiza atraves de los

parámetros que se estiman, como por ejemplo mediante la esperanza matemática o

momentos de la distribución de probabilidades. La esperanza matemática o los momentos

de la distribución vienen a ser uno de los métodos que permite evaluar los descriptores de la

distribución (parámetros), como por ejemplo el coeficiente de sesgo.

VARIABLE ALEATORIA

Se denomina como variable aleatoria, porque su valor queda determinado por el resultado

de un experimento, es decir, depende del azar. Tales resultados son debidos a las

operaciones de causas no predecibles. Una variable aleatoria (X) es una función definida

sobre un espacio muestral “S”, esto significa que a cada elemento e i del espacio muestral

”S”, corresponde un número real único, cuyo valor es X.

e1 , e2 , e3……… en son los experimentos realizados

x1 , x2 , x3……….xn son los resultados de los experimentos

Como el valor de la variable aleatoria está determinado por el resultado del experimento

(suceso aleatorio de caudales, precipitaciones, etc.) se puede asignar probabilidades a sus

valores posibles (función de probabilidad).

La distribución de probabilidad de una variable aleatoria X es una descripción de las

probabilidades asociadas con los posibles valores de X, según esta definición se tiene la

distribución de probabilidades siguientes:

- Para el caso de variables aleatorias discretas: función de masa de probabilidad o

función discreta masa de probabilidades y la función de distribución acumulada o

distribución acumulada discreta

- Para el caso de variables aleatorias continuas: función de densidad de probabilidad o

función de densidad de probabilidades y la función de distribución acumulada o

distribución acumulada continúa.

CLASES DE VARIABLE ALEATORIA

En muchos casos prácticos las variables aleatorias son, o bien Discretas o bien Continuas.

VARIABLE ALEATORIA DISCRETA

Se dice que una variable aleatoria X es discreta, si tiene las siguientes propiedades:

- El número de valores, para los cuales X tiene una probabilidad positiva es finito, o a

lo más infinito numerable 0, 1,2,...

- Cada intervalo finito en la escala de números reales, contiene a lo más un numero

finito de los valores de X.

Si un intervalo a< X ≤b no contiene ni uno solo de esos valores, entonces P (a< X<b¿=0

Función de densidad y función de distribución de una variable aleatoria discreta

Sea una variable aleatoria discreta, entonces la función definida por f ( X )=P( X0=X ), se le

llama función de densidad discreta de X0

Ejemplo,

Tomemos el lanzamiento de dos monedas, si X representa el número total de caras que se obtendrían, es suficiente definirf por medio del siguiente conjunto de valores:

f(0) = ¼

f(1) = ½

f(2) = ¼

Para juzgar, como se distribuye una variable aleatoria, es decir, como cambia su

probabilidad cuando cambia la variable, es útil representar la función densidad por medio

de un gráfico.

Ejemplo.

Sea X la variable aleatoria que representa la suma de los puntos que se obtienen al lanzar

dos dados.

Se obtiene en total 36 puntos muéstrales del espacio muestral.

f(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

x 2 3 4 5 6 7 8 9 10 11 12

Si se deseara calcular la probabilidad de que la suma de los puntos exceda de 7.

En términos de espacio muestral, esta probabilidad está dada por:

P(x¿7¿=∑x=8

12

f (x )=¿¿ 5/36 + 4/36 + 3/36 + 2/36 +1/36 = 15/36

Los gráficos correspondientes a la función de densidad y función de distribución se

encuentran a continuación.

Una función estrechamente relacionado con la función de densidad f(x), es la correspondiente a la función de distribución F(x), que se define por:

F(x) = P(X0≤ X ¿=∑ f ( x )=∑

xi< x

f (x i)

Donde, esta suma, se extiende a todos aquellos valores de la variable aleatoria, que sean menores o iguales que el valor especificado X.

El grafico correspondiente al lanzamiento de dos dados y su correspondiente variable aleatoria (suma de los puntos) se muestra en la figura anterior.

VARIABLE ALEATORIA CONTINUA

Las variables continuas aparecen cuando se hacen mediciones en una escala continua, como por ejemplo las mediciones de descarga, precipitación, etc., este tipo de variables tienen una probabilidad cero de tomar exactamente cualquiera de sus valores y su distribución probabilidad no se pueden presentar en forma de tablas. Por tanto se trabaja con intervalos en vez de trabajar con datos puntuales como en el caso de las variables aleatorias discretas.

Si el rango de X es continuo, se dice que la variable aleatoria es continua y puede tomar valores en cierto intervalo o colección de intervalos sobre la recta real, este tipo de variable

es la más frecuente en hidrología. Por ejemplo las descargas de un rio, los valores que puede tener Q en escala continua teóricamente es de cero hasta el infinito.

FUNCIÓN DE DENSIDAD Y FUNCIÓN DE DISTRIBUCIÓN DE VARIABLES ALEATORIAS CONTINUAS

Una función de densidad de una variable aleatoria continua X, es una función f(x) que posee las siguientes propiedades:

i) f ( x ) ≥ 0

ii) ∫−∞

∞

f ( x ) dx=1

iii) ∫a

b

f ( x )dx=P (a¿¿ x<b)¿

Donde a y b son dos valores cualesquiera de X, que cumpla la condición de que a¿b.

Ejemplo.

Consideremos f (x)=K e−x como una función de densidad de X, en donde K= constante. De

acuerdo a la primera propiedad K debe ser positivo.

De la segunda condición la integral de e− x desde −∞ a+∞ es infinita, entonces se debe restringir el limite inferior X= 0, para satisfacer las condiciones K=1, suponiendo que x≥ 0, entonces se cumple con las tres propiedades.

f (x)=K e−x

De la primera condición se obtiene que K = 1 entonces:

f (x)=e−x

MOMENTOS DE DISTRIBUCIONES

La descripción de la distribución de probabilidades (curva que describe la población) se realiza a través de los parámetros que se estiman, como por ejemplo mediante la Esperanza matemática o los momentos de la distribución de probabilidades. Vienen hacer uno de los métodos que permiten evaluar los descriptores de la distribución (parámetros), como por ejemplo el coeficiente de sesgo.

Por lo tanto se puede decir que los momentos son magnitudes fundamentales asociadas a las leyes de probabilidad. Se demuestra, en efecto, que una ley de probabilidad se halla descrita completamente por sus momentos.

ESPERANZA MATEMATICA

Si X es la variable aleatoria, la Esperanza matemática, la media o el valor esperado son términos sinónimos, por consiguiente si queremos hallar la Esperanza matemática de una variable aleatoria, en la práctica estamos hallando el promedio de la variable aleatoria (en el eje X) y como la variable aleatoria se describe mediante las distribuciones de probabilidad, la Esperanza matemática se halla o se estima a partir de las funciones de distribución que son función masa discreta de probabilidades o función de densidad de probabilidades, dependiendo del tipo de variable aleatoria si es discreto o continuo.

E(x) =∫ x f ( x ) dx

Si la variable aleatoria es discreta, la Esperanza matemática o el valor esperado o la media de cualquier variable aleatoria discreta se obtiene al multiplicar cada uno de los valores de la variable aleatoria X por su correspondiente probabilidad P(x) y luego se suman estos productos.

La esperanza matemática se simboliza por E(x) o μ y representa la media poblacional o media teórica de la variable aleatoria X. Como la esperanza matemática describa a la población viene a ser un parámetro (valor desconocido solo puede ser estimado).

Entonces la media de la variable aleatoria discreta X se calcula mediante la siguiente ecuación:

μ=E (x)=∑x

xp(x )

Si la variable aleatoria X es continua, la media o la esperanza matemática se calcula mediante la siguiente ecuación:

μ=E (x)=∫−∞

∞

xf ( x ) dx

En la ecuación se usa la integral en vez de sumatoria y f ( x ) dx a cambio de p(x), la media o la esperanza matemática describe el lugar donde se centra la función masa de probabilidad o la función de densidad de probabilidad.

Por ejemplo en el curso de estática, resistencia de materiales, etc., el centro de gravedad de una figura geométrica plana en el eje X y es equivalente a la ecuación para una variable aleatoria continua.

x = ∫ xdA

A=∫ x f ( x ) dx

A

Dónde:

x = centro de gravedad de la figura en el eje X

A = área de la figura

dA = f ( x ) dx = diferencial del área

Es importante indicar que en la estadística el área A representa el área bajo la curva de la función densidad de probabilidades f ( x ), que en este caso es 1, por tanto, el denominador de la ecuación en los modelos probabilísticos es 1, por lo que la ecuación son equivalentes.

De otro lado, si X es una variable aleatoria con función de densidad de probabilidad f ( x ) o con función discreta masa de probabilidad p(x) y si h(x) es otra función de X, entonces la esperanza matemática o el valor esperado o la media se define mediante las siguientes ecuaciones:

Si X es una variable aleatoria discreta, se tiene:

E (h(x)) = ∑x

h (x ) p(x)

Si X es una variable aleatoria continua, se tiene:

E (h(x)) = ∫−∞

∞

h ( x ) f ( x ) dx

ESTIMACION DE PARAMETROS

La función densidad y de distribución pueden escribirse como una función de la variable aleatoria y en general como una función de sus parámetros.

1) Método de momentosComo se conoce los parámetros media (μ¿ y variancia (σ 2 ) están dados por el primer

momento y segundo momento central respectivamente.

Ejemplo.

Por el método de momentos determinar la media y variancia de la siguiente función

densidad.

f (x)=e− λ λx

x ! Para x > 0

(x = variable aleatoria discreta)

a) Media = µ = E(x) = ∑ e− λ λx

x !. x

µ = ∑ e−λ λx

( x−1)! = e− λ∑ λx

(x−1)!

Se puede extender la suma para x = 1, 2, 3,…..

µ = e− λ( λ1

0 !+ λ2

1 !+ λ3

2!+ λ4

3 !+…)

µ=e− λ λ(1+ λ1 !

+ λ2

2 !+ λ3

3!+…)

Los términos entre paréntesis representan la expresión de e λ como serie de Taylor, por lo

tanto: µ=e− λ λ eλ=λ

Entonces la media de la distribución es λb) Calculo de la variancia (σ 2 )

(σ 2 )=E ¿

Pero además: σ 2 = M 2 = M2 – M 21 = E(x )2- [ E(x )]2

Calculamos E(x2)

E(x2) = M2 = ∑ e− λ λx x2

x !=∑ e− λ λx x

( x−1)!

E(x2) = ∑ e− λ λx (x−1+1)(x−1)!

E(x2) = e− λ∑ λx(1)(x−1)!

+ e− λ∑ λx(x−1)(x−1)!

E(x2) = e− λ∑ λx

(x−1)! + e− λ∑ λx

(x−2)!

En serie de Taylor

E(x2) = e− λ( λ1

0 !+ λ2

1!+ λ3

2!+…)+¿ e− λ( λ2

0 !+ λ3

1 !+ λ4

2!+…)

E(x2) = e− λ λ(1+ λ1 !

+ λ2

2 !+…)+¿ e− λ λ2(1+ λ

1!+ λ2

2 !+…)

E(x2) = e− λ . λ . e− λ . λ2 . eλ

E(x2) = λ+ λ2

Por lo tanto

σ 2=( λ+ λ2 )−( λ2 )= λ

Conclusión:

Los parámetros media y variancia para la distribución estudiada es λ

µ =σ 2=λ

1) Método de máxima verosimilitud

Se asume que tenemos n observaciones aleatorias X1, X2,…Xn, su función correspondiente:

f (X1, X2, X3,…Xn, θ1 , θ2 ,…θn¿, pudiendo para cada Xi, escribir su función de probabilidad

y se tendrá:

f (X1, θ1 , θ2 ,…θn¿ f (X2, θ1 , θ2 ,…θn¿

f (X2, θ1 , θ2 ,…θn¿ f (Xn, θ1 , θ2 ,…θm¿ ,donde θ1 , θ2 ,…θm son los parámetros de la función.

La expresión anterior es proporcional a la probabilidad de que una observación aleatoria

sea obtenida de la población y es conocida como función de máxima verosimilitud o

máxima probabilidad.

L (θ1 , θ2 ,…θm¿=∏i=1

n

f (x i ,¿θ1 ,θ2, …θm)¿

Los m parámetros son desconocidos, por lo tanto la estimación de estos se hace teniendo

presente que deben maximizar la función de verosimilitud.

Esto es posible tomando la derivada parcial de L (θi ¿ respecto a cada θ e igualando a cero.

Ejemplo

Empleando el método de máxima verosimilitud estimar el parámetro λ de la función de

densidad siguiente:

f (x)=λ e− λx Para x > 0Solución:

L (λ¿=∏i=1

n

λ e−λx = λe− λ∑ x i

Ln [L(λ)] = n Ln (λ) - λ∑i=1

n

x i

∂ ln [ L ( λ )]∂ λ

=0=nλ−∑

i=1

n

x i

λ = n

∑ xi

=1x

x ≅1λ

DISTRIBUCION DE FRECUENCIAS (representación grafica)

Los registros Hidrológicos, muestran por lo general una larga secuencia de datos que

requieren un análisis cualitativo y cuantitativo para su empleo posterior.

Uno de estos análisis importantes es la determinación del histograma de frecuencias

relativas y absolutas, distribución de frecuencias acumuladas, polígonos de frecuencia etc.

Cuando se dispone de un gran número de datos, es necesario distribuirlos en clase o

categorías y determinar el número de datos pertenecientes a cada clase, que es la frecuencia

de clase. Una ordenación tabular de los datos en clases y con las frecuencias

correspondientes a cada una, se conoce como una tabla de distribución de frecuencias.

Para determinar un número conveniente de intervalos de clase se tienen como referencia

algunas consideraciones:

- Spiegel (1961), sugiere que un número de intervalos de clase conveniente es de 5 a

20.

- Steel y Torrie (1960), sugieren que el número de intervalos no debe ser menor que

1/4, ni mayor que 1/2 del valor de la desviación estándar

- Sturges (1926), recomienda para determinar el número de intervalos de clase la

siguiente formula: N° intervalos = 1 + 3.3 Ln N, donde N es el número de datos

observados.

Ejemplo.

Para los datos de caudales picos anuales mostrados a continuación se pide:

a) Determinar la media y desviación estándar, para datos sin agrupar en tabla de

distribución de frecuencias.

b) Determinar la media y desviación estándar a partir de los datos agrupados en una

tabla de distribución de frecuencias.

c) Graficar el histograma, polígono de frecuencias y también la curva de distribución

de frecuencia acumulada.

AÑO CAUDAL (m3/seg)




1940194119421943194419451946194719481949

200480430680470350630765420555

1950195119521953195419551956195719581959

370695690730340800540400250420

1960196119621963196419651966196719681969

750780360530580520550610590536

1970197119721973197419751976197719781979

690548530570450650320680610290

Solución.

a) Para datos que no están agrupados en tabla de distribución de frecuencias, los

parámetros media y desviación estándar, se calculan con las formulas siguientes.

- Media:

x = µ= ∑i=1

40

Qi

N=21,559

40=539

m3

seg

- desviacion estandar muestral :

S=√∑i=1

40 (Qi−Q )39

=164m3

seg

- Desviación estándar poblacional:

σ=√∑i=1

40 ( Qi−Q )40

=161.9 m3/seg

b) Tabla de distribución de frecuenciasNUMERO DE CLASE

INTERVALO DE CLASE

MARCA DE

CLASE

FRECUENCIA ABSOLUTA

f 0

FRECUENCIA-----------------------

f r=f 0

N(%)

RELATIVA-----------------

f r=f 0

N

FRECUENCIA ACUMULATIVA

∑ f 0

FRECUENCIA ACUMULATIVA

RELATIVA

∑ f r(%)1 2 3 4 5 5 6 71234567

201 – 300301 – 400401 – 500501 – 600601 – 700701 – 800801 – 900

250.5350.5450.5550.5650.5750.5850.5

35711842

----------------

40

7.512.517.627.520.010.05.0

------------------100%

0.0750.1250.1750.2750.2000.1000.05

--------------1.00

381526343840

7.520.037.565.085.095.0100.0

c) Calculo de la media y desviación estándar a partir de datos agrupados en una

tabla de distribución de frecuencias

NUMERO DE CLASE

INTERVALO DE CLASE

MARCAS DE CLASE

Qi

FRECUENCIA ABSOLUTA

OBSERVADA f i

f i× Qi (Qi−Q )2 f i (Qi−Q )2

1 2 3 4 5 6 71234567

200 – 300301 – 400401 – 500501 – 600601 – 700701 – 800801 – 900

250350450550650750850

35711842

40

750175031506050520030001700

21,600

84100361008100100

121004410096100

252,300180,50056,7001,10096,800176,400192,200

1056,000

Media muestral: x = ∑i=1

7

f i Qi

∑ f i

=21,60040

=540

Desviación estándar muestral:

S=√∑i=1

7 f i (Qi−Q ) ²N−1

=√ 1 ´ 056,00039

=164.5

Media poblacional: µ =x

Desviación estándar poblacional:

σ=√∑i=1

7 f i (Qi−Q ) ²N

=√ 1´ 056,00040

=162.4

PARAMETROS ESTADISTICOS

El objetivo de la estadística consiste en extraer de un conjunto muy grande de datos unos

pocos valores pero que sean representativos de las características del conjunto. Estos

valores se denominan parámetros estadísticos o simplemente estadísticos. Así pues, los

parámetros estadísticos son característicos de la población, tal como μ y σ.

Un parámetro estadístico es el valor esperado E de alguna función de la variable

aleatoria (también se denomina la esperanza matemática). El parámetro más simple es el

promedio μ, el cual viene a ser el valor esperado de la variable aleatoria misma. Para una

variable aleatoria X, el promedio es E(X), que se calcula como el producto de x por la

densidad de probabilidades correspondiente f(x), integrado en el rango factible de la

variable aleatoria:

(2.17)

E(X) es el primer momento con respecto al origen, una medida del punto medio o Tendencia Central de la distribución.

El estimador muestral de la media es el promedio aritmético de los datos de la muestra:

(2.18)

En la Tabla 2.2 se da un resumen de las fórmulas para calcular algunos parámetros de la

población y sus estimadores muéstrales.

La variabilidad de los datos se mide a través de la varianza σ2 la cual es el segundo

momento con respecto al promedio:

(2.19)

El estimador muestral de la varianza está dado por la expresión

(2.20)

E( X )=μ=∫−∞

∞

xfdx

x=1n∑i=1

n

x i

E [( x−μ )2 ]=σ2=∫−∞

∞(x−μ )2 f ( x )dx

S2= 1n−1

∑i=1

n

( xi−x )2

En la cual (n-1) indica los grados de libertad, y se usa en vez de n para asegurar que el

parámetro sea insesgado, es decir, que no posea tendencia de ser menor o mayor que el

valor verdadero. La varianza tiene la dimensión [X]2. La desviación estándar σ tiene las

mismas unidades de X; es igual a la raíz cuadrada de la varianza y su estimador muestral es

S. En la Figura 2.5 (a), se ilustra el significado de la desviación estándar; mientras mayor es

la desviación estándar, mayor es la dispersión de los datos. El coeficiente de variación

Cv = σ/μ, estimado por s√ x , es una medida adimensional de la variabilidad.

TABLA 2.2 PARAMETROS ESTADISTICOS DE LA POBLACIÓN POBLACIÓN MUESTRA

1. Tendencia CentralPromedio Aritmético.

μ=E ( X )=∫−∞

∞xf ( x )dx x=1

n∑ x i¿

Mediana

X tal que F(x) = 0,5 50 avo. Percentil de los datos

Promedio geométrico

Antilog [E (log x)] ( Π i=1

n x i)1/n

2. Variabilidad

Varianza

σ 2=E [ ( x−μ)2 ] S2= 1n−1

∑i=1

n

( xi− x )2

Desviación estándar σ S

Coeficiente de variación

Cv=σ/μ Cv=s/ x¿ .

3. Asimetría

Coeficiente de asimetría.

Cs=n∑

i=1

n

( xi− x )3

(n−1 )(n−2 )S3

γ=E[ ( x−μ )3 ]

σ3

El grado de simetría de la distribución con respecto al promedio se mide mediante la

asimetría, la cual viene a ser el tercer momento con respecto al promedio.

(2.21)

FIGURA 2.5. EFECTO DE LA DESVIACIÓN ESTÁNDAR Y EL COEFICIENTE DE ASIMETRÍA SOBRE LA FUNCIÓN DE DENSIDAD DE PROBABILIDADES

La asimetría se da normalmente en forma adimensional, dividiendo la Ecuación (2.21) entre

σ3, cuyo cociente se denomina Coeficiente de Asimetría γ:

(2.22)

el estimador muestral de γ está dado por la expresión Cs.

(2.23)

O también

(2.24)

Como se ilustra en la Figura 2.5 (b), para una asimetría positiva (γ > 0) los datos se inclinan

a la derecha del pico de la distribución, con solamente un pequeño número de valores muy

grandes; para asimetría negativa (γ < 0) los datos se inclinan a la izquierda. Cuando los

datos poseen una asimetría pronunciada, los pocos valores extremos, ejercen un efecto

significativo sobre el cálculo del promedio aritmético (Ecuación 2.18), en cuyo caso, se

E [( x−μ )3 ]=∫−∞

∞

(x−μ )3 f ( x )dx

γ= 1

σ 3E [ (x−μ )3 ]

C s=n2∑

i=1

n

( x i−x )3

n(n−1 )(n−2)S3

C s=n2(∑

i=1

n

x3

i)−3n (∑i=1

n

x i )(∑i=1

n

xi2)+2(∑

i=1

n

xi3)

n(n−1)(n−2)S3

debe usar un parámetro alternativo para calcular en forma apropiada la tendencia central, tal

como la mediana o el promedio geométrico (ver Tabla 2.2).

EJEMPLO.

Dados los datos de precipitación anual en la estación X para el período 1970 – 1979, calcular los parámetros estadísticos de la muestra. Los datos son:

(1970,861) (1971,805) (1972,800) (1973,1.514) (1974,1.283) (1975,980) (1976,1.102)

(1977,729) (1978,813) (1979,1.316).

Solución:

Utilizando la ecuación (2.18), el promedio aritmético es:

X=1n∑i=1

n

x i=1020310

=1020 mm

La varianza se calcula mediante la ecuación (2.20)

S2= 1n−1

∑i=1

n

( xi−x )2=656 .5819

=72 .953

El coeficiente de asimetría se calcula usando la ecuación (2.23)

Ejemplo. Calcule la media de la muestra, la desviación estándar de la muestra y el coeficiente de asimetría de la muestra de la información de precipitación anual Tabla 11.3.2

Solución. Los valores de precipitación anual desde 1970 hasta 1979 se muestras en la columna 2 de la tabla 11.3.2. Utilizando la ecuación la media es:

C s=n∑

i=1

n

(x i−x )3

(n−1 )(n−2)s3=10*107 . 048 . 967

9*8*19 . 683 .000=0. 755

MEDIA: X

x = 1n

∑i = 1

n

x i

= 401 .710

= 40 .17 pu lg .

Los cuadrados de las desviaciones de la media se muestran en la columna 3 de la tabla, totalizando 1,016.9 pulg. De la ecuación

S2 = 1n − 1

∑i =1

n

( x i − x )2

= 1 ,016 .99

= 113. 0 Pu lg2

La desviación estándar es:

S = (113 .0 )1/2

= 10 .63 pu lg .Los cubos de la desviación de la media se muestran en la columna 4 de la tabla 11.3.2, totalizando 6,4803. Utilizando la ecuación (11.3.7)

Coeficiente de Asimetría: CS

CS =n ∑

i=1

n

( x i − x )3

(n−1) (n−2) S3

= 10 x 6 , 480.39 x 8 x (10 . 63 )3

= 0 .749

MODELOS PROBABILISTICOS APLICADOS EN LA HIDROLOGIA

MODELOS PROBABILISTICOS O DISTRIBUCION DE PROBABILIDADES

El modelo probabilístico explica el comportamiento del espacio muestral y a cada uno de

los resultados (eventos) se asocia con una probabilidad de ocurrencia, mediante el uso de

funciones de probabilidad (función masa de probabilidades o función de densidad de

probabilidades). Existen dos tipos de modelos de probabilidad: modelos probabilísticos

discretos y modelos probabilísticos continuos.

El procedimiento más eficiente para la predicción de ocurrencia de máximas avenidas es

realizarla en base a los registros de caudales o precipitaciones.

Es indiscutible que este método da estimados correctos con la condición de que existen

suficientes datos de caudales o precipitaciones, y que el régimen del río no haya sufrido

cambios importantes (inconsistencia de datos). Con este método se puede determinar no

solamente la magnitud de la avenida sino también la probabilidad de ocurrencia, con la

ventaja de que el valor es mucho más exacto que los métodos anteriores por basarse en

valores registrados.

Por lo general se recomienda, para que el método probabilístico sea digno de confianza, los

registros existentes cubran un periodo de alrededor de veinte años.

MODELOS PROBABILISTICOS CORRESPONDIENTE A UNA VARIABLE ALEATORIA DE TIPO DISCRETA

Estos modelos describen el comportamiento probabilístico de variables aleatorias discretas,

en un experimento aleatorio no es posible conocer anticipadamente con certeza el resultado

final, pero sin embargo es factible conocer todos los resultados posibles que puede tener la

realización del experimento de eventos mutuamente excluyentes y colectivamente

exhaustivos (resultados contables).

Los modelos probabilísticos discretos más usados en la hidrología son: distribución

Bernoulli, binomial, geométrica, binomial negativa y de Poisson.

MODELOS PROBABILISTICOS CORRESPONDIENTES A UNA VARIABLE

ALEATORIA DE TIPO CONTINUO

El hidrólogo generalmente tendrá disponible un registro de datos hidrometeorologico

(precipitación, caudales, evapotranspiración, temperaturas, etc.) a través de su

conocimiento del problema físico, escogerá un modelo probabilístico a usar, que represente

satisfactoriamente el comportamiento de la variable.

Los modelos probabilísticos continuos comúnmente usados en la hidrología son: normal,

logarítmico normal, Gamma, Pearson III y Gumbel. Para utilizar estos modelos

probabilísticos, se deben calcular sus parámetros y realizar la prueba de bondad de ajuste.

Si el ajuste es bueno, se puede utilizar la distribución elegida, una vez encontrada la ley de

distribución que rige a las variables aleatorias, además, se podrá predecir con determinada

probabilidad, la ocurrencia de una determinada magnitud, de un fenómeno

hidrometeorologico. También se podrá determinar la magnitud de un fenómeno para un

determinado periodo de retorno.

DISTRIBUCIÓN NORMAL O GAUSSIANA

Con fines referenciales se define esta distribución por ser la más conocida. Co la aclaración,

que la misma no sirve para estimar eventos máximos. Su función de densidad se expresa de

la siguiente forma:

f ( x )= 1(2 πσ )1 /2 e

−(x − μ)2

2σ2

(2.1)

Donde σ y μ

son parámetros de la distribución, en este caso la desviación estándar y la

media de los registros x.

Zi=Qi−Q

SQ

Despejando:

Qi=Q+Z . SQ

Problema. Dados los caudales máximos instantáneos en estación de aforo, se pide:

a) La probabilidad de que en un año cualquiera el caudal sea mayor igual a 7500

m3/seg. Determinar el periodo de retorno.

b) Caudal de avenida para un periodo de 60 años. Considerar que el registro de

caudales se ajusta a la distribución normal de probabilidades.

AÑO Q(m3/s) AÑO Q(m3/s) 195419551956195719581959196019611962196319641965

223032202246180427372070368242402367706124892350

1966196719681969197019711972197319741975197619771978

3706267562675971474460004060690055653130241417967430

N = 25

Solución:

a) P (Q≥ 7500¿=?

De los datos: Q=3886m3

seg

SQ=√∑ (Qi−Q) ²26

=1825.9m3

seg

Para: Q = 7500 m3/seg.

Z=7500−38861825.9

=1.98

De la tabla de distribución normal:

F(1.98)=0.9761

P(Q ≥7500)=1−0.9761

P(Q ≥7500)=0.0239=2.39 %

T= 1P

= 10.0239

→T=42 años

b) QT=? T = 60 años

Sabemos que: T= 1P(Q≥Q T)

= 11−P(Q<QT)

P=T−1T

=5960

=0.9833

De la tabla de distribución normal hallamos:

Z = 2.126 Z=Q 60−Q

SQ

=Q60−3886

1825.9=2.126

Q60=7768 m3/seg

DISTRIBUCIÓN LOG-NORMAL 2 PARAMETROS

La expresión de la función de densidad de probabilidad es la siguiente:

f ( x )= 1

xσY (2 Π )1/2 e−

( ln x − μY )2

2 σY 2

(2.2)

Dónde: μ y , σ y

son la media y desviación estándar del logaritmo natural de x, donde x es

caudal o precipitación.

La relación que existe entre el periodo de retorno (T) en años y función de densidad f(x) es:

f ( x )= 1T

(2.3)

Y con la función de densidad acumulada Fx () es:

f ( x ) = 100 − F( x )

(2.4)

Problema:

Resolver el problema anterior si se ajusta a la distribución Log normal.

a) P(Q ≥7500)=?

Calculamos y = Ln Q, para todos los caudales máximos instantáneos

Luego:

Z= y−γ∅

y = Ln Q

γ=∑ y i

N ; ∅=√∑ ¿¿¿¿

γ=8.162 ; ∅=0.46

Para Q = 7500

Z= ln 7500−8.1620.46

= 1.654

Con este valor, de la tabla de distribución normal hallamos:

F(z )=0.9509=P(Q<7500)

P(Q<7500)=1−0.9509

P(Q<7500)=0.0491=4.91%

T= 1P

= 10.0491

→T=20 años

b) Q60=¿ ( T = 60 años)

Sabemos que la probabilidad menor que viene dado por:

P=T−1T

=5960

=0.9833=F ( z )

De la tabla de Distribución normal hallamos: Z = 2.126

Z=ln Q60−γ

∅

→ Q60=9144 m3/ seg

“Z” también se pudo hallar aplicando

T = 60 p = 1/T = 0.0167

W =[ ln ( 10.0167 )

2]0.5

; W = 2.8609

De la expresión de Z=f (w)

Hallamos Z = 2.127

DISTRIBUCIÓN LOG-NORMAL 3 PARAMENTROS

La definición de la función de densidad de probabilidades es:

f ( x ) =1

( x − a ) σy (2 Π )1/2 e−

(( ln (x−a) − μy ))2 σy2

(2.5)

Donde, μy , σy

son parámetros de forma y escala y, a, es el parámetro de posición, la

notación con sub índice y significa que son la media y desviación estándar de los

logaritmos naturales de x (a registros).

DISTRIBUCIÓN EXTREMO TIPO 1, O GUMBEL O DOBLE EXPONENCIAL

El modelo para los valores extremos (máximos o mínimos) es de tres tipos, según Chow, a

sido desarrollado por Fisher y Tippett (1928), quienes lo clasificaron en tres formas:

Distribución de valor extremo llamados tipo I, II y III. Gumbel (1941) desarrollo con mayor

detalle las propiedades las propiedades de la distribución de Valor Extremo Tipo I, por esta

razón este tipo de distribución lleva su nombre.

La función de densidad de probabilidad de esta distribución es:

(−α (x − β ) − e −α ( x − β))f ( x ) = α e

(2.6)

Y la función de densidad acumulada F(x) es:

−e −α (x− β )

F ( x )= e(2.7)

Dónde: α , β

son parámetros de la distribución

PROBLEMA:

La función

−e −α (x− β )

F (Qi) =P(Q≤Qi)e

Para muestras grandes: N > 100

α=1.2825SQ

β=Q – 0.45 SQ

Q=Promedio de los caudales

SQ=Desviacion Estandar de los caudales

Para muestras pequeñas: N ≤ 100

α=σ y

SQ

β=Q−μ y

α

σ y ; μ y Se obtienen de tablas están en función de N.

Resolver el problema anterior asumiendo que la distribución se ajusta a la distribución

Gumbel.

a) P(Q ≥7500)=?

Del registro de los caudales hallamos:

Q=3886 m3 /seg

SQ=1825 m3 /seg

N = 25

De tablas

σ y=1.0914 ; μy=0.5309

Luego:

α=1.09141825.9

=0.000598

β=3886− 0.5309

598 x 10−6=2997.81

Para Q = 7500 m3/seg.

F(7500)=P(Q<7500)=e−e−598 x10−6

(7500−2997.81)

⇒P(Q<7500)=0.9345

P(Q ≥7500)=1−0.9345

P(Q ≥7500)=0.0655=6.55 %

T= 10.0655

⇒T=15 años

b) Q60=¿ ( T = 60 años)

P=5960

=0.9833

e−e−598 x10−6

(Q 60−2997.81)=0.9833

⇒Q60=9827 m3/seg

TABLA: MEDIAS ESPERADAS ( yn ¿ o (μy ¿ DE EXTREMOS REDUCIDOS EN FUNCION DE n

TABLA: DESVIACION STANDARD (S¿¿n)¿ o (σ y¿ DE EXTREMOS EN FUNCION DE n

DISTRIBUCIÓN PEARSON TIPO 3. O GAMMA 3 PARAMETROS

Esta distribución ha sido una de las más utilizadas en hidrología. Como la mayoría de las

variables hidrológicas son sesgadas, la función Gamma se utiliza para ajustar la

distribución de frecuencia de variables tales como crecientes máximas anuales, Caudales

mínimos, Volúmenes de flujo anuales y estacionales, valores de precipitaciones extremas y

volúmenes de lluvia de corta duración. La función de distribución Gamma tiene dos o tres

parámetros.

Esta distribución es un caso especial de la Gamma, es asimétrica y generalmente con forma

de campana, depende de tres parámetros estadísticos y por ello es bastante flexible. Cuando

el coeficiente de asimetría (Cs) es cero, se reduce a una distribución normal.

En los análisis probabilísticos de eventos extremos como lluvias y avenidas, se ha

generalizado el uso de la llamada: Distribución Log – Pearson Tipo III, en la cual se utiliza

como variable y = Log x, para reducir la simetría, tal modelo cuando el coeficiente de

oblicuidad (g) vale cero, se reduce a una distribución Log normal

La función de densidad de probabilidades es:

f ( x )=1

αΓ ( β ) ( x − γα ) β − 1 e

− ( x − γα )

(2.8)

Dónde: α , β , y γ

son parámetros de la distribución, y Γ ( β )

es la función Gamma la que

se define como:

( β − 1 )I = Γ ( β ) = ∫−∞

∞

xβ − 1 e x d x(2.9)

Para β > 0

, además

Γ ( β + 1)= β Γ ( β )(2.10)

DISTRIBUCIÓN LOG-PEARSON TIPO III

Si se hace un reemplazo de la variable x por el logaritmo natural (ln) de x, entonces la

función de densidad de esta distribución es:

f ( x ) =1

α x Γ ( β ) ( ln x − γα )

β −1

e− (ln x − γ

α )(2.11)

Dónde: α , β , γ

son los parámetros de escala, forma, y ubicación respectivamente, la

Aplicación de esta distribución es limitada debida a que está definido dentro de un rango la

cual es: β > 1 :1/α>1

Se debe calcular los siguientes parámetros estadísticos:

Q=∑i=1

N Qi

N

SQ=√∑i=1

N

(Q i−Q )2

N−1

Ag=N ¿¿

Ag = coeficiente de asimetría (se calcula con un solo decimal)

Se cumple la relación:

Qi=Q+K . SQ

El valor de “K” se obtiene de la tabla:

Ag 99 80 50 …….4 2 11.0101 1.25 2 ….25 50 100

3.02.80.70..-2.8-3.0

1.966 2.406

⇒ Resolver el problema anterior, asumiendo que la información se ajusta a la Distribución Pearson III.

a) P(Q ≥7500)=?

Calculando, obtenemos Q=3886 m3 /seg

SQ=1825 m3 /seg

Ag=25¿¿

Hallamos “K”

7500 = 3886 + K (1825.9)⇒ K = 1.98

Interpolando:

P (%) K4 1.966

X 1.982 2.406

Hallamos

P(Q ≥7500)=0.0206=2.06 %

T= 10.0206

⇒T=48.5 años

c) Q60=¿ ( T = 60 años)

P= 1T

= 160

⇒P=0.0167 (Mayor que)

Interpolando:

P (%) K1 2.8232 2.406

Para P = 1.67% ⇒K=2.54

⇒Q60=3886+2.54 x1825.9

Q60=8524m3

seg

“K” también se puede calcular:

P= 1T

si p > 0.5 usar: 1 – p

w=[ ln ( 1p2 )]

0.5

Z=w−(2.5155+o .8029 w+0.0103 w2 )

1+1.4328 w+0.1893 w2+0.0013 w3

Sea x=A g

6entonces

K=Z+x (Z2−1)+ x2

3(Z3−6 Z )−x3(Z2−1)+Z x4++x5

3

En este caso: Z = 2.127

x=0.76⇒ x=0.12

Remplazando hallamos:

K = 2.53

Luego:

Q60=3886+2.53 x 1825.9

⇒Q60=8506 m3 /seg

VERIFICACION DE LOS MODELOS PROBABILÍSTICOS Y RIESGOS DE

FALLA

Verificación del modelo

Se refiere la validez del modelo probabilístico propuesto, se quiere saber: es o no una

representación aproximada del fenómeno hidrológico el modelo elegido; el ingeniero ha

adoptado por una u otra razón un modelo matemático de un fenómeno físico, busca,

después de conseguir datos (registros), la validez del modelo adoptado. Para verificar

recurre a las pruebas de bondad y ajuste.

Prueba de bondad y ajuste

Las pruebas de bondad de ajuste consisten en comprobar gráfica y estadísticamente si la

frecuencia empírica de la serie de registros analizados se ajusta a un determinado modelo

probabilístico adoptado a priori, con los parámetros estimados en base a los valores

muéstrales.

Las pruebas estadísticas, tiene por objeto medir la certidumbre que se obtiene al hacer una

hipótesis estadística sobre una población, es decir, calificar el hecho de suponer que una

variable aleatoria se distribuye según un modelo probabilístico. Los ajustes más comunes

son: Chi – Cuadrado, Mínimos Cuadrados y Smirnov – Kolmogrov, en este trabajo se

utilizará la prueba de Chi – Cuadrado y la de Mínimos Cuadrados. Esta prueba se lleva a

cabo en base a la función de la densidad de probabilidad y el histograma de los registros.

PRUEBA CHI – CUADRADO

La prueba de Chi – Cuadrado fue propuesto por Karl Pearson, el estadígrafo ( x

2c )

utilizado relaciona las desviaciones del histograma respecto de los valores predichos. El

estadígrafo es:

x2c = ∑

i = 1

k (O1 − Ei )2

Ei(4.1)

Dónde:

x2

: Valor calculado de Chi – cuadrado.

Oi: Número de valores observados en el intervalo de clase i.

Ei: Número de valores esperados o predichos en el intervalo de clase i.

k: Número de intervalos de clase en que se agrupa los registros

Una guía práctica empírica sugerido por Sturges para determinar el número de intervalos de

clase k es:

k = 1 + 3 . 3 log n(4.2)

Asignando probabilidades a la ecuación (4.1), es decir, asignando igual probabilidad de

ocurrencia a cada intervalo de clase, se tiene:

x2c = ∑

i = 1

k (n1 − npi )2

npi(4.3)

Dónde:

n1: Número de observaciones que caen dentro del os límites de clase ajustados del

intervalo i.

n: Tamaño de muestra.

p1: Igual probabilidad para todos los intervalos de clase i.

Dónde:

pi =1k

ó Ei = n pi

Desarrollando y simplificando la ecuación (4.3) Markovic dedujo la siguiente ecuación:

x2c = k

n(∑

i = 1

k

ni2 ) − n

(4.4)

PROCEDIMIENTO DE LA PRUEBA DE CHI – CUADRADO

El procedimiento a seguir para comprobar la bondad de ajuste mediante la prueba de Chi –

Cuadrado es como sigue:

1. Se plantea la hipótesis: Hipótesis planteada o nula (Hp) y la hipótesis alternante (Ha).

2. Seleccionar el nivel de significación (α

), llamado también error tipo I; estos valores

de α

usualmente se pueden tomar: 10%, 5% y 1%.

3. Cálculo del estadígrafo Chi – Cuadrado calculado, mediante la ecua. (4.1) y (4.4)

4. Determinar el Chi – Cuadrado tabular (X

2b

), de tablas existente, con:

X b2 α , (k − m − 1)

Dónde: (k-m-1): Son los grados de libertad.

m: Es el número de parámetros del modelo probabilístico.

5. Criterio de decisión

a) Si X

2c ≤ X

2b

Se acepta la hipótesis planteada.

b) Si X

2c > X

2b

Se rechaza la hipótesis planteada

6. Conclusión.

AJUSTE MEDIANTE MÍNIMOS CUADRADOS

Este método compara las diferencias que existen entre los eventos registrados con los

estimados, por cada modelo probabilístico. La relación para calcular estas diferencias,

llamado también Error Standard es:

SE = ∑i = 1

k

( x1 − y1 )2 / (n − m j)

1/2

(4.5)

Dónde:

x1: Valor de los registros con i=1, 2, 3, …., n

y1: Valor estimado mediante la distribución con i=1, 2, 3, …., n

n: Longitud de registro.

m j: Número de parámetros estimados en cada distribución.

El modelo probabilístico de mejor ajuste será aquel modelo que tenga un menor valor de

error estándar.

CAUDAL MÁXIMO DE DISEÑO Y RIESGO DE FALLA

A toda estructura hidráulica se le debe asignar una vida o duración aproximada, la que es

determinada por consideraciones, económicas, técnicas, sociales, etc. Sin embargo no es

posible establecer con certeza la vida de las estructuras, por cuanto siempre es posible que

aquella falle por la ocurrencia de una avenida mayor a la prevista.

RIESGO DE FALLA

Supóngase para un tiempo del sistema hidrológico, la probabilidad de ocurrencia de un

evento, X, mayor que el evento de diseño, xo

para un periodo de n años es P. Luego la

probabilidad de no ocurrencia, Q es:

Q = 1 – P (5.1)

La probabilidad de exceder al evento de diseño, xo

, para un periodo de retorno de T años

es:

P = 1/T (5.2)

La probabilidad de no ocurrencia en un año es:

Q = 1 – 1/T (5.3)

La probabilidad de no ocurrencia en n años es:

Q = ( 1 − 1 /T )n

(5.4)

Finalmente la probabilidad de que el evento, X, ocurra por lo menos una vez en n años es:

P = 1 − Q

P = 1 − (1 − 1/Q )n

(5.5)

La ecuación (5.5) es el “riesgo de falla”; esta ecuación se ha tabulado para varios valores de

periodos de retorno, T, y diferentes vidas esperados del proyecto, n, encontrándose las

diferentes probabilidades, P, de riesgo de fallas (ver cuadro Nº 5.1)

DESARROLLLO DE LA ECUACIÓN 5.5 PARA PERIODOS DE RETORNO REALES CON

DIFERENTE RIESGOS DE FALLA DURANTE LA VIDA ESPERADA DE LA ESTRUCTURA

Riesgo

falla

Perms

Vida esperada del Proyecto, n,

(años)

1 2 5 10 20 25 50 100

0.99

0.95

1.01

1.05

1.11

1.29

1.66

2.22

2.71

3.86

4.9

7.2

5.9

8.8

11.4

17.2

22.2

33.9

0.90

0.75

0.50

0.33

0.25

0.20

0.10

0.05

0.02

0.01

1.11

1.33

2.00

3.00

4.00

5.00

10.00

20.00

50.00

100.00

1.46

2.00

3.41

5.45

7.46

9.47

19.50

39.50

99.00

199.50

2.71

4.13

7.73

12.90

17.90

22.90

48.00

98.00

248.00

498.00

4.86

7.73

14.90

25.20

35.30

45.30

95.40

195.00

495.00

995.00

9.2

14.9

29.4

49.9

70.0

90.1

190.0

390.0

990.0

1990.0

11.4

18.6

36.6

62.1

87.3

113.0

238.0

488.0

1230.0

2488.0

22.2

36.6

72.6

124.0

174.0

225.0

475.0

975.0

2476.0

4977.0

43.9

72.6

145.0

247.0

3448.0

449.0

950.0

1950.0

4951.0

9953.0

CAUDAL MÁXIMO DE DISEÑO

Es el valor de aquella descarga que considera la vida esperada, n, años del proyecto, y

el porcentaje de riesgo de que fallen estas estructuras, este riesgo de falla está en

función del periodo de retorno, T.

La determinación de la descarga máxima de diseño es como sigue:

1. Escoger vidas esperadas, n, del proyecto estos pueden ser, 2, 5, 10, 25, etc. Años.

2. Escoger determinados riesgos de fallas, que deben aplicarse a la vida esperada del

proyecto que pueden ser: 0.01, 0.05, 0.10, 0.20, etc.

3. Para cada vida esperada del proyecto y riesgo de falla se determina cual es el

periodo de retorno real de la tabla 5.1.

4. Con los periodos de retorno real determinados en el paso 3, se va al gráfico que

relaciona descargas máximas y periodos de retorno del río en estudio, y se

determina que descarga le corresponde al periodo de retorno real. Esta descarga es

el caudal máximo de diseño.

EJEMPLO:

AJUSTE DE UNA DISTRIBUCION DE FRECUENCIAS EMPÍRICA A UNA TEÓRICA

Precipitación: mes de enero (de 37 años de registro) Nº 37

Estación: Cajamarca. Latitud: 07º03’; longitud: 78º30’; Altitud: 2,727 m.s.n.m.

P(mm) θ (orden)f (θ)=θ

N+1

(Frec. acumulada)P(mm) θ (orden)

f (θ)=θN+1

(Frec. acumulada)121.3

26.7

110.1

63.4

122.9

64.2

59.6

10

37

14

26

9

25

27

0.263

0.974

0.368

0.684

0.237

0.658

0.711

144.7

112.2

205.8

37.4

148.3

36.0

52.3

6

12

1

28

4

36

31

0.158

0.316

0.026

0.737

0.105

0.947

0.816

144.9

92.8

95.6

76.3

162.1

110.2

40.3

142.4

28.8

48.8

52.3

97.2

5

18

17

22

3

13

34

7

29

32

30

16

0.132

0.474

0.447

0.579

0.079

0.342

0.895

0.184

0.763

0.842

0.789

0.421

109.2

137.1

114.5

79.0

67.5

88.0

145.0

48.5

36.4

78.5

76.9

15

8

11

20

24

19

2

33

35

23

21

0.395

0.211

0.289

0.586

0.632

0.50

0.053

0.868

0.921

0.605

0.553

Luego se obtiene la media y la desviación estándar de la muestra:

X = 91 . 82 mm

, σ n − 1 = 42 .99 mm

Coeficiente Variabilidad

σn − 1

X= 0 .408

AJUSTE POR CHI-CUADRADO

Este ajuste requiere un análisis por frecuencias relativas. Para lo cual dividimos el rango de

la muestra en intervalos de clase. Algunos hidrólogos siguieron las formulas:

Nº de intervalos = 1 + 1.33 ln N (1).

Rango o intervalos:

σ¿

4 (2); o que el número de intervalos debe de ser como mínimo 5 y

para mejor uso de la información 10-25 intervalos. Usaremos 6 intervalos en la formula (1)

e intervalos aritméticos.

Δ = ( Pmáx − Pmin)/6 ≃ 29 .85 → 30 (Tomaremos un valor mayor que el Δ calculado para

abarcar el rango de la muestra).

Marca de claseFrecuencia

Observada (fo)Frecuencia relativa

Frecuencia acumulada

Marca

26-56 9 9/37 = 0.243 0.243 41

56-86

86-116

116-146

146-176

176-206

8

9

7

2

2

0.226

0.243

0.189

0.054

0.054

0.459

0.702

0.891

0.948

0.999

71

101

131

19

20

LIMITES DE

CLASE Z

AREA BAJO

LA CURVA

NORMAL DE

0 A Z

AREA PARA

CADA CLASE

e

FRECUENCIA

ESPERADA

fe = e x N

265686116146176206

-1.53-0.83-0.140.561.261.962.66

0.43700.29670.05570.21230.39620.47500.4961

0.14030.2410.2680.18390.07880.0211

5.1918.9179.9166.8042.9160.781

Z =X (26 )− X (91 . 82)

σn−1

¿

(42 . 99)=−1.53 X = 91.82 m

σ¿

n−1 = 42 . 99

e = Área para cada clase (0.4370 - 0.296 = 0.1403)

fe = Frecuencia esperada

x2c ≡

(9−5.191)2

5.191+(8−8.917)2

8.917+

(9−9.816)2

9.816+(7−6.804)2

6.804+

(2−2.916)2

2.916+

(2−0.781)2

0.781

x2c=5.153

X tabla2

Para 𝛂 ¿0.05 ; (1-𝛂) = 0.95 ; G.L. = 6 – 2 - 1 = 3

x2cal = ∑i−1

6 ( f 0 − f e )2

f e

De la tabla X 0. 95

2

se tiene X t

2

= 7.81

Como X c

2 ∠ X t2

se concluye que el conjunto de datos analizados siguen o se aproxima a

una distribución normal.

AJUSTE POR KOLMOCROF – SMIRNOV

Trabajamos con la distribución de frecuencia acumulativa f (θ) y f ( z )

f (θ) = mn+1

= 137+1

=0 .026

Z=Pi−P

σ=205.8−91.87

42.99=2.65

f ( z)=0.5−f ( x)

f ( x)=se obtiene de tablas con valor de Z ¿)

Para Z = 2.65 se obtiene 0.4960

Entonces f ( z)=0.5−0.4960=0.004

θ f (θ) z f ( z ) Δ=f (θ)

- f ( z )

12345678910111213141516171819202122232425262728293031323334353637

0.0260.0530.0790.1050.1320.1580.1840.210.2370.2630.2890.3160.3420.3680.3950.4210.4470.4740.5000.5260.5530.5790.6050.6320.6580.6840.7110.7370.7630.7890.8160.8420.8680.8950.9210.9470.974

2.651.701.631.311.231.231.181.050.710.690.530.470.430.430.400.130.090.02-0.09-0.30-0.35-0.36-0.45-0.57-0.64-0.66-0.75-0.80-0.83-0.92-0.92-1.00-1.01-1.20-1.29-1.29-1.51

0.0040.0450.0520.0960.1100.1100.1190.1470.2370.2450.2980.3190.3340.3340.3450.4480.4640.4920.5360.6180.6370.6410.6740.7100.7390.7450.7730.7880.7910.8190.8210.8410.8440.8850.9020.9020.935

0.0220.0080.0270.0100.0230.0490.0650.0640.0020.0180.0030.0030.0080.0340.0500.0270.0170.0180.0360.092*0.0840.0620.0690.0840.0810.0610.0420.0510.0280.0320.0050.0010.0240.0360.0200.0460.040

Probabilidad acumulada f (θ) y f ( z )

Δ tabla para α = 0 . 05 (0 .95 fiabilidad ); n = 37 ⇒ Δ tabla = 0. 22Δ observado ( Δ máx) = 0 . 092Si Δ observado < Δ tabla

Conclusión: Los datos analizados se ajustan a una distribución normal

Problema: La descarga de los ríos Acarí y Yauca tiene similitud en su comportamiento

(H1 = H2 ), realizar la prueba e verosimilitud (prueba t); a partir de una muestra de

24 años de registro.

X acarí = 451.8 M .M .

X Yauca = 319 .8 M . M .

σ¿

acarí = 276 .8 M . M .

σ¿

yauca = 227 . 6 M . M . n1 = 24 años

n2 = 24 años

α = 0. 05

Solución:

1) H p → M 1 = M 2 ; H α → M 1 ≠ M 2

2) Prueba estadística a usarse “t”

t c =( X1 − X2 )− ( M1 − M 2 )

σ¿

X1 − X2

M 1 − M 2 = 0 ( por hipótesis) ¿ σ¿ X¿= σ

¿

p √1n1

+ 1n2

¿ ¿¿¿¿¿

Dónde:

σ¿

X 1 − X2 : Desviación Standart de las diferencias de promedios.

σ¿

p: Desviación Standart ponderado

Reemplazando los valores se obtiene: σ¿

p = 253 . 40 M . M .

σ¿

X 1 − X2= 73 .15 M . M .

⇒ t c =(451 .8 − 319.8 )73 .15

⇒ t c = 1. 8 t calculado.

3) Hallar el valor de t t (en las tablas con

α=0 . 05 ; 95 % de probabilidad) y

G . L . = n1 +n2 −2 = 46 en la tabla

2 .00 < t t < 2 .021 Interpolando

¿ 2 . 015 ⇒ t t ≃ 2 . 015

Como t c

(1.8) se encuentra dentro de la zona de aceptación de la hipótesis. Se concluye que

los medios poblacionales de la descarga de los ríos de Acarí y Yauca son iguales.

Download - ESTADISTICA Y PROBABILIDAD EN LA HIDROLOGIA.docx

Top Related