PROBABILIDAD APLICADA A LA HIDROLOGIA
Msc. Ing. Isidro Alberto Pilares Hualpa
MODELOS HIDROLÓGICOS
Según Chow. Maiduant y Mays (1984), un modelo de sistema hidrológico es una
aproximación al sistema real: sus entradas y salidas son variables hidrológicos mensurables
y su estructura es un conjunto de ecuaciones que conectan las entradas y salidas.
Los modelos hidrológicos pueden dividirse en dos categorías: modelos físicos y modelos
abstractos. Los primeros incluyen, modelos de escala que refrendan el sistema en una
escala reducida, tal como un modelo hidráulico del vertedero de una prosa. Los modelos
abstractos representan el sistema en forma matemática, la operación del sistema se describe
por medio de un conjunto de ecuaciones que relacionan los variables de entrada y salida.
Estas funciones pueden ser funciones de espacio y del tiempo y también pueden ser
variables probabilísticas y aleatorias, que no tienen un valor fijo en un punto particular del
espacio y tiempo, pero que están descritas a través de distribuciones de probabilidad.
MODELO MATEMATICO
Un modelo matemático es una simplificación de una situación real, expresada mediante una
serie de hipótesis o suposiciones, traducidas en lenguaje matemático y que conducen,
después de una adecuada manipulación, utilizando para ello las técnicas matemáticas
apropiadas, a una serie de resultados de cuyo análisis se espera sacar a la luz aspectos de la
situación original no fácilmente apreciables a simple vista.
CHOW (1964) señala que los modelos matemáticos son aplicados para simular el
fenómeno hidrológico natural, el cual es considerado como un proceso o sistema.
Cualquier fenómeno que esté sometido a cambios, particularmente con respecto al tiempo,
es llamado un proceso. Como prácticamente todos los fenómenos hidrológicos cambian con
el tiempo pueden ser llamados procesos hidrológicos. Si la oportunidad de ocurrencia de las
variables envueltas en tal proceso es ignorada y el modelo se considera que sigue una ley de
certeza pero ninguna ley de probabilidad, el proceso y el modelo son descritos como
determinísticos. De otra forma, si la oportunidad de ocurrencia de la variable es tomada en
consideración y el concepto de probabilidad es introducido en la formulación del modelo, el
proceso y el modelo son descritos como estocásticos o probabilísticos (CHOW, 1964).
Estrictamente hablando, un proceso estocástico es diferente a uno probabilístico en que el
primero es considerado dependiente del tiempo y el segundo independiente del tiempo.
Podría decirse, entonces, que los modelos Probabilísticos hacen predicciones, mientras que
los modelos estocásticos hacen pronósticos (CHOW et al., 1994).
En realidad, todos los procesos hidrológicos son más o menos estocásticos. Se asumen
determinísticos o probabilísticos sólo para simplificar su análisis.
Tipos de modelos matemáticos de cuencas
Un modelo matemático de cuenca consiste en varios componentes, cada uno describe cierta
fase o fases del ciclo hidrológico. Un modelo matemático puede ser de tres tipos: (1)
teórico, (2) conceptual, o (3) empírico. Los modelos teóricos y empíricos son exactamente
opuestos en significado, con modelos conceptuales que se ubican entre ellos. En suma, un
modelo matemático puede ser determinístico o probabilístico, lineal o no lineal, invariable
en el tiempo o variable en el tiempo, global o distribuido, continúo o discreto, analítico o
numérico, evento guiado o proceso continuo.
En la práctica del modelado de cuenca, cuatro tipos generales de modelos matemáticos se
reconocen comúnmente: (1) determinísticos, (2) probabilísticos, (3) conceptuales, y (4)
paramétricos.
Los modelos determinísticos
Son formulados siguiendo las leyes de los procesos físicos y procesos químicos descriptos
por ecuaciones diferenciales. Un modelo determinístico es formulado en términos de un
grupo de variables y parámetros y ecuaciones relacionadas a ellos. Un modelo
determinístico implica una relación causa-efecto entre los valores de los parámetros
elegidos y los resultados obtenidos de la aplicación de las ecuaciones. Idealmente, un
modelo determinístico debería proveer el mejor detalle en la simulación de los procesos
físicos o químicos. En la práctica, sin embargo, la aplicación de modelos determinísticos
está asociada frecuentemente a la incapacidad del modelo o del modelador de resolver la
variabilidad temporal y espacial del fenómeno natural en incrementos suficientemente
pequeños.
Los modelos conceptuales
Son representaciones simplificadas de los procesos físicos, obtenida por los variaciones
espacial y temporal y usualmente recaen sobre descripciones matemáticas (ya sean en
forma algebraica o por ecuaciones diferenciales ordinarias), que simulan procesos
complejos basándose en unas pocas claves de parámetros conceptuales. El uso extensivo de
los modelos conceptuales en la ingeniería hidrológica refleja la complejidad inherente del
fenómeno y la incapacidad práctica de considerar los componentes determinísticos en todas
las instancias. De allí que los modelos conceptuales son sustitutos útiles y prácticos para los
modelos determinísticos.
Los modelos paramétricos (esto es empírico o caja negra)
Son los más simples de todas las propuestas de modelado. Como su nombre indica, el
énfasis de los modelos paramétricos está en los parámetros empíricos en los que está basada
la solución. Usualmente, un modelo paramétrico consiste en una ecuación (o ecuaciones)
algebraica que contiene uno o más parámetros a ser determinados por el análisis de datos u
otro medio empírico. La aplicabilidad de los modelos paramétricos está restringida al rango
de datos utilizados en la determinación de los valores de los parámetros. Los modelos
paramétricos son útiles cuando los modelos conceptuales, determinísticos o probabilísticos
no son prácticos o son demasiado caros.
Los modelos probabilísticos
Son exactamente lo opuesto en significado a los modelos determinísticos. Un modelo
probabilístico se formula siguiendo las leyes del azar o probabilidad. Los modelos
probabilísticos son de dos tipo: (1) estadísticos, y (2) estocásticos. El desarrollo de los
modelos estadísticos es gobernado por las leyes de la probabilidad y aleatoriedad los
modelos estadísticos tratan con ejemplos observados, y requieren invariablemente el uso de
datos; mientras que los modelos estocásticos enfocan en las propiedades aleatorias o
estructura del azar observada en ciertas series de tiempo hidrológicas - por ejemplo, flujos
diarios de corriente en cuencas de tamaño medio. los modelos estocásticos enfatizan sobre
las características estocásticas de los procesos hidrológicos.
Primera conclusión.
Los fenómenos que se presentan en la ingeniería, pueden clasificarse desde el punto de
vista de la certeza de su ocurrencia, en determinísticos y probabilísticos. Si la
probabilidad de ocurrencia de las variables en proceso es cierta, es decir asegurar una
ley determinada no probabilístico. En cambio si se toma en cuenta la probabilidad de
ocurrencia y la falta de certeza existente entonces se habla de un proceso de
naturaleza probabilística en el campo de la ingeniería de la hidrológica pertenecen a la
categoría de los probabilísticos o estadísticos.
En rigor, existen diferencias entre los procesos probabilísticos y los estocásticos. Los
primeros son independientes del tiempo y los segundos son dependientes. Se denominan
proceso estadístico a un conjunto de variables aleatorias cuyas características varían en el
tiempo. En un proceso probabilístico, independiente de la variable del tiempo, la secuencia
de las variables no interesan y se supone que ellas siguen un determinado comportamiento
dado por el modelo probabilístico o distribución.
Relaciones precipitación-duración-frecuencia.
Uno de los primeros pasos que debe seguirse en muchos proyectos de diseño hidrológico es
la determinación del o los eventos de precipitación que deben usarse. La forma más común
de hacerlo es utilizar una lluvia de diseño o un evento que involucre una relación entre la
precipitación, la duración de esta, y las frecuencias o períodos de retorno apropiados para la
obra y el sitio. Estos eventos, por otra parte, pueden estar basados en análisis regionales o
de sitio específico (CHOW et al., 1994 y ZALINA et al., 2002).
Procedimiento de análisis.
AYALA y FERRER (1973) señalan que el procedimiento de análisis de frecuencia
comprende las siguientes etapas:
- Verificar la confiabilidad de los datos hidrológicos
- Suponer ciertos modelos probabilísticos
- Estimar los parámetros estadísticos de las funciones de distribución de
probabilidades de cada modelo elegido
- Realizar pruebas que permitan seleccionar el modelo probabilístico que mejor
describe el fenómeno que se intenta representar
- Estimar él o los valores de diseño correspondientes al período de retorno de interés.
Según BROWN y VARGAS (1986); JARA (1986); BOOY y LYE (1989); CHOW et al.
(1994) y VARAS y BOIS (1998), al estimar estos valores de diseño, existen varias fuentes
de incertidumbre hidrológica que pueden ser divididas en tres categorías:
- Incertidumbre natural o inherente con respecto al proceso de generación aleatoria
del fenómeno de interés
- Incertidumbre de modelo, al representar un proceso con un modelo inadecuado
- Incertidumbre de parámetro, asociada a la metodología usada en la estimación de
los parámetros del modelo
Estimación de parámetros.
AYALA y FERRER (1973) y KITE (1977), señalan que una vez que un modelo
probabilístico ha sido escogido, la segunda fuente de error es aparente: los parámetros
estadísticos de la función de distribución de probabilidades deben ser estimados desde la
muestra. Dado que la muestra está sujeta a errores, el método de estimación debe minimizar
estos errores.
Según OBREGÓN (1977) y YEVJEVICH (1978), un estimador es un estadígrafo cuyo
valor observado intentamos usar para estimar el valor de un parámetro desconocido de una
función de distribución de probabilidades. De este modo, pueden ser clasificados en
términos de sesgo, eficiencia, consistencia, suficiencia y eficiencia asintótica.
MÉTODOS PROBABILÍSTICOS
El procedimiento más eficiente para la predicción de ocurrencia de máximas avenidas es
realizarla en base a los registros de caudales o precipitaciones.
Es indiscutible que este método da estimados correctos con la condición de que existen
suficientes datos de caudales o precipitaciones, y que el régimen del río no haya sufrido
cambios importantes (inconsistencia de datos). Con este método se puede determinar no
solamente la magnitud de la avenida sino también la probabilidad de ocurrencia, con la
ventaja de que el valor es mucho más exacto que los métodos anteriores por basarse en
valores registrados.
Por lo general se recomienda, para que el método probabilístico sea digno de confianza, los
registros existentes cubran un periodo de alrededor de veinte años.
FENOMENO ALEATORIO
DIAZ (2010), Es aquel fenómeno que bajo las mismas condiciones experimentales se
presenta en mas de una manera o también se le denomina fenomeno que sucede al azar. En
el lenguaje de probabilidades las palabras: fenomeno, suceso, experimento, observación o
dato son términos que se usan indistintamente. Por ejemplo, todas las variables
hidrológicas como las precipitaciones, descargas etc. Son consideradas como fenómenos o
sucesos aleatorios, por que se consideran como sucesos al azar. El azar hace que algunas
cosas ocurran de manera fortuita e impredecible. Los fenómenos aleatorios se estudian a
través de la ley de probabilidades (posibilidades).
ELEMENTOS DE ESTADÍSTICA
Los procesos hidrológicos son de naturaleza estocástica, es decir, que su distribución en
el tiempo y en el espacio es tal que, en parte son determinísticos (predecibles) y en parte
aleatorios.
Algunas veces, la variabilidad aleatoria es muy grande comparada con la determinística,
de modo que se justifica un tratamiento de proceso aleatorio puro, tal como cuando una
magnitud de una observación del proceso no está correlacionada con la magnitud de una
observación adyacente, siendo las propiedades estadísticas de todas las observaciones, las
mismas.
Cuando no existe correlación entre observaciones adyacentes, la salida del sistema
hidrológico se considera estocástica, independiente en el espacio y en el tiempo. Este
comportamiento es típico de eventos hidrológicos extremos, tal como crecidas o sequías; y
de datos hidrológicos medios sobre intervalos de tiempo largos, como precipitación anual.
En este capítulo se describen los datos hidrológicos pertenecientes a un proceso aleatorio
puro, mediante el uso de parámetros y funciones estadísticas. Los métodos estadísticos se
basan en principios matemáticos que describen la variación de un conjunto de
observaciones de un proceso, centrando la atención, más bien en las mismas observaciones
en vez del proceso físico que las origina
ESPACIO MUESTRAL
Si el resultado de un proceso es aleatorio para el observador se puede hablar, entonces, de
un experimento.
Para describir el resultado de un experimento pueden definirse muchas variables, pero
interesara formular un modelo matemático simple del fenómeno físico que interesa.
Así, si el experimento consiste en analizar el resultado un dado, convendrá que la variable
que modela el problema sea el número que indica la cara superior del dado. Otras variables
como color, distancia recorrida, velocidad inicial etc. No serán relevantes en el
experimento.
Aun cuando en un experimento, no es posible determinar con seguridad su resultado, se
puede si, definir con precisión un listado de los resultados posibles de ocurrir. Esta lista
constituye el espacio muestral. “Espacio muestral es el listado más detallado de todos los
resultados posibles del experimento definidos por eventos mutuamente exclusivos y
colectivamente exhaustivos”
Por ejemplo, el espacio muestral del lanzamiento de un dado es el conjunto de números
enteros 1, 2, 3, 4,5 y 6. El espacio muestral al lanzar una moneda es cara y sello
ALGEBRA DE EVENTOS
Constituye una herramienta y una terminología precisa para manejar y utilizar los
conceptos de probabilidades.
Antes de establecer sus postulados es necesario definir los siguientes conceptos, para los
cuales se utilizan los llamados diagramas de VENN.
EVENTOS
Son colecciones de puntos o sub-conjuntos en un espacio que tienen características
comunes, los cuales quedaran más claramente especificadas al definir el espacio muestral.
La colección de todos los puntos del espacio se denomina Universo. Conjunto Universal o
Evento Universal. Se designara por U
Se denominara complemento de un evento, evento A´, a todos los puntos del universo que
no están incluidos en el evento A. Un caso especial es el evento nulo o vacío que es el
complemento del evento universal.
Intersección de dos eventos A y B es la colección de puntos que están incluidos en el
evento A y en el evento B. Se designa intersección de A y B.
U
Unión de dos eventos A y B es la colección de puntos que están en A o en B o en ambos.
La unión de dos eventos A y B se designaran por A+ B.
Dos eventos A y B son mutuamente excluyentes o exclusivos o disjuntos o ajenos, si
ningún punto del universo (espacio muestral) esta incluido en mas de un evento. Es decir A
y B no tienen elementos comunes, matemáticamente se representa mediante la siguiente
ecuación:
A ∩ B = ∅
ELEMENTOS DE PROBABILIDADES EN HIDROLOGIA.
Para completar la descripción de un modelo para un experimento, se requiere además,
asignar alguna medida que represente la posibilidad que ese evento ocurra. Esta medida es
la probabilidad, se tiene entonces que un modelo de un experimento físico debe contar con
una definición del espacio muestral, indicando los resultados posibles del experimento y de
una asignación de probabilidad en cada punto del espacio. Hecho esto, el modelo estará
completo.
Una variable aleatoria X es una variable que se describe mediante una función de
distribución de probabilidades. La distribución indica la probabilidad de que una
observación cualquiera x de la variable X obtenga un valor dentro de un rango específico
de X.
Supongamos por ejemplo que X sea la precipitación anual en un punto determinado, la
distribución de X especifica el chance que tiene un valor de precipitación anual observado
en un año dado de caer dentro de un rango previamente definido, tal como por ejemplo,
menos que 1.200 mm, o entre 1.200 y 1.500 mm.
A un conjunto de observaciones x1, x2,..., xn de la variable aleatoria se denomina
muestra. Se asume que las muestras se extraen de una población hipotéticamente infinita
de propiedades estadísticas constantes; mientras que las propiedades de las muestras
pueden variar de una a otra. El conjunto de todas las muestras posibles que se puedan
extraer de la población se denomina espacio muestral y un evento viene a ser un
subconjunto del espacio muestral, como se ilustra en la Figura 2.1.
Así por ejemplo, el campo muestral de la precipitación anual es teóricamente el rango
desde cero a infinito positivo (los limites prácticos, inferior y superior, son por supuesto
valores finitos pequeños); el evento A podría ser la ocurrencia de un valor de precipitación
anual menor que alguna magnitud especifica, tal como por ejemplo 1.200 mm.
PROBABILIDAD DE UN EVENTO
La probabilidad de ocurrencia de un evento, P(A), es el chance de ocurrencia de dicho
evento cuando se lleva a cabo una observación de la variable aleatoria. Si una muestra de n
observaciones posee nA valores en el rango del evento A, entonces la frecuencia relativa de
A es nA/n. La frecuencia relativa se constituye en un estimado progresivamente mejor de la
probabilidad de ocurrencia del evento a medida que el tamaño de la muestra se incrementa,
es decir:
P (A) = lim nA/n (2.1)
n ∞
A este tipo de probabilidades se denomina probabilidades objetivas o posteriores, debido
a que dependen totalmente de observaciones de la variable aleatoria.
En contraposición a ellas, tenemos las probabilidades subjetivas o a priori, es decir,
cuando se estima la ocurrencia de un evento sobre la base de juicios personales y
experiencia.
Es costumbre calcular la probabilidad futura de un evento sobre la base de las
observaciones de la muestra, por tanto la probabilidad de cualquier evento A que contenga
nA elementos de estos n puntos (tamaño de la muestra o del espectro muestral) es la razón
del número de elementos en A al número de elementos en la muestra. Matemáticamente
esta definición se expresa por:
P(A) ¿nA
n= casos faborables
casos posibles
nA es considerado como el número de resultados o puntos favorables o como los éxitos,
entonces la probabilidad de éxito (que ocurra A), está dada por esta ecuación. (El termino
favorable o éxito es meramente enunciativo).
La probabilidad de ocurrencia de los eventos hidrológicos se rige por los siguientes
principios:
1. Probabilidad Total: Si el espacio muestral Ω se divide en m áreas excluyentes o
eventos A1, A2,... Am, entonces:
P (A1) + P (A2) +.... + P (Am) = P (Ω) = 1 (2.2)
2. Complementariedad: Si sucede que A es el complemento de A, es decir, A = Ω - A,
entonces:
P(A) = 1 - P(A) (2.3)
3. Probabilidad Condicional: Supongamos que tenemos dos eventos A y B, como se
muestra en la Figura 2.1. Si P(B/A) es la probabilidad condicional de que ocurra B, dado
que A ya ha ocurrido, entonces, la probabilidad conjunta de que A y B ocurran P(A ∩ B),
es el producto de P(B/A) y la probabilidad de que ocurra A, es decir,
P(A ∩ B) = P (B/A) x P(A),
O
P( AB )=P( A ∩ B)
P( A)(2.4)
Si la ocurrencia de B no depende de la ocurrencia de A, se dice que los eventos son
independientes, y P (B/A) = P (B). Para eventos independientes, de la Ecuación (2.4)
tenemos
P(A ∩ B) = P(A) x P (B) (2.5)
Ejemplo.
Usando los datos del registro de caudales para el rio sondando, estimar la probabilidad
que un “caudal” pico que exceda los 100 m3 /seg; ocurra en dos sucesivos años en el rio
sondando.
Solución:
En el registro vemos que los caudales de 100 m3/seg. Han sido excedidos 3 veces en 66
años, la probabilidad que un caudal exceda en un año es 3/66 = 0.0455, y que exceda en dos
años consecutivos será:
P(A∩ B ¿= 0.0455 x 0.0455
P(A ∩ B ¿=0.0027
(Se asume que los eventos son independientes, lo cual se explica físicamente por la no
dependencia de año en las descargas máximas)
Sea A el evento de que en este año la precipitación sea menor que 1.600 mm; y B, el
evento de que en el próximo año la precipitación sea menor que 1.600 mm. La unión A ∩ B
o superposición de A y B indica que ambos eventos ocurren, es decir, dos años sucesivos
con una precipitación anual menor de 1.600 mm.
Retomando el ejemplo anterior, si los eventos de precipitación fuesen independientes de
año a año, entonces, la probabilidad de que la precipitación sea menor que 1.600 mm en
dos años sucesivos es simplemente el cuadrado de la probabilidad de que la precipitación
anual en cualquiera de los dos años sea menor que 1.600 mm.
La noción de eventos u observaciones independientes es muy importante para la
interpretación estadística correcta de una secuencia de datos hidrológicos, ya que los
eventos independientes se pueden analizar sin considerar el orden de su ocurrencia. En
cambio, cuando los datos son dependientes (auto correlacionados), los métodos de análisis
son más complejos debido a que la probabilidad conjunta P(A ∩ B) de even tos
sucesivos no es igual a P(A) x P(B).
Ejemplo:
En la Tabla 2.1 se dan los valores anuales de precipitación (R) registrados en la estación X
durante el período 1911-1979, los mismos que se han graficado en la Figura 2.2 (a).
Calcular la probabilidad de que la precipitación anual R en cualquier año sea menor que
889 mm, mayor que 1.143 mm; esté entre 889 mm y 1.143 mm.
Solución:
El conjunto de datos está constituido por 69 años, es decir n = 69. Hagamos que sea los
eventos
A sea R < 889 mm
B sea R > 1.143 mm
De los 69 valores de la Tabla 2.1, 23 caen en el evento A y 19 en el B; es decir, nA = 23; y
nB = 19. Luego,
P(A) ≡ 23/69 = 0.333
P(B) ≡ 19/69 = 0.275
De la Ecuación (2.3), la probabilidad de que la precipitación anual esté entre 889 y 1.143
mm se calcula como
P(889 ≤ R ≤ 1.143) = 1 - P(R<889) - P(R > 1.143) = 0.392
TABLA 2.1 PRECIPITACION ANUAL EN LA ESTACION X, 1991 – 1979 (mm).
Año 1910 1920 1930 1940 1950 1.960 1970
0 - 1.237 1.229 1.252 792 1.168 861
1 1.013 1.120 864 1.123 686 1.125 805
2 787 1.087 1.158 1.059 940 960 800
3 1.074 1.229 947 782 1.189 752 1.514
4 1.069 869 1.110 1.361 683 892 1.283
5 1.044 823 1.062 876 645 1.262 980
6 729 1.179 1.044 1.278 584 930 1.102
7 427 988 792 1.113 1.435 826 729
8 866 947 894 549 1.102 1.567 813
9 1.433 1.285 892 1.196 1.049 1.204 1.316
EJEMPLO 2.2:
Asumiendo que los datos de la Tabla 2.1 constituyen un proceso independiente, calcular la
probabilidad de que ocurra en dos sucesivos precipitaciones menores que 889 mm/año.
Compare esta probabilidad estimada con la frecuencia relativa de dicho evento en el en el
conjunto de valores de la Tabla 2.1.
Solución: Hagamos que C sea el evento para el cual R < 889 mm en dos año sucesivos.
Del ejemplo 2.1 tenemos que P (R <889 mm) = 0,333, asumiendo independencia tenemos:
P(C) ≡ [P(R<889mm)2 = (0,333)2 = 0,111
Observando el conjunto de valores de la Tabla 2.1, es encuentran nueve (9) pares de dos
años sucesivos con precipitación menor que 889 mm de un total de 68 pares posibles,
luego,
P(C) ≡ nc/n = 9/68 = 0.132
Que es aproximadamente igual al calculado (0.111) asumiendo independencia.
Las probabilidades estimadas como en los Ejemplos 2.1 y 2.2 dan resultados
aproximados, ya que dependen del tamaño de la muestra. Un método alterno consiste en
ajustar a los datos una función de distribución de probabilidades y luego determinar la
probabilidad de los eventos mediante dicha función.
VARIABLE ALEATORIA Y DISTRIBUCIONES. ESPERANZA MATEMATICA Y MOMENTOS DE LAS DISTRIBUCIONES
Como se ha indicado líneas arriba, las variables hidrometeorologicos como las descargas,
precipitaciones, temperaturas, horas de sol, etc., son consideradas como variables aleatorias
y por lo tanto se pueden describir mediante las distribuciones o modelos de probabilidades
de tipo discreto o continuo.
Díaz (2010), en una muestra es importante describir las curvas de frecuencias mediante las
estadísticas, de igual manera en el estudio de la variable aleatoria la descripción de la
distribución de probabilidades (curva que describe la población) se realiza atraves de los
parámetros que se estiman, como por ejemplo mediante la esperanza matemática o
momentos de la distribución de probabilidades. La esperanza matemática o los momentos
de la distribución vienen a ser uno de los métodos que permite evaluar los descriptores de la
distribución (parámetros), como por ejemplo el coeficiente de sesgo.
VARIABLE ALEATORIA
Se denomina como variable aleatoria, porque su valor queda determinado por el resultado
de un experimento, es decir, depende del azar. Tales resultados son debidos a las
operaciones de causas no predecibles. Una variable aleatoria (X) es una función definida
sobre un espacio muestral “S”, esto significa que a cada elemento e i del espacio muestral
”S”, corresponde un número real único, cuyo valor es X.
e1 , e2 , e3……… en son los experimentos realizados
x1 , x2 , x3……….xn son los resultados de los experimentos
Como el valor de la variable aleatoria está determinado por el resultado del experimento
(suceso aleatorio de caudales, precipitaciones, etc.) se puede asignar probabilidades a sus
valores posibles (función de probabilidad).
La distribución de probabilidad de una variable aleatoria X es una descripción de las
probabilidades asociadas con los posibles valores de X, según esta definición se tiene la
distribución de probabilidades siguientes:
- Para el caso de variables aleatorias discretas: función de masa de probabilidad o
función discreta masa de probabilidades y la función de distribución acumulada o
distribución acumulada discreta
- Para el caso de variables aleatorias continuas: función de densidad de probabilidad o
función de densidad de probabilidades y la función de distribución acumulada o
distribución acumulada continúa.
CLASES DE VARIABLE ALEATORIA
En muchos casos prácticos las variables aleatorias son, o bien Discretas o bien Continuas.
VARIABLE ALEATORIA DISCRETA
Se dice que una variable aleatoria X es discreta, si tiene las siguientes propiedades:
- El número de valores, para los cuales X tiene una probabilidad positiva es finito, o a
lo más infinito numerable 0, 1,2,...
- Cada intervalo finito en la escala de números reales, contiene a lo más un numero
finito de los valores de X.
Si un intervalo a< X ≤b no contiene ni uno solo de esos valores, entonces P (a< X<b¿=0
Función de densidad y función de distribución de una variable aleatoria discreta
Sea una variable aleatoria discreta, entonces la función definida por f ( X )=P( X0=X ), se le
llama función de densidad discreta de X0
Ejemplo,
Tomemos el lanzamiento de dos monedas, si X representa el número total de caras que se obtendrían, es suficiente definirf por medio del siguiente conjunto de valores:
f(0) = ¼
f(1) = ½
f(2) = ¼
Para juzgar, como se distribuye una variable aleatoria, es decir, como cambia su
probabilidad cuando cambia la variable, es útil representar la función densidad por medio
de un gráfico.
Ejemplo.
Sea X la variable aleatoria que representa la suma de los puntos que se obtienen al lanzar
dos dados.
Se obtiene en total 36 puntos muéstrales del espacio muestral.
f(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
x 2 3 4 5 6 7 8 9 10 11 12
Si se deseara calcular la probabilidad de que la suma de los puntos exceda de 7.
En términos de espacio muestral, esta probabilidad está dada por:
P(x¿7¿=∑x=8
12
f (x )=¿¿ 5/36 + 4/36 + 3/36 + 2/36 +1/36 = 15/36
Los gráficos correspondientes a la función de densidad y función de distribución se
encuentran a continuación.
Una función estrechamente relacionado con la función de densidad f(x), es la correspondiente a la función de distribución F(x), que se define por:
F(x) = P(X0≤ X ¿=∑ f ( x )=∑
xi< x
f (x i)
Donde, esta suma, se extiende a todos aquellos valores de la variable aleatoria, que sean menores o iguales que el valor especificado X.
El grafico correspondiente al lanzamiento de dos dados y su correspondiente variable aleatoria (suma de los puntos) se muestra en la figura anterior.
VARIABLE ALEATORIA CONTINUA
Las variables continuas aparecen cuando se hacen mediciones en una escala continua, como por ejemplo las mediciones de descarga, precipitación, etc., este tipo de variables tienen una probabilidad cero de tomar exactamente cualquiera de sus valores y su distribución probabilidad no se pueden presentar en forma de tablas. Por tanto se trabaja con intervalos en vez de trabajar con datos puntuales como en el caso de las variables aleatorias discretas.
Si el rango de X es continuo, se dice que la variable aleatoria es continua y puede tomar valores en cierto intervalo o colección de intervalos sobre la recta real, este tipo de variable
es la más frecuente en hidrología. Por ejemplo las descargas de un rio, los valores que puede tener Q en escala continua teóricamente es de cero hasta el infinito.
FUNCIÓN DE DENSIDAD Y FUNCIÓN DE DISTRIBUCIÓN DE VARIABLES ALEATORIAS CONTINUAS
Una función de densidad de una variable aleatoria continua X, es una función f(x) que posee las siguientes propiedades:
i) f ( x ) ≥ 0
ii) ∫−∞
∞
f ( x ) dx=1
iii) ∫a
b
f ( x )dx=P (a¿¿ x<b)¿
Donde a y b son dos valores cualesquiera de X, que cumpla la condición de que a¿b.
Ejemplo.
Consideremos f (x)=K e−x como una función de densidad de X, en donde K= constante. De
acuerdo a la primera propiedad K debe ser positivo.
De la segunda condición la integral de e− x desde −∞ a+∞ es infinita, entonces se debe restringir el limite inferior X= 0, para satisfacer las condiciones K=1, suponiendo que x≥ 0, entonces se cumple con las tres propiedades.
f (x)=K e−x
De la primera condición se obtiene que K = 1 entonces:
f (x)=e−x
MOMENTOS DE DISTRIBUCIONES
La descripción de la distribución de probabilidades (curva que describe la población) se realiza a través de los parámetros que se estiman, como por ejemplo mediante la Esperanza matemática o los momentos de la distribución de probabilidades. Vienen hacer uno de los métodos que permiten evaluar los descriptores de la distribución (parámetros), como por ejemplo el coeficiente de sesgo.
Por lo tanto se puede decir que los momentos son magnitudes fundamentales asociadas a las leyes de probabilidad. Se demuestra, en efecto, que una ley de probabilidad se halla descrita completamente por sus momentos.
ESPERANZA MATEMATICA
Si X es la variable aleatoria, la Esperanza matemática, la media o el valor esperado son términos sinónimos, por consiguiente si queremos hallar la Esperanza matemática de una variable aleatoria, en la práctica estamos hallando el promedio de la variable aleatoria (en el eje X) y como la variable aleatoria se describe mediante las distribuciones de probabilidad, la Esperanza matemática se halla o se estima a partir de las funciones de distribución que son función masa discreta de probabilidades o función de densidad de probabilidades, dependiendo del tipo de variable aleatoria si es discreto o continuo.
E(x) =∫ x f ( x ) dx
Si la variable aleatoria es discreta, la Esperanza matemática o el valor esperado o la media de cualquier variable aleatoria discreta se obtiene al multiplicar cada uno de los valores de la variable aleatoria X por su correspondiente probabilidad P(x) y luego se suman estos productos.
La esperanza matemática se simboliza por E(x) o μ y representa la media poblacional o media teórica de la variable aleatoria X. Como la esperanza matemática describa a la población viene a ser un parámetro (valor desconocido solo puede ser estimado).
Entonces la media de la variable aleatoria discreta X se calcula mediante la siguiente ecuación:
μ=E (x)=∑x
xp(x )
Si la variable aleatoria X es continua, la media o la esperanza matemática se calcula mediante la siguiente ecuación:
μ=E (x)=∫−∞
∞
xf ( x ) dx
En la ecuación se usa la integral en vez de sumatoria y f ( x ) dx a cambio de p(x), la media o la esperanza matemática describe el lugar donde se centra la función masa de probabilidad o la función de densidad de probabilidad.
Por ejemplo en el curso de estática, resistencia de materiales, etc., el centro de gravedad de una figura geométrica plana en el eje X y es equivalente a la ecuación para una variable aleatoria continua.
x = ∫ xdA
A=∫ x f ( x ) dx
A
Dónde:
x = centro de gravedad de la figura en el eje X
A = área de la figura
dA = f ( x ) dx = diferencial del área
Es importante indicar que en la estadística el área A representa el área bajo la curva de la función densidad de probabilidades f ( x ), que en este caso es 1, por tanto, el denominador de la ecuación en los modelos probabilísticos es 1, por lo que la ecuación son equivalentes.
De otro lado, si X es una variable aleatoria con función de densidad de probabilidad f ( x ) o con función discreta masa de probabilidad p(x) y si h(x) es otra función de X, entonces la esperanza matemática o el valor esperado o la media se define mediante las siguientes ecuaciones:
Si X es una variable aleatoria discreta, se tiene:
E (h(x)) = ∑x
h (x ) p(x)
Si X es una variable aleatoria continua, se tiene:
E (h(x)) = ∫−∞
∞
h ( x ) f ( x ) dx
ESTIMACION DE PARAMETROS
La función densidad y de distribución pueden escribirse como una función de la variable aleatoria y en general como una función de sus parámetros.
1) Método de momentosComo se conoce los parámetros media (μ¿ y variancia (σ 2 ) están dados por el primer
momento y segundo momento central respectivamente.
Ejemplo.
Por el método de momentos determinar la media y variancia de la siguiente función
densidad.
f (x)=e− λ λx
x ! Para x > 0
(x = variable aleatoria discreta)
a) Media = µ = E(x) = ∑ e− λ λx
x !. x
µ = ∑ e−λ λx
( x−1)! = e− λ∑ λx
(x−1)!
Se puede extender la suma para x = 1, 2, 3,…..
µ = e− λ( λ1
0 !+ λ2
1 !+ λ3
2!+ λ4
3 !+…)
µ=e− λ λ(1+ λ1 !
+ λ2
2 !+ λ3
3!+…)
Los términos entre paréntesis representan la expresión de e λ como serie de Taylor, por lo
tanto: µ=e− λ λ eλ=λ
Entonces la media de la distribución es λb) Calculo de la variancia (σ 2 )
(σ 2 )=E ¿
Pero además: σ 2 = M 2 = M2 – M 21 = E(x )2- [ E(x )]2
Calculamos E(x2)
E(x2) = M2 = ∑ e− λ λx x2
x !=∑ e− λ λx x
( x−1)!
E(x2) = ∑ e− λ λx (x−1+1)(x−1)!
E(x2) = e− λ∑ λx(1)(x−1)!
+ e− λ∑ λx(x−1)(x−1)!
E(x2) = e− λ∑ λx
(x−1)! + e− λ∑ λx
(x−2)!
En serie de Taylor
E(x2) = e− λ( λ1
0 !+ λ2
1!+ λ3
2!+…)+¿ e− λ( λ2
0 !+ λ3
1 !+ λ4
2!+…)
E(x2) = e− λ λ(1+ λ1 !
+ λ2
2 !+…)+¿ e− λ λ2(1+ λ
1!+ λ2
2 !+…)
E(x2) = e− λ . λ . e− λ . λ2 . eλ
E(x2) = λ+ λ2
Por lo tanto
σ 2=( λ+ λ2 )−( λ2 )= λ
Conclusión:
Los parámetros media y variancia para la distribución estudiada es λ
µ =σ 2=λ
1) Método de máxima verosimilitud
Se asume que tenemos n observaciones aleatorias X1, X2,…Xn, su función correspondiente:
f (X1, X2, X3,…Xn, θ1 , θ2 ,…θn¿, pudiendo para cada Xi, escribir su función de probabilidad
y se tendrá:
f (X1, θ1 , θ2 ,…θn¿ f (X2, θ1 , θ2 ,…θn¿
f (X2, θ1 , θ2 ,…θn¿ f (Xn, θ1 , θ2 ,…θm¿ ,donde θ1 , θ2 ,…θm son los parámetros de la función.
La expresión anterior es proporcional a la probabilidad de que una observación aleatoria
sea obtenida de la población y es conocida como función de máxima verosimilitud o
máxima probabilidad.
L (θ1 , θ2 ,…θm¿=∏i=1
n
f (x i ,¿θ1 ,θ2, …θm)¿
Los m parámetros son desconocidos, por lo tanto la estimación de estos se hace teniendo
presente que deben maximizar la función de verosimilitud.
Esto es posible tomando la derivada parcial de L (θi ¿ respecto a cada θ e igualando a cero.
Ejemplo
Empleando el método de máxima verosimilitud estimar el parámetro λ de la función de
densidad siguiente:
f (x)=λ e− λx Para x > 0Solución:
L (λ¿=∏i=1
n
λ e−λx = λe− λ∑ x i
Ln [L(λ)] = n Ln (λ) - λ∑i=1
n
x i
∂ ln [ L ( λ )]∂ λ
=0=nλ−∑
i=1
n
x i
λ = n
∑ xi
=1x
x ≅1λ
DISTRIBUCION DE FRECUENCIAS (representación grafica)
Los registros Hidrológicos, muestran por lo general una larga secuencia de datos que
requieren un análisis cualitativo y cuantitativo para su empleo posterior.
Uno de estos análisis importantes es la determinación del histograma de frecuencias
relativas y absolutas, distribución de frecuencias acumuladas, polígonos de frecuencia etc.
Cuando se dispone de un gran número de datos, es necesario distribuirlos en clase o
categorías y determinar el número de datos pertenecientes a cada clase, que es la frecuencia
de clase. Una ordenación tabular de los datos en clases y con las frecuencias
correspondientes a cada una, se conoce como una tabla de distribución de frecuencias.
Para determinar un número conveniente de intervalos de clase se tienen como referencia
algunas consideraciones:
- Spiegel (1961), sugiere que un número de intervalos de clase conveniente es de 5 a
20.
- Steel y Torrie (1960), sugieren que el número de intervalos no debe ser menor que
1/4, ni mayor que 1/2 del valor de la desviación estándar
- Sturges (1926), recomienda para determinar el número de intervalos de clase la
siguiente formula: N° intervalos = 1 + 3.3 Ln N, donde N es el número de datos
observados.
Ejemplo.
Para los datos de caudales picos anuales mostrados a continuación se pide:
a) Determinar la media y desviación estándar, para datos sin agrupar en tabla de
distribución de frecuencias.
b) Determinar la media y desviación estándar a partir de los datos agrupados en una
tabla de distribución de frecuencias.
c) Graficar el histograma, polígono de frecuencias y también la curva de distribución
de frecuencia acumulada.
AÑO CAUDAL (m3/seg)
AÑO CAUDAL (m3/seg)
AÑO CAUDAL (m3/seg)
AÑO CAUDAL (m3/seg)
1940194119421943194419451946194719481949
200480430680470350630765420555
1950195119521953195419551956195719581959
370695690730340800540400250420
1960196119621963196419651966196719681969
750780360530580520550610590536
1970197119721973197419751976197719781979
690548530570450650320680610290
Solución.
a) Para datos que no están agrupados en tabla de distribución de frecuencias, los
parámetros media y desviación estándar, se calculan con las formulas siguientes.
- Media:
x = µ= ∑i=1
40
Qi
N=21,559
40=539
m3
seg
- desviacion estandar muestral :
S=√∑i=1
40 (Qi−Q )39
=164m3
seg
- Desviación estándar poblacional:
σ=√∑i=1
40 ( Qi−Q )40
=161.9 m3/seg
b) Tabla de distribución de frecuenciasNUMERO DE CLASE
INTERVALO DE CLASE
MARCA DE
CLASE
FRECUENCIA ABSOLUTA
f 0
FRECUENCIA-----------------------
f r=f 0
N(%)
RELATIVA-----------------
f r=f 0
N
FRECUENCIA ACUMULATIVA
∑ f 0
FRECUENCIA ACUMULATIVA
RELATIVA
∑ f r(%)1 2 3 4 5 5 6 71234567
201 – 300301 – 400401 – 500501 – 600601 – 700701 – 800801 – 900
250.5350.5450.5550.5650.5750.5850.5
35711842
----------------
40
7.512.517.627.520.010.05.0
------------------100%
0.0750.1250.1750.2750.2000.1000.05
--------------1.00
381526343840
7.520.037.565.085.095.0100.0
c) Calculo de la media y desviación estándar a partir de datos agrupados en una
tabla de distribución de frecuencias
NUMERO DE CLASE
INTERVALO DE CLASE
MARCAS DE CLASE
Qi
FRECUENCIA ABSOLUTA
OBSERVADA f i
f i× Qi (Qi−Q )2 f i (Qi−Q )2
1 2 3 4 5 6 71234567
200 – 300301 – 400401 – 500501 – 600601 – 700701 – 800801 – 900
250350450550650750850
35711842
40
750175031506050520030001700
21,600
84100361008100100
121004410096100
252,300180,50056,7001,10096,800176,400192,200
1056,000
Media muestral: x = ∑i=1
7
f i Qi
∑ f i
=21,60040
=540
Desviación estándar muestral:
S=√∑i=1
7 f i (Qi−Q ) ²N−1
=√ 1 ´ 056,00039
=164.5
Media poblacional: µ =x
Desviación estándar poblacional:
σ=√∑i=1
7 f i (Qi−Q ) ²N
=√ 1´ 056,00040
=162.4
PARAMETROS ESTADISTICOS
El objetivo de la estadística consiste en extraer de un conjunto muy grande de datos unos
pocos valores pero que sean representativos de las características del conjunto. Estos
valores se denominan parámetros estadísticos o simplemente estadísticos. Así pues, los
parámetros estadísticos son característicos de la población, tal como μ y σ.
Un parámetro estadístico es el valor esperado E de alguna función de la variable
aleatoria (también se denomina la esperanza matemática). El parámetro más simple es el
promedio μ, el cual viene a ser el valor esperado de la variable aleatoria misma. Para una
variable aleatoria X, el promedio es E(X), que se calcula como el producto de x por la
densidad de probabilidades correspondiente f(x), integrado en el rango factible de la
variable aleatoria:
(2.17)
E(X) es el primer momento con respecto al origen, una medida del punto medio o Tendencia Central de la distribución.
El estimador muestral de la media es el promedio aritmético de los datos de la muestra:
(2.18)
En la Tabla 2.2 se da un resumen de las fórmulas para calcular algunos parámetros de la
población y sus estimadores muéstrales.
La variabilidad de los datos se mide a través de la varianza σ2 la cual es el segundo
momento con respecto al promedio:
(2.19)
El estimador muestral de la varianza está dado por la expresión
(2.20)
E( X )=μ=∫−∞
∞
xfdx
x=1n∑i=1
n
x i
E [( x−μ )2 ]=σ2=∫−∞
∞(x−μ )2 f ( x )dx
S2= 1n−1
∑i=1
n
( xi−x )2
En la cual (n-1) indica los grados de libertad, y se usa en vez de n para asegurar que el
parámetro sea insesgado, es decir, que no posea tendencia de ser menor o mayor que el
valor verdadero. La varianza tiene la dimensión [X]2. La desviación estándar σ tiene las
mismas unidades de X; es igual a la raíz cuadrada de la varianza y su estimador muestral es
S. En la Figura 2.5 (a), se ilustra el significado de la desviación estándar; mientras mayor es
la desviación estándar, mayor es la dispersión de los datos. El coeficiente de variación
Cv = σ/μ, estimado por s√ x , es una medida adimensional de la variabilidad.
TABLA 2.2 PARAMETROS ESTADISTICOS DE LA POBLACIÓN POBLACIÓN MUESTRA
1. Tendencia CentralPromedio Aritmético.
μ=E ( X )=∫−∞
∞xf ( x )dx x=1
n∑ x i¿
Mediana
X tal que F(x) = 0,5 50 avo. Percentil de los datos
Promedio geométrico
Antilog [E (log x)] ( Π i=1
n x i)1/n
2. Variabilidad
Varianza
σ 2=E [ ( x−μ)2 ] S2= 1n−1
∑i=1
n
( xi− x )2
Desviación estándar σ S
Coeficiente de variación
Cv=σ/μ Cv=s/ x¿ .
3. Asimetría
Coeficiente de asimetría.
Cs=n∑
i=1
n
( xi− x )3
(n−1 )(n−2 )S3
γ=E[ ( x−μ )3 ]
σ3
El grado de simetría de la distribución con respecto al promedio se mide mediante la
asimetría, la cual viene a ser el tercer momento con respecto al promedio.
(2.21)
FIGURA 2.5. EFECTO DE LA DESVIACIÓN ESTÁNDAR Y EL COEFICIENTE DE ASIMETRÍA SOBRE LA FUNCIÓN DE DENSIDAD DE PROBABILIDADES
La asimetría se da normalmente en forma adimensional, dividiendo la Ecuación (2.21) entre
σ3, cuyo cociente se denomina Coeficiente de Asimetría γ:
(2.22)
el estimador muestral de γ está dado por la expresión Cs.
(2.23)
O también
(2.24)
Como se ilustra en la Figura 2.5 (b), para una asimetría positiva (γ > 0) los datos se inclinan
a la derecha del pico de la distribución, con solamente un pequeño número de valores muy
grandes; para asimetría negativa (γ < 0) los datos se inclinan a la izquierda. Cuando los
datos poseen una asimetría pronunciada, los pocos valores extremos, ejercen un efecto
significativo sobre el cálculo del promedio aritmético (Ecuación 2.18), en cuyo caso, se
E [( x−μ )3 ]=∫−∞
∞
(x−μ )3 f ( x )dx
γ= 1
σ 3E [ (x−μ )3 ]
C s=n2∑
i=1
n
( x i−x )3
n(n−1 )(n−2)S3
C s=n2(∑
i=1
n
x3
i)−3n (∑i=1
n
x i )(∑i=1
n
xi2)+2(∑
i=1
n
xi3)
n(n−1)(n−2)S3
debe usar un parámetro alternativo para calcular en forma apropiada la tendencia central, tal
como la mediana o el promedio geométrico (ver Tabla 2.2).
EJEMPLO.
Dados los datos de precipitación anual en la estación X para el período 1970 – 1979, calcular los parámetros estadísticos de la muestra. Los datos son:
(1970,861) (1971,805) (1972,800) (1973,1.514) (1974,1.283) (1975,980) (1976,1.102)
(1977,729) (1978,813) (1979,1.316).
Solución:
Utilizando la ecuación (2.18), el promedio aritmético es:
X=1n∑i=1
n
x i=1020310
=1020 mm
La varianza se calcula mediante la ecuación (2.20)
S2= 1n−1
∑i=1
n
( xi−x )2=656 .5819
=72 .953
El coeficiente de asimetría se calcula usando la ecuación (2.23)
Ejemplo. Calcule la media de la muestra, la desviación estándar de la muestra y el coeficiente de asimetría de la muestra de la información de precipitación anual Tabla 11.3.2
Solución. Los valores de precipitación anual desde 1970 hasta 1979 se muestras en la columna 2 de la tabla 11.3.2. Utilizando la ecuación la media es:
C s=n∑
i=1
n
(x i−x )3
(n−1 )(n−2)s3=10*107 . 048 . 967
9*8*19 . 683 .000=0. 755
MEDIA: X
x = 1n
∑i = 1
n
x i
= 401 .710
= 40 .17 pu lg .
Los cuadrados de las desviaciones de la media se muestran en la columna 3 de la tabla, totalizando 1,016.9 pulg. De la ecuación
S2 = 1n − 1
∑i =1
n
( x i − x )2
= 1 ,016 .99
= 113. 0 Pu lg2
La desviación estándar es:
S = (113 .0 )1/2
= 10 .63 pu lg .Los cubos de la desviación de la media se muestran en la columna 4 de la tabla 11.3.2, totalizando 6,4803. Utilizando la ecuación (11.3.7)
Coeficiente de Asimetría: CS
CS =n ∑
i=1
n
( x i − x )3
(n−1) (n−2) S3
= 10 x 6 , 480.39 x 8 x (10 . 63 )3
= 0 .749
MODELOS PROBABILISTICOS APLICADOS EN LA HIDROLOGIA
MODELOS PROBABILISTICOS O DISTRIBUCION DE PROBABILIDADES
El modelo probabilístico explica el comportamiento del espacio muestral y a cada uno de
los resultados (eventos) se asocia con una probabilidad de ocurrencia, mediante el uso de
funciones de probabilidad (función masa de probabilidades o función de densidad de
probabilidades). Existen dos tipos de modelos de probabilidad: modelos probabilísticos
discretos y modelos probabilísticos continuos.
El procedimiento más eficiente para la predicción de ocurrencia de máximas avenidas es
realizarla en base a los registros de caudales o precipitaciones.
Es indiscutible que este método da estimados correctos con la condición de que existen
suficientes datos de caudales o precipitaciones, y que el régimen del río no haya sufrido
cambios importantes (inconsistencia de datos). Con este método se puede determinar no
solamente la magnitud de la avenida sino también la probabilidad de ocurrencia, con la
ventaja de que el valor es mucho más exacto que los métodos anteriores por basarse en
valores registrados.
Por lo general se recomienda, para que el método probabilístico sea digno de confianza, los
registros existentes cubran un periodo de alrededor de veinte años.
MODELOS PROBABILISTICOS CORRESPONDIENTE A UNA VARIABLE ALEATORIA DE TIPO DISCRETA
Estos modelos describen el comportamiento probabilístico de variables aleatorias discretas,
en un experimento aleatorio no es posible conocer anticipadamente con certeza el resultado
final, pero sin embargo es factible conocer todos los resultados posibles que puede tener la
realización del experimento de eventos mutuamente excluyentes y colectivamente
exhaustivos (resultados contables).
Los modelos probabilísticos discretos más usados en la hidrología son: distribución
Bernoulli, binomial, geométrica, binomial negativa y de Poisson.
MODELOS PROBABILISTICOS CORRESPONDIENTES A UNA VARIABLE
ALEATORIA DE TIPO CONTINUO
El hidrólogo generalmente tendrá disponible un registro de datos hidrometeorologico
(precipitación, caudales, evapotranspiración, temperaturas, etc.) a través de su
conocimiento del problema físico, escogerá un modelo probabilístico a usar, que represente
satisfactoriamente el comportamiento de la variable.
Los modelos probabilísticos continuos comúnmente usados en la hidrología son: normal,
logarítmico normal, Gamma, Pearson III y Gumbel. Para utilizar estos modelos
probabilísticos, se deben calcular sus parámetros y realizar la prueba de bondad de ajuste.
Si el ajuste es bueno, se puede utilizar la distribución elegida, una vez encontrada la ley de
distribución que rige a las variables aleatorias, además, se podrá predecir con determinada
probabilidad, la ocurrencia de una determinada magnitud, de un fenómeno
hidrometeorologico. También se podrá determinar la magnitud de un fenómeno para un
determinado periodo de retorno.
DISTRIBUCIÓN NORMAL O GAUSSIANA
Con fines referenciales se define esta distribución por ser la más conocida. Co la aclaración,
que la misma no sirve para estimar eventos máximos. Su función de densidad se expresa de
la siguiente forma:
f ( x )= 1(2 πσ )1 /2 e
−(x − μ)2
2σ2
(2.1)
Donde σ y μ
son parámetros de la distribución, en este caso la desviación estándar y la
media de los registros x.
Zi=Qi−Q
SQ
Despejando:
Qi=Q+Z . SQ
Problema. Dados los caudales máximos instantáneos en estación de aforo, se pide:
a) La probabilidad de que en un año cualquiera el caudal sea mayor igual a 7500
m3/seg. Determinar el periodo de retorno.
b) Caudal de avenida para un periodo de 60 años. Considerar que el registro de
caudales se ajusta a la distribución normal de probabilidades.
AÑO Q(m3/s) AÑO Q(m3/s) 195419551956195719581959196019611962196319641965
223032202246180427372070368242402367706124892350
1966196719681969197019711972197319741975197619771978
3706267562675971474460004060690055653130241417967430
N = 25
Solución:
a) P (Q≥ 7500¿=?
De los datos: Q=3886m3
seg
SQ=√∑ (Qi−Q) ²26
=1825.9m3
seg
Para: Q = 7500 m3/seg.
Z=7500−38861825.9
=1.98
De la tabla de distribución normal:
F(1.98)=0.9761
P(Q ≥7500)=1−0.9761
P(Q ≥7500)=0.0239=2.39 %
T= 1P
= 10.0239
→T=42 años
b) QT=? T = 60 años
Sabemos que: T= 1P(Q≥Q T)
= 11−P(Q<QT)
P=T−1T
=5960
=0.9833
De la tabla de distribución normal hallamos:
Z = 2.126 Z=Q 60−Q
SQ
=Q60−3886
1825.9=2.126
Q60=7768 m3/seg
DISTRIBUCIÓN LOG-NORMAL 2 PARAMETROS
La expresión de la función de densidad de probabilidad es la siguiente:
f ( x )= 1
xσY (2 Π )1/2 e−
( ln x − μY )2
2 σY 2
(2.2)
Dónde: μ y , σ y
son la media y desviación estándar del logaritmo natural de x, donde x es
caudal o precipitación.
La relación que existe entre el periodo de retorno (T) en años y función de densidad f(x) es:
f ( x )= 1T
(2.3)
Y con la función de densidad acumulada Fx () es:
f ( x ) = 100 − F( x )
(2.4)
Problema:
Resolver el problema anterior si se ajusta a la distribución Log normal.
a) P(Q ≥7500)=?
Calculamos y = Ln Q, para todos los caudales máximos instantáneos
Luego:
Z= y−γ∅
y = Ln Q
γ=∑ y i
N ; ∅=√∑ ¿¿¿¿
γ=8.162 ; ∅=0.46
Para Q = 7500
Z= ln 7500−8.1620.46
= 1.654
Con este valor, de la tabla de distribución normal hallamos:
F(z )=0.9509=P(Q<7500)
P(Q<7500)=1−0.9509
P(Q<7500)=0.0491=4.91%
T= 1P
= 10.0491
→T=20 años
b) Q60=¿ ( T = 60 años)
Sabemos que la probabilidad menor que viene dado por:
P=T−1T
=5960
=0.9833=F ( z )
De la tabla de Distribución normal hallamos: Z = 2.126
Z=ln Q60−γ
∅
→ Q60=9144 m3/ seg
“Z” también se pudo hallar aplicando
T = 60 p = 1/T = 0.0167
W =[ ln ( 10.0167 )
2]0.5
; W = 2.8609
De la expresión de Z=f (w)
Hallamos Z = 2.127
DISTRIBUCIÓN LOG-NORMAL 3 PARAMENTROS
La definición de la función de densidad de probabilidades es:
f ( x ) =1
( x − a ) σy (2 Π )1/2 e−
(( ln (x−a) − μy ))2 σy2
(2.5)
Donde, μy , σy
son parámetros de forma y escala y, a, es el parámetro de posición, la
notación con sub índice y significa que son la media y desviación estándar de los
logaritmos naturales de x (a registros).
DISTRIBUCIÓN EXTREMO TIPO 1, O GUMBEL O DOBLE EXPONENCIAL
El modelo para los valores extremos (máximos o mínimos) es de tres tipos, según Chow, a
sido desarrollado por Fisher y Tippett (1928), quienes lo clasificaron en tres formas:
Distribución de valor extremo llamados tipo I, II y III. Gumbel (1941) desarrollo con mayor
detalle las propiedades las propiedades de la distribución de Valor Extremo Tipo I, por esta
razón este tipo de distribución lleva su nombre.
La función de densidad de probabilidad de esta distribución es:
(−α (x − β ) − e −α ( x − β))f ( x ) = α e
(2.6)
Y la función de densidad acumulada F(x) es:
−e −α (x− β )
F ( x )= e(2.7)
Dónde: α , β
son parámetros de la distribución
PROBLEMA:
La función
−e −α (x− β )
F (Qi) =P(Q≤Qi)e
Para muestras grandes: N > 100
α=1.2825SQ
β=Q – 0.45 SQ
Q=Promedio de los caudales
SQ=Desviacion Estandar de los caudales
Para muestras pequeñas: N ≤ 100
α=σ y
SQ
β=Q−μ y
α
σ y ; μ y Se obtienen de tablas están en función de N.
Resolver el problema anterior asumiendo que la distribución se ajusta a la distribución
Gumbel.
a) P(Q ≥7500)=?
Del registro de los caudales hallamos:
Q=3886 m3 /seg
SQ=1825 m3 /seg
N = 25
De tablas
σ y=1.0914 ; μy=0.5309
Luego:
α=1.09141825.9
=0.000598
β=3886− 0.5309
598 x 10−6=2997.81
Para Q = 7500 m3/seg.
F(7500)=P(Q<7500)=e−e−598 x10−6
(7500−2997.81)
⇒P(Q<7500)=0.9345
P(Q ≥7500)=1−0.9345
P(Q ≥7500)=0.0655=6.55 %
T= 10.0655
⇒T=15 años
b) Q60=¿ ( T = 60 años)
P=5960
=0.9833
e−e−598 x10−6
(Q 60−2997.81)=0.9833
⇒Q60=9827 m3/seg
TABLA: MEDIAS ESPERADAS ( yn ¿ o (μy ¿ DE EXTREMOS REDUCIDOS EN FUNCION DE n
TABLA: DESVIACION STANDARD (S¿¿n)¿ o (σ y¿ DE EXTREMOS EN FUNCION DE n
DISTRIBUCIÓN PEARSON TIPO 3. O GAMMA 3 PARAMETROS
Esta distribución ha sido una de las más utilizadas en hidrología. Como la mayoría de las
variables hidrológicas son sesgadas, la función Gamma se utiliza para ajustar la
distribución de frecuencia de variables tales como crecientes máximas anuales, Caudales
mínimos, Volúmenes de flujo anuales y estacionales, valores de precipitaciones extremas y
volúmenes de lluvia de corta duración. La función de distribución Gamma tiene dos o tres
parámetros.
Esta distribución es un caso especial de la Gamma, es asimétrica y generalmente con forma
de campana, depende de tres parámetros estadísticos y por ello es bastante flexible. Cuando
el coeficiente de asimetría (Cs) es cero, se reduce a una distribución normal.
En los análisis probabilísticos de eventos extremos como lluvias y avenidas, se ha
generalizado el uso de la llamada: Distribución Log – Pearson Tipo III, en la cual se utiliza
como variable y = Log x, para reducir la simetría, tal modelo cuando el coeficiente de
oblicuidad (g) vale cero, se reduce a una distribución Log normal
La función de densidad de probabilidades es:
f ( x )=1
αΓ ( β ) ( x − γα ) β − 1 e
− ( x − γα )
(2.8)
Dónde: α , β , y γ
son parámetros de la distribución, y Γ ( β )
es la función Gamma la que
se define como:
( β − 1 )I = Γ ( β ) = ∫−∞
∞
xβ − 1 e x d x(2.9)
Para β > 0
, además
Γ ( β + 1)= β Γ ( β )(2.10)
DISTRIBUCIÓN LOG-PEARSON TIPO III
Si se hace un reemplazo de la variable x por el logaritmo natural (ln) de x, entonces la
función de densidad de esta distribución es:
f ( x ) =1
α x Γ ( β ) ( ln x − γα )
β −1
e− (ln x − γ
α )(2.11)
Dónde: α , β , γ
son los parámetros de escala, forma, y ubicación respectivamente, la
Aplicación de esta distribución es limitada debida a que está definido dentro de un rango la
cual es: β > 1 :1/α>1
Se debe calcular los siguientes parámetros estadísticos:
Q=∑i=1
N Qi
N
SQ=√∑i=1
N
(Q i−Q )2
N−1
Ag=N ¿¿
Ag = coeficiente de asimetría (se calcula con un solo decimal)
Se cumple la relación:
Qi=Q+K . SQ
El valor de “K” se obtiene de la tabla:
Ag 99 80 50 …….4 2 11.0101 1.25 2 ….25 50 100
3.02.80.70..-2.8-3.0
1.966 2.406
⇒ Resolver el problema anterior, asumiendo que la información se ajusta a la Distribución Pearson III.
a) P(Q ≥7500)=?
Calculando, obtenemos Q=3886 m3 /seg
SQ=1825 m3 /seg
Ag=25¿¿
Hallamos “K”
7500 = 3886 + K (1825.9)⇒ K = 1.98
Interpolando:
P (%) K4 1.966
X 1.982 2.406
Hallamos
P(Q ≥7500)=0.0206=2.06 %
T= 10.0206
⇒T=48.5 años
c) Q60=¿ ( T = 60 años)
P= 1T
= 160
⇒P=0.0167 (Mayor que)
Interpolando:
P (%) K1 2.8232 2.406
Para P = 1.67% ⇒K=2.54
⇒Q60=3886+2.54 x1825.9
Q60=8524m3
seg
“K” también se puede calcular:
P= 1T
si p > 0.5 usar: 1 – p
w=[ ln ( 1p2 )]
0.5
Z=w−(2.5155+o .8029 w+0.0103 w2 )
1+1.4328 w+0.1893 w2+0.0013 w3
Sea x=A g
6entonces
K=Z+x (Z2−1)+ x2
3(Z3−6 Z )−x3(Z2−1)+Z x4++x5
3
En este caso: Z = 2.127
x=0.76⇒ x=0.12
Remplazando hallamos:
K = 2.53
Luego:
Q60=3886+2.53 x 1825.9
⇒Q60=8506 m3 /seg
VERIFICACION DE LOS MODELOS PROBABILÍSTICOS Y RIESGOS DE
FALLA
Verificación del modelo
Se refiere la validez del modelo probabilístico propuesto, se quiere saber: es o no una
representación aproximada del fenómeno hidrológico el modelo elegido; el ingeniero ha
adoptado por una u otra razón un modelo matemático de un fenómeno físico, busca,
después de conseguir datos (registros), la validez del modelo adoptado. Para verificar
recurre a las pruebas de bondad y ajuste.
Prueba de bondad y ajuste
Las pruebas de bondad de ajuste consisten en comprobar gráfica y estadísticamente si la
frecuencia empírica de la serie de registros analizados se ajusta a un determinado modelo
probabilístico adoptado a priori, con los parámetros estimados en base a los valores
muéstrales.
Las pruebas estadísticas, tiene por objeto medir la certidumbre que se obtiene al hacer una
hipótesis estadística sobre una población, es decir, calificar el hecho de suponer que una
variable aleatoria se distribuye según un modelo probabilístico. Los ajustes más comunes
son: Chi – Cuadrado, Mínimos Cuadrados y Smirnov – Kolmogrov, en este trabajo se
utilizará la prueba de Chi – Cuadrado y la de Mínimos Cuadrados. Esta prueba se lleva a
cabo en base a la función de la densidad de probabilidad y el histograma de los registros.
PRUEBA CHI – CUADRADO
La prueba de Chi – Cuadrado fue propuesto por Karl Pearson, el estadígrafo ( x
2c )
utilizado relaciona las desviaciones del histograma respecto de los valores predichos. El
estadígrafo es:
x2c = ∑
i = 1
k (O1 − Ei )2
Ei(4.1)
Dónde:
x2
: Valor calculado de Chi – cuadrado.
Oi: Número de valores observados en el intervalo de clase i.
Ei: Número de valores esperados o predichos en el intervalo de clase i.
k: Número de intervalos de clase en que se agrupa los registros
Una guía práctica empírica sugerido por Sturges para determinar el número de intervalos de
clase k es:
k = 1 + 3 . 3 log n(4.2)
Asignando probabilidades a la ecuación (4.1), es decir, asignando igual probabilidad de
ocurrencia a cada intervalo de clase, se tiene:
x2c = ∑
i = 1
k (n1 − npi )2
npi(4.3)
Dónde:
n1: Número de observaciones que caen dentro del os límites de clase ajustados del
intervalo i.
n: Tamaño de muestra.
p1: Igual probabilidad para todos los intervalos de clase i.
Dónde:
pi =1k
ó Ei = n pi
Desarrollando y simplificando la ecuación (4.3) Markovic dedujo la siguiente ecuación:
x2c = k
n(∑
i = 1
k
ni2 ) − n
(4.4)
PROCEDIMIENTO DE LA PRUEBA DE CHI – CUADRADO
El procedimiento a seguir para comprobar la bondad de ajuste mediante la prueba de Chi –
Cuadrado es como sigue:
1. Se plantea la hipótesis: Hipótesis planteada o nula (Hp) y la hipótesis alternante (Ha).
2. Seleccionar el nivel de significación (α
), llamado también error tipo I; estos valores
de α
usualmente se pueden tomar: 10%, 5% y 1%.
3. Cálculo del estadígrafo Chi – Cuadrado calculado, mediante la ecua. (4.1) y (4.4)
4. Determinar el Chi – Cuadrado tabular (X
2b
), de tablas existente, con:
X b2 α , (k − m − 1)
Dónde: (k-m-1): Son los grados de libertad.
m: Es el número de parámetros del modelo probabilístico.
5. Criterio de decisión
a) Si X
2c ≤ X
2b
Se acepta la hipótesis planteada.
b) Si X
2c > X
2b
Se rechaza la hipótesis planteada
6. Conclusión.
AJUSTE MEDIANTE MÍNIMOS CUADRADOS
Este método compara las diferencias que existen entre los eventos registrados con los
estimados, por cada modelo probabilístico. La relación para calcular estas diferencias,
llamado también Error Standard es:
SE = ∑i = 1
k
( x1 − y1 )2 / (n − m j)
1/2
(4.5)
Dónde:
x1: Valor de los registros con i=1, 2, 3, …., n
y1: Valor estimado mediante la distribución con i=1, 2, 3, …., n
n: Longitud de registro.
m j: Número de parámetros estimados en cada distribución.
El modelo probabilístico de mejor ajuste será aquel modelo que tenga un menor valor de
error estándar.
CAUDAL MÁXIMO DE DISEÑO Y RIESGO DE FALLA
A toda estructura hidráulica se le debe asignar una vida o duración aproximada, la que es
determinada por consideraciones, económicas, técnicas, sociales, etc. Sin embargo no es
posible establecer con certeza la vida de las estructuras, por cuanto siempre es posible que
aquella falle por la ocurrencia de una avenida mayor a la prevista.
RIESGO DE FALLA
Supóngase para un tiempo del sistema hidrológico, la probabilidad de ocurrencia de un
evento, X, mayor que el evento de diseño, xo
para un periodo de n años es P. Luego la
probabilidad de no ocurrencia, Q es:
Q = 1 – P (5.1)
La probabilidad de exceder al evento de diseño, xo
, para un periodo de retorno de T años
es:
P = 1/T (5.2)
La probabilidad de no ocurrencia en un año es:
Q = 1 – 1/T (5.3)
La probabilidad de no ocurrencia en n años es:
Q = ( 1 − 1 /T )n
(5.4)
Finalmente la probabilidad de que el evento, X, ocurra por lo menos una vez en n años es:
P = 1 − Q
P = 1 − (1 − 1/Q )n
(5.5)
La ecuación (5.5) es el “riesgo de falla”; esta ecuación se ha tabulado para varios valores de
periodos de retorno, T, y diferentes vidas esperados del proyecto, n, encontrándose las
diferentes probabilidades, P, de riesgo de fallas (ver cuadro Nº 5.1)
DESARROLLLO DE LA ECUACIÓN 5.5 PARA PERIODOS DE RETORNO REALES CON
DIFERENTE RIESGOS DE FALLA DURANTE LA VIDA ESPERADA DE LA ESTRUCTURA
Riesgo
falla
Perms
Vida esperada del Proyecto, n,
(años)
1 2 5 10 20 25 50 100
0.99
0.95
1.01
1.05
1.11
1.29
1.66
2.22
2.71
3.86
4.9
7.2
5.9
8.8
11.4
17.2
22.2
33.9
0.90
0.75
0.50
0.33
0.25
0.20
0.10
0.05
0.02
0.01
1.11
1.33
2.00
3.00
4.00
5.00
10.00
20.00
50.00
100.00
1.46
2.00
3.41
5.45
7.46
9.47
19.50
39.50
99.00
199.50
2.71
4.13
7.73
12.90
17.90
22.90
48.00
98.00
248.00
498.00
4.86
7.73
14.90
25.20
35.30
45.30
95.40
195.00
495.00
995.00
9.2
14.9
29.4
49.9
70.0
90.1
190.0
390.0
990.0
1990.0
11.4
18.6
36.6
62.1
87.3
113.0
238.0
488.0
1230.0
2488.0
22.2
36.6
72.6
124.0
174.0
225.0
475.0
975.0
2476.0
4977.0
43.9
72.6
145.0
247.0
3448.0
449.0
950.0
1950.0
4951.0
9953.0
CAUDAL MÁXIMO DE DISEÑO
Es el valor de aquella descarga que considera la vida esperada, n, años del proyecto, y
el porcentaje de riesgo de que fallen estas estructuras, este riesgo de falla está en
función del periodo de retorno, T.
La determinación de la descarga máxima de diseño es como sigue:
1. Escoger vidas esperadas, n, del proyecto estos pueden ser, 2, 5, 10, 25, etc. Años.
2. Escoger determinados riesgos de fallas, que deben aplicarse a la vida esperada del
proyecto que pueden ser: 0.01, 0.05, 0.10, 0.20, etc.
3. Para cada vida esperada del proyecto y riesgo de falla se determina cual es el
periodo de retorno real de la tabla 5.1.
4. Con los periodos de retorno real determinados en el paso 3, se va al gráfico que
relaciona descargas máximas y periodos de retorno del río en estudio, y se
determina que descarga le corresponde al periodo de retorno real. Esta descarga es
el caudal máximo de diseño.
EJEMPLO:
AJUSTE DE UNA DISTRIBUCION DE FRECUENCIAS EMPÍRICA A UNA TEÓRICA
Precipitación: mes de enero (de 37 años de registro) Nº 37
Estación: Cajamarca. Latitud: 07º03’; longitud: 78º30’; Altitud: 2,727 m.s.n.m.
P(mm) θ (orden)f (θ)=θ
N+1
(Frec. acumulada)P(mm) θ (orden)
f (θ)=θN+1
(Frec. acumulada)121.3
26.7
110.1
63.4
122.9
64.2
59.6
10
37
14
26
9
25
27
0.263
0.974
0.368
0.684
0.237
0.658
0.711
144.7
112.2
205.8
37.4
148.3
36.0
52.3
6
12
1
28
4
36
31
0.158
0.316
0.026
0.737
0.105
0.947
0.816
144.9
92.8
95.6
76.3
162.1
110.2
40.3
142.4
28.8
48.8
52.3
97.2
5
18
17
22
3
13
34
7
29
32
30
16
0.132
0.474
0.447
0.579
0.079
0.342
0.895
0.184
0.763
0.842
0.789
0.421
109.2
137.1
114.5
79.0
67.5
88.0
145.0
48.5
36.4
78.5
76.9
15
8
11
20
24
19
2
33
35
23
21
0.395
0.211
0.289
0.586
0.632
0.50
0.053
0.868
0.921
0.605
0.553
Luego se obtiene la media y la desviación estándar de la muestra:
X = 91 . 82 mm
, σ n − 1 = 42 .99 mm
Coeficiente Variabilidad
σn − 1
X= 0 .408
AJUSTE POR CHI-CUADRADO
Este ajuste requiere un análisis por frecuencias relativas. Para lo cual dividimos el rango de
la muestra en intervalos de clase. Algunos hidrólogos siguieron las formulas:
Nº de intervalos = 1 + 1.33 ln N (1).
Rango o intervalos:
σ¿
4 (2); o que el número de intervalos debe de ser como mínimo 5 y
para mejor uso de la información 10-25 intervalos. Usaremos 6 intervalos en la formula (1)
e intervalos aritméticos.
Δ = ( Pmáx − Pmin)/6 ≃ 29 .85 → 30 (Tomaremos un valor mayor que el Δ calculado para
abarcar el rango de la muestra).
Marca de claseFrecuencia
Observada (fo)Frecuencia relativa
Frecuencia acumulada
Marca
26-56 9 9/37 = 0.243 0.243 41
56-86
86-116
116-146
146-176
176-206
8
9
7
2
2
0.226
0.243
0.189
0.054
0.054
0.459
0.702
0.891
0.948
0.999
71
101
131
19
20
LIMITES DE
CLASE Z
AREA BAJO
LA CURVA
NORMAL DE
0 A Z
AREA PARA
CADA CLASE
e
FRECUENCIA
ESPERADA
fe = e x N
265686116146176206
-1.53-0.83-0.140.561.261.962.66
0.43700.29670.05570.21230.39620.47500.4961
0.14030.2410.2680.18390.07880.0211
5.1918.9179.9166.8042.9160.781
Z =X (26 )− X (91 . 82)
σn−1
¿
(42 . 99)=−1.53 X = 91.82 m
σ¿
n−1 = 42 . 99
e = Área para cada clase (0.4370 - 0.296 = 0.1403)
fe = Frecuencia esperada
x2c ≡
(9−5.191)2
5.191+(8−8.917)2
8.917+
(9−9.816)2
9.816+(7−6.804)2
6.804+
(2−2.916)2
2.916+
(2−0.781)2
0.781
x2c=5.153
X tabla2
Para 𝛂 ¿0.05 ; (1-𝛂) = 0.95 ; G.L. = 6 – 2 - 1 = 3
x2cal = ∑i−1
6 ( f 0 − f e )2
f e
De la tabla X 0. 95
2
se tiene X t
2
= 7.81
Como X c
2 ∠ X t2
se concluye que el conjunto de datos analizados siguen o se aproxima a
una distribución normal.
AJUSTE POR KOLMOCROF – SMIRNOV
Trabajamos con la distribución de frecuencia acumulativa f (θ) y f ( z )
f (θ) = mn+1
= 137+1
=0 .026
Z=Pi−P
σ=205.8−91.87
42.99=2.65
f ( z)=0.5−f ( x)
f ( x)=se obtiene de tablas con valor de Z ¿)
Para Z = 2.65 se obtiene 0.4960
Entonces f ( z)=0.5−0.4960=0.004
θ f (θ) z f ( z ) Δ=f (θ)
- f ( z )
12345678910111213141516171819202122232425262728293031323334353637
0.0260.0530.0790.1050.1320.1580.1840.210.2370.2630.2890.3160.3420.3680.3950.4210.4470.4740.5000.5260.5530.5790.6050.6320.6580.6840.7110.7370.7630.7890.8160.8420.8680.8950.9210.9470.974
2.651.701.631.311.231.231.181.050.710.690.530.470.430.430.400.130.090.02-0.09-0.30-0.35-0.36-0.45-0.57-0.64-0.66-0.75-0.80-0.83-0.92-0.92-1.00-1.01-1.20-1.29-1.29-1.51
0.0040.0450.0520.0960.1100.1100.1190.1470.2370.2450.2980.3190.3340.3340.3450.4480.4640.4920.5360.6180.6370.6410.6740.7100.7390.7450.7730.7880.7910.8190.8210.8410.8440.8850.9020.9020.935
0.0220.0080.0270.0100.0230.0490.0650.0640.0020.0180.0030.0030.0080.0340.0500.0270.0170.0180.0360.092*0.0840.0620.0690.0840.0810.0610.0420.0510.0280.0320.0050.0010.0240.0360.0200.0460.040
Probabilidad acumulada f (θ) y f ( z )
Δ tabla para α = 0 . 05 (0 .95 fiabilidad ); n = 37 ⇒ Δ tabla = 0. 22Δ observado ( Δ máx) = 0 . 092Si Δ observado < Δ tabla
Conclusión: Los datos analizados se ajustan a una distribución normal
Problema: La descarga de los ríos Acarí y Yauca tiene similitud en su comportamiento
(H1 = H2 ), realizar la prueba e verosimilitud (prueba t); a partir de una muestra de
24 años de registro.
X acarí = 451.8 M .M .
X Yauca = 319 .8 M . M .
σ¿
acarí = 276 .8 M . M .
σ¿
yauca = 227 . 6 M . M . n1 = 24 años
n2 = 24 años
α = 0. 05
Solución:
1) H p → M 1 = M 2 ; H α → M 1 ≠ M 2
2) Prueba estadística a usarse “t”
t c =( X1 − X2 )− ( M1 − M 2 )
σ¿
X1 − X2
M 1 − M 2 = 0 ( por hipótesis) ¿ σ¿ X¿= σ
¿
p √1n1
+ 1n2
¿ ¿¿¿¿¿
Dónde:
σ¿
X 1 − X2 : Desviación Standart de las diferencias de promedios.
σ¿
p: Desviación Standart ponderado
Reemplazando los valores se obtiene: σ¿
p = 253 . 40 M . M .
σ¿
X 1 − X2= 73 .15 M . M .
⇒ t c =(451 .8 − 319.8 )73 .15
⇒ t c = 1. 8 t calculado.
3) Hallar el valor de t t (en las tablas con
α=0 . 05 ; 95 % de probabilidad) y
G . L . = n1 +n2 −2 = 46 en la tabla
2 .00 < t t < 2 .021 Interpolando
¿ 2 . 015 ⇒ t t ≃ 2 . 015
Como t c
(1.8) se encuentra dentro de la zona de aceptación de la hipótesis. Se concluye que
los medios poblacionales de la descarga de los ríos de Acarí y Yauca son iguales.