propagacion-simbolica

Upload: jimmy-borja-chagua

Post on 01-Mar-2016

216 views

Category:

Documents


0 download

DESCRIPTION

PRO

TRANSCRIPT

PROPAGACION SIMBOLICAPROPAGACION DE EVIDENCIALos mtodos de propagacin simblica conducen a soluciones que se expresan como funciones de los parmetros. Por ello, las respuestas a cuestiones generales pueden darse en forma simblica en funcin de los parmetros, y las respuestas a preguntas especficas pueden obtenerse sin ms que sustituir los valores de los parmetros en la solucin simblica, sin necesidad de rehacer la propagacin. Por otra parte, la propagacin simblica permite estudiar con escaso esfuerzo computacional la sensibilidad de los resultados

A cambios en los valores de los parmetros. La propagacin simblica es especialmente til en los casos siguientes:1. Cuando no se dispone de la especificacin numrica del modelo probabilstico.

2. Cuando los especialistas solo son capaces de especificar intervalos de Los parmetros en vez de valores concretos. En este caso, los mtodos De propagacin simblica pueden utilizarse para obtener cotas inferiores y superiores de las probabilidades para todos los valores posibles de los parmetros en los intervalos dados.

3. Cuando se requiere un anlisis de sensibilidad. Una de las cuestiones que surge normalmente en este contexto es, cmo son de sensibles los resultados a cambios en los parmetros y a los valores evidnciales?

Los algoritmos de propagacin simblica han sido introducidos recientemente en la literatura. Por ejemplo, Castillo, Gutirrez y Hada (1995c,1995d) realizan la propagacin simblica adaptando algunos de los mtodos Numricos de propagacin descritos en el Captulo 8 a este tipo de propagacin un. Estos mtodos realizan los clculos simblicos necesarios utilizando Paquetes de clculo con posibilidades simblicas (tales como Matemtica Y Maple).

Otro mtodo con capacidades de clculo simblico es el algoritmo de inferencia Probabilstica simblica (SPI) (Sachet, Ambrosio y DelFabero (1990) y Li y Ambrosio (1994)). Este mtodo es orientado a un objetivo Y analiza solo los clculos que se requieren para responder a la preguntaEn estudio.

Con este mtodo, los resultados se obtienen posponiendo la Evaluacin de las expresiones y mantenindolas en forma simblica. Sin embargo, los dos mtodos anteriores tienen el mismo problema: necesitan Utilizar programas especiales, o un esfuerzo computacional extra, Para poder tratar las expresiones simblicas. Por otra parte, el clculo Y la simplificacin de expresiones simblicas es una tarea computacionalmente Cara, y a veces progresivamente ineficiente cuando se trata con Grandes redes o grandes conjuntos de parmetros simblicos.

Recientemente, Castillo, Gutirrez y Hada (1996c) han introducido una solucin a la Propagacin simblica que utiliza ventajosamente la estructura simblica Polinomio de las probabilidades de los nodos (vase la Seccin 7.5.1) para evitar los clculos simblicos.

La principal idea del mtodo consiste en obtener las expresiones simblicas mediante un algoritmo numrico que calcula los coeficientes de los polinomios correspondientes. Entonces, todos los clculos se hacen de forma numrica, evitando la manipulacin de expresiones simblicas costosas.

En la Seccin 10.2 se introduce la notacin y el marco de trabajo de los mtodos simblicos. La Seccin 10.3 discute la generacin automtica de cdigo simblico. La estructura algebraica de las probabilidades se analiza en la Seccin 10.4. La Seccin 10.5 muestra cmo se pueden utilizar los mtodos de propagacin simblica de evidencia para obtener las expresiones simblicas de las probabilidades de ocurrencia de los nodos.

La Seccin 10.6 presenta una mejora del mtodo anterior para el caso de tareas orientadas a un objetivo. La Seccin 10.7 trata del problema de la evidencia aleatoria simblica. La Seccin 10.8 muestra cmo hacer un estudio de sensibilidad mediante los mtodos simblicos. Finalmente, la Seccin 10.9analiza el problema de la propagacin simblica de la evidencia en redes BayesianasNormales.

10.2 Notacin y Conceptos Preliminares

Se ha visto que la funcin de probabilidad conjunta asociada a las redes probabilsticas de Jrkov descomponibles y Bayesianas puede darse mediante una factorizacin como producto de probabilidades condicionales

p(x1, . . . , xn) =n_i=1p(xi|i). (10.1)

En el caso de redes Bayesianas, los conjuntos condicionantes son los padres del nodo,

i, i = 1, . . . , n.

En el caso de redes de Markov descomponibles,estos conjuntos se obtienen aplicando la regla de la cadena a la factorizacin obtenida a partir de la cadena de conglomerados.

Por tanto, aunque algunos de los mtodos introducidos pueden ser fcilmente extendidos para tratar una representacin potencial de la funcin de probabilidad conjunta, por simplicidad, pero sin perdida de generalidad, se utiliza el conjunto de probabilidades condicionales en (10.1) como representacin paramtrica bsica de la funcin de probabilidad conjunta.

Sea X = {X1, . . . , Xn} un conjunto de n variables discretas, cada una de las cuales puede tomar valores en el conjunto {0, 1, . . . , ri}, y sea B = (D,P) una red Bayesiana definida sobre X, donde el grafo dirigido cclico D determina la estructura del conjunto de probabilidades condicionales, y P = {p(x1|1), . . . , p(xn|n)} es el conjunto de probabilidades condicionales que se necesitan para especificar la funcin de probabilidad conjunta.

Algunas de las probabilidades condicionales en (10.1) pueden darse en forma numrica y otras en forma simblica, es decir, p (xi|i) pueden ser familias paramtricas o probabilidades totalmente especificadas numricamente.

Definicin 10.1 Nodo Simblico.

Cuando p(xi|i) es una familia paramtrica simblica (es decir, depende de al menos un parmetro en forma simblica), el nodo Xi se denomina un nodo simblico, y se utiliza i para denotar sus correspondientes parmetros simblicos.

Como se ha visto en la Seccin 7.5.1, cuando p(xi|i) es una familia paramtrica, es decir, cuando Xi es un nodo simblico, una eleccin conveniente de los parmetros es la siguiente

ij = p(Xi = j|i = ), j {0, . . . , ri}, (10.2) donde es cualquier posible realizacin de los padres, i, de Xi. Por ello, el primer subndice de ij se refiere al nmero del nodo, el segundo subndice se refiere al estado del nodo, y los restantes subndices se refieren a las realizaciones de sus padres. Puesto que _ri j=0 ij = 1, para todo i y , no todos los parmetros son libres, es decir, uno cualquiera de ellos puede ser escrito como la unidad menos la suma del resto. Por ejemplo, el primer parmetro puede escribirse como i0 = 1r_j=1ij. (10.3)

Para simplificar la notacin en los casos en los que la variable Xi no tiene padres, se utiliza ij para denotar pi(Xi = j), j {0, . . . , ri}. Se ilustra esta notacin usando el ejemplo siguiente.

Ejemplo 10.1 Nodos simblicos. Considrese una red Bayesiana discreta consistente en las variables X = {X1, . . . , X8} cuyo correspondiente grafo dirigido cclico se muestra en la Figura 10.1. La estructura del grafo implica que la probabilidad conjunta del conjunto de nodos puede escribirseen la forma (10.1), como p(x) = p(x1)p(x2|x1)p(x3|x1)p(x4|x2, x3)p(x5|x3)p(x6|x4)p(x7|x4)p(x8|x5).(10.4) por simplicidad, y sin prdida de generalidad, supngase que todos los nodos representan variables binarias con valores en el conjunto {0, 1}. Esto y la estructura de la distribucin de probabilidad en (10.4) implican que la funcin de probabilidad conjunta de las ocho variables depende de 34 parmetros = {ij}. Ntese, sin embargo, que solamente 17 de ellos son libres (puesto que las probabilidades en cada una de las probabilidades condicionales deben sumar la unidad).