universidad nacional autÓnoma de mexico maestrÍa …11 de enero de 2016. resumen las redes de...

28
UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA EN CIENCIAS (FÍSICA) INSTITUTO DE CIENCIAS FÍSICAS EVOLUCIÓN DE LA ESTRUCTURA Y DINÁMICA DE REDES DE REGULACIÓN GENÉTICA PROTOCOLO DE INVESTIGACIÓN QUE PARA OPTAR POR EL GRADO DE: MAESTRO EN CIENCIAS (FÍSICA) PRESENTA: Saúl Huitzil Juárez Tutor Principal: Dr. Maximino Aldana González Instituto de Ciencias Físicas Miembros del Comité Tutor: Dr. Francois Alan Leyvraz Waltz Instituto de Ciencias Físicas Dr. Octavio Reymundo Miramontes Vidal Instituto de Física Cuernavaca, Morelos. Diciembre de 2015

Upload: others

Post on 13-Apr-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICOMAESTRÍA EN CIENCIAS (FÍSICA)INSTITUTO DE CIENCIAS FÍSICAS

EVOLUCIÓN DE LA ESTRUCTURA Y DINÁMICADE REDES DE REGULACIÓN GENÉTICA

PROTOCOLO DE INVESTIGACIÓN

QUE PARA OPTAR POR EL GRADO DE:MAESTRO EN CIENCIAS (FÍSICA)

PRESENTA:Saúl Huitzil Juárez

Tutor Principal:Dr. Maximino Aldana González

Instituto de Ciencias Físicas

Miembros del Comité Tutor:Dr. Francois Alan Leyvraz Waltz

Instituto de Ciencias FísicasDr. Octavio Reymundo Miramontes Vidal

Instituto de Física

Cuernavaca, Morelos. Diciembre de 2015

Page 2: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

Evolución de la estructura y dinámica de redes

de regulación genética

Saúl Huitzil Juárez

11 de enero de 2016

Page 3: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

Resumen

Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios en los estados que genera la dinámica al realizar pequeñasperturbaciones a una condición inicial, dichas perturbaciones se mantienen deforma constante a lo largo de toda la dinámica, sin propagarse por todos losestados de la red (dinámica caótica), ni desvanecerse con el paso del tiempo(dinámica ordenada), esto les permite realizar sus funciones de forma estableincluso en entornos cambiantes y al mismo tiempo, les permite ser capaces dedesarrollar nuevas funciones que les brindan una mayor posibilidad de adapta-ción; además poseen una estructura particular llamada de libre escala, lo quesigni�ca que la probabilidad de que un elemento arbitrario de la red esté co-nectado con exactamente k otros elementos satisface una ley de potencias, esdecir P (k) = Ck−γ , donde γ es llamado el exponente de escala libre (ver Fig.1.1). Sabemos que el equilibrio entre robustez y evolutividad no solo es unaconsecuencia de la criticalidad sino que a su vez, la criticalidad surge al pedirrobustez y evolutividad, sin embargo hasta el momento no sabemos cuales hansido los mecanismos evolutivos que han llevado a estas redes a tener este tipo deestructura. Un trabajo reciente [Torres-Sosa et al., 2012] sugiere que existe unarelación entre la información contenida en el paisaje de atractores y el surgi-miento de nodos altamente conectados en redes de Kau�man. Este trabajo abrela posibilidad de entender por qué las redes de regulación genética poseen unaestructura de libre escala, estudiando su estructura a través de su dinámica.

1

Page 4: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

Índice general

1. Introducción 3

2. Redes de regulación genética y redes de Kau�man 5

2.1. Redes de regulación genética . . . . . . . . . . . . . . . . . . . . 52.1.1. Núcleo de una red de regulación genética . . . . . . . . . 5

2.2. Redes de Kau�man . . . . . . . . . . . . . . . . . . . . . . . . . . 62.2.1. Dinámica . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2.2. Atractores . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.2.3. Estructura . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.3. Hipótesis de Kau�man . . . . . . . . . . . . . . . . . . . . . . . . 92.3.1. Paisaje epigenético y paisaje de atractores . . . . . . . . . 92.3.2. La vida al borde del caos . . . . . . . . . . . . . . . . . . 10

3. Modelo 11

3.1. Criterios de selección . . . . . . . . . . . . . . . . . . . . . . . . . 113.2. Método mutagénico . . . . . . . . . . . . . . . . . . . . . . . . . . 113.3. Duplicación y divergencia . . . . . . . . . . . . . . . . . . . . . . 123.4. Parámetro de variabilidad α . . . . . . . . . . . . . . . . . . . . . 123.5. Repoblación y �jación . . . . . . . . . . . . . . . . . . . . . . . . 133.6. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.6.1. Evolución hacia la criticalidad . . . . . . . . . . . . . . . 143.6.2. Estructura �nal de las redes en la población . . . . . . . . 15

3.6.2.1. Sin usar el parámetro de variabilidad . . . . . . 153.6.2.2. Usando el parámetro de variabilidad . . . . . . . 16

4. Objetivos 18

4.1. Promiscuidad en factores de transcripción . . . . . . . . . . . . . 184.2. Super-poblaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 184.3. Complejidad de Kolmogorov . . . . . . . . . . . . . . . . . . . . . 194.4. Optimización del algoritmo . . . . . . . . . . . . . . . . . . . . . 20

5. Organigrama y conclusiones 22

5.1. Propuesta de actividades . . . . . . . . . . . . . . . . . . . . . . . 225.2. Cómo integrar las distintas propuestas . . . . . . . . . . . . . . . 24

2

Page 5: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

Capítulo 1

Introducción

Los genes juegan un papel fundamental en la codi�cación de la informaciónque almacenan los seres vivos, ya que en ellos se guardan reglas especí�cas parala síntesis de proteínas. Pero decodi�car esta información para saber cuálesgenes intervienen en la síntesis de cada proteína no es su�ciente para entendermuchos de los mecanismos biológicos que permiten a los seres vivos llevar aacabo tareas como la diferenciación celular, o para explicar su capacidad deadaptación a entornos cambiantes. Esto se debe a que los genes no actúan deforma aislada, ya que el estado de expresión de cada gen depende del estado deexpresión de otros genes, por lo que cada gen está vinculado con un conjuntode genes que lo regulan y un conjunto de genes que a su vez son regulados poreste, dando lugar a una red conocida como red de regulación genética.

Dos de los aspectos más importantes en el estudio de este tipo de redes estánbasados en su dinámica y estructura, es decir, la forma en la que cambian losestados de la red a lo largo del tiempo, y la con�guración en la que están ligadossus genes mediante sus reglas de regulación. En particular, uno de los aspectosmás relevantes es tratar de entender cuáles han sido los mecanismos evolutivosque hacen que estas operen en una dinámica crítica y con una estructura de libreescala. Para redes que operan en punto crítico se ha encontrado que poseenuna mayor capacidad de robustez y adaptabilidad en sus rasgos fenotípicos[Torres-Sosa et al., 2012, Sandoval et al., 2014], sin embargo aún no se tiene unaidea clara del por qué la estructura de libre escala supone una ventaja evolutiva.Redes con este tipo de estructura como se puede observar en la Fig. 1.2, poseennodos altamente conectados llamados hubs, encargados de regular el estado deexpresión de una gran cantidad de genes.

3

Page 6: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 1. INTRODUCCIÓN 4

Figura 1.1: Representación de las vías de regulación genética para E. Coli.Se observa que existe una gran variedad en el número de conexiones que tienenlos genes. La probabilidad de que un gen regule a k genes está dada por unadistribución que sigue una ley de potencias P (k) = Ak−γ , con γ = 1.636[Aldana et al., 2007].

Figura 1.2: Parte de la red de transcripción de E. Coli.Una red de transcripción que representa 20% de la red de Escherichia Co-li. Los nodos rojos son genes y las aristas que los unen indican un factor detranscripción codi�cado por un gen para regular al otro.

Page 7: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

Capítulo 2

Redes de regulación genéticay redes de Kau�man

2.1. Redes de regulación genética

Cada gen está constituido por una secuencia especí�ca de nucléotidos quepuede ser traducida a una secuencia de aminoácidos para formar proteínas, estodepende de la presencia de factores de transcripción especí�cos presentes en suregión promotora, quienes a su vez son el resultado de la expresión de otrosgenes o de él mismo, por lo que dichos factores de transcripción son las vías porlas que ocurre la regulación genética, es decir, la transcripción de la informacióncodi�cada en cada gen.

Cuando se tiene un conjunto de genes capaces de regular el estado de ex-presión entre ellos se dice tenemos una red de regulación genética, pero paraestudiar este tipo de redes no es necesario trabajar con todo el conjunto degenes, sino con un subconjunto al que podemos llamar el núcleo de la red.

2.1.1. Núcleo de una red de regulación genética

El genoma humano posee un número aproximado de 25000 genes codi�ca-dores de proteínas [Pennisi, 2003], número que no dista mucho para organismosmenos complejos como C. Elegans o Escherichia Coli [Hillier et al., 2005]; perosolo un subconjunto de ellos codi�can factores de transcripción, por lo que, sipara el genoma humano tomamos en cuenta únicamente a este subconjunto,podemos trabajar con una red de regulación de al rededor de 3000 genes; estosin tomar en cuenta el control indirecto que los demás genes pueden generar,como cambios en el ph, que a su vez cambia el estado de expresión de otrosgenes [Huang and Kau�man, 2009].

5

Page 8: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 2. REDES DE REGULACIÓNGENÉTICA Y REDES DE KAUFFMAN6

2.2. Redes de Kau�man

En 1969 Stuart A. Kau�man propuso un modelo de red booleana para es-tudiar la dinámica y evolución de redes genéticas. En este modelo, Kau�manestableció que dados dos genes, estos estarían ligados si el resultado de la síntesisde proteínas de alguno de ellos in�uía en la expresión del otro, pero debido a locomplicado y desconocido que resultaba modelar las conexiones reales en los se-res vivos, las conexiones de una red de Kau�man se asignan de forma aleatoria,por lo que todos los resultados obtenidos por este modelo no están restringidos aun conjunto particular de conexiones, sino que re�ejan las propiedades generalesde las redes de regulación genética [Kau�man, 1969, Aldana et al., 2003].

Una red de Kau�man consiste en un conjunto de nodos ligados entre sí pormedio de reglas de regulación llamadas funciones booleanas. Estas determinanel estado del nodo al cual pertenecen un paso posterior en el tiempo una vezdado el estado de cada uno de sus reguladores. Dichas funciones se construyenasignando los valores cero o uno de forma aleatoria con probabilidad p para unoy 1 − p para cero, a cada una de las con�guraciones encendido-apagado de losreguladores del nodo (ver Fig. 2.1). Además la actualización de todos los nodosen la red sucede al mismo tiempo.

Para expresar mejor esta regla, vamos a denotar por σi (t) el estado del nodoi-ésimo al tiempo τ , σij (con j = 1, 2, · · · , ki) el estado de su j-ésimo reguladory Fi su regla de regulación. Entonces, el estado del nodo i-ésimo al tiempo t+ 1está dado por la siguiente ecuación

σi (t+ 1) = Fi

(σi1 (t) , σi2 (t) · · · , σiki

(t)). (2.1)

Figura 2.1: Ejemplo de regulación para σi.Se muestra un ejemplo para un nodo σi regulado por tres re-guladores σi1 , σi2 y σi3 . Para cada con�guración posible de susreguladores se asignaron los valores 0 y 1 a la función booleanaFi de forma aleatoria con probabilidad p = 1

2 .

Page 9: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 2. REDES DE REGULACIÓNGENÉTICA Y REDES DE KAUFFMAN7

El número de reguladores que tiene un nodo se conoce como grado de entradao conectividad, mientras que el número de nodos a los que este regula se conocecomo grado de salida.

2.2.1. Dinámica

Dado un estado inicial para todos los nodos de la red al que denotaremoscomo

∑t = {σ1 (t) , σ2 (t) , · · · , σN (t)}, podemos determinar el estado siguiente

por medio la función booleana de cada nodo, y luego repetir este proceso paracalcular el estado siguiente; de esta manera el conjunto de todas estas funcionesllamado regla dinámica, genera una sucesión de estados a la que nos referiremoscomo dinámica de la red.

Para distinguir cómo responde la dinámica una red de Kau�man ante pertur-baciones en su condición inicial, vamos a denotar como x (t) a la superposición

entre dos con�guraciones distintas∑t y∑t, de�nida de la siguiente manera

x (t) ≡ 1− 1

N

N∑i=1

|σi (t)− σi (t)| , (2.2)

donde∑t y∑t son gobernadas por la misma regla dinámica pero la condición

inicial que da lugar a∑t se obtiene al perturbar ligeramente la condición inicial

de∑t.

Figura 2.2: Fase ordenada, crítica y caótica.Superposición de dos dinámicas

∑t y∑t que parten de condiciones

iniciales que di�eren por el estado de un solo nodo. En la fase ordenadala perturbación (representada por los puntos en rojo) se pierde a lolargo de la dinámica. En la fase crítica se alcanza una dinámica establecon perturbaciones estacionarias. Por último, en la fase caótica sepuede ver que la perturbación se propaga por toda la red.

Existen tres tipos de comportamiento dinámico, caracterizados por la formaen la que responde la red ante pequeñas perturbaciones sobre una condicióninicial dada. Si al perturbar ligeramente la condición inicial obtenemos unadinámica completamente distinta (es decir lımt→∞ x (t) = 0.5), se dice que elcomportamiento de la red es caótico; si la perturbación se pierde a lo largo de la

Page 10: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 2. REDES DE REGULACIÓNGENÉTICA Y REDES DE KAUFFMAN8

dinámica (lımt→∞ x (t) = 1) el comportamiento es ordenado, y crítico cuandolas perturbaciones se mantienen a lo largo de toda la dinámica (ver Fig. 2.2).

En 1986, Derrida y Pomeau demostraron de forma analítica, para redes alea-torias (ver Fig. 2.3), la existencia de una transición de fase dinámica controladapor la conectividad promedio de la red (K), y la probabilidad que se usa paraasignar el valor de encendido a las funciones booleanas (p) [Derrida and Pomeau, 1986].Más tarde, esta transición también fue hallada para redes de libre escala [Aldana, 2003].

Figura 2.3: Diagrama de fase para redes booleanas aleatorias.El área sombreada corresponde a la región ordenada, mientras que elárea superior corresponde a la región caótica. La curva que separa ambasregiones es la fase crítica dada por la ecuación Kc = [2p (1− p)]−1.

Usando el parámetro de orden x ≡ lımt→∞ x (t), puede mostrarse que latransición de fase ocurre cuando 2p (1− p)K = 1 [Aldana, 2003]. Este resultadopermite de�nir una cantidad llamada la sensitividad promedio de la red de�nidacomo

S = 2p (1− p)K, (2.3)

donde S es un parámetro de orden tal que para S = 1 el comportamiento dinámi-co de la red es crítico; S < 1, ordenado y S > 1, caótico [Derrida and Pomeau, 1986,Aldana, 2003].

Page 11: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 2. REDES DE REGULACIÓNGENÉTICA Y REDES DE KAUFFMAN9

2.2.2. Atractores

El número total de estados que puede tener una red booleana es 2N , dondeN es el número de nodos; por consiguiente la dinámica de la red eventualmentetendrá que pasar por un estado ya explorado, una vez hecho esto los estadosgenerados por la dinámica se repetirán de forma cíclica, a menos que perturbe-mos algún estado lo su�ciente como para salir de él, para posteriormente volvera caer en otro ciclo. El conjunto de estados por los que atraviesa la dinámicaen cada ciclo se conoce como atractor y en general una red puede tener más deuno, pero forzosamente debe tener al menos un atractor.

2.2.3. Estructura

La estructura de una red puede ser caracterizada por la distribución de co-nexiones que tienen sus nodos, su coe�ciente de agregación y el camino mínimoentre ellos [Albert, 2005]. Algunas redes tienen nodos con un número de conexio-nes que no dista mucho de las de los demás nodos, para esos casos la estructurade la red está bien determinada por el número promedio de conexiones, peroeste promedio no siempre es un buen parámetro para caracterizar la estructu-ra de una red, por ejemplo cuando la distribución de nodos en función de laconectividad sigue una ley de potencia, es decir

P (k) = Ak−γ , (2.4)

donde A es una constante de normalización y γ un número que usualmente estáentre 2 y 3; de la forma de esta función podemos notar que existe una granvariedad de nodos con distinta conectividad en la red y por tanto no hay ungrado típico que pueda ser usado para caracterizar al resto de nodos. Debidoa esta falta de un grado o escala �típica� este tipo de redes se conoce como de�libre escala�, una estructura que poseen muchas redes de regulación genéticacomo E. Coli, S. Servisiae y D. Melanogaster [Albert, 2005].

2.3. Hipótesis de Kau�man

2.3.1. Paisaje epigenético y paisaje de atractores

En 1950 Conrad H. Waddington notó que no era posible explicar la divisióncelular suponiendo que cada fenotipo corresponde a un conjunto especí�co degenes, ya que la variación fenotípica solo podría ocurrir por medio de mutacionesgenéticas. Waddington propuso el concepto de paisaje epigenético para represen-tar metafóricamente las distintas formas de expresión que puede tener un mismoconjunto de genes. En esta metáfora, una célula embriónica no diferenciada estárepresentada por una esfera que rueda desde lo alto de una super�cie con cres-tas y valles, donde existen rami�caciones que conducen a distintos estados dediferenciación celular, representados por mínimos locales (ver Fig. 2.4).

Page 12: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 2. REDES DE REGULACIÓNGENÉTICA Y REDES DE KAUFFMAN10

Figura 2.4: Paisaje epigenético de Waddington.La célula embriónica no diferenciada es imaginada como una esfe-ra que rueda colina abajo en una super�cie que representa todoslos posibles estados de expresión en el genoma. Los mínimos esta-bles corresponden a fenotipos estables del organismo. Las distintasbifurcaciones representan las vías alternativas de diferenciación.

La cuestión de cómo es que un genotipo puede generar toda una variedadde distintos fenotipos puede ser resuelta si suponemos que cada fenotipo corres-ponde a un atractor dinámico. Esta correspondencia fue probada experimental-mente por S. Huang et al. y posteriormente corroborada por otros grupos deinvestigación [Huang et al., 2005].

2.3.2. La vida al borde del caos

Los seres vivos son capaces de mantener sus rasgos fenotípicos pese a es-tar sometidos a cambios en el entorno o mutaciones puntuales, pero al mismotiempo deben ser capaces de generar nuevos con el �n de obtener una mayorprobabilidad de adaptación. Para redes booleanas, este equilibrio entre robusteze innovación solo puede ser logrado bajo una dinámica crítica, por esta razónKau�man propuso una hipótesis conocida como �la hipótesis de la vida al bordedel caos�, la cual supone que las redes genéticas en los seres vivos operan bajouna dinámica crítica [Kau�man, 1969, Huang and Kau�man, 2009].

El problema central de esta investigación radica en entender cuáles han sido losmecanismos evolutivos que han conferido a las redes genéticas una estructurade libre escala, estudiando la relación que existe entre la información contenidaen el paisaje de atractores y el surgimiento de nodos altamente conectados enredes de Kau�man tras ser sometidas a un modelo evolutivo.

Page 13: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

Capítulo 3

Modelo

3.1. Criterios de selección

Como tesis doctoral el Dr. Christian Torres S. presentó un modelo de cre-cimiento y evolución de redes basado en los siguientes criterios de selección[Torres-Sosa, 2014]:

1. Los organismos deben ser lo su�cientemente robustos como para conservartodos sus rasgos fenotípicos ante mutaciones en sus redes de regulación.

2. Eventualmente deben generar nuevos fenotipos sin perder los ya obtenidos.

Usando estos dos criterios de selección construyó un modelo para llevar a unapoblación de redes de Kau�man hacia una dinámica crítica, y tomando en cuen-ta que los nuevos rasgos fenotípicos deben aportar información biológicamenterelevante construyó un parámetro para medir y posteriormente favorecer en lapoblación redes cuyos atractores posean mayor variabilidad en sus estados. Trasimponer la condición de mayor variabilidad en el paisaje de atractores encontrónodos altamente conectados (hubs) en las redes �nales, pero sin dar una expli-cación de la relación que existe entre el surgimiento de hubs y la variabilidad delos estados en el paisaje de atractores de la red. Este trabajo abre la posibilidadde entender por qué las redes de regulación genética poseen una estructura delibre escala, estudiando la estructura de redes de Kau�man desde un punto devista dinámico.

3.2. Método mutagénico

La regulación genética está dada por la unión de factores de transcripcióna sitios especí�cos en la región reguladora de cada gen llamados sitios de unión(ver Fig. 3.1). Además, cada gen posee una región codi�cante, que es la porciónde ADN donde se realiza la transcripción.

11

Page 14: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 3. MODELO 12

Figura 3.1: Regiones reguladora y codi�cante del gen σn.

La mutación de un gen puede producir cambios en su región reguladora,añadiendo, eliminando o simplemente modi�cando sus sitios de unión. Un cam-bio de este tipo puede modi�car la forma de regulación dada por alguno de susreguladores, hacer que alguno de estos deje serlo, o bien añadir un reguladormás a la lista.

También puede modi�carse su región codi�cante, y si el gen era encargadode la síntesis de un factor de transcripción entonces puede ocurrir que se dejende regular genes que antes lo eran, que se modi�que el tipo de regulación o quenuevos genes comiencen a ser regulados.

El modelo de crecimiento y evolución de redes mencionado anteriormente in-corpora dichas mutaciones recableando nodos y modi�cando las funciones boo-leanas de los nodos correspondientes. Después elimina de la población aquellasredes que no satisfagan el primer criterio de selección (robustez ante mutacio-nes), este evento se toma como el paso de una generación a la siguiente.

3.3. Duplicación y divergencia

Para crecer el tamaño de las redes, tras cierto número de generaciones, secopia para cada red, uno de sus nodos elegido de forma aleatoria de entre todoslos nodos de la red e inmediatamente se muta su región de regulación y codi�-cación. Cada vez que se añade un nodo a la red empleamos el segundo criteriode selección, es decir, eliminamos de la población aquellas redes que no seancapaces de generar al menos un nuevo atractor sin perder los ya obtenidos.

3.4. Parámetro de variabilidad α

Cuando un regulador se encuentra apagado, el estado de expresión del genregulado es el mismo que tendría si tal regulación no existiera. Este comporta-miento hace que las redes cuyos nodos añadidos estén apagados la mayor partedel tiempo, tengan mayor probabilidad de conservar todos sus atractores, loque provoca que dichos atractores se vayan llenando de ceros conforme se vanañadiendo nodos a las redes.

Para evitar esto, se construye un parámetro denotado por la letra α, que midela proporción de ceros y unos presente en los atractores de cada red, alcanzando

Page 15: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 3. MODELO 13

su valor más alto cuando la proporción de ceros es igual a la de unos. Esteparámetro es usado como veremos a continuación para promover una poblaciónde redes con mayor variabilidad en los estados de sus atractores.

3.5. Repoblación y �jación

Si después de eliminar aquellas redes que no lograron satisfacer alguno delos criterios de selección, el número de redes en la población es menor quela mitad de la población inicial, realizamos copias a las redes sobrevivientesproporcionalmente a su variabilidad, hasta alcanzar un número lo más cercanoal de la población inicial.

En la población original se asigna un índice distinto a cada red, que se heredaa todas las copias que se hagan de esta en cada repoblación. Pero, cuando entoda la población sobrevive un solo índice, es decir que todas las redes actualesprovienen de un ancestro común, volvemos a asignar un índice distinto a cadared como si se tratara de la población inicial. Este tipo de evento recibe elnombre de �jación y como puede verse en la Fig. 3.2, en todo el proceso deevolución y crecimiento de redes ocurren varias �jaciones.

Figura 3.2: Fijación de distintas redes en todo el proceso de evolución.Para una población de 1000 redes, se muestra como a lo largo de la evoluciónsolo algunos linajes son capaces de sobrevivir a los criterios de selección.Cuando todas las redes provienen de un ancestro común ocurre la �jación desu linaje y se reasignan etiquetas para poder observar una �jación posterior.

Page 16: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 3. MODELO 14

3.6. Resultados

3.6.1. Evolución hacia la criticalidad

Al llevar a cabo este método sobre poblaciones de distinta conectividad ini-cial, se encontró (ver Fig. 3.3) que la sensitividad promedio en cada poblacióntiende a 1. Esto implica que la dinámica de dichas redes se vuelve crítica con-forme avanza el número de generaciones.

Figura 3.3: Tendencia hacía la criticalidad.Se muestra la sensitividad promedio para cuatro poblacio-nes con conectividad inicial de K = 1, 2, 3 y 4 a lo largo dela evolución. Se observa que todas ellas tienden a S = 1,esto signi�ca que las redes en la población tienden haciauna dinámica crítica.

Teniendo en cuenta que la probabilidad con la que se asignó el valor �1�(encendido) a las funciones booleanas siempre fue igual a 1

2 , usando la ecuación

(2.3) podemos expresar la sensitividad para cada red como S = K2 , por tanto la

dinámica de las redes se vuelve crítica cuando K → 2.

Page 17: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 3. MODELO 15

3.6.2. Estructura �nal de las redes en la población

3.6.2.1. Sin usar el parámetro de variabilidad

Usar los criterios de selección es su�ciente para llevar a una población deredes de Kau�man hacia una dinámica crítica, pero la estructura de las redes�nales se asemeja a la de redes aleatorias (ver Fig. 3.4) cuando no favorecemosredes con gran variabilidad en sus atractores.

Figura 3.4: Estructura �nal al no usar α.Se muestra el grado de salida de cada nodo para una de las redes�nales tras usar el método de crecimiento y evolución de redes sinusar el parámetro de variabilidad α.

Page 18: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 3. MODELO 16

3.6.2.2. Usando el parámetro de variabilidad

Cuando se utiliza el parámetro de variabilidad, el comportamiento dinámicode la población es el mismo que se obtiene al no usar dicho parámetro, sinembargo, como puede observarse en la Fig. 3.5, la estructura �nal es distinta.Lo más notable es la presencia de nodos altamente conectados en las redes�nales, un hecho no esperado, y del que aún no se tiene una explicación.

Figura 3.5: Estructura �nal al usar α.Se muestra el grado de salida de cada nodo para una de las redesde la población tras �nalizar el método de crecimiento y evoluciónde redes en el que fueron favorecidas las redes cuyos atractorestuvieran mayor variabilidad. Se puede observar que la estructuraes distinta a la obtenida al no promover mayor variabilidad en lasredes.

Page 19: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 3. MODELO 17

La �gura (3.6) muestra que cuando promovemos una población con redes demayor variabilidad, la distribución para el grado de salida decae máslentamente que cuando no medimos la variabilidad. Pero dada la pocacantidad de datos, no podemos a�rmar con certeza que tal distribuciónsatisfaga una ley de potencias.

Figura 3.6: Comparación de la distribución de grado de salida.Se muestra la distribución de grado de salida para las dos redesmostradas en las �guras 3.4 y 3.5 (para tener una distribución nor-malizada hay que dividir entre el número de nodos N = 100). Las�guras 3.4, 3.5 y 3.6 fueron obtenidas usando el programa Gephi(https://gephi.org/).

Page 20: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

Capítulo 4

Objetivos

Como se mencionó anteriormente, nuestro objetivo es entender los mecanis-mos evolutivos que han dado lugar a una estructura de libre escala en las redesde regulación genética de muchos organismos.

Tenemos indicios que relacionan el surgimiento de hubs con la petición deque los atractores de las redes alberguen un gran contenido de información, peroaún debemos desarrollar esta idea y entender por qué ocurre esta relación entreinformación y estructura.

4.1. Promiscuidad en factores de transcripción

Una propiedad que consideramos importante y que aún no ha sido implemen-tada en el modelo es la facilidad que tienen algunos factores de transcripción paraadherirse a distintos sitios de unión en la región promotora de los genes, conocidacomo �promiscuidad de los factores de transcripción� [Voordeckers et al., 2015].Creemos que esta propiedad interviene directamente en la estructura de las re-des de regulación generando hubs, pero hasta el momento no podemos decirnada acerca de cuales serían las consecuencias sobre la dinámica de la redes.

Adaptar esta idea a las mutaciones es directo: cuando se añada un enlace ala región de regulación de un gen, este elegirá con mayor probabilidad a aquelloscuyo parámetro de promiscuidad sea mayor; pero aún falta saber cómo debemosasignar dichos parámetros, con qué tasa de mutación varían, y qué tanto cambiasu valor con cada mutación.

4.2. Super-poblaciones

Nos gustaría saber cuales son las características que debe tener una redpara que su probabilidad de mantener e innovar sus atractores sea grande. Parahacer esto, primero debemos notar, como puede verse en la Fig. 4.1, que notodas las redes generadas de forma aleatoria son capaces de superar los �ltros de

18

Page 21: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 4. OBJETIVOS 19

selección, pero que existen algunas cuya capacidad es considerablemente mayoral promedio.

Para estudiar dichas características, podemos seleccionar de entre distin-tas poblaciones las redes que tengan mayor probabilidad de sobrevivir, y cons-truir con ellas una población especial a la que llamaremos super-población, queusaremos para distinguir las propiedades comunes que brindan a sus redes talcapacidad de sobrevivencia.

Figura 4.1: Probabilidad de �jación para cada red en la población.Se muestra la probabilidad de �jación para todas las redes (1000) de unapoblación. Para esto, se toma una población inicial y se somete a loscriterios de selección hasta que ocurra la primera �jación, cuando estaocurre se registra el índice de la red �jada. Este proceso se repite unnúmero su�cientemente grande como para tener una buena estadística,y se gra�ca la frecuencia de �jación para todas los redes de la población.

Al observar la �gura 4.1 podemos concluir que la �jación de una red no esun hecho fortuito dado por la estocasticidad del modelo, sino una consecuenciade propiedades aún no conocidas inherentes a la red.

4.3. Complejidad de Kolmogorov

Debemos utilizar una mejor medida de la información en lugar del parámetrode variabilidad α, ya que este no siempre da una medida exacta de la informacióncontenida en una cadena [Zenil and Delahaye, 2011].

El mejor candidato es la complejidad de Kolmogorov, usada ya por Nykter,Price, et al. [Nykter et al., 2008] para analizar la información contenida en elpaisaje de atractores de redes de Kau�man y mostrar que estas maximizan elprocesamiento de información cuando su dinámica es crítica. En dicho trabajo,

Page 22: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 4. OBJETIVOS 20

se de�nió una distancia para aproximar la complejidad de Kolmogorov entre lascadenas formadas por los atractores de una población de redes, para medir quétan distintos son los estados de sus atractores entre sí dependiendo de la fasedinámica en la que se encuentra la red.

En nuestro caso, podemos de�nir una medida que opere de forma similar alparámetro α y calcular después el promedio sobre todos los estados del atractory sobre todos los atractores, o una medida que considere toda la informacióncontenida en el paisaje de atractores, visto como un solo objeto.

Esperamos que medir de esta manera la información contenida en los atrac-tores no afectará signi�cativamente los resultados obtenidos, pero es necesariocomprobarlo e implementar parámetros que puedan ser comparados con los re-sultados obtenidos en otros trabajos.

4.4. Optimización del algoritmo

Uno de nuestros objetivos es poder evolucionar redes con al menos 1000nodos, para poder compararlas con las redes genéticas que poseen muchos or-ganismos de interés como las redes de Drosophila Melanogaster, C Elegans yHumana. Sin embargo, en el modelo actual no es �viable� tratar de traba-jar con redes de más de 100 nodos debido al tiempo de computo requerido[Torres-Sosa et al., 2012, Torres-Sosa, 2014]. Esto se debe a que el tiempo nece-sario para que una red añada un nodo crece de forma exponencial (ver Fig. 4.2),debido a que por cada nodo añadido a la red, aumenta el número de atractoresy la longitud de sus estados, además, también aumenta la probabilidad de queuna red mute, por lo que habrá que comprobar más veces la conservación deatractores cada vez más numerosos y con estados más grandes.

Para reducir el tiempo de cómputo desarrollamos un algoritmo capaz de co-rrer en paralelo, y exploramos otros valores para los parámetros propuestos enel modelo original encontrando los mismos resultados, sin embargo el tiemporequerido sigue creciendo de forma exponencial, por lo que es necesario imple-mentar nuevos métodos diseñados para trabajar con redes de este tamaño.

Page 23: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 4. OBJETIVOS 21

Figura 4.2: Tiempo requerido para mutar y comprobar conservación.Se muestra el tiempo (en minutos) necesario únicamente paramutar y comprobar la conservación de atractores en todo el cre-cimiento de las redes de la población.

Page 24: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

Capítulo 5

Organigrama y conclusiones

5.1. Propuesta de actividades

Es posible que ideas nuevas surjan conforme se vaya trabajando en el proble-ma de doctorado o de algún artículo de investigación, por lo que esta propuestano es de�nitiva, pero de cualquier forma servirá de guía para evaluar el desem-peño realizado en cada semestre.

Semestre Propuesta de actividades

Ampliar mis conocimientos de:

� Biología.

� Programación y paralelización.

� Teoría de la información.

Implementar un método para hallar atractores deredes con más de 100 nodos.

Escribir introducción de la tesis.

Reescribir mi código implementado nuevos métodosy haciendo una paralelización más profunda.

� Proponer criterios de selección y métodos mu-tagénicos para redes con más de 100 nodos.

� Implementar la complejidad de Kolmogorov co-mo medida para la información contenida en elpaisaje de atractores de las redes.

Escribir en la tesis en qué consisten los nuevos crite-rios de selección y métodos mutagénicos.

Hacer el examen de candidatura

22

Page 25: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 5. ORGANIGRAMA Y CONCLUSIONES 23

Semestre Propuesta de actividades

Revisar y mejorar lo que lleve escrito en el borradorde tesis.

Revisar en la literatura lo que se sepa acerca de lapromiscuidad en los factores de transcripción e im-plementarlos en el modelo.

Escribir en la tesis en qué consiste la promiscuidaden los factores de transcripción y cómo fueron imple-mentados en el modelo.

Correr mi código para obtener datos y poder hacerajustes al programa.

Revisar los datos obtenidos

� Hacer una estadística para identi�car los datosobtenidos más relevantes.

� Hacer grá�cas con los resultados más represen-tativos.

� Dar una interpretación a los datos.

Añadir datos, grá�cas e interpretación a la Tesis.

Obtener más datos para corroborar si la interpreta-ción de los resultados es correcta.

Escribir conclusiones.

Escribir primera versión del artículo que necesito pa-ra graduarme.

Revisar y mejorar lo que lleve escrito en el borradorde tesis.

Hacer correcciones al artículo para poder enviarlo aalguna revista.

Realizar los cambios que me pidan para la publica-ción del artículo.

� Obtener nuevos datos.

� Reescribir y reestructurar el artículo.

Completar la tesis y darle una estructura apropiada.

Revisar cuáles son los trámites para presentar exa-men de grado y preparar los documentos que seannecesarios

8ºIniciar trámites para presentar el examen de grado

Examen de grado

Page 26: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

CAPÍTULO 5. ORGANIGRAMA Y CONCLUSIONES 24

5.2. Cómo integrar las distintas propuestas

Para poder dar respuesta a cuáles han sido los mecanismos evolutivos quehan dado lugar a organismos con redes genéticas de libre escala, es necesarioprimero el poder trabajar con redes que tengan un número aproximado de 1000nodos, ya que para redes más pequeñas no se tendrían los datos su�cientes comopara poder a�rmar que la distribución del grado de salida para los nodos en lared sigue una ley de potencias (ver Fig. 3.6).

Recientemente diseñé un algoritmo capaz de hallar en poco tiempo una grancantidad de atractores para redes de más de 100 nodos, pero aún falta saberqué porcentaje del total de atractores se puede obtener de esta manera y si essu�ciente para garantizar que los criterios de selección funcionen. Conocer elnúmero total de atractores no es sencillo, hasta donde sabemos sólo se puedeestimar para una red aleatoria en la que todos sus nodos tengan un solo regula-dor, o para una red aleatoria en la que todos sus nodos tengan dos reguladores[Drossel, 2005].

Una vez podamos hallar una cantidad su�ciente de atractores para redescon aproximadamente 1000 nodos, es necesario implementar métodos mutagé-nicos y criterios de selección que tomen en cuenta tal cantidad de nodos, y quepuedan ser computados en un tiempo adecuado. En el método mutagénico seimplementará el concepto de promiscuidad en los factores de transcripción, elcual suponemos juega un papel importante en la estructura de las redes, tam-bién se implementará la complejidad de Kolmogorov para medir la informacióncontenida en el paisaje de atractores de las redes.

Page 27: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

Bibliografía

[Albert, 2005] Albert, R. (2005). Scale-free networks in cell biology. Journal ofcell science, 118(21):4947�4957.

[Aldana, 2003] Aldana, M. (2003). Boolean dynamics of networks with scale-free topology. Physica D: Nonlinear Phenomena, 185(1):45 � 66.

[Aldana et al., 2007] Aldana, M., Balleza, E., Kau�man, S., and Resendiz, O.(2007). Robustness and evolvability in genetic regulatory networks. Journalof Theoretical Biology, 245(3):433 � 448.

[Aldana et al., 2003] Aldana, M., Coppersmith, S., and Kadano�, L. (2003).Boolean Dynamics with Random Couplings. Springer New York.

[Derrida and Pomeau, 1986] Derrida, B. and Pomeau, Y. (1986). Random net-works of automata: a simple annealed approximation. EPL (EurophysicsLetters), 1(2):45.

[Drossel, 2005] Drossel, B. (2005). Number of attractors in random booleannetworks. Phys. Rev. E, 72:016110.

[Hillier et al., 2005] Hillier, L. W., Coulson, A., Murray, J. I., Bao, Z., Sulston,J. E., and Waterston, R. H. (2005). Genomics in c. elegans: So many genes,such a little worm. Genome Research, 15(12):1651�1660.

[Huang et al., 2005] Huang, S., Eichler, G., Bar-Yam, Y., and Ingber, D. E.(2005). Cell fates as high-dimensional attractor states of a complex generegulatory network. Physical review letters, 94(12):128701.

[Huang and Kau�man, 2009] Huang, S. and Kau�man, S. (2009). Complex ge-ne regulatory networks. from structure to biological observables: Cell fatedetermination. In Meyers, R. A., editor, Encyclopedia of Complexity andSystems Science, pages 1180�1213. Springer New York.

[Kau�man, 1969] Kau�man, S. A. (1969). Metabolic stability and epigenesis inrandomly constructed genetic nets. Journal of theoretical biology, 22(3):437�467.

25

Page 28: UNIVERSIDAD NACIONAL AUTÓNOMA DE MEXICO MAESTRÍA …11 de enero de 2016. Resumen Las redes de regulación genética operan bajo una dinámica crítica caracteri-zada por los cambios

BIBLIOGRAFÍA 26

[Nykter et al., 2008] Nykter, M., Price, N. D., Larjo, A., Aho, T., Kau�man,S. A., Yli-Harja, O., and Shmulevich, I. (2008). Critical networks exhibitmaximal information diversity in structure-dynamics relationships. Physicalreview letters, 100(5):058702.

[Pennisi, 2003] Pennisi, E. (2003). A low number wins the genesweep pool.Science, 300(5625):1484.

[Sandoval et al., 2014] Sandoval, S., Torres, C., Garc�a, M. P., and Aldana, M.(2014). Frontiers in Ecology, Evolution and Complexity, chapter Criticalityin gene networks, pages 159 � 181. CopIt arXives, Mexico.

[Torres-Sosa, 2014] Torres-Sosa, C. (2014). Dinámica evolutiva en redes de re-gulación genética. PhD thesis, Ciencias Bioquímicas - Unam.

[Torres-Sosa et al., 2012] Torres-Sosa, C., Huang, S., and Aldana, M. (2012).Criticality is an emergent property of genetic networks that exhibit evolvabi-lity. PLoS Computational Biology, 8(9).

[Voordeckers et al., 2015] Voordeckers, K., Pougach, K., and Verstrepen, K. J.(2015). How do regulatory networks evolve and expand throughout evolu-tion? Current Opinion in Biotechnology, 34:180 � 188. Systems biology -Nanobiotechnology.

[Zenil and Delahaye, 2011] Zenil, H. and Delahaye, J.-P. (2011). Un metodoestable para la evaluacion de la complejidad algoritmica de cadenas cortas.ArXiv e-prints.