convocatoria de ayudas de proyectos de investigación...

64
Subdirección General de Proyectos de Investigación MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B) Convocatoria de ayudas a Proyectos de I+D «EXCELENCIA» SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO 2013 INSTRUCCIONES PARA COMPLETAR LA MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS DE I+D DEL SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO (PROGRAMA ESTATAL DE FOMENTO DE LA INVESTIGACIÓN CIENTÍFICA Y TÉCNICA DE EXCELENCIA) Lea detenidamente estas instrucciones para completar correctamente la memoria-científico técnica. 1. Este modelo de memoria está restringido en su extensión máxima y por consiguiente ha de limitarse a los espacios indicados al completarla. 2. Las memorias pueden completarse en español o en inglés, a excepción del apartado 1. RESUMEN DE LA PROPUESTA, que debe completarse en ambos idiomas. 3. Se recomienda completar la memoria empleando un pc con sistema operativo Windows y usando como procesador de textos MS Word (MS Office). 4. Para completar los textos, sitúe el cursor en las zonas sombreadas. 4000 caracteres son, aproximadamente, una página. 5. Una vez terminada la memoria, guarde su archivo en formato pdf (de no más de 4Mb) y apórtelo a la solicitud telemática del proyecto en el apartado “Añadir documentos”. 6. Debido a que este formulario está diseñado para incluir únicamente texto con un tipo de letra determinado, si necesita incluir fórmulas, reacciones químicas, fórmulas matemáticas, etc., o figuras aclarativas, deberá hacerlo en los anexos I y II, respectivamente, tras citarlas en el cuerpo del texto. No deberá emplear más extensión que la indicada. 7. El formulario está adaptado para poder emplear la opción de “copiar y pegar”. 1

Upload: others

Post on 03-Aug-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

INSTRUCCIONES PARA COMPLETAR LA MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS DE I+D DEL SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

(PROGRAMA ESTATAL DE FOMENTO DE LA INVESTIGACIÓN CIENTÍFICA Y TÉCNICA DE EXCELENCIA)

Lea detenidamente estas instrucciones para completar correctamente la memoria-científico técnica.

1. Este modelo de memoria está restringido en su extensión máxima y por consiguiente ha de limitarse a los espacios indicados al completarla.

2. Las memorias pueden completarse en español o en inglés, a excepción del apartado 1. RESUMEN DE LA PROPUESTA, que debe completarse en ambos idiomas.

3. Se recomienda completar la memoria empleando un pc con sistema operativo Windows y usando como procesador de textos MS Word (MS Office).

4. Para completar los textos, sitúe el cursor en las zonas sombreadas. 4000 caracteres son, aproximadamente, una página.

5. Una vez terminada la memoria, guarde su archivo en formato pdf (de no más de 4Mb) y apórtelo a la solicitud telemática del proyecto en el apartado “Añadir documentos”.

6. Debido a que este formulario está diseñado para incluir únicamente texto con un tipo de letra determinado, si necesita incluir fórmulas, reacciones químicas, fórmulas matemáticas, etc., o figuras aclarativas, deberá hacerlo en los anexos I y II, respectivamente, tras citarlas en el cuerpo del texto. No deberá emplear más extensión que la indicada.

7. El formulario está adaptado para poder emplear la opción de “copiar y pegar”.

1

Page 2: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

AVISO IMPORTANTEEn virtud del artículo 11 de la convocatoria NO SE ACEPTARÁN NI SERÁN SUBSANABLES MEMORIAS CIENTÍFICO-TÉCNICAS que no se presenten en este formato.

1. RESUMEN DE LA PROPUESTA / SUMMARY OF THE PROPOSAL(Debe rellenarse también en inglés / It should also be completed in English)

INVESTIGADOR PRINCIPAL 1 (Nombre y apellidos):Antonio Barbadilla Prados

INVESTIGADOR PRINCIPAL 2 (Nombre y apellidos):Mario Cáceres Aguilar

TÍTULO DEL PROYECTO:La interpretación de la variación genómica desde la secuencia nucleotídica al fenotipo en Drosophila y humanos

ACRÓNIMO:GENVAR

TITLE OF THE PROJECT:Understanding genome variation from nucleotides to phenotypes in Drosophila and humans

ACRONYM:GENVAR

2

Page 3: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

RESUMENDebe contener los aspectos más relevantes, los objetivos propuestos y los resultados esperados.

El resumen del proyecto debe completarse también en la aplicación de la solicitud. Su contenido podrá ser publicado a efectos de difusión si el proyecto resultara financiado en esta convocatoria.

Máximo 3500 caracteresLas tecnologías de secuenciación de nueva generación han revelado una gran cantidad de variación en los genomas de múltiples organismos. Sin embargo, y a pesar de este aluvión de datos, todavía queda por resolver cuál es la cantidad relativa de los distintos tipos de variación, cómo la variación afecta los rasgos fenotípicos y qué metodologías son más adecuadas para detectar y medir la selección natural en los genomas. En este proyecto se quiere responder a estas cuestiones, y para ello se trabajará con dos de los organismos modelo más estudiados en el nivel de la variación genómica: Drosophila melanogaster y la especie humana. Nos centraremos tanto en la variación nucleotídica como en la estructural, con un énfasis especial en las inversiones cromosómicas. En concreto, se seguirá una aproximación interdisciplinar, integrando métodos y conocimientos de genómica, genética de poblaciones, biología de sistemas y bioinformática, para abordar los siguientes objetivos: (1) la integración de datos de genómica de poblaciones y genómica funcional para caracterizar los determinantes genómicos de los patrones de variación nucleotídica y proteica; (2) el desarrollo de nuevos modelos teóricos y estimadores de genética de poblaciones para estimar la selección sobre la variación genómica en general y las inversiones en particular; (3) el estudio global de las consecuencias funcionales de las inversiones y su asociación con diferentes características fenotípicas en humanos, especialmente para las inversiones que presenten una huella selectiva; (4) el análisis de la evolución adaptiva y purificadora en genes del desarrollo que se expresan diferencialmente en el tiempo y en el espacio tanto en Drosophila como en humanos; y finalmente, (5) el mantenimiento y la ampliación de las prestaciones de nuestros recursos bioinformáticos actuales para poner a disposición de la comunidad científica toda la información que se genere. Este proyecto se beneficiará de toda la valiosa información generada por nosotros y por otros investigadores y supondrá una contribución significativa a la comprensión de la verdadera naturaleza de la variación genómica.

PALABRAS CLAVEMáximo 200 caracteresGenómica, variación nucleotídica y estructural, evolución, fenotipo, genética de poblaciones, selección natural, expresión génica, modificaciones epigenéticas, Drosophila, humanos

SUMMARYIt should contain the most relevant topics of the project, the objectives and the expected results.

The summary should also be completed in the electronic application. It could be published for diffusion purposes if the project is financed in this call.

Maximum 3500 charactersNew genome sequencing technologies have uncovered a great amount of variation in the genomes of multiple species. However, despite this wealth of data, the relative amount of the different types of DNA variation, how they relate to phenotypic traits and which are the most appropriate methodologies to detect and measure the action of natural selection at the DNA level are still unclear. In order to address these questions we will use two of the most studied model organisms for genomic variation, Drosophila melanogaster and humans, and we will focus both on single nucleotide variation and structural variation, with a special interest on inversions. In particular, we will take an interdisciplinary

3

Page 4: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

approach, merging methods and knowhow from genomics, population genetics, system biology and bioinformatics, to address the following objectives: (1) Integrate population genomics data with functional data to characterize the genomic determinants of nucleotide and protein evolution; (2) Develop new theoretical population genetics models to estimate the action of selection on genome variation in general, and inversions specifically; (3) Carry out a global study of the functional consequences of inversions and their association with different phenotypic traits in humans, especially for those inversions with a signature of selection; (4) Analyze adaptive evolution and conservation of developmental genes which are differentially expressed in time and space for Drosophila and humans; and finally, (5) Maintain and extend the performance of our existing bioinformatic resources that will make all the information generated during this project publicly available. This project will take advantage of all the valuable information that has been generated by ourselves and other researchers and represents a significant contribution to the understanding of the very nature of genome variation.

KEY WORDSMaximum 200 charactersGenomics, nucleotide and structural variation, evolution, phenotype, population genetics, natural selection, gene expression, epigenetic modifications, Drosophila, humans

4

Page 5: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

2. INTRODUCCIÓN 2.1. Antecedentes y estado actual de los conocimientos científico-técnicos de la materia específica del proyecto, incluyendo, en su caso, los resultados previos del equipo investigador, de otros grupos que trabajen en la misma y la relación, en su caso, entre el grupo solicitante y otros grupos de investigación nacionales y extranjeros;

- si el proyecto es continuación de otro previamente financiado, deben indicarse con claridad los objetivos y los resultados alcanzados de manera que sea posible evaluar el avance real que se propone en el proyecto solicitado.

- si el proyecto aborda un nuevo tema, deben indicarse los antecedentes y contribuciones previas del equipo investigador con el fin de justificar su capacidad para llevar a cabo el nuevo proyecto.

Máximo 16 000 caracteresLa edad de oro de la genómica de poblaciones

La explosión de datos de secuencias genómicas propiciada por las nuevas tecnologías de secuenciación ha conducido a la presente edad oro del estudio de la variación genética [1]. La genética de poblaciones es hoy una compleja actividad interdisciplinar, en la que se integran herramientas bioinformáticas de minería y gestión de datos a gran escala, modelos teóricos y estadísticos de interpretación, y avanzadas técnicas moleculares de generación masiva de secuencias. Hoy es posible examinar en cualquier especie la variación genética a cualquier escala de resolución, trazar la huella de la selección natural en el genoma, hacer inferencias acerca de la historia de la población y probar modelos explicativos de la genética de poblaciones que han estado en discusión durante décadas. Actualmente la genética de poblaciones a escala genómica, la genómica de poblaciones, es central en la genómica comparativa y funcional [2,3], en los estudios de asociación genotipo-fenotipo [2], en la genómica personalizada [4], y un sinfín de otros campos [5-8]. El fin último de estos estudios es desvelar la base genética de la evolución y de la diversidad fenotípica, con todas las implicaciones que este conocimiento tiene para la biología básica, la salud y la sociedad [9,10].

Los dos IP de este proyecto han participado en sendos proyectos internacionales donde la genómica de poblaciones era un objetivo principal, The Drosophila Genetics Reference Panel (DGRP) [11] y Evolutionary and functional analysis of polymorphic inversions in the human genome (INVFEST) [12], uno en Drosophila y otro en humanos. El proyecto que se solicita surge de los resultados de los dos proyectos previos, cuyos objetivos y resultados principales se resumirán brevemente para después exponer los nuevos retos que nos proponemos abordar.

Genómica de poblaciones en Drosophila melanogaster

La genómica de poblaciones describe los patrones de variación a lo largo de todo el genoma, dentro y entre especies próximas [13] para entonces poder dilucidar la importancia relativa de los factores que determinan estos patrones: la mutación, la recombinación, la selección natural y la deriva genética. Los primeros estudios de variación a escala genómica se iniciaron en organismos modelos como la levadura [14], Drosophila [13,15-17], Arabidopsis [18] o la especie humana [19-22] y han continuado con un número creciente de otros organismos de interés [23-29]. Las dos especies eucariotas más extensamente estudiadas en su variación genómica son los humanos y D. melanogaster, la especie modelo por excelencia de la genética de poblaciones molecular desde casi sus inicios.

El grupo de investigación del IP1 ha participado en el consorcio DGRP, una iniciativa para crear un recurso de referencia a partir de la secuenciación de 192 genomas completos de individuos muestreados de una única población natural de D. melanogaster con el fin de analizar las relaciones entre variación molecular, redes moleculares causales y variación genética de rasgos complejos [30,31] así como los estudios de genómica de poblaciones. The US National Human Genome Research Institute financió la secuenciación de los genomas del DGRP, pero cada grupo que participó en el análisis tuvo que buscarse su propia financiación, que en nuestro caso fue el proyecto que antecede al que ahora se solicita. El grupo del IP1 llevó a cabo en exclusiva el análisis de genómica de poblaciones de D. melanogaster. Estos resultados ocupan la mayor parte de la primera publicación del consorcio DGRP, que apareció en 2012 en la revista Nature [16] y donde el IP1 comparte la primera autoría junto a otros tres investigadores principales.

5

Page 6: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

Este conjunto de genomas nos ha permitido llevar a cabo el estudio más completo de genómica de poblaciones hecho hasta la fecha, suministrando la primera descripción detallada de los patrones de polimorfismo y divergencia de un genoma. Los resultados más destacados obtenidos por nuestros grupo de investigación son: (a) la primera descripción a escala genómica de la variación nucleotídica [16] y de indels [32,33] en D. melanogaster; (b) un nuevo estimador de la fracción de mutaciones seleccionadas en el genoma que corrige el test de McDonald y Kreitman estándar (MKT) [34] cuando segregan variantes deletéreas y permite estimar hasta cinco regímenes de selección distintos [16]; (c) el primer mapa exhaustivo de la selección natural adaptativa y purificadora a lo largo de un genoma [16], donde se observa que la selección natural es ubicua, aunque la importancia de los diferentes regímenes de selección varía en función de las clases de sitios funcionales y las regiones del genoma que se consideren [16,33]; (d) el primer mapa de bloques de selección ligada a lo largo del genoma [35]; (e) la observación que el cromosoma X está sometido a una selección más intensa y efectiva que el resto de cromosomas [16,33]; y (f) un navegador de genómica de poblaciones para la visualización de las secuencias, anotaciones y estimas de diversidad y selección junto a un paquete de software que automatiza las estimas a lo largo del genoma (PopDrowser) [36].

El estudio de las inversiones polimórficas a nivel genómico

Las nuevas técnicas genómicas han permitido descubrir también un grado de variación estructural sin precedentes en humanos y otros organismos [37,38]. Sin embargo, la mayoría de estudios se han centrado en las variaciones en el número de copias (CNVs) y se han acumulado evidencias sobre su importancia en enfermedades humanas, caracteres complejos y evolución [39-41]. Las inversiones por su parte han demostrado tener efectos adaptativos en Drosophila [42,43], y más recientemente en otros organismos, desde plantas a peces [44-47]. No obstante, en humanos las inversiones se habían estudiado muy poco debido a la dificultad de su detección tanto a nivel bioinformático como experimental, y a pesar de que se habían predicho varios cientos de inversiones [48], sólo unas pocas se habían caracterizado en detalle [49-52].

Para resolver esta cuestión el IP2 inició hace 4 años un proyecto muy ambicioso, INVFEST, financiado por el European Research Council, para caracterizar completamente las inversiones polimórficas humanas. Los resultados de este proyecto han representado un avance considerable en el conocimiento de las inversiones, pero han dejado aun preguntas importantes por responder. Entre los resultados obtenidos destacan: (a) el análisis de la técnica del mapeo de extremos apareados utilizada habitualmente para la identificación de inversiones [53] y el desarrollo de un nuevo algoritmo para predecir inversiones con más precisión, que ha revelado que una gran parte de las inversiones predichas hasta el momento son falsas y ha permitido identificar las principales causas de estos errores [54]; (b) la generación de la base de datos más completa y fiable de inversiones polimórficas humanas, que incluye varios cientos de inversiones no redundantes [55]; (c) la optimización del método de la PCR inversa para interrogar inversiones mediadas por repeticiones invertidas (IRs) [56] y la validación experimental de más de 90 inversiones candidatas, de las cuales 53 resultaron ser reales; (d) el desarrollo de un nuevo método para genotipar 41 inversiones simultánemente a gran escala [57] que ha permitido genotipar estas inversiones en 550 individuos de diferentes poblaciones incluidos en los proyectos HapMap [21] y 1000 Genomes (1000GP) [19] y ha revelado diferencias significativas entre poblaciones en la frecuencia de las inversiones; (e) el análisis del desequilibrio de ligamiento entre inversiones y SNPs que ha demostrado que muchas de las inversiones causadas por IRs son recurrentes y han aparecido múltiples veces en el linaje humano [56]; (f) y por último, la asociación de los genotipos de las inversiones y los niveles de expresión génica que han permitido identificar que una pequeña fracción de inversiones afecta la expresión génica y en algunos casos rompe un gen [56,58]).

Retos actuales del estudio de la variación genética

Los proyectos DGRP e INVEST han generado un valiosísimo conjunto de datos para futuros estudios. Estos logros nos sitúan en una posición idónea para profundizar no solo en las cuestiones que se plantearon originalmente, sino abordar nuevos desafíos más ambiciosos e integradores que se enmarcan dentro de algunos de los principales retos actuales en la investigación de la genómica de poblaciones y que se exponen brevemente a continuación.

6

Page 7: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

- La integración de datos de genómica funcional y genómica de poblaciones. Paralelamente al proyecto DGRP y 1000GP en humanos [19], se han desarrollado proyectos de genómica funcional para organismos modelo como D. melanogaster o C. elegans (proyecto modENCODE) [59] y humanos (el proyecto ENCODE) [60]. En estos proyectos se han generado multitud de datos sobre los elementos funcionales de estos genomas: incluyendo tanto los genes como su regulación (dominios funcionales de cromatina, sitios de unión de factores de transcripción, niveles de expresión, splicing alternativo, etc.) en diferentes tejidos y durante distintas etapas del desarrollo. Trabajos previos con conjuntos de datos más pequeños han demostrado que algunos de estos factores genómicos determinan la tasa de evolución proteica al margen de la esencialidad de las proteínas [61]. En este sentido, se han descrito correlaciones entre los niveles de polimorfismo dentro de especies, o divergencia entre especies, con el nivel de expresión [62-64],, la variedad de formas de splicing [65], el tiempo de replicación [66], o el grado de compactación génica [62,67-69]. Los resultados de genómica de poblaciones del proyecto DGRP y los de modENCODE permiten explorar, a una escala sin precedentes en Drosophila, nuevas relaciones entre los elementos funcionales y los mecanismos de regulación genómica por un lado, y la variación, el constreñimiento funcional y la adaptación a lo largo del genoma por el otro. Este análisis heurístico de datos de genómica de poblaciones y genómica funcional es una investigación exploratoria, y representa un paso lógico y oportuno en este momento de producción masiva de datos en estos dos niveles genómicos. Por otra parte, este abordaje permite adentrarse en el territorio de integración de grandes conjuntos de datos que algunos empiezan a denominar biología evolutiva de sistemas [70,71].

- La medida de la selección adaptativa en el genoma. El test de McDonald y Kreitman (MKT) y sus extensiones [34,72] forman parte de la metodología estándar para detectar y cuantificar la selección adaptativa a largo del genoma [15-18,26-28]. El test es uno de los de mayor potencia estadística [73] y permite estimar la fracción de sustituciones nucleotídicas adaptativas (α). El MKT supone implícitamente equilibrio demográfico, y a pesar de que es robusto a las desviaciones de este equilibrio, en los últimos años se han propuesto métodos de máxima verosimilitud (ML) para la estimación de la selección independientemente de la demografía [74]. Los modelos que incorporan demografía suponen que ésta deja una marca en todo el genoma en tanto que la selección deja una huella local [75,76]. Sin embargo, los primeros estudios de variación genómica muestran que la variación neutra no se encuentra en el equilibro mutación-deriva que postula el neutralismo, sino en un equilibrio selección-mutación-deriva, como propone la hipótesis del draft genético [77]. El arrastre selectivo recurrente que propone el draft genético genera un exceso de variantes a baja frecuencia que las aproximaciones estándares que tratan de estimar la selección adaptativa, como el MKT [16] o los métodos ML [74], interpretan erróneamente como una expansión demográfica o un cuello de botella. Si muchos loci están afectados por la selección ligada, como parece deducirse del primer mapa de bloques selección ligada en D. melanogaster [35], la estima de α requiere de nuevas aproximaciones teóricas que consideren un contexto genómico de arrastre selectivo recurrente. Estudios recientes indican que herramientas de simulación heurística como las simulaciones hacia delante (forward simulations) [75] pueden usarse para obtener estimas robustas a los efectos del ligamiento [72]. No obstante, hasta la fecha, no se ha propuesto ningún método que permita estimar α en un contexto genómico de arrastre selectivo recurrente. Desarrollar un método que permita estimar la selección bajo draft genético es un objetivo que debe abordarse en los estudios de genómica de poblaciones que tratan de medir la selección en el genoma [72].

- Impacto funcional y evolutivo de las inversiones. A pesar de muchos años de trabajo sobre inversiones, quedan importantes cuestiones por resolver. En primer lugar, aunque hay evidencias claras del efecto adaptativo de las inversiones, es muy difícil determinar las dianas de la selección [78]. Uno de los efectos principales de las inversiones es la inhibición de la recombinación, que causa alteraciones de la diversidad genética de las regiones flanqueantes [79-81]. Esto complica la detección de la selección natural y no existen estimadores específicos de selección en inversiones. Por otra parte, se sabe muy poco sobre las consecuencias funcionales de las inversiones y su implicación en características fenotípicas, especialmente en humanos. No obstante, las inversiones humanas se han asociado con enfermedades genéticas [82,83], susceptibilidad a otros reordenamientos [50,84,85], y fertilidad [49]. Además, sigue en pie el debate sobre los mecanismos por los que las inversiones producen estos efectos, desde los efectos más directos relacionados con la rotura y reorganización de una región genómica, al mantenimiento de determinadas combinaciones

7

Page 8: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

de alelos por la inhibición de la recombinación. Dentro del proyecto INVFEST, se ha podido determinar que hay inversiones que afectan la expresión de genes en líneas celulares [58], aunque es necesario estudiar estos casos en más detalle. Asimismo, se ha podido determinar que muchas inversiones son recurrentes y no están asociadas a ningún haplotipo concreto, lo cual pone de manifiesto la limitación de los estudios de asociación basados en SNPs para poder detectar sus efectos [56]. Afortunadamente, gracias al desarrollo de un nuevo método de genotipado de inversiones es posible obtener sus genotipos en un gran número de individuos y llevar a cabo un análisis multidisciplinar para determinar el efecto funcional de las inversiones y los genes implicados.

- Adaptación en genes del desarrollo embrionario. El desarrollo embrionario es uno de los procesos principales que determinan el mapa genotipo-fenotipo en los organismos multicelulares. A pesar de que el desarrollo es un proceso complejo existe un número pequeño de vías de transducción de señales (STP) que se utilizan una y otra vez en diferentes estadios y partes del embrión. En Drosophila, por ejemplo, se han descrito unas 10 STP [86]. Las mismas vías existen en todos los metazoos estudiados e involucran, mayoritariamente, genes homólogos y las mismas relaciones jerárquicas entre ellos (aunque algunos genes están duplicados varias veces en vertebrados) [87] La comparación de las STPs entre especies (generalmente distantes) ha sido uno de los temas principales de la biología evolutiva del desarrollo [88]. La integración de la información que suministra la genómica de poblaciones (los datos de DGRP [16,32] y 1000GP [19]) con el conocimiento que tenemos de la genética del desarrollo permite ir más allá y extender esta comparación a la variación intraespecífica. Tal comparación puede suministrar evidencias de cómo evoluciona el desarrollo embrionario a nivel microevolutivo y probar la importancia selectiva de la jerarquía en la red, de las interacciones pleiotrópicas (definida como el número de genes que interacciona en una STP) o de la evolución preferencial de secuencias promotoras o codificantes.

2.2. Bibliografía más relevante.

Máximo 8000 caracteres1. Pennisi E (2007) Breakthrough of the year. Human genetic variation. Science 318: 1842-1843.

2. Kellis M, et al. (2003) Sequencing and comparison of yeast species to identify genes and regulatory elements. Nature 423: 241-254.

3. Stark A, et al. (2007) Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature 450: 219-232.

4. Editorial N (2008) My genome. So what? Nature 456: 1.

5. Hudson TJ, et al. (2010) International network of cancer genome projects. Nature 464: 993-998.

6. Maher B (2011) Human genetics: Genomes on prescription. Nature 478: 22-24.

7. Nadeau NJ, et al. (2010) A golden age for evolutionary genetics? Genomic studies of adaptation in natural populations. Trends in genetics : TIG 26: 484-492.

8. Pool JE, et al. (2010) Population genetic inference from genomic sequence variation. Genome research 20: 291-300.

9. Collins FS, et al. (2003) A vision for the future of genomics research. 422: 835-847.

10. Green ED, et al. (2011) Charting a course for genomic medicine from base pairs to bedside. Nature 470: 204-213.

11. Ledford H (2008) Population genomics for fruitflies. Nature 453: 1154-1155.

12. Cáceres M (2009) Evolutionary and functional analysis of polymorphic inversions in the human genome. http://cordiseuropaeu/projects/rcn/93873_enhtml.

8

Page 9: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

13. Begun DJ, et al. (2007) Population genomics: whole-genome analysis of polymorphism and divergence in Drosophila simulans. PLoS biology 5: e310.

14. Liti G, et al. (2009) Population genomics of domestic and wild yeasts. Nature 458: 337-341.

15. Langley CH, et al. (2012) Genomic variation in natural populations of Drosophila melanogaster. Genetics 192: 533-598.

16. Mackay TFC, et al. (2012) The Drosophila melanogaster Genetic Reference Panel. Nature 482: 173-178.

17. Sackton TB, et al. (2009) Population genomic inferences from sparse high-throughput sequencing of two populations of Drosophila melanogaster. Genome biology and evolution 1: 449-465.

18. Slotte T, et al. (2011) Genomic determinants of protein evolution and polymorphism in Arabidopsis. Genome biology and evolution 3: 1210-1219.

19. Abecasis GR, et al. (2012) An integrated map of genetic variation from 1,092 human genomes. Nature 491: 56-65.

20. Consortium TIH (2005) A haplotype map of the human genome. Nature 437: 1299-1320.

21. Consortium TIH (2007) A second generation human haplotype map of over 3.1 million SNPs. Nature 449: 851-861.

22. Li Y, et al. (2010) Resequencing of 200 human exomes identifies an excess of low-frequency non-synonymous coding variants. Nature genetics 42: 969-972.

23. Gayral P, et al. (2013) Reference-free population genomics from next-generation transcriptome data and the vertebrate-invertebrate gap. PLoS genetics 9: e1003457.

24. Perry GH, et al. (2012) Comparative RNA sequencing reveals substantial genetic variation in endangered primates. Genome research 22: 602-610.

25. Prado-Martinez J, et al. (2013) Great ape genetic diversity and population history. Nature 499: 471-475.

26. Hvilsom C, et al. (2012) Extensive X-linked adaptive evolution in central chimpanzees. Proceedings of the National Academy of Sciences of the United States of America 109: 2054-2059.

27. Phifer-Rixey M, et al. (2012) Adaptive evolution and effective population size in wild house mice. Molecular biology and evolution 29: 2949-2955.

28. Strasburg JL, et al. (2011) Effective population size is positively correlated with levels of adaptive divergence among annual sunflowers. Molecular biology and evolution 28: 1569-1580.

29. Xia Q, et al. (2009) Complete resequencing of 40 genomes reveals domestication events and genes in silkworm (Bombyx). Science (New York, NY) 326: 433-436.

30. Mackay TFC, et al. (2009) The genetics of quantitative traits: challenges and prospects. Nature reviews Genetics 10: 565-577.

31. Yamamoto A, et al. (2008) Neurogenetic networks for startle-induced locomotion in Drosophila melanogaster. Proceedings of the National Academy of Sciences of the United States of America 105: 12393-12398.

32. Consortium DGRP (In prep.) Natural Variation in Genome Architecture Among 205 Drosophila melanogaster Genetic Reference Panel Lines.

33. Ràmia M, et al. (In prep.) Indel variation landscape in the genome of D. melanogaster.

34. McDonald JH, et al. (1991) Adaptive protein evolution at the Adh locus in Drosophila. Nature 351: 652-654.

35. Barrón M, et al. (Subm.) Mapping linked selection blocks throughout the Drosophila melanogaster genome.

9

Page 10: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

36. Ràmia M, et al. (2012) PopDrowser: the Population Drosophila Browser. Bioinformatics (Oxford, England) 28: 595-596.

37. Feuk L, et al. (2006) Structural variation in the human genome. Nat Rev Genet 7: 85-97.

38. Yalcin B, et al. (2012) The fine-scale architecture of structural variants in 17 mouse genomes. Genome Biol 13: R18.

39. Conrad DF, et al. (2010) Origins and functional impact of copy number variation in the human genome. Nature 464: 704-712.

40. Cooper GM, et al. (2011) A copy number variation morbidity map of developmental delay. Nat Genet 43: 838-846.

41. Craddock N, et al. (2010) Genome-wide association study of CNVs in 16,000 cases of eight common diseases and 3,000 shared controls. Nature 464: 713-720.

42. Hoffmann AA, et al. (2008) Revisiting the Impact of Inversions in Evolution: From Population Genetic Markers to Drivers of Adaptive Shifts and Speciation? Annu Rev Ecol Evol Syst 39: 21-42.

43. Kirkpatrick M (2012) How and why chromosome inversions evolve. PLoS Biol 8.

44. Lowry DB, et al. (2010) A widespread chromosomal inversion polymorphism contributes to a major life-history transition, local adaptation, and reproductive isolation. PLoS Biol 8.

45. Thomas JW, et al. (2008) The chromosomal polymorphism linked to variation in social behavior in the white-throated sparrow (Zonotrichia albicollis) is a complex rearrangement and suppressor of recombination. Genetics 179: 1455-1468.

46. Jones FC, et al. (2012) The genomic basis of adaptive evolution in threespine sticklebacks. Nature 484: 55-61.

47. Joron M, et al. (2011) Chromosomal rearrangements maintain a polymorphic supergene controlling butterfly mimicry. Nature 477: 203-206.

48. Feuk L (2010) Inversion variants in the human genome: role in disease and genome architecture. Genome Med 2: 11.

49. Stefansson H, et al. (2005) A common inversion under selection in Europeans. Nat Genet 37: 129-137.

50. Antonacci F, et al. (2009) Characterization of six human disease-associated inversion polymorphisms. Hum Mol Genet 18: 2555-2566.

51. Salm MP, et al. (2012) The origin, global distribution, and functional impact of the human 8p23 inversion polymorphism. Genome Res 22: 1144-1153.

52. Pang AW, et al. (2013) Mechanisms of formation of structural variation in a fully sequenced human genome. Hum Mutat 34: 345-354.

53. Lucas-Lledó JI, et al. (2013) On the power and the systematic biases of the detection of chromosomal inversions by paired-end genome sequencing. PLoS One 8: e61292.

54. Martínez-Fundichely A, et al. (Subm.) Accurate prediction of inversions in the human genome from paired-end mapping data with the GRIAL algorithm.

55. Martínez-Fundichely A, et al. (2013) InvFEST, a database integrating information of polymorphic inversions in the human genome. Nucleic Acids Res.

56. Aguado C, et al. (In press) Large-scale validation and genotyping of multiple human polymorphic inversions mediated by inverted repeats reveals a high degree of recurrence. PLoS Genet.

57. Cáceres M, et al. (2013) Inverse multiplex ligation-dependent probe amplification (iMLPA), an in vitro method of genotyping multiple inversions. European Patent Office Application Ref. EP13382296.5.

10

Page 11: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

58. González JR, et al. (In press) A common 16p11.2 inversion underlies the joint susceptibility to asthma and obesity. Am J Hum Genet.

59. Roy S, et al. (2010) Identification of functional elements and regulatory circuits by Drosophila modENCODE. Science 330: 1787-1797.

2.3. Finalidad del proyecto, oportunidad de llevarlo a cabo y adecuación del mismo a la Estrategia Española de Ciencia y Tecnología y de Innovación y, en su caso, a Horizonte 2020 o a cualquier otra estrategia nacional o internacional de I+D+i.

Máximo 8000 caracteresLos dos IP de este proyecto han participado en sendos proyectos internacionales de genómica de poblaciones, uno en Drosophila y otro en humanos. Estos proyectos han generado resultados muy significativos, además un valiosísimo conjunto de datos, que nos permite abordar nuevos desafíos más ambiciosos e integradores que se enmarcan dentro de algunos de los principales retos actuales de la investigación en genómica de poblaciones. Son estos nuevos retos, que requieren enfoques multidisciplinares con capacidades complementarias, unido a las recomendaciones en las bases de esta convocatoria de potenciar la creación de grupos de investigación con mayor masa crítica, permitiendo dos IPs por proyecto, los que nos convencieron de la oportunidad de solicitar este proyecto conjunto. Ambos IPs tienen una larga trayectoria previa de colaboración que ha resultado en publicaciones comunes, y a pesar que buscan responder a las mismas cuestiones, siguen aproximaciones complementarias, tan necesarias en proyectos multidisciplinares como el que se solicita. Se ha conseguido formar un equipo científico que tiene los conocimientos y capacidades complementarias que se requieren para un proyecto complejo de estas características. Se quiere destacar la participación en el equipo del Dr. Isaac Salazar, uno de los mayores expertos en modelos evolutivos del desarrollo, que participará activamente en el objetivo 4 del proyecto. La calidad investigadora de los miembros del equipo lo demuestran los resultados que han obtenido de sus proyectos y sus publicaciones científicas, varias de las cuales se han publicado en revistas con el mayor índice de impacto, como Nature.

El objetivo último del proyecto es comprender la naturaleza de la variación genética, las fuerzas que gobiernan su distribución y sus consecuencias fenotípicas. Esta es una de las cuestiones más importantes del campo emergente de la genómica de poblaciones y es el momento oportuno de tratar de responder a estas preguntas por la enorme cantidad datos de variación que están generando las nuevas técnicas genómicas. Específicamente, este proyecto propone una estrategia innovadora, que combina métodos de diferentes disciplinas, desde la evolución molecular hasta el análisis funcional. En su planteamiento, el proyecto promete generar resultados de gran interés en campos distintos. La importancia y calidad del equipo investigador junto a los objetivos ambiciosos y de frontera en ciencia básica, el proyecto se adecua a la categoría de ciencia de excelencia dentro de la Estrategia Española de Ciencia y Tecnología de Innovación y el programa marco Horizon 2020 de la Unión Europea. Financiando proyectos de excelencia como el que se solicita, esta agencia posibilita que la ciencia española alcance, en estos momentos especialmente difíciles, el nivel de excelencia que se espera y se requiere de ella.

Hay que destacar que aunque se trata de un proyecto fundamentalmente orientado a la ciencia básica, todas las cuestiones relacionadas con el estudio de la variación pueden extrapolarse a otros organismos de interés económico. Por ejemplo, el proyecto generará herramientas bioinformáticas para el análisis y la interpretación de la variación genética y su correlación con niveles superiores de información genómica. Además se contribuirá al mantenimiento de repositorios públicos de información genética que facilitan el acceso a la sociedad a estos tipos de datos, como por ejemplo en el caso de las inversiones. Por último, uno de los principales objetivos del proyecto está centrado en el descubrimiento de los efectos funcionales de un tipo de variante en el genoma humano, las inversiones, que se ha podido estudiar muy poco. Esto puede permitir identificar asociaciones de las inversiones con características fenotípicas y diferencias en la susceptibilidad a enfermedades en la especie humana, que nos pueden ayudar a entender mejor la causa genética de estas enfermedades y mejorar su diagnóstico y su tratamiento. Por tanto, esta parte del proyecto

11

Page 12: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

encaja muy bien con el primer reto de la Estrategia Española de Ciencia y Tecnología de Innovación y el programa marco Horizon 2020 de la Unión Europea, centrado en “Salud, cambios demográficos, y bienestar”.

12

Page 13: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

3. HIPÓTESIS Y OBJETIVOS DEL PROYECTODescriba las razones por las cuales se considera pertinente plantear esta investigación, la hipótesis de partida y los objetivos generales perseguidos. Enumere brevemente, con claridad, precisión y de manera realista (acorde con la duración prevista del proyecto), los objetivos específicos que se persiguen con indicación expresa del investigador principal (IP) responsable en aquellos proyectos con dos investigadores principales.

Máximo 8000 caracteresEl tema general del proyecto se enmarca en la compresión de la base genética de la evolución y de la diversidad fenotípica. Este es uno de los grandes temas de la investigación científica actual, en primer lugar porque la revolución genómica es el motor principal de los grandes avances en este campo, y segundo por todas las implicaciones que este conocimiento tiene para la biología básica, la salud y la sociedad [9,10]. Dentro de esta problemática, el proyecto plantea varios objetivos interrelacionados, que abarcan diferentes niveles del estudio de la variación nucleotídica y estructural, desde su relación con la información epigenética y de expresión génica, sus consecuencias funcionales y fenotípicas tanto a nivel intraespecífico como a lo largo del desarrollo, y la detección de la selección natural.

Obj. 1. Búsqueda de los determinantes genómicos de la diversidad proteica y nucleotídica mediante la integración de datos de genómica funcional y genómica de poblaciones (Antonio Barbadilla).

En este objetivo se pretende integrar las anotaciones funcionales, provenientes de los proyectos modENCODE [59], y los datos de genómica de poblaciones de los proyectos DGRP [16] y DPGP [15] con el objeto de encontrar los principales determinantes genómicos de los niveles de variación y la selección en el nivel nucleotídico en D. melanogaster. Se buscará como influyen las variables funcionales (por ejemplo estados de la cromatina, niveles de expresión génica y abundancia de transcritos alternativos), junto a las variables genómicas y génicas (por ejemplo tasa de recombinación local, cromosoma o compactación génica), en (a) los niveles de polimorfismo y divergencia, (b) el constreñimiento funcional y (c) la adaptación a lo largo del genoma.

Obj. 2. Desarrollo de estimadores de la selección natural en distintos contextos genómicos (Antonio Barbadilla/Mario Cáceres).

Se dispone de múltiples métodos para la detección de la selección y estimadores de la selección adaptativa [89]. Sin embargo, todavía no existen estimadores apropiados para la estimación de la selección en regiones genómicas sometidas a draft genético [77] ni métodos específicos para detectar selección en inversiones cromosómicas. En este objetivo se propone desarrollar estimadores de la selección que sean aplicables en estos dos contextos genómicos.

(a) Estimación de la selección adaptativa en regiones genómicas sometidas a draft genético.

La reciente evidencia de los patrones de variación genómica muestra que muchos loci y regiones genómicas están afectados por la selección ligada recurrente (genetic draft). En este objetivo se desarrollará un nuevo estimador de la fracción de sustituciones adaptativas que pueda aplicarse tanto en regiones sometidas a arrastres selectivos recurrentes como no. Se empleará un estimador heurístico basado en un algoritmo de aprendizaje automático.

(b) Detección de la selección natural en inversiones cromosómicas.

Para tratar de determinar el papel de la selección natural en el mantenimiento de las inversiones aprovecharemos los datos disponibles sobre genotipos de inversiones y variación nucleotídica en Drosophila y humanos. En concreto, se construirá un modelo lineal de la frecuencia y diferentes características de las inversiones para identificar aquellas que no se ajustan, se desarrollará un test de selección basado en la comparación de la frecuencia observada y esperada según la edad de la inversión, y se determinará la variación nucleotídica y diferentes estimadores de selección balanceada y positiva alrededor de los puntos de rotura. Los resultados arrojarán luz sobre el impacto evolutivo y el valor adaptativo de las inversiones, a la vez que permitirán identificar inversiones candidatas para estudios posteriores.

13

Page 14: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

Obj. 3. Análisis global de las consecuencias funcionales de las inversiones y su asociación con características fenotípicas en humanos (Mario Cáceres).

Para complementar los resultados de las pruebas de selección, se llevará a cabo un estudio funcional completo de las inversiones polimórficas humanas. En primer lugar, se realizará un análisis bioinformático para asociar los genotipos de las inversiones con datos de niveles de expresión génica en múltiples tejidos y modificaciones epigenéticas de la cromatina. Además, se hará un estudio de asociación mediante el genotipado experimental de las inversiones en cohortes de individuos caracterizados fenotípicamente y en casos y controles de ciertas enfermedades. Finalmente, se investigarán en profundidad los efectos de las inversiones a nivel molecular mediante la confirmación de las diferencias de expresión y el mapeo de los puntos de rotura y de las variantes nucleotídicas asociadas respecto a los elementos funcionales del genoma. Esto puede ayudar a identificar inversiones de interés biomédico y proporcionará información sobre el mecanismo por el cual las inversiones causan efectos fenotípicos.

Obj. 4: Sustitución adaptativa y conservación en genes del desarrollo embrionario de Drosophila y humanos (Antonio Barbadilla).

La información que suministra la genómica de poblaciones puede integrarse con el conocimiento del desarrollo para obtener una visión global de cómo evoluciona el desarrollo embrionario a nivel microevolutivo y probar la importancia selectiva de la jerarquía en la red, de las interacciones pleiotrópicas o de la evolución preferencial de regiones promotoras o secuencias codificadoras. En este objetivo se estudiará la evolución de genes importantes para el desarrollo y los resultados obtenidos de este análisis se compararán con resultados de evolución in silico del desarrollo embrionario [90].

(a) Genes de las vías de señalización celular embrionaria.

Se quiere analizar las secuencias codificadoras y reguladoras de cada uno de los genes involucrados en las diferentes vías de transducción de señal (STP) en el desarrollo de D. melanogaster y humanos y estimar la tasa de adaptación y conservación a la que se han visto sometidas estas vías en su conjunto.

(b) Genes del desarrollo que difieren en su patrón de expresión espacio-temporal.

Se quiere probar la hipótesis de si diferentes estadios embrionarios difieren en su constreñimiento evolutivo [88,91]. Se buscarán correlaciones entre la tasa de substitución adaptativa y el estadio embrionario de expresión de genes implicados en la señalización embrionaria en D. melanogaster y en humanos para inferir el modo de acción de la selección en las regiones codificadoras y reguladoras en los diferentes estadios de desarrollo. El mismo análisis se realizará respecto a la zona del embrión y tejido en la que se expresa cada gen. Así podremos estimar si hay algunas zonas o tejidos del embrión que muestran una mayor frecuencia de genes con evidencias de selección positiva. De la misma manera estimaremos si los diferentes estadios del desarrollo difieren en el número de genes con evidencias de selección positiva.

Obj. 5. Actualización, ampliación, mejora e integración de los recursos bioinformáticos. (Antonio Barbadilla/Mario Cáceres).

Actualmente el grupo dispone de una serie de herramientas bioinformáticas creadas en proyectos anteriores que han sido instrumentales en nuestra investigación u objetivos científicos por sí mismos que se han publicado en revistas bioinformáticas. El correcto funcionamiento de todos estos recursos bioinformáticos es una condición imprescindible para la continuación de nuestra investigación. Por otra parte, estos recursos se han puesto libremente a disposición de la comunidad científica, lo que implica un compromiso para disponibilidad futura. Por todo ello, el mantenimiento y la mejora de estos recursos deben contemplarse como un objetivo más de este proyecto.

14

Page 15: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

4. METODOLOGÍA, PLAN DE TRABAJO Y RESULTADOS PREVISTOS4.1. Descripción de los materiales, infraestructuras y equipamientos singulares a disposición del proyecto que permitan abordar la metodología propuesta.

Máximo 4000 caracteresActualmente el equipo de investigación dispone de la mayor parte del equipamiento y la infrastructura necesaria para llevar a cabo el proyecto. En concreto esto incluye un conjunto de diversos servidores de cómputo y el acceso al cluster de computadores del Instituto de Biotecnología y de Bioimedicina (IBB) de la UAB. No obstante, debido a la gran cantidad de datos genómicos que se proponen analizar en el proyecto, es necesario adquirir un servidor de cómputo intensivo con una gran cantidad de memoria RAM para analizar estos datos de una manera rápida y eficiente. Por otra parte, durante los años proyectos anteriores se han desarrollado toda una serie de recursos y herramientas bioinformáticas que seran de gran utilidad para este proyecto y que permitirán un avance más rápido.

A nivel experimental, el grupo de investigación dispone de un laboratorio totalmente equipado que incluye todos los aparatos necesarios para llevar a cabo el genotipado de las inversiones y los experimentos posteriores. Además, se tiene acceso también a diferentes infraestructuras disponibles en el IBB y en los servicios científico-técnicos de la UAB. Uno de los recursos principales para este proyecto es el desarrollo de un método nuevo para genotipar inversiones humanas a gran escala. Este método, del cual se ha realizado la solicitud de una patente titulada (número de referencia EP13382296.5) y el conocimiento generado nos proporciona una oportunidad única para llevar a cabo un estudio de las inversiones humans a un nivel que no había sido posible anteriormente. Por último, como parte de los proyectos previos, se ha adquirido una colección excepcional de material biológico que será de gran utilidad para el proyecto solicitado. En concreto, esto incluye muestras de DNA de 550 individuos de diferentes poblaciones humanas más líneas celulares linfoblastoides de muchos de estos individuos, y muestras de diferentes tejidos de 10 individuos para análisis funcionales de expresión de RNA y modificaciones de la cromatina.

4.2. Metodología. Detalle la metodología propuesta de acuerdo con los objetivos del apartado 3.

- Deberá indicarse la viabilidad metodológica de las tareas y reseñar los hitos o entregables previstos. Si fuera necesario, se incluirá una evaluación crítica de las posibles dificultades de un objetivo específico y un plan de contingencia para resolverlas.

El personal implicado en cada una de las tareas deberá especificarse en el cronograma.

- Si solicita ayuda para la contratación de personal, justifique claramente su necesidad y las tareas que vaya a desarrollar.

Máximo 24 000 caracteresObj. 1. Búsqueda de los determinantes genómicos de la diversidad proteica y nucleotídica mediante la integración de datos de genómica funcional y genómica de poblaciones en D. melanogaster:

En el presente objetivo nos proponemos integrar los nuevos datos masivos de genómica funcional del proyecto modENCODE [59] con los de genómica de poblaciones de los proyectos DGRP [16] y DPGP [15] en D. melanogaster para hacer un análisis exhaustivo de los posibles determinantes genómicos de la diversidad proteica y nucleotídica. La minería de los datos se efectuará con Scripts ad hoc escritos en Perl y Bash. Para los análisis estadísticos se utilizará el paquete R. El plan de trabajo para la búsqueda de los determinantes genómicos sobre la variación nucleotídica seguirá los siguientes pasos:

- A partir de las anotaciones funcionales del proyecto modENCODE [59], (a) se cartografiarán los estados de la cromatina a lo largo del genoma, (b) se obtendrá un listado de genes con sus niveles de transcripción a lo largo del

15

Page 16: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

desarrollo (que se podrán complementar con los de la base de datos BDGP [92], y (c) se obtendrá un listado de los exones y su presencia o ausencia en los diferentes transcritos del gen a lo largo del desarrollo.

- De los datos de proyecto DGRP se estimará el polimorfismo (número de sitios segregantes a una frecuencia i sobre n individuos, Si, y la diversidad nucleotídica, Ѳ y π) y la divergencia (número de sitios divergentes, D, y K) y otros parámetros de genética de poblaciones (como el constreñimiento, entendido como la razón entre polimorfismo no-sinónimo (o selectivo) y polimorfismo sinónimo (o neutro), Pa/Ps, o la tasa de substituciones adaptativa, α) para cada clase funcional (codificadora –sinónima y no sinónima-, intrónica, 5’ UTR, 3’ UTR, intergénica).

- Se utilizarán el mapa de recombinación de alta resolución de Comeron et al. [93] para obtener estimas de recombinación en cada región genómica.

- A partir de la minería efectuada de los datos de los proyectos indicados, se considerarán al menos las siguientes variables explicativas: (a) variables contexto genómico y epigenómico (tasa recombinación, estado cromatínico, cromosoma); (b) variables contexto génico (tamaño proteína, número transcritos por gen, razón entre el número de transcritos por gen y el número de exones por gen, distancia media entre exones de un gen); variables contexto exón (tamaño exón, número de transcritos por exón, orden exón, exón representatividad del exón entre transcritos alternativos); y (c) variables transcripcionales espacial-temporal a partir de las medidas de los niveles de expresión de cada gen del proyecto modENCODE a lo largo del desarrollo, en diferentes tejidos y condiciones de estrés (para la estimación del sesgo en la expresión de cada gen se utilizará el estadístico Index T [94]).

- Modelo estadístico para la integración de los datos obtenidos. Se integrarán todos los datos en una regresión por pasos que selecciona secuencialmente las variables explicativas de mayor a menor grado de explicación. Complementariamente, analizaremos los datos con un modelo generalizado lineal y mixto (GLMM) que permite tratar la complejidad de nuestros datos. De los resultados del análisis estadístico se establecerán los principales determinantes de la variación nucleotídica y la selección.

Obj. 2. Desarrollo de estimadores de la selección natural en distintos contextos genómicos.

En este objetivo se abordarán dos sub-objetivos diferenciados.

(a) Estimación de la selección adaptativa en regiones genómicas sometidas a draft genético.

Se quiere desarrollar un estimador de la fracción de substituciones adaptativas (α) que contemple contextos genómicos en los que se producen arrastres selectivos recurrentes a baja o nula recombinación (genetic draft) [77]. En este escenario se debe considerar la dinámica colectiva de los sitios ligados para poder estimar α. Proponemos una nueva aproximación, un estimador heurístico basado en el aprendizaje automático (machine-learning) a partir de datos empíricos y simulaciones de parámetros, que permita modelizar el efecto de arrastres selectivos recurrentes. En primer lugar, se considerará un contexto genómico de ligamiento extremo, donde la recombinación es nula, como en los genomas mitocondriales. Mediante el uso extensivo de simulaciones hacia delante (forward in time) se muestrea uniformemente el espacio de parámetros que determinan la distribución de los coeficientes de selección, los tamaños de población, los tamaños cromosómicos, las densidad de región funcional (sometida a selección) y los escenarios demográficos (expansión poblacional, cuello de botella, etc.). Del conjunto de simulaciones se correlaciona el valor de distintos parámetros de las pruebas de genética de poblaciones que tratan de detectar o medir la adaptación (Tajima, п, Ѳ, MKT, IHS, Sweepfinder) con el valor de adaptación calculado en las simulaciones. En el siguiente paso, se implementa una regresión de componentes principales que relacione el valor de estos estadísticos bajo distintas condiciones selectivas y/o demográficas con α. Una vez que el modelo estadístico se ha entrenado con las simulaciones y se obtienen resultados fiables se puede entonces aplicar sobre datos reales para estimar α. Esta metodología es aplicable a cualquier contexto de recombinación. La simulación requiere valores semillas del tamaño poblacional, la tasa de mutación neutra, el tamaño de los cromosomas y la densidad génica. La bondad de la aproximación depende del grado de conocimiento de los distintos modos de acción de la selección natural y de las limitaciones en tiempo de cómputo de los actuales simuladores forward in time. No obstante, actualmente existen

16

Page 17: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

simuladores muy completos y rápidos (como los csfs_code [75] y Slim [95]). De este modo se consigue estimar la selección adaptativa en situaciones complejas, donde ningún estimador actual, desde el basado en el MKT [34] con sus extensiones [95] hasta los basados en la estimación ML [74] de los coeficientes de selección, es capaz de dar estimas fiables. Para la simulación se utilizará código Perl y bash. Para la estimación estadística se utilizará el paquete R. Las simulaciones y el pipeline escrito en Perl y en bash que ejecutan iterativamente los simuladores estarán a libre disposición de la comunidad científica y se podrá descargar a través de ftp.

(b) Estimación de la selección natural en inversiones cromosómicas.

Para obtener una visión más completa del efecto de la selección sobre las inversiones estudiaremos tanto Drosophila como la especie humana mediante 3 enfoques complementarios. Para Drosophila, utilizaremos las predicciones y datos de variación nucleotídica del proyecto DGRP [16], mientras que para humanos se utilizarán los datos de inversiones en 550 individuos del proyecto INVFEST [12] y de variación nucleotídica del 1000GP [19].

- Partiendo de la frecuencia calculada en diferentes poblaciones humanas construiremos un modelo lineal que reúna las diferentes características de las inversiones, tales como la longitud, el efecto sobre los genes, tamaño e identidad de las repeticiones invertidas, y la tasa local de recombinación. El modelo servirá para determinar los factores que explican la mayor parte de la variación en la distribución de las frecuencias e identificar inversiones candidatas a estar bajo selección [96].

- La detección de inversiones con una frecuencia inesperada de acuerdo con su edad es una evidencia clara de selección balanceada o positiva. Para detectar estos casos, desarrollaremos un test para comparar la frecuencia observada y la distribución de probabilidades de la frecuencia en función de la edad según un modelo neutro, como se ha propuesto para inserciones de elementos transponibles [97]. La edad de las inversiones se estimará con los métodos habituales [98] teniendo en cuenta modelos demográficos de la variación poblacional. A pesar de que las frecuencias esperadas pueden tener una variación considerable, desviaciones significativas serán una buena indicación de la acción de la selección.

- Por último, examinaremos los patrones de variación nucleotídica en torno a los puntos de rotura de las inversiones. Para ello, se analizará 1 Mb a ambos lados de la inversión mediante ventanas de longitud variable en función del tamaño de la inversión. Utilizando el programa PopGenome [99], se calcularán medidas de diversidad genética y desviación del espectro de frecuencias [100-102], tratando las dos orientaciones como una única población o poblaciones diferentes. Esto nos dará una idea de los efectos de la inversión sobre la variación nucleotídica, posibles expansiones de cada ordenación y casos claros de selección balanceada. Finalmente, aplicaremos tests basados en la longitud de haplotipos como iHS o EHH [103,104]. Aunque estos resultados pueden verse afectados por la inhibición de la recombinación causada por la inversión, serviría para identificar evidencias de selección positiva y descartar inversiones no seleccionadas positivamente.

Obj. 3. Análisis global de las consecuencias funcionales de las inversiones y su asociación con características fenotípicas en humanos.

Para determinar el impacto funcional de las inversiones nos centraremos en el análisis de las inversiones polimórficas humanas, que tienen un considerable interés biomédico, combinando el trabajo experimental con el análisis bioinformático de datos disponibles a varios niveles. En particular, utilizaremos los datos de genotipos de inversiones generados en el proyecto INVFEST [12], así como el método desarrollado para genotipar 41 inversiones polimórficas humanas (que esperamos que aumente próximamente hasta unas 60). Además, se utilizarán los datos funcionales del genoma humano que se están generando dentro de proyectos como ENCODE [60].

- Por ahora, los estudios sobre los efectos de las inversiones sobre los niveles de expresión génica han sido limitados y se han centrado en el estudio de líneas celulares linfoblastoides [51,58,105]. Por tanto, muchos efectos reguladores de las inversiones se pueden haber perdido y se llevará a cabo un análisis completo de la asociación de las inversiones con niveles de expresión génica en múltiples tejidos. Como primera aproximación, buscaremos la información disponible

17

Page 18: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

sobre eQTLs (loci que afectan a la expresión génica) en distintos tejidos a menos de 1 Mb de distancia de las inversiones y determinaremos si están en desequilibrio de ligamiento con la inversión, lo que indicaría que ésta podría ser la principal causa del cambio en los niveles de expresión. Como muchas inversiones no están asociadas a ningún haplotipo en particular [56], se buscará también la asociación directa entre los genotipos de las inversiones y los niveles de expresión génica en distintos tejidos. Este análisis se basará en la información generada en el proyecto GTEx [106], que pretende generar el conjunto de datos más completo de expresión génica en humanos en diversos tejidos de >900 individuos. Como el DNA de estas muestras está disponible para la comunidad científica, genotiparemos las inversiones en las muestras de GTEx y evaluaremos el efecto de las inversiones en los niveles de expresión génica del mismo modo que para las líneas celulares linfoblastoides.

- Una de las consecuencias directas de las inversiones es la reordenación de las secuencias de DNA, que se ha relacionado con diferencias de expresión debidas al traslado de un gen a un dominio genómico distinto y cambios epigenéticos [107]. Sin embargo, hasta hoy no ha sido posible explorar como las inversiones afectan a las modificaciones epigenéticas de la cromatina en las regiones que las rodean. Para ello aprovecharemos los datos recientes de metilación del DNA a lo largo de todo el genoma en 270 individuos de 3 poblaciones humanas [108] y de diversas modificaciones de histonas en 29 humanos [109,110]. Respecto a los niveles de metilación, los datos disponibles no incluyen individuos genotipados para las inversiones, pero gracias a la colaboración con Holger Heyn (IDIBELL), podremos genotipar las inversiones en las mismas muestras. Por otra parte, hay ya datos disponibles de genotipos de inversiones y de modificaciones de histonas para 18 individuos. Además, este tipo de información se irá acumulando rápidamente durante los próximos años, lo que permitirá un análisis más completo.

- Para complementar los análisis anteriores, haremos un estudio de asociación de las inversiones humanas con características fenotípicas. En concreto, nuestro nuevo método de genotipado de inversiones a gran escala nos da por primera vez la oportunidad de genotipar estas variantes en múltiples individuos de una manera rápida y fiable. Mediante la colaboración con Tonu Esko y Andres Metspalu del Estonian Genome Center (véase carta adjunta) genotiparemos la inversiones en muestras de DNA de ~2000 individuos normales que han sido exhaustivamente caracterizados para rasgos de interés biomédico, niveles de expresión génica o datos metabolómicos [111]. Para las inversiones con indicios de asociación con algún fenotipo, se genotiparán muestras adicionales para determinar el alcance de la asociación y si es necesario el análisis se replicará en una cohorte independiente. Finalmente, basándose en los genes afectados por los cambios de expresión y las señales de GWAS existentes cerca de las inversiones, se extenderá el análisis a muestras de enfermedades candidatas del Estonian Genome Center o de otros colaboradores como Xavier Estivill (CRG). De esta forma, se podrá obtener una lista de inversiones relacionadas con diferencias fenotípicas y de susceptibilidad a enfermedades entre individuos, y aunque no se encuentren asociaciones inversión-fenotipo, los resultados serán informativos para comprender las consecuencias fenotípicas de este tipo de variantes.

- Finalmente, trataremos de determinar el mecanismo exacto por el que las inversiones producen efectos funcionales y profundizar en sus consecuencias. Este análisis se centrará en las inversiones candidatas identificadas en los hitos previos o que muestren evidencias de selección, empezando con algunas de las identificadas dentro del proyecto INVFEST. La estrategia dependerá de la inversión para la que se hayan identificado efectos, y se validarán siempre las diferencias en expresión génica o cambios epigenéticos en muestras independientes (líneas celulares o muestras de tejidos disponibles en el laboratorio o bancos de tejidos). A continuación, se examinarán los patrones de desequilibrio de ligamiento de la inversión con variantes nucleotídicas y se localizarán con precisión los puntos de rotura y los SNPs asociados con respecto a los elementos funcionales conocidos del genoma [60]. Aparte de genes y RNAs no codificantes, nos fijaremos especialmente en posibles regiones reguladoras (sitios de unión de factores de transcripción obtenidos por ChIP-seq, enhancers predichos mediante modificaciones de histonas, sitios de hipersensibilidad a la DNasaI o regiones conservadas entre especies). Excepcionalmente, el efecto de las posibles variantes reguladoras en la expresión de genes cercanos se puede testar con reporter assays. Esto nos dará una idea de si el efecto de las inversiones deriva directamente del efecto mutacional producido por la reordenación del DNA o de su asociación con SNPs.

18

Page 19: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

Obj. 4. Sustitución adaptativa y conservación en genes del desarrollo embrionario de Drosophila y humanos.

Este objetivo incluye también dos sub-objetivos relacionados con diferentes tipos de genes importantes durante el desarrollo.

(a) Genes de las vías de señalización celular embrionaria.

- A partir de una búsqueda bibliográfica se obtendrán los genes implicados y su jerarquía de interacción para cada una de las STP de Drosophila y humanos. Las STP, los genes que las constituyen y su jerarquía de interacción, de Drosophila se encuentran descritas en bases de datos basadas en la bibliografía de experimentos funcionales en la genética del desarrollo [112-115]. Una vez se haya obtenido esta información, los genes se categorizarán en función de la STP en la que participan y en función de si son factores de crecimiento, receptores, proteínas de transducción de señal o factores de transcripción.

- De los datos de proyecto DGRP y 1000GP se estimará el polimorfismo y la divergencia nucleotídica y otros parámetros de genética de poblaciones (Pa/Ps, α) como se explica en el Obj. 1. La secuencia de los promotores se obtendrán de las anotaciones de modENCODE [59], y en su defecto, se tomarán las secuencias 1 kb corriente arriba del origen de la transcripción.

- Los resultados obtenidos de la acción de la selección en las STP se compararán con los resultados de un modelo matemático que simula la evolución virtual en redes genéticas a lo largo del desarrollo (de forma similar y con una generalización de un modelo previo [116]). Este modelo es una implementación matemática de las reglas básicas de interacciones genéticas (vía señales extracelulares y sus STPs) y biomecánicas entre células, y de las actividades que las células realizan durante el desarrollo (dividirse, morirse, adherirse, contraerse, moverse por adhesión y contracción, secretar a la matriz extra-celular y comunicarse). Se han utilizado versiones previas del modelo para entender el desarrollo de órganos complejos como los dientes y predecir los patrones de variación morfológica multidimensional en el nivel poblacional y sin relación con la variación en las STPs [90]. El modelo actual es lo suficientemente general como para implementar cualquier red genética y probar como ésta afecta la secreción de señales extra-celulares y las STPs. También permite incorporar la mutación y distintas poblaciones en las cada individuo tiene un genotipo (representado por su red genética) y un fenotipo (resultado de correr el modelo de desarrollo en el genotipo de cada individuo). Con mutación y selección natural el modelo permite simular el proceso evolutivo mediante un mapa genotipo-fenotipo que aproxima nuestro conocimiento actual de la biología del desarrollo en animales (de modo análogo al estudio previo [116]). Este modo de simular el proceso evolutivo se utilizará para entender si los genes a diferentes niveles en la jerarquía de las STPs (señales, receptores, proteínas de transducción o factores de transcripción) son más susceptibles a la selección purificadora (conservación) y/o a la selección positiva.

(b) Genes del desarrollo que difieren en su patrón de expresión espacio-temporal.

- A partir de las anotaciones funcionales de los proyectos modENCODE [59] para Drosophila, y para humanos ENCODE [60] y el EMBL-EBI Expression Atlas [117] se obtendrá un listado de genes con sus niveles de transcripción a lo largo del desarrollo. Para Drosophila se obtendrá la información de las variables transcripcionales espacial-temporal a lo largo del desarrollo, en diferentes tejidos y condiciones de estrés como se describe en el Obj. 1. Estos datos se podrán complementar con los de la base de datos Flyexpress [118].

- Con la información obtenida, los genes se categorizarán según los estadios (para el análisis temporal), los tejidos y zona del embrión (la forma del embrión en cada estadio será partida en regiones arbitrariamente como en [119]) en los que se expresan.

- De los datos del proyecto DGRP y 1000GP se estimará el polimorfismo y la divergencia nucleotídica y otros parámetros de genética de poblaciones (Pa/Ps, α) como se explica en el Obj. 1. Esto nos permitirá hacer estimas de estos parámetros para el conjunto de los genes en función del tiempo (estadio), tejido y espacio (para cada estadio). Esto equivale a trazar mapas de cada parámetro de genética de poblaciones en el tiempo, espacio y tejido de cada

19

Page 20: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

embrión para comparar como las diferentes partes del embrión (en el espacio y el tiempo) evolucionan (a través de la evolución de los genes que se expresan en ellas).

- El análisis espacial y de tejido se realizará tanto para Drosophila como para humanos. El análisis espacial se realizará sólo para Drosophila, pues en humanos no existen datos por las lógicas restricciones éticas y experimentales.

Obj. 5. Actualización, ampliación, mejora e integración de los recursos bioinformáticos.

Para cada uno de los recursos citados en este objetivo nos proponemos mejorar la eficiencia y velocidad de cómputo de las distintas aplicaciones y bases de datos, seguir ampliando sus funcionalidades, y ampliar los contenidos de las bases de datos con los nuevos datos que se van generando, como se describe a continuación. Además, se iniciará su mantenimiento y actualización a través del repositorio público GitHub [120], separando una versión pública del recurso y otra de desarrollo, y se creará un servidor espejo (mirror) externo usando los servicios de Amazon.

- Actualización y ampliación del navegador de genómica de poblaciones PopDrowser [36]: El PopDrowser es la herramienta de visualización vía web del mapa de polimorfismo nucleotídico en D. melanogaster. Esta herramienta se ampliará y actualizará en múltiples aspectos. (1) Se añadirá todos los datos de transcriptómica y epigenómica que se obtendrán el objetivo 1 y los nuevos datos disponibles de secuenciación 454 de variación estructural, cómo inserciones/deleciones (indels) o inversiones. (2) Se actualizará el visualizador genómico genérico GBrowse [121] con nuevas funcionalidades y formatos de anotaciones (VCF [122]). (3) Configuración en un nuevo entorno aislado dentro de una máquina virtual. (4) Actualzación formato WIG [123] al nuevo formato BigWig [124], optimizado para la lectura rápida grandes volúmenes de datos genómicos.

- Desarrollo del algoritmo de predicción de inversiones GRIAL para su uso con datos de secuenciación de nueva generación. Nuestro algoritmo GRIAL ha demostrado funcionar mejor que ningún otro programa para la predicción de inversiones [53,54], pero predecir inversiones de forma fiable a partir de secuencias cortas es todavía complicado, sobre todo para las inversiones mediadas por IRs [53]. Para solucionar este problema, desarrollaremos un nuevo score de las inversiones basado en los mapeos concordantes y discordantes que soportan cada posible ordenación, teniendo en cuenta los posibles mapeos alternativos de cada secuencia. Además, en colaboración con el Departamento de Arquitectura de Computadores y Sistemas Operativos de la UAB, se incrementará la eficiencia y velocidad del programa para que pueda procesar adecuadamente la gran cantidad de datos disponibles de cada individuo. La mejora de GRIAL nos permitirá refinar las predicciones de inversiones previas e identificar otros posibles candidatos de interés.

- Mejora de la base de datos de inversiones polimórficas humanas InvFEST. Aunque la primera versión de la base de datos InvFEST se ha puesto en marcha hace sólo unas semanas [55], durante este proyecto nos proponemos incrementar su funcionalidad y la información contenida para que InvFEST sea una referencia mundial para las inversiones humanas. (1) Se implementará la herramienta BreakSeq [125] para inferir automáticamente para cada inversión el mecanismo de generación, las características de los IRs en los puntos de rotura, y el estado ancestral por comparación con otros genomas de primates. (2) Se modificará la parte administrativa para hacer la introducción de información más flexible e incluir en la interficie una herramienta de visualización de la secuencia de los puntos de rotura. (3) Se incorporará una nueva sección en el resumen de cada inversión para incluir los datos del desequilibrio de ligamiento entreSNPS e inversiones y los resultados de los tests de selección y medidas de diversidad nucleotídica. (4) Por último, se añadirá continuamente toda la información que se vaya generando en la literatura o en los diferentes objetivos del proyecto.

20

Page 21: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

4.3.1. Cronograma. Para cada objetivo deben indicarse: el investigador responsable del mismo, los participantes involucrados, el período de ejecución (expresado en trimestres) y los hitos y entregables esperados con indicación del trimestre previsto (Tx) para su consecución.

Máximo 24 000 caracteres

Ejemplo:

O1: Breve descripción del objetivo 1 Responsable: Nombre y apellidosParticipantes: Nombre y apellidos P1; Nombre y apellidos P2; Nombre y apellidos P3; Nombre y apellidos P4; Nombre y apellidos PnPeriodo de ejecución (en trimestres); p. ej., T1 – T2H1 – Breve descripción del hito 1 y trimestre previsto, p. ej., T1H2 – Breve descripción del hito 2 y trimestre previsto, p. ej., T2Hn – Breve descripción del hito n …E1 – Breve descripción del entregable 1 y trimestre previsto, p. ej., T2En – Breve descripción del entregable n…

O1: Búsqueda de los determinantes genómicos de la diversidad proteica y nucleotídica mediante la integración de datos de genómica funcional y genómica de poblaciones.

Responsable: Antonio Barbadilla

Participantes: Sergio González; Raquel Egea

Periodo de ejecución: T1-T9

H1.1 – Minería de anotaciones del proyecto modENCODE: T1-T2

H1.2 – Minería de DGRP y estimas de DGRP: T3-T4

H1.3 – Análisis estadístico y caracterización determinantes genómicos: T5-T7

H1.4 – Redacción manuscrito: T8-T9

O2: Desarrollo de estimadores de la selección natural en distintos contextos genómicos.

Responsables: Antonio Barbadilla; Mario Cáceres.

Participantes: Carla Giner; Sònia Casillas; Becario FPI

Colaboradores externos: David Castellano; Adam Eyre-Walker

Periodo de ejecución: T1-T12

H2.1 – Código Perl y Bash: T1-T2

H2.2 – Simulaciones y prueba del estimador: T3-T4

H2.3 – Modelo lineal de la frecuencia de las inversiones: T1-T2

H2.4 – Desarrollo e implementación del test de frecuencia y edad de inversiones: T3-T6

H2.5 – Patrones de variación nucleotídica en torno puntos de rotura: T6-T9

21

Page 22: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

H2.6 – Análisis conjunto de datos y redacción manuscrito: T9-T12

O3: Análisis global de las consecuencias funcionales de las inversiones y su asociación con características fenotípicas en humanos.

Responsable: Mario Cáceres

Participantes: Sonia Casillas; Marta Puig; Postdoc solicitado

Colaboradores externos: Holger Heyn; Tonu Esko; Andres Metspalu

Periodo de ejecución: T1-T12

H3.1 - Análisis de la asociación de las inversiones con niveles de expresión génica en múltiples tejidos: T1-T4

H3.2 - Efecto de las inversiones en las modificaciones epigenéticas de la cromatina: T1-T4

H3.3 - Asociación de las inversiones con características fenotípicas humanas: T5-T8

H3.4 - Caracterización exhaustiva de la base genética del efecto de las inversiones: T1-T12

H3.5 – Redacción de manuscritos: T9-T12

O4: Sustitución adaptativa y conservación en genes del desarrollo embrionario de Drosophila y humanos

Responsable: Antonio Barbadilla

Participantes: Isaac Salazar; Becario FPI

Periodo de ejecución: T1-T12

H4.1 – Estima de la sustitución adaptativa y conservación en genes STPs: T1-T10

H4.2 - Estima de la sustitución adaptativa y conservación en genes que difieren en su patrón de expresión espacio-temporal: T1-T10

H4.3 – Redacción manuscrito: T11-T12

O5: Actualización, ampliación, mejora e integración de los recursos bioinformáticos.

Responsable: Antonio Barbadilla; Mario Cáceres

Participantes: Raquel Egea; Sònia Casillas; Técnico informático solicitado

Periodo de ejecución: T1-T12

H5.1 - Actualización y ampliación del navegador de genómica de poblaciones PopDrowser : T3, T9

H5.2 - Desarrollo del algoritmo de predicción de inversiones GRIAL para su uso con datos de secuenciación de nueva generación: T1-T4

H5.3 - Mejora de la base de datos de inversiones polimórficas humanas InvFEST: T1-T12

22

Page 23: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

4.3.2. Cronograma (gráfico). En el cronograma, marque la duración del OBJETIVO (X) y señale con H1...Hx los HITOS, y con E1…Ex los ENTREGABLES, en su caso, de cada objetivo

Año 1 (trimestres) Año 2 (trimestres)Objetivo 1 2 3 4 5 6 7 81 (p. ej.) X X H1; H2 E1 X H3; H4 E2

2 (p. ej.) X X H1 H2; E1 E2 H3

AÑOS 1 y 2Año 1 (trimestres) Año 2 (trimestres)

Objetivo 1 2 3 4 5 6 7 81 X H1.1 X H1.2 X X H1.3 X

2 X H2.1; H2.3 X H2.2 X H2.4 X

3 X X X H3.1; H3.2 X X X H3.3

4 X X X X X X X X

5 X X H5.1 H5.2 X X X X

AÑOS 3 y 4Año 3 (trimestres) Año 4 (trimestres)

Objetivo 9 10 11 12 13 14 15 16

23

Page 24: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

1 H1.1

2 H2.5 X X H2.6

3 X X X H3.4; H3.5

4 X H4.1; H4.2 X H4.3

5 H5.1 X X H5.3

24

Page 25: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

5. IMPACTO ESPERADO DE LOS RESULTADOSDescriba brevemente el impacto científico-técnico, internacional, social o económico que se espera de los resultados del proyecto.

El impacto esperado de los resultados debe completarse también en la aplicación de la solicitud. Su contenido podrá ser publicado a efectos de difusión si el proyecto resultara financiado en esta convocatoria1.Máximo 3500 caracteresLa finalidad de este proyecto es llevar a cabo investigación básica de excelencia, en adecuación a los objetivos de la presente convocatoria. Por eso, el impacto esperado de este tipo de proyecto es que los resultados obtenidos signifiquen un avance significativo en el campo de investigación básica al que pertenece. La temática del proyecto es uno de los grandes temas de la investigación científica actual, la compresión de la base genética de la evolución y de la diversidad fenotípica, pero lo que define la excelencia e impacto potencial de un proyecto son los objetivos específicos que se quieren abordar y el equipo que debe ejecutarlos. Del equipo ya se ha comentado su idoneidad para este proyecto. Respecto a los objetivos específicos, exceptuando el objetivo 5, que es un objetivo más bien técnico, los cuatro objetivos de investigación restantes (objetivos 1-4) tratan de temas centrales, frontera, en el ámbito de la genómica de poblaciones y la genómica cuyos resultados contribuirán a entender mejor como se relaciona la variabilidad en el genoma con niveles superiores, como los cambios epigenéticos y las modificaciones de la cromatina. Además, permitirá desarrollar nuevos métodos para la detección de la selección en el genoma. Asimismo, mediante la combinación de métodos de diferentes disciplinas, este proyecto permitirá llevar a cabo uno de los primeros estudios exhaustivos del impacto sobre los efectos funcionales y las características fenotípicas de un tipo de variante estructural, las inversiones, que a pesar de haber sido un gran modelo de la biología evolutiva han sido muy poco estudiadas en humanos. Dos objetivos son esencialmente exploratorios, y tratan de encontrar nuevas relaciones, explicaciones y principios a partir de la integración de los grandes conjuntos datos producidos por proyectos internaciones, en algunos de los cuales han participado los IPs del proyecto (objetivos 1 y 4). El impacto de los resultados se visualiza principalmente a través de las publicaciones científicas, por la que esperamos que los resultados de este proyecto se publiquen en las mejores revistas del campo. El proyecto también contribuye con recursos bioinformáticos (objetivo 5), como el navegador genómico PopDrowser o la base de datos de inversiones humanos InvFEST, que son muy necesarios para el manejo y el acceso a la gran cantidad de datos genómicos disponibles actualmente. Hay que destacar también que del objetivo 3 puede asimismo derivarse una aplicación práctica más directa, pues se llevará un estudio exhaustivo pionero del impacto sobre los efectos funcionales y las características fenotípicas de las inversiones que puede permitir detectar la base genética de diferencias en la susceptibilidad a enfermedades, con el impacto social y económico consiguiente. Por último, no hay que olvidar el impacto en el fortalecimiento de grupos y la formación de nuevos científicos de este proyecto. Se participará en una investigación puntera con un alto componente internacional, integrando datos de escala genómica, con todos los beneficios científicos y formativos que implica para todo el equipo de investigadores, especialmente para los doctorandos, pues se formarán al más alto nivel contribuyendo así al desarrollo científico del país.

1 Si el proyecto resultara financiado en esta convocatoria, el órgano concedente podrá solicitar las conclusiones y los resultados del mismo, que podrán ser publicados a efectos de difusión.

25

Page 26: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

6. DIFUSIÓN Y TRANSFERENCIA DE LOS RESULTADOS6.1. PLAN DE DIFUSIÓN. Máximo 4000 caracteresLa difusión de nuestros resultados de investigación seguirá los cauces habituales, publicación científica en revistas de prestigio internacional de nuestra especialidad, así como comunicaciones y ponencias en congresos nacionales e internacionales. En concreto, de los resultados obtenidos esperamos publicar un mínimo de 6 artículos científicos durante el desarrollo del proyecto. Puesto que los objetivos que se plantean son fundamentales en nuestro campo, esperamos que los resultados de la investigación de publiquen en las mejores revistas del campo, como Nature Genetics, Genome Research, Molecular Biology and Evolution, PLoS Genetics, Genome Biology, Bioinformatics, Genetics o Nucleics Acids Research. Incluso algunos de los resultados, si se cumplieran nuestras expectativas, podrían publicarse en revistas generales de gran impacto como Science, Nature o PNAS o PLoS Biology.

Respecto a congresos, esperamos que al menos una vez al año cada miembro del equipo de trabajo atienda a un congreso científico nacional o internacional para exponer los resultados obtenidos en el proyecto. Entre los congresos internacionales a los que se asistirá se incluyen algunos centrados en genómica (The Biology of Genomes, Cold Spring Harbour Laboratory), evolución (Society for Molecular Biology and Evolution Meeting), y genética humana (American Society of Human Genetics Meeting). Además, esto se complementará con conferencias invitadas en diferentes centros de investigación nacionales e internacionales. En concreto, el IP2 organiza con el Dr. Sebastián Ramos (CRAG) un ciclo de Seminarios de Genómica y Evolución a lo largo de todo el curso académico (octubre-junio), donde quincenalmente se presenta nuestra investigación y la de otros grupos que trabajan en nuestra área. El IP1 imparte frecuentemente conferencias divulgativas en muchas de las cuáles explica la investigación que lleva a cabo y espera seguir haciéndolo a lo largo de este proyecto.

Por último, los resultados del proyecto serán incluidos en el navegador genómico existente PopDrowser y la base de datos de inversiones InvFEST, que permitirán acceder a la información de manera sencilla a todos los usuarios interesados y representa un medio de difusión en si mismo. Al mismo tiempo, se incluirán noticias sobre los resultados de la investigación, las publicaciones científicas y las actualizaciones de las bases de datos en las páginas web de cada uno de los grupos.

6.2. PLAN DE TRANSFERENCIA Y EXPLOTACIÓN, en su caso, de los resultados del proyecto, incluyendo aquellas entidades interesadas en los resultados del proyecto, concretando su participación y/o aportaciones al desarrollo del mismo.

Máximo 4000 caracteresUno de los resultados del proyecto previo INVFEST ha sido la solicitud de una patente titulada "Inverse multiplex ligation-dependent probe amplification (iMLPA), an in vitro method of genotyping multiple inversions" (número de referencia EP13382296.5), correspondiente al método desarrollado para genotipar múltiples inversiones humanas a gran escala. Como parte de este proyecto, es posible que se lleven a cabo mejoras en el método que puedan servir para complementar esta patente e incrementar las posibilidades de transferencia y explotación de la tecnología. De hecho, estamos en contacto con varias empresas, como MRC Holland (www.mrc-holland.com/) o Myriad Genetics (www.myriad.com/), por su posible interés en la licencia de este método. Además, una parte de la investigación del proyecto está encaminada a la búsqueda de posibles asociaciones entre inversiones y características fenotípicas en humanos. Esta investigación podría generar resultados sobre la base genética de diferencias en la susceptibilidad a enfermedades entre individuos y a través de la Oficina de Valorización y Patentes de la UAB estamos pendientes de la posibilidad de proteger la propiedad intelectual y explotar estas posibles asociaciones de cara a una mejora en el diagnóstico y en el tratamiento de las enfermedades en cuestión. En concreto, hemos contactado ya con una empresa

26

Page 27: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

de diagnóstico genético, qGenomics (http://www.qgenomics.com/), que estaría interesada en el uso de estos ensayos en sus pruebas diagnósticas.

27

Page 28: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

7. FINANCIACIÓN PÚBLICA Y PRIVADA (PROYECTOS Y CONTRATOS DE I+D+i)DEL EQUIPO DE INVESTIGACIÓN

Indique únicamente la financiación en los últimos 5 años (2009-2013), ya sea de ámbito autonómico, nacional o internacional. Incluya también las solicitudes pendientes de resolución.

Debe indicar: referencia, título, investigador principal, entidad financiadora, duración y cuantía de la subvención, además de las siguientes claves: 0 = es el mismo tema; 1 = está muy relacionado; 2 = está algo relacionado; 3 = sin relación; C o una S según se trate de una concesión o de una solicitud.

Máximo 20 proyectos o contratos.

Máximo 12 000 caracteres

Ejemplo:

1. Referencia XXX2009-nnnnn. “Título”, “Investigador principal”, MICINN, 01/2010-12/2012. xx.xxx €. 1-C2. Referencia XXX2012-nnnnn. “Título”, “Investigador principal”, MINECO, 01/2013-12/2015. xxx.xxx €. 3-C3. FP7-NMP-20xx-SMALL-x. “Título”, “Investigador principal”, UE, 01/2013-12/2015. xxx.xxx €. 2-C4. FP7-PEOPLE-2012-ITN. Título”, “Investigador principal”, UE, 01/2013-12/2015. xxx.xxx €. 1-S…20.

1. Referencia BFU2006-08640. "Patrones de diversidad nucleotídica en diferentes regiones funcionales de Drosophila y Cordados", PI = Antonio Barbadilla, MEC, 02/2010-01/2015. 48.800 €. 1-C

2. Referencia BFU2007-60930. "Genomic determinants of gene expression levels in the human brain", PI = Mario Cáceres, MEC,10/2007-12/2009. 105.270 €. 2-C

3. Referencia BFU2009-09504. "Análisis genómico del polimorfismo y la divergencia en Drosophila melanogaster", PI = Antonio Barbadilla, MICINN,1/20107-12/2013. 72.600 €. 1-C

4. 2009 SGR 88. "Genómica, bioinformática y evolución", PI = Alfredo Ruiz, Generalita de Catalunya, 01/2009-12/2013. 48.000 €. 2-C

5. GM45146. "The Drosophila Genetic Reference Panel", PI = Trudy Mackay-Stephen Richards- Richard Gibbs, US National Human Genome Research Institute, 02/2008-01/2011.US$ 4.000.000. 1-C

6. ERC-StG-2009-243212-INVFEST. "Evolutionary and functional analysis of polymorphic inversions in the human genome", PI = Mario Cáceres, EU, 02/2010-01/2015. 1.475.377 €. 1-C

7. ERC-PoC-2013-632293-INGENIHUS. "A novel high-throughput tool to genotype human genome inversions for personalised medicine", PI = Mario Cáceres, EU, 03/2014-03/2015. 149.671 €. 2-S

28

Page 29: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

8. RELACIÓN DE LAS PERSONAS QUE COMPONEN EL EQUIPO DE TRABAJORelacione las personas del equipo de trabajo que participarán en la ejecución del proyecto de investigación (de acuerdo con el artículo 18.9 de la convocatoria). Recuerde que el currículum de los doctores aquí incluidos deberá aportarse en la aplicación de solicitud del proyecto.

Máximo 8000 caracteresIndique NOMBRE Y APELLIDOS y las siguientes claves según proceda:TITULACIÓN: Doctor (D); Licenciado o ingeniero (L); Graduado (G); Máster (M); Formación profesional (FP); Otros (O)TIPO DE CONTRATO: En formación (F); Contratado (C); Técnico (PT); Entidad extranjera (EE); Otros (OC)DURACIÓN DEL CONTRATO: Indefinido (I); Temporal (T)

1. Nombre y apellidos. G-F-T2. Nombre y apellidos. FP-PT-I3. Nombre y apellidos. EE

Gracias a la participación en diferentes proyectos de alto impacto, hemos podido reunir un equipo científico y un equipo de trabajo multidisciplinar, con los conocimientos y capacidades diversos que se requieren para llevar a cabo un proyecto de estas características. Esto está avalado por sus logros científicos previos, como demuestran los resultados de sus proyectos y sus publicaciones, todo lo cual es una garantía de que los objetivos planteados se alcanzarán con éxito.

1. Antonio Barbadilla Prados. D-C-I (IP1)

Véase el formulario de solicitud del proyecto para un resumen de su CV.

2. Mario Cáceres Aguilar. D-C-I (IP2)

Véase el formulario de solicitud del proyecto para un resumen de su CV.

3. Isaac Salazar Ciudad. D-EE-I

El Dr. Isaac Salazar-Ciudad es un investigador del Instituto de Biotecnología de la Universidad de Helsinki y profesor visitante en el Departament de Genètica i Microbiologia de la UAB. El Dr. Salazar-Ciudad tiene una trayectoria de 15 años trabajando en modelos computacionales de redes genéticas en el desarrollo embrionario y la evolución. Además, ha realizado varios trabajos sobre como una mejor comprensión de estas redes ayuda a entender mejor el mapa genotipo-fenotipo y su efecto sobre la evolución. Su modelos más recientes (Nature 2010, Nature 2013) resumen el estado actual de nuestro conocimiento sobre como la variación genética afecta la dinámica de las redes del desarrollo para dar lugar a patrones específicos de variación fenotípica. El Dr. Salazar-Ciudad participará en el objetivo 4.

4. Sònia Casillas Viladerrams. D-C-T

La Dra. Sònia Casillas es una investigadora postdoctoral del Institut de Biotecnologia i Biomedicina y del Departament de Genètica i Microbiologia de la UAB. La Dra. Casillas tiene una trayectoria de más de 10 años trabajando en la representación y análisis de la diversidad genética a partir de datos nucleotídicos, y en los últimos años se ha dedicado al estudio de las inversiones en humanos. Ha llevado la dirección científica de la Plataforma Bioinformática UAB-Hospitales entre los años 2006 y 2010, y desde los últimos años imparte docencia en Genética de poblaciones, Genómica y Bioinformática en varios de los grados y másteres ofertados en la universidad. La Dra. Casillas participará en varios de los objetivos del proyecto. Tal como se explica en la carta del área de personal de la UAB adjunta a su CV, ocupa una plaza interina equivalente a profesor lector y su contrato postodctoral se renueva anualmente hasta que haya la posibilidad de convocar estas plazas.

29

Page 30: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

5. Raquel Egea Sánchez. D-C-T

La Dra. Raquel Egea es una investigadora del Institut de Biotecnologia i Biomedicina y del Departament de Genètica i Microbiologia de la UAB. La Dra. Egea tiene una trayectoria de casi 10 años trabajando en la representación y análisis de la diversidad genética a partir de datos nucleotídicos y también en el análisis de datos obtenidos por distintas técnicas de secuenciación masiva. Ha colaborado en distintos proyectos nacionales e internacionales realizando análisis bioinformáticos y desde los últimos años imparte docencia en Técnicas Instrumentales y Bioinformática en varios grados y másteres ofertados en la universidad. La Dra. Egea participará en el objetivo 1 y 5. Tal como se explica en la carta del área de personal de la UAB adjunta a su CV tiene un contrato temporal sin fecha de finalización y con un compromiso claro de permanencia.

6. Marta Puig Font. D-C-T

La Dra. Marta Puig es una investigadora postdoctoral del Institut de Biotecnologia i Biomedicina de la UAB. La Dra. Puig tiene 13 años de experiencia trabajando en el análisis de los efectos funcionales de las inversiones. Durante los últimos 3 alos ha estado trabajano en el desarrollo de diferentes estrategias para la validación y el genotipado a gran escala de inversiones polimórficas humanas y conoce perfectamente todas las ténicas experimentales de biología molecular que se van a utilizar en el proyecto. En la actualidad su contracto tiene una duración de un año y medio y participará en el análisis experimental del impacto funcional de las inversiones del objetivo 3 durante el primer año de proyecto.

7. Carla Giner Delgado. M-F-T

Carla Giner Delgado es estudiante de doctorado de primer año del Institut de Biotecnologia i Biomedicina y del Departament de Genètica i Microbiologia de la UAB con una beca PIF (personal Investigador en Formación). Su tesis está centrada en el estudio de la variación genética asociada a las inversiones humanasy las estimas de la acción de la selección. Carla Giner participará en el objetivo 2.

8. Sergio González Rodrífuez. M-F-T

Sergio González es estudiante de doctorado de primer año del Institut de Biotecnologia i Biomedicina y del Departament de Genètica i Microbiologia de la UAB con una beca PIF (personal Investigador en Formación). Su tesis está centrada en el análisis de la variación genética en Drosophila y la integración de datos de genómica funcional y genómica de poblaciones. Sergio González participará en el objetivo 1.

30

Page 31: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

9. CAPACIDAD FORMATIVA DEL EQUIPO SOLICITANTEComplete únicamente en caso de que se solicite la inclusión del proyecto en la convocatoria de “Contratos predoctorales para la formación de doctores”2.

Especifique:

- plan de formación previsto en el contexto del proyecto solicitado;

- relación de tesis realizadas o en curso con indicación del nombre del doctorando, el título de tesis y la fecha de obtención del grado de doctor o de la fecha prevista de lectura de tesis (últimos 10 años).

Máximo 8000 caracteresEn este proyecto solicitamos un becario FPI del Subprograma de Formación de Investigadores para que realice la Tesis Doctoral bajo la dirección de los Drs. Antonio Barbadilla y Mario Cáceres. El proyecto es muy intensivo en análisis de datos, y el número de objetivos que puedan completarse dependerá esencialmente del personal investigador disponible para analizar la ingente cantidad de datos. El becario participará en los análisis teóricos de los objetivos 2 y 4 del proyecto. Su incorporación en nuestro grupo le permitirá obtener una capacitación bioinformática puntera en el análisis de la variación genómica, conocimientos y destrezas muy buscado para afrontar los retos de la investigación genómica y biomédica actual.

La Facultad de Biociencias de la UAB es la única universidad española que ofrece un ciclo completo de formación en Genética, empezando con el Grado de Genética (la única oferta actual en España), pasando por el Máster de Genética Avanzada y finalizando con el Programa de Doctorado de Genética. El grupo de Genómica, Bioinformática y Evolución participa activamente en el Programa de Doctorado de Genética de la UAB. Este programa, organizado por el Departamento de Genética y de Microbiología, ha recibido de forma continuada desde 2003 la Mención de Calidad del Ministerio de Educación y Ciencia, la última el pasado año 2012. Durante los últimos años se han programado distintos cursos con profesores invitados, cuya incorporación en nuestro programa ha sido posible gracias a la financiación obtenida como consecuencia de la mención de calidad.

Por otra parte, en el curso académico 2012-13 se inició un nuevo Máster de Bioinformática directamente relacionado con la investigación que se llevará a cabo en este proyecto, denominado Máster en Bioinformática para la Genómica y el Diseño de Fármacos (http://mscbioinformatics.uab.es). El máster, cuya propuesta y puesta en marcha la coordina el Dr. A. Barbadilla, es una acción estratégica dentro del proyecto Campus de Excelencia Internacional UAB, y tiene por objetivo formar bioinformáticos para suplir la actual carencia de expertos en los conocimientos y destrezas que se requieren en la investigación genómica, biomédica y biotecnológica. Los Drs. A. Ruiz, A. Barbadilla, M. Cáceres, S. Casillas y M. Puig participan en la impartición de diversas asignaturas del mencionado Programa. El máster cuenta con la participación de destacados investigadores como los Dres. Mateo Valero (Director del Barcelona Supercomputing Center), Cedric Notredame (Centre de Regulació Genòmica), Josep F. Abril (Universitat de Barcelona), Luis Serrano (Director Centre de Regulació Genòmica), y Xavier Martínez-Picado (Investigador ICREA del IrsiCaixa), entre otros. El acceso al máster pasa por una escrupulosa selección de los alumnos debido a la gran cantidad de solicitudes que recibe. Al becario solicitado se le aconsejará que asista al Máster de Bioinformática y/o el módulo de especialización de Genómica en caso que lo requiera.

Por otra parte los dos IPs se incluyen dentro del Grupo de Genómica, Bionformática y Evolución (GGBE) del Departamento de Genética y Microbiología y del Instituto de Biotecnología y Biomedicina de la UAB (Grup de Recerca con expediente 2009 SGR 88 de la Generalitat de Catalunya). A lo largo de su historia, el GGBE ha demostrado una capacidad muy notable de innovación y progresión en la calidad de su investigación. El grupo se ha diversificado y especializado, lleva a cabo cuatro líneas de investigación, al compás de los grandes desarrollos en nuestra ciencia. La

2 La inclusión en la convocatoria de “Contratos predoctorales para la formación de doctores” solo será posible en un número limitado de los proyectos aprobados

31

Page 32: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

capacidad formativa de nuestro grupo viene avalada por las 20 Tesis Doctorales que se han presentado en los últimos 18 años (1995-2013): Esther Betrán, Arcadi Navarro, José María Ranz, Mario Cáceres (Premio Extraordinario de Doctorado), Josefa González, Ferran Casals (Premio Extraordinario de Doctorado), Bàrbara Negre, Francesc López, Sònia Casillas (Premio Extraordinario de Doctorado), Natalia Petit, Raquel Egea (Premio Extraordinario de Doctorado), Oriol Calvete, Marta Puig (Premio Extraordinario de Doctorado), Vlad Dinca, Fernando Prada, Mar Marzo, Raquel Rubio y Alexander Martínez-Fundichely. En este mismo período, 22 estudiantes de 3er ciclo han finalizado su Máster. Seis de estos Másters se han llevado a cabo en los últimos cuatro años. En este momento hay doce estudiantes realizando la tesis doctoral (Miquel Ràmia, Maite Barrón, David Castellano, Claudia Sañudo, Yolanda Guillem, Núria Rius, Andrea Acurio, Miquel Marín, David Vicente, Meritxell Oliva, y Carla Giner). La calidad de nuestros doctorandos queda probada por sus cargos y destinaciones después de la finalización de sus tesis: Esther Betrán (Assistant Professor, University of Texas at Arlington, USA), Arcadi Navarro (Profesor de Investigación ICREA, UPF), José María Ranz (Assistant Professor, University of California at Irvine, USA), Mario Cáceres (Profesor de Investigación ICREA, Universitat Autònoma de Barcelona, premio Josep M. Sala-Trepat 2008), Josefa González (Ramón y Cajal, Institut de Biologia Evolutiva), Ferran Casals (Beatriu de Pinós-AGAUR, Institut de Biologia Evolutiva), Barbara. Negre (Postdoctoral researcher, Centre de Regulació Genòmica), F. López-Giráldez (Inv. postdoctoral, Yale University), Sònia Casillas (Investigadora postdoctoral, Universitat Autònoma de Barcelona), Raquel Egea (Dirección científica de la Plataforma Bioinformàtica de la UAB), y Marta Puig (Investigadora postdoctoral, Universitat Autònoma de Barcelona).

Hay que destacar también que el Dr. M. Cáceres co-organiza con el Dr. Sebastián Ramos un ciclo de Seminarios de Genómica y Evolución a lo largo de todo el curso académico (octubre-junio), donde quincenalmente se presenta la investigación de los grupos o se invita a investigadores de prestigio de otros centros. Las sesiones están abiertas a todo el personal interesado de los distintos institutos de investigación y departamentos próximos (por ejemplo IBB, CRAG, Departamento de Genética y Microbiología). Intercalados con los seminarios, los estudiantes de doctorado de nuestro grupo organizan una sesión quincenal de Journal Club, donde se presentan y discuten artículos de investigación. Asimismo, el Dr. M. Cáceres tiene establecida una sesión semanal de Lab Meeting donde alternativamente se discute el trabajo reciente de los miembros del grupo o las últimas publicaciones en revistas de interés (mensualmente), a la que se añadirá el Dr. A. Barbadilla con su equipo.

Por último, la participación en un proyecto internacional y multidisciplinar como el que aquí se plantea, donde se celebrarán reuniones e intercambios de ideas, resultados y avances entre los miembros del proyecto, es otro valor añadido para la formación de nuevos científicos en esta era postgenómica, donde la investigación interdisciplinar y la cooperación entre grupos es un ingrediente esencial.

32

Page 33: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

10. IMPLICACIONES ÉTICAS Y/O DE BIOSEGURIDADDE LA INVESTIGACIÓN PROPUESTA

Si en la aplicación electrónica de solicitud ha contestado afirmativamente en alguno de los aspectos relacionados con implicaciones éticas o de bioseguridad allí recogidos, explique los aspectos éticos referidos a la investigación que se propone, las consideraciones, procedimientos o protocolos a aplicar en cumplimiento de la normativa vigente, así como las instalaciones y las preceptivas autorizaciones de las que dispone para la ejecución del proyecto.

Máximo 8000 caracteres

Implicaciones éticas:

Dentro del trabajo experimental del proyecto (objetivo 3) se incluye el genotipado de inversiones en muestras humanas. Este trabajo ha recibido previamente la autorización del Comité Ético de Experimentación Animal y Humana de la UAB en relación al proyecto europeo INVFEST (Referencia CEEAH-281H) y se ha solicitado una extensión de la autorización para cubrir la propuesta actual. Básicamente, en este proyecto se llevarán a cabo análisis bioinformáticos y experimentales de muestras humanas obtenidas previamente y disponibles para investigación en diferentes repositorios públicos, como son los proyectos HapMap (www.hapmap.org), 1000 Genomes Project (www.1000genomes.org) o el Estonian Genome Center Biobank (http://www.geenivaramu.ee/info/the-estonian-biobank.html). Estos proyectos tienen su propios comités de ética que regulan la obtención y la difusión de las muestras. En concreto, todas las muestras han dido obtenidas con consentimiento informado que permite el uso del DNA en proyectos de investigación y están codificadas de manera que se asegura totalmente el anonimato de los donantes.

Además, como parte del análisis experimental del efecto funcional de las inversiones es posible que se utilicen muestras de tejidos humanos para cuantificar los niveles de expresión génica en individuos con diferentes genotipos para las inversiones. No obstante, estas muestras se han obtenido previamente dentro del proyecto "Determinantes genómicos de los niveles de expresión génica en el cerebro humano" (BFU2007-60930, Ministerio de Educación y Ciencia), que fue aprobado por el Comité Ético de Investigación Clínica del Instituto Municipal de Asistencia Sanitaria del Hospital del Mar (Referencia 2006/2561/I). En este caso, para preservar el anonimato y la confidencialidad de la información de las personas incluidas en este estudio, toda la información personal sobre los pacientes fue codificada por el personal sanitario y los investigadores únicamente recibieron códigos numéricos que relacionan las muestras de tejido con información de interés como la edad, sexo, origen y circunstancias excepcionales que puedan afectar los niveles de expresión génica.

Todos los procedimientos realizados dentro de la investigación propuesta se llevarán a cabo de acuerdo con los principios fundamentales de la Declaración de Helsinki, del Convenio del Consejo de Europa relativo a los derechos humanos y la biomedicina, de la Declaración Universal de la UNESCO sobre el genoma humano y los derechos humanos, y del Convenio para la protección de los derechos humanos y la dignidad del ser humano con respecto a las aplicaciones de la Biología y la Medicina. Además, el proyecto también respetará los principios éticos de la Ley 41/2002 de 14 de noviembre, básica reguladora de la autonomía del paciente y de derechos y obligaciones en materia de información y documentación clínica, el Real Decreto 411/1996, de 1 de marzo, por el que se regulan las actividades relativas a la utilización de tejidos humanos, y la Ley Orgánica 15/1999 de 13 de Diciembre de Protección de Datos de carácter personal. Por último, es importante mencionar que toda la información obtenida a lo largo de este estudio será utilizada exclusivamente para llevar a cabo la investigación propuesta, con el único objetivo de aumentar el conocimiento científico y que en ningún caso se utilizará esta información para la estigmatización o discriminación de grupos ni para apoyar ideas de diferencias entre razas o poblaciones.

Implicaciones de bioseguridad:

33

Page 34: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

A nivel de bioseguridad el trabajo en el laboratorio consistirá principalmente en procesos básicos de biología molecular (amplificación por PCR, hibridación de DNA, electroforesis) que no suponen ningún riesgo para la salud humana. La mayor parte de los experimentos se llevarán a cabo a partir de muestras purificadas de DNA o RNA de origen comercial o extraídas previamente en el laboratorio. En casos excepcionales se realizarán extracciones de DNA o RNA a partir de líneas celulares humanas comerciales o muestras de tejido humano de origen europeo obtenidas como parte del proyecto previo BFU2007-60930 y que no contienen ningún agente infeccioso conocido. Este trabajo se realiza siempre en cabinas de seguridad biológica con las medidas de protección personal correspondientes de acuerdo con la normativa vigente. Además, hay que destacar que a nivel de todo el Instituto de Biotecnología y de Biomedicina de la UAB se está llevando a cabo una solicitud para el nivel de bioseguridad BL2, que cubre los procedimientos llevados a cabo dentro de este proyecto y el trabajo con las muestras humanas descritas.

34

Page 35: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

ANEXO IIncluya las fórmulas, reacciones químicas, etc., que por el tipo de letra del texto del formulario no hayan podido ser insertadas en el mismo. El número de ecuación debe coincidir con su llamada en el texto.

Máximo 2 páginas

Respete la extensión máxima indicada. Recuerde que en virtud del artículo 11 de la convocatoria NO SE ACEPTARÁN NI SERÁN SUBSANABLES MEMORIAS CIENTÍFICO-TÉCNICAS que no se presenten en este formato.

35

Page 36: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

ANEXO IIÚnicamente en caso de que se considere necesario para aclarar ciertos aspectos del proyecto, incorpore las imágenes o figuras (formato TIFF, JPEG o GIF), hasta un máximo de 6, a las que se haya hecho referencia en el texto.

Respete el número máximo de figuras indicado. Recuerde que en virtud del artículo 11 de la convocatoria NO SE ACEPTARÁN NI SERÁN SUBSANABLES MEMORIAS CIENTÍFICO-TÉCNICAS que no se presenten en este formato.

Bibliografía adicional del proyecto y direcciones web60. Bernstein BE, et al. (2012) An integrated encyclopedia of DNA elements in the human genome. Nature 489: 57-74.

61. Choi SS, et al. (2013) Three Independent Determinants of Protein Evolutionary Rate. Journal of Molecular Evolution 76: 98-111.

62. Marais G, et al. (2005) Intron Size and Exon Evolution in Drosophila. Genetics 170: 481-485.

63. Drosophila 12 Genomes Consortium et al. (2007) Evolution of genes and genomes on the Drosophila phylogeny. Nature 450: 203-218.

64. Lawniczak MKN, et al. (2008) Genomic analysis of the relationship between gene expression variation and DNA polymorphism in Drosophila simulans. Genome biology 9.

65. Haerty W, et al. (2009) Similar selective factors affect both between-gene and between-exon divergence in Drosophila. Molecular biology and evolution 26: 859-866.

66. Weber CC, et al. (2012) Late-replicating domains have higher divergence and diversity in Drosophila melanogaster. Molecular Biology and Evolution 29: 873-882.

67. Lemos B, et al. (2005) Evolution of proteins and gene expression levels are coupled in Drosophila and are independently associated with mRNA abundance, protein length, and number of protein-protein interactions. Molecular Biology and Evolution 22: 1345-1354.

68. Parsch J, et al. (2010) On the utility of short intron sequences as a reference for the detection of positive and negative selection in Drosophila. Molecular biology and evolution 27: 1226-1234.

69. Clemente F, et al. (2012) Unconstrained evolution in short introns? - an analysis of genome-wide polymorphism and divergence data from Drosophila. Journal of evolutionary biology 25: 1975-1990.

70. Loewe L (2009) A framework for evolutionary systems biology. BMC systems biology 3: 27.

71. Wagner A (2008) Neutralism and selectionism: a network-based reconciliation. Nature reviews Genetics 9: 965-974.

72. Messer PW, et al. (2013) Frequent adaptation and the McDonald-Kreitman test. Proc Natl Acad Sci U S A 110: 8615-8620.

73. Zhai W, et al. (2009) An investigation of the statistical power of neutrality tests based on comparative and population genetic data. Molecular biology and evolution 26: 273-283.

74. Eyre-Walker A, et al. (2009) Estimating the rate of adaptive molecular evolution in the presence of slightly deleterious mutations and population size change. Molecular biology and evolution 26: 2097-2108.

75. Lewontin RC, et al. (1973) Distribution of gene frequency as a test of the theory of the selective neutrality of polymorphisms. Genetics 74: 175-195.

76. Hahn MW (2008) Toward a selection theory of molecular evolution. Evolution; international journal of organic evolution 62: 255-265.

77. Gillespie JH (2000) Genetic drift in an infinite population. The pseudohitchhiking model. Genetics 155: 909-919.

36

Page 37: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

78. Kirkpatrick M, et al. (2012) Where's the money? Inversions, genes, and the hunt for genomic targets of selection. Genetics 190: 1153-1155.

79. Andolfatto P, et al. (2001) Inversion polymorphisms and nucleotide variability in Drosophila. Genet Res 77: 1-8.

80. Guerrero RF, et al. (2012) Coalescent patterns for chromosomal inversions in divergent populations. Philos Trans R Soc Lond B Biol Sci 367: 430-438.

81. Navarro A, et al. (1997) Recombination and gene flux caused by gene conversion and crossing over in inversion heterokaryotypes. Genetics 146: 695-709.

82. Lakich D, et al. (1993) Inversions disrupting the factor VIII gene are a common cause of severe haemophilia A. Nat Genet 5: 236-241.

83. Tantisira KG, et al. (2008) Chromosome 17: association of a large inversion polymorphism with corticosteroid response in asthma. Pharmacogenet Genomics 18: 733-737.

84. Small K, et al. (1997) Emerin deletion reveals a common X-chromosome inversion mediated by inverted repeats. Nat Genet 16: 96-99.

85. Koolen DA, et al. (2006) A new chromosome 17q21.31 microdeletion syndrome associated with a common inversion polymorphism. Nat Genet 38: 999-1001.

86. Martinez-Arias A, et al. (2002) Molecular principles of Animal Developmen. Oxford: Oxford University Press.

87. Davidson EH, et al. (2006) Gene regulatory networks and the evolution of animal body plans. Science 311: 796-800.

88. Gilbert SF, et al. (1996) Resynthesizing evolutionary and developmental biology. Developmental biology 173: 357-372.

89. Nielsen R, et al. (2013) Introduction to Population Genetics: Sinauer.

90. Salazar-Ciudad I, et al. (2010) A computational model of teeth and the developmental origins of morphological variation. Nature 464: 583-586.

91. Raff RA (1996) The shape of life: genes, development, and the evolution of animal form. Chicago: University of Chicago Press. xxiii, 520 p.

92. http://insitu.fruitfly.org/cgi-bin/ex/insitu.pl.

93. Comeron JM, et al. (2012) The many landscapes of recombination in Drosophila melanogaster. PLoS Genet 8: e1002905.

94. Yanai I, et al. (2005) Genome-wide midrange transcription profiles reveal expression level relationships in human tissue specification. Bioinformatics 21: 650-659.

95. Messer PW, et al. (2012) The McDonald-Kreitman Test and its Extensions under Frequent Adaptation: Problems and Solutions.

96. Petrov DA, et al. (2011) Population genomics of transposable elements in Drosophila melanogaster. Mol Biol Evol 28: 1633-1644.

97. Blumenstiel JP, et al. (2012) An age-of-allele test of neutrality for transposable element insertions. ArXiv prepint http://arxiv.org/abs/1209.3456.

98. Corbett-Detig RB, et al. (2012) Population genomics of inversion polymorphisms in Drosophila melanogaster. PLoS Genet 8: e1003056.

37

Page 38: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

99. Pfeifer B (2013) PopGenome: A swiss army knife for population genetic & genomic analysis. http://cranr-projectorg/web/packages/PopGenome/indexhtml.

100. Tajima F (1989) Statistical method for testing the neutral mutation hypothesis by DNA polymorphism. Genetics 123: 585-595.

101. Achaz G (2008) Testing for neutrality in samples with sequencing errors. Genetics 179: 1409-1424.

102. Fu YX, et al. (1993) Statistical tests of neutrality of mutations. Genetics 133: 693-709.

103. Voight BF, et al. (2006) A map of recent positive selection in the human genome. PLoS Biol 4: e72.

104. Sabeti PC, et al. (2002) Detecting recent positive selection in the human genome from haplotype structure. Nature 419: 832-837.

105. de Jong S, et al. (2012) Common inversion polymorphism at 17q21.31 affects expression of multiple genes in tissue-specific manner. BMC Genomics 13: 458.

106. Lonsdale J, et al. (2013) The Genotype-Tissue Expression (GTEx) project. Nature Genetics 45: 580-585.

107. Girton JR, et al. (2008) Chromatin structure and the regulation of gene expression: the lessons of PEV in Drosophila. Adv Genet 61: 1-43.

108. Heyn H, et al. (2013) DNA methylation contributes to natural human variation. Genome Res 23: 1363-1372.

109. Kasowski M, et al. (2013) Extensive Variation in Chromatin States Across Humans. Science 342: 750-752.

110. McVicker G, et al. (2013) Identification of Genetic Variants That Affect Histone Modifications in Human Cells. Science 342: 747-749.

111. http://www.geenivaramu.ee/info/the-estonian-biobank.html.

112. http://wikipathways.org.

113. http://www.cellsignal.com/reference/pathway/.

114. http://hipathdb.kobic.re.kr/index.php.

115. http://www.genome.jp/.

116. Salazar-Ciudad I, et al. (2013) Adaptive dynamics under development-based genotype-phenotype maps. Nature 497: 361-364.

117. http://www.ebi.ac.uk/gxa/.

118. http://www.flyexpress.net/.

119. Frise E, et al. (2010) Systematic image-driven analysis of the spatial Drosophila embryonic expression landscape. Molecular systems biology 6: 345.

120. https://github.com/.

121. Stein LD, et al. (2002) The generic genome browser: a building block for a model organism system database. Genome Res 12: 1599-1610.

122. http://www.1000genomes.org/wiki/Analysis/Variant%20Call%20Format/vcf-variant-call-format-version-41.

123. http://genome.ucsc.edu/goldenPath/help/wiggle.html

124. http://genome.ucsc.edu/goldenPath/help/bigWig.html.

38

Page 39: Convocatoria de ayudas de Proyectos de Investigación (2004)bioinformatica.uab.es/base/documents/Proyecto2013/Me…  · Web viewSe recomienda completar la memoria empleando un pc

Subdirección General de Proyectos de Investigación

MEMORIA CIENTÍFICO-TÉCNICA DE PROYECTOS INDIVIDUALES (TIPO A o B)

Convocatoria de ayudas a Proyectos de I+D

«EXCELENCIA»

SUBPROGRAMA DE GENERACIÓN DE CONOCIMIENTO

2013

125. Lam HY, et al. (2010) Nucleotide-resolution analysis of structural variants using BreakSeq and a breakpoint library. Nat Biotechnol 28: 47-55.

39