anotaci ón automática
DESCRIPTION
Anotaci ón Automática. Dante Travisany. Temas. Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl. Identificaci ón del Problema. Virus : 15 – 20 Bacteria 3000 - 5000 Eucariontes : sobre los 10000. Pipeline. Pipeline. Unix S ímbolo : | Segmentaci ón. Tools. BLAST - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/1.jpg)
Anotación Automática
Dante Travisany
![Page 2: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/2.jpg)
Temas• Pipeline
• Tools
• Bases de Datos
• Conceptos
• Ejemplos
• Ensembl
![Page 3: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/3.jpg)
Identificación del Problema
• Virus : 15 – 20
• Bacteria 3000 - 5000
• Eucariontes: sobre los 10000
![Page 4: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/4.jpg)
Pipeline
Pipeline• Unix
• Símbolo: |
• Segmentación
![Page 5: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/5.jpg)
Tools• BLAST • InterProScan• AmiGO• Pathway Tools• Infernal• Glimmer• Critica• GeneMark• GeneWise• BedTools• Samtools• GenomicTools• KEGG-API
![Page 6: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/6.jpg)
Base de Datos
BLAST DB Protein-KEGG-PRIAM-SWISSPROT-UNIPROT-NR
BLAST DB Nucleotide- NT- REFSEQ- RDP
InterProScan - Databases
- Pfam- SSF- Gene3D- TIGRfam
![Page 7: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/7.jpg)
Nuevo Problema
• Gran cantidad de bases de datos.
• Errores en Anotación, doble anotación.
• Necesidad de Crear un vocabulario Controlado
• Gene Ontology, UniPROT, SwissPROT, InterProScan.
• Capacidad de realizar referencias cruzadas en las bases de datos.
![Page 8: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/8.jpg)
Algunos Conceptos Importantes
• Gene Name
• Vocabulario Controlado
• IFAA
![Page 9: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/9.jpg)
GeneName:
Para cada Organismo existen gene names particulares, según la base de datos de Referencia.
HUGO:www.genenames.org
![Page 10: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/10.jpg)
Gene Ontology ConsortiumGene Ontology:
Proyecto colaborativo entre variadas instituciones.
Vocabulario:EstructuradoPrecisoComún Controlado
Permite describir los roles de los genes y los productos génicos en cualquier organismo.
![Page 11: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/11.jpg)
División Gene Ontology
• Proceso Biológico
• Función Molecular
• Componente Celular
![Page 12: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/12.jpg)
COG - KOG
![Page 13: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/13.jpg)
Idea
• Filtrar por bases de datos
• Generar una rutina automática capaz de iterar el proceso, para cada set de genes.
![Page 14: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/14.jpg)
Tools & Databases
![Page 15: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/15.jpg)
![Page 16: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/16.jpg)
![Page 17: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/17.jpg)
Resumen
• Hasta ahora, se han visto:
NGS sequencing.Assembly.Gene Prediction.Annotation (Databases).Automatic Annotation
![Page 18: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/18.jpg)
Caso Transcriptómica
![Page 19: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/19.jpg)
Nannochloropsis salina transcriptomics
![Page 20: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/20.jpg)
![Page 21: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/21.jpg)
![Page 22: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/22.jpg)
RNA processing and modification
Chromatin structure and dynamics
Energy production and conversion
Cell cycle control, cell division, chromosome partitioning
Amino acid transport and metabolism
Nucleotide transport and metabolism
Carbohydrate transport and metabolism
Coenzyme transport and metabolism
Lipid transport and metabolism
Translation, ribosomal structure and biogenesis
Transcription
Replication, recombination and repair
Cell wall/membrane/envelope biogenesis
Cell motility
Posttranslational modification, protein turnover, chaperones
Inorganic ion transport and metabolism
Secondary metabolites biosynthesis, transport and catabolism
General function prediction only
Function unknown
Signal transduction mechanisms
Intracellular trafficking, secretion, and vesicular transport
Defense mechanisms
Extracellular structures
Nuclear structure
Cytoskeleton
AB
CD
EF
GH
IJ
KL
MN
OP
QR
ST
UV
WY
Z
0 5 10 15 20 25
KOG Category N.salina v/s C.reindhardtii
N.salinaC.reindhartii
Category Percentage
KOG
Cate
gory
![Page 23: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/23.jpg)
23
GenDB
– Automatic Annotation System for Prokaryotic genomes
• Development for the University of Bielefeld since 2002.
• Modular system developed using an OOP and a relational database (O2DBI).
• Provide an Application program Interface (API).
![Page 24: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/24.jpg)
24
GenDB
• Folker Meyer et all. GenDB an open source genome annotation system for prokaryote genomes. Nucleic Acids Research,2003
![Page 25: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/25.jpg)
25
GenDBPipeline
25
![Page 26: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/26.jpg)
26
GenDB
![Page 27: Anotaci ón Automática](https://reader033.vdocuments.co/reader033/viewer/2022061608/568166e7550346895ddb27c5/html5/thumbnails/27.jpg)
Ensembl
• Inicio:1999
• Objetivo: generar herramientas de anotación automática.
Ensembl Pipeline.
• Website:http://www.ensembl.org/