gil ramirez, tamara - examen parcial

12
Examen Parcial de Bioinformatica Alumna: Gil Ramírez, Romina Tamara 1. Para identificar una secuencia problema (así llamaremos de aquí en adelante a la secuencia a utilizar), utilizaremos una herramienta bioinformática llamada BLAST. Como es una secuencia de nucleótidos, seleccionamos la opción “nucleotide Blast” lo cual nos llevara a la siguiente ventana.

Upload: jhordyarmasamat

Post on 11-Feb-2016

21 views

Category:

Documents


0 download

DESCRIPTION

bio

TRANSCRIPT

Page 1: Gil Ramirez, Tamara - Examen Parcial

Examen Parcial de BioinformaticaAlumna: Gil Ramírez, Romina Tamara

1.Para identificar una secuencia problema (así llamaremos de aquí en adelante a la secuencia a utilizar), utilizaremos una herramienta bioinformática llamada BLAST.

Como es una secuencia de nucleótidos, seleccionamos la opción “nucleotide Blast” lo cual nos llevara a la siguiente ventana.

Page 2: Gil Ramirez, Tamara - Examen Parcial

Una vez aquí, colocamos la secuencia problema en formato FASTA (incluido el signo mayor con el nombre de la secuencia problema) para que este pueda ser reconocido y analizado. Una vez colocada la secuencia problema, observamos que este marcada la opción “nr” en “Database” y procedemos a darle click en BLAST.

Se abrirá una nueva ventana donde encontraremos mucha información útil sobre nuestra secuencia problema. Por ejemplo el nombre, el tipo de molécula, el programa utilizado, etc.

En la parte inferior encontraremos una gráfica sobre las comparaciones entre la secuencia problema y las secuencia de nucleótidos existentes en otras bases de datos ya que BLAST compara las secuencias utilizando bases de datos existentes.

Page 3: Gil Ramirez, Tamara - Examen Parcial

Podemos observar que existen distintos colores dependiendo del grado de similitud entre las secuencias analizadas. La línea roja superior (query) es nuestra secuencia problema y las líneas inferiores son las secuencias similares que BLAST encontró en su análisis. Las bandas fucsias son segmentos similares entre las secuencias analizadas y nuestra secuencia problema y por el color se puede decir que la cantidad de nucleótidos se encuentra entre 80 y 200 y que estas se encuentran entre los 600 pb y 900 pb se nuestra secuencia problema, mientras que las bandas de color rojo nos dice que la cantidad de nucleótidos similares es mayor a 200 y que estos se encuentran a partir del nucleótido 1200 de nuestra secuencia problema. Cabe agregar que nuestra secuencia problema posee 1588 pb (nucleótidos).

Page 4: Gil Ramirez, Tamara - Examen Parcial

En esta imagen observamos las secuencias similares a nuestra secuencia problema. Encontramos el nombre de la secuencia, el porcentaje de

Page 5: Gil Ramirez, Tamara - Examen Parcial

identidad, e incluso los códigos de accesión por si deseamos obtener sus secuencias.

Si seguimos desplazándonos hacia la parte inferior encontramos los alineamientos entre la secuencia problema y las secuencias con las que se comparó. Se observa el porcentaje de identidad, la cantidad de gaps añadidos para que se puedan alinear correctamente, etc

Al final podemos concluir que la secuencia problema posee genes parciales tanto del gen que codifica el RNA ribosomal 5.8S y el de 28S de distintas especies de caracoles (gastropoda).

2.Para poder recuperar la secuencia consenso del marcador COI del lepidóptero, accedemos a la página BOLDSYSTEMS y entramos a la sección de Public Data Portal.

Page 6: Gil Ramirez, Tamara - Examen Parcial

Nos aparece la siguiente ventana donde colocamos el Record correspondiente.

Y descargamos los cromatogramas en el formato TRACE. Esos archivos los abrimos utilizando el programa CHROMAS.

Page 7: Gil Ramirez, Tamara - Examen Parcial

El electropherograma de arriba es del Foward y el de abajo es del Reverse. Descargamos también los primers LepF1 y LepR1.

Al electropherograma de foward, le aplicamos la opción Reverse más complement y editamos la secuencia del primer reverse (LepR1) y una vez terminado, empezamos a comparar las secuencias editando primero el electropherograma del foward.

Un vez editado el electropherograma del foward, le quitamos la opción reverse mas complement y al electropherograma de reverse le aplicamos esta opción y con ayuda del primer LepF1 editamos este electropherograma.

Page 8: Gil Ramirez, Tamara - Examen Parcial

Una vez arreglados, procedemos a guardar ambos archivos y a exportarlos en formato FASTA.

Entramos a la página Prabi y colocamos las secuencias del reverse y foward exportadas en formato FASTA. Esta página nos dará la secuencia consenso.

La secuencia consenso es:>Contig1ATTCAACCAATCATAAAGATATTGGAACATTATATTTTATTTTCGGAATTTGAGCTGGAATAGTAGGTACCTCACTAAGATTGTTAATTCGAGCAGAATTAGGAAATCCTGGATCTTTAATCGGAGATGATCAAATCTACAATACTATTGTAACAGCTCATGCTTTTATTATAATTTTTTTTATAGTTATACCAATCATAATTGGAGGATTTGGTAATTGATTAGTTCCTTTAATATTAGGAGCTCCTGATATAGCTTTCCCCCGAATAAATAATATAAGTTTTTGACTTTTACCCCCCTCAATAACTTTATTAATTTCAAGAAGAATCGTAGAAAATGGAGCAGGAACAGGATGAACAGTTTACCCCCCTCTTTCTTCTAATATCGCTCATGGAGGTAGATCAGTTGATTTAGCTATTT

Page 9: Gil Ramirez, Tamara - Examen Parcial

TTTCTCTTCATTTAGCTGGTATTTCTTCAATTCTAGGAGCTATTAATTTTATTACCACAATTATTAACATACGATTAAATAATTTATCTTTTGATCAAATACCTTTATTTGTTTGAGCTGTAGGGATTACAGCTTTTTTATTACTCCTCTCATTACCTGTTTTAGCGGGAGCTATTACTATACTTTTAACTGATCGAAACTTAAATACATCATTTTTTGACCCCGCTGGGGGGGGAGANCCCATTCTTTATCAACATTTATNNTGATTTTTTGGACATCCAGAAGTTTA

3. Para recuperar secuencias, podemos buscarlas en las distintas bases de datos existentes y una de ella es el NCBI.

Una vez que nos encontramos en esta página, procedemos a colocar los códigos de accesión que poseemos, los cuales son: JF414806 – JF414816 y EU239241 y GQ370443.

Page 10: Gil Ramirez, Tamara - Examen Parcial

Empezamos colocando el primero “JF414806” y le damos click a Search. Nos aparece la siguiente ventana.

Podemos observar que nos aparecen dos opciones, la primera seria en la sección de nucleótidos…pero también observamos que en la sección de Popset podemos encontrar esta secuencia. El rango de secuencias según su código de accesión es JF414806 – JF414816, y se encuentra también en Popset y accedemos a esta sección.

Observamos que las secuencias en este Popset pertenecen a la genero Scolodontidae y es el gen parcial codificante de la subunidad del citocromo

Page 11: Gil Ramirez, Tamara - Examen Parcial

oxidasa c (COI) el cual es un gen mitocondrial y se utiliza como marcador para estudios poblacionales y posee 706 nucleótidos o pares de bases.Descargamos las secuencias en formato FASTA, las cuales ya están listas para ser analizadas. (Se adjunta archivo).

Procedemos a buscar las otras dos secuencias utilizando sus respectivos códigos de accesión.

EU239241: Especie Pomatias elegans, marcador COI subunidad 1, gen mitocondrial de tamaño de 658 pares de bases. Secuencia codificante.>gi|162145711|gb|EU239241.1| Pomatias elegans haplotype PET cytochrome oxidase subunit 1 (COI) gene, partial cds; mitochondrialTACTTTATATATTTTGTTTGGTATATGATCTGGGCTGGTTGGGACTGCTTTAAGGCTTTTAATTCGGGCTGAATTGGGGCAGCCTGGGAGTTTGCTAGGTGATGATCAACTTTATAATGTTATTGTTACTGCTCATGCATTTGTTATAATTTTTTTTTTGGTTATGCCAATAATGATTGGTGGTTTTGGCAATTGGTTAGTTCCTTTAATGTTGGGGGCTCCTGATATGGCTTTTCCTCGGTTAAATAATATAAGATTTTGATTACTTCCTCCTGCGTTATTTTTATTGTTAATATCTGCGGCTGTAGAGAGGGGAGCTGGTACTGGGTGAACAGTATATCCCCCTTTGGCTGGTAATTTAGCACATTCGGGTGGTTCTGTTGATCTTGCTATTTTTTCGTTACATTTGGCTGGGGCATCTTCTATTTTAGGTGCTGTGAATTTCATTACTACTATTGTTAATATACGATGGTGTGGTGTTCAGTTGGAGCGGTTATCTTTGTTTGTTTGGTCGGTTAAAATTACTGCTATTTTGCTTTTACTTTCTTTACCAGTTTTGGCTGGGGCAGTTACTATGCTTTTAACAGATCGGAATTTTAATACTACTTTTTTTGATCCTGCTGGTGGAGGAGATCCTATTTTATATCAGCATTTGTTTGQ370443: Especie Tudorella sulcata, marcador COI subunidad 1, gen mitocondrial de tamaño de 670 pares de bases. Secuencia codificante.>gi|257168374|gb|GQ370443.1| Tudorella sulcata isolate YEM3 cytochrome oxidase subunit I (COX1) gene, partial cds; mitochondrialTGTATATTTTATTTGGTGTGTGGTCTGGATTGGTTGGAACTGCTTTAAGTCTTTTAATTCGGGCTGAACTTGGTCAACCTGGAGCTTTGTTAGGTGATGATCAACTTTATAATGTGATTGTTACTGCTCATGCGTTTGTTATAATTTTTTTTTTGGTAATACCAATGATAATTGGTGGTTTTGGTAATTGATTGGTTCCTTTAATGTTAGGGGCTCCTGATATAGCTTTTCCTCGATTGAATAACATAAGTTTTTGGTTGCTTCCTCCTGCTTTATTTTTGTTATTGTCTTCTGCTGCTGTAGAGGGGGGGGTGGGTACTGGGTGGACGGTATATCCTCCTTTGGCTGGAAATTTAGCTCATTCTGGTGGGTCTGTTGATCTTGCTATTTTTTCTTTACACTTAGCTGGTGTGTCTTCTATTTTGGGTGCTTTAAATTTCATTACTACGGTTGTTAATATACGGTGATGTGGAATGCAATTTGAGCGTTTATCTTTATTTGTTTGATCGGTGAAAATTACTGCTATTTTGCTTTTACTTTCTTTGCCGGTTTTGGCTGGGGCAATTACTATACTTTTAACTGATCGGAATTTTAATACTACTTTTTTTGATCCAGCAGGTGGTGGGGATCCTGTTTTATATCAACATTTGTTTTGATTTTTTGGTCACCC

Alineamos las secuencias en clustalw y el alineamiento lo pasamos a documento de texto para que pueda ser admitida y analizada por el programa DAMBE.

Page 12: Gil Ramirez, Tamara - Examen Parcial

Nos muestra 3 haplotipos existentes para ese marcador (COI).