bioinformatica

13
Introducción La Bioinformática es un campo de la ciencia en el cual confluyen varias disciplinas tales como: biología, computación y tecnología de la información. Al comienzo de la "revolución genómica", el concepto de bioinformática se refería sólo a la creación y mantenimiento de base de datos donde se almacena información biológica, tales como secuencias de nucleótidos y aminoácidos. El desarrollo de este tipo de base de datos no solamente significaba el diseño de la misma sino también el desarrollo de interfaces complejas donde los investigadores pudieran acceder a los datos existentes y suministrar o revisar dichos datos. En este informe se detallan algunas las formas de uso de la bioinformática, para actividades tales como la traducción de una secuencia de nucleótidos, así como la identificación del organismo al que corresponde cada secuencia. Objetivos: Aprender a utilizar las bases de datos como un media de apoyo a la hora de trabajar con secuencias nucleotídicas. Diferenciar los distintos tipos de programas bioinformáticos, así como también saber la función de cada uno de estos.

Upload: alonso-pino

Post on 12-Jun-2015

843 views

Category:

Documents


2 download

DESCRIPTION

trabajo de bioinformatica, guia para hacer una investigacion bioinformatica a partir de una secuencia de bases nitrogenadas.

TRANSCRIPT

Page 1: bioinformatica

Introducción

La Bioinformática es un campo de la ciencia en el cual confluyen varias disciplinas tales como: biología, computación y tecnología de la información. Al comienzo de la "revolución genómica", el concepto de bioinformática se refería sólo a la creación y mantenimiento de base de datos donde se almacena información biológica, tales como secuencias de nucleótidos y aminoácidos. El desarrollo de este tipo de base de datos no solamente significaba el diseño de la misma sino también el desarrollo de interfaces complejas donde los investigadores pudieran acceder a los datos existentes y suministrar o revisar dichos datos.

En este informe se detallan algunas las formas de uso de la bioinformática, para actividades tales como la traducción de una secuencia de nucleótidos, así como la identificación del organismo al que corresponde cada secuencia.

Objetivos:

Aprender a utilizar las bases de datos como un media de apoyo a la hora de trabajar con secuencias nucleotídicas.

Diferenciar los distintos tipos de programas bioinformáticos, así como también saber la función de cada uno de estos.

Page 2: bioinformatica

Resultados:

Identificación de una secuencia nucleotídica desconocida mediante programas bioinformáticos.

La secuencia utilizada en fue:

>secuencia3GGTGTGATGGAAGATACAAAACAACATGAGGAGATGGAGAATGATAAGCTATGTTTGAAGGAGGACACAAATCTATTTGAGGAGATGATGGAGTCGGCAAAAGATAGGATGATCCGTTCAGTGGAGGAACTCTTAGGAGGAGAATTCCCTTATCTTGGATCTTACGAAAACATCCACACTTGGCTCAGTGGCGTTCTTACTAGCTACATCACATGTATCGACGAAATTGGTGACGGTGCCTATAAACGTCGGGTCGAGCCACAGCTTCAAGACCTCATTTCTAAGGCAAAGGTAGCTTTGGCTCTTTTTATCTCCATTTCGCCGAGAGACAACACCGAACTTAACTCGGTGGTTCCCAATAGCCCGTCTTGGTTATCTCATGTTGACAAGAAAGATCTATATCTCAATGCTGAGGCTCTAAAAAAGATTGCCGATGTTGTGGTCGCGAAAGATGGGACCGGAAAGTACAACACAGTGAATGCGGCCATTGCAGCAGCACCTCAACACAGCCACAAGAGATTCATCATCTATATAAAGACAGGCATTTATGATGAAATCGTCGCCATTGAGAATACGAAACCCAATTTAACTCTTATAGGTGATGGTCAAGATTCAACCATCATCACGGGCAATTTAAGCGCTAGCAATGTTAGAAGAACGTTCTACACTGCAACTTTTGCTTCTAATGGTAAAGGATTCATCGGAGTAGACATGTGCTTCCGAAACACGGTCGGGCCGGCAAAAGGACCAGCTGTTGCCCTCCGTGTGAGTGGTGATATGTCCGTCATTTACAGATGTCGTGTCGAGGGATATCAGGATGCCTTGTATCCTCACATAGACCGCCAGTTTTATAGGGAGTGCTTTATTACCGGTACTGTAGATTTCATTTGTGGAAACGCAGCGGCGGTATTTCAATTCTGCCAGATTGTAGCAAGACAGCCTAATATGGGGCAAAGCAATTTCATAACCGCTCAATCACGCGAGACTAAGGACGACAAATCGGGCTTCTCAATTCAAAACTGCAACATCACAGCAAGTTCGGATCTAGATACAGCAACCGTAAAAACGTATCTTGGAAGGCCTTGGAGGATATTTTCAACAGTCGCGGTTCTGCAGTCTTTCATCGGTGATTTAGTTGATCCCGCAGGCTGGACTCCTTGGGAAGGAGAAACTGGTCTGTCAACTCTCCA

Los programas que fueron utilizados para identificar la secuencia nucleotídica fueron los siguientes:

Blast: Compara la secuencia con una base de datos de secuencias. Blastx: Compara la secuencia con una base de datos de proteínas. Translate: Traduce la secuencia a proteínas. Blastp: Compara la secuencia de aminoácidos con una base de datos de proteínas.

Al utilizar el Programa Translate, se obtuvo la siguiente secuencia aminoacídica:

>secuencia3(frame 5’ a 3’)

GVMEDTKQHEEMENDKLCLKEDTNLFEEMMESAKDRMIRSVEELLGGEFPYLGSYENIHTWLSGVLTSYITCIDEIGDGAYKRRVEPQLQDLISKAKVALALFISISPRDNTELNSVVPNSPSWLSHVDKKDLYLNAEALKKIADVVVAKDGTGKYNTVNAAIAAAPQHSHKRFIIYIKTGIYDEIVAIENTKPNLTLIGDGQDSTIITGNLSASNVRRTFYTATFASNGKGFIGVDMCFRNTVGPAKGPAVALRVSGDMSVIYRCRVEGYQDALYPHIDRQFYRECFITGTVDFICGNAAAVFQFCQIVARQPNMGQSNFITAQSRETKDDKSGFSIQNCNITASSDLDTATVKTYLGRPWRIFSTVAVLQSFIGDLVDPAGWTPWEGETGLSTL

Page 3: bioinformatica

Con los resultados obtenidos, la secuencia corresponde a al organismo Arabidopsis Thaliana. Esto se pudo comprobar con los resultados de los 3 programas Blast, ya que los 3 dieron como resultado el mismo organismo..

Además también se pudo identificar la proteína que codifica esta secuencia, dentro de las posibles alternativas de proteínas son:

Pectinesterasa. Pectinmethylesterasa

Ambas alternativas presentaron un porcentaje de identificación del 100%.

Según los resultados, se pudo inferir que el porcentaje de la proteína completa que se tiene es:

Si se procede a utilizar el programa Blast como el Blastx, se obtendrá un porcentaje de cobertura de la secuencia, respecto de la base de datos es del 75%.

Al comparar todos los resultados obtenidos, se procedió a buscar el resultado con el mejor porcentaje de acierto, una vez identificado, el resultado adecuado, tanto en el Blast como el Blastx, se procedió a obtener el porcentaje de cobertura de la secuencia mediante una simple ecuación:

L: Longitud de la secuencia en la base de datos.l: longitud de la secuencia poseída.

L 100 ; reemplazando los valores: L= 1575, l: 1229l x

x = (1229*100)/ 1575 => x= 75,4%

Si se utiliza el Blastp, se procede a buscar el resultado con el mayor porcentaje de acierto.

Según los resultados la proteína deducida es la Pectinesterasa, con un porcentaje de 75% de la proteína completa.

Page 4: bioinformatica

Identificación:

Número de Acceso: NM_116631.4

Organismo Perteneciente: Arabidopsis Thaliana.

Función: Catalizar la hidrólisis de grupos metilester encontrados en la cadena peptídica

Condiciones en las que se obtuvo:

Procesos en los que participa:

Análisis

Utilizando el programa protparam con la secuencia nucleotídica:

P. I: 5.04Masa Molecular: 97873.3 g/mol Utilizando la secuencia aminoacídica:

P. I: 5.23Masa molecular 43801.5 g/mol

Localización subcelular:

0.450 en el citoplasma. 0.100 en el espacio mitocondrial. 0.100 en el lisosoma. (lumen) 0.091 en el peroxisoma.

Según estos datos, se puede inferir que la localización subcelular es el citoplasma.

Número de regiones transmembrana: Utilizando el programa DAS se obtuvo las posibles regiones transmembrana:

Inicio Fin Tamaño ~ Cutoff62 71 10 ~ 1.765 67 3 ~ 2.297 106 10 ~ 1.799 103 5 ~ 2.2294 297 4 ~ 1.7302 304 3 ~ 1.7366 376 11 ~ 1.7369 371 3 ~ 2.2

Page 5: bioinformatica

Comparación de secuencias

Para esta parte se utilizaron, además las secuencias 1 y 2, traducidas a secuencias aminoacídicas.

>secuencia1RRRNSGKWVCEVREPNKKTRIWLGTFQTAEMAARAHDVAALALRGRSACLNFADSAWRLRIPESTCAKDIQKAAAEAALAFQDEMCDATTDHGFDMEETLVEAIYTAEQSENAFYMHDEAMFEMPSLLANMAEGMLLPLPSVQWNHNHEVDGDDDDVSLWSY-

>secuencia2PNLSHTKSKEEQWLPLCSLPLLWLPLRLRPLWSLLSTDLSPPLPSQPPARLTTTLLPSQATAEELTACRCGLRLERRSLRLSLTFLTLPIPNWLRKLTTLSATSGFLVLNSTRICVP-AR-LTRIL-WTVLDNVEASLVRLHRLRSSVEGSGRVQEGVPQCLH-DHRIRQHPSSPVHQFHCLQATKLHRLISLCFCVNLKTLSPIFDFIPCFSAFFFFLGF-FPDLTFVFRFA

Utilizando el programa ClustalW2 se obtuvo el siguiente resultado:

secuencia3 GVMEDTKQHEEMENDKLCLKEDTNLFEEMMESAKDRMIRSVEELLGGEFPYLGSYENIHT 60secuencia1 -----------------------------------------------------RRRNSGK 7secuencia2 ------------------------------------------------PNLSHTKSKEEQ 12:

secuencia3 WLSGVLTSYITCIDEIGDGAYKRRVEPQLQDLISKAKVALALFISISPRDNTELNSVVPN 120secuencia1 WVCEVRE----------------------------------------PNKKTRI------ 21secuencia2 WLPLCSLP-----------------------------------LLWLPLRLRPL------ 31*: * :

secuencia3 SPSWLSHVDKKDLYLNAEALKKIADVVVAKDGTGKYNTVNAAIAAAPQHSHKRFIIYIKT 180secuencia1 ---WLGTFQTAEMAARAHDVAALA---------------LRGRSACLNFADSAWRLRIPE 63secuencia2 ---WSLLSTDLSPPLPSQPPARLT------------TTLLPSQATAEELTACRCGLRLER 76* . :. :: . ::. : : : :

secuencia3 GIYDEIVAIENTKPNLTLIGDGQDSTIITGNLSASNVRRTFYTATFASNGKGFIGVDMCF 240secuencia1 STCAKDIQKAAAEAALAFQDEMCDATTDHGFDMEETLVEAIYTAEQSEN----------- 112secuencia2 -RSLRLSLTFLTLPIPNWLRKLTTLSATSGFLVLNSTRICVP-AR-LTRIL--------- 124. : . . : * .. . * .

secuencia3 RNTVGPAKGPAVALRVSGDMSVIYRCRVEGYQDALYPHIDRQFYRECFITGTVDFICGNA 300secuencia1 ---------------------------------AFYMHDEAMFEMPSLLA---------- 129secuencia2 --------------------------------WTVLDNVEASLVRLHRLRSSVE------ 146:. : : : :

secuencia3 AAVFQFCQIVARQPNMGQSNFITAQSRETKDDKSGFSIQNCNITASSDLDTATVKTYLGR 360secuencia1 --------------NMAEGMLLPLPS----------VQWNHNHEVDGDDDDVSLWSY--- 162secuencia2 -----------GSGRVQEGVPQCLH-DHRIRQHPSSPVHQFHCLQATKLHRLISLCFCVN 194.: :. : : . . :

secuencia3 PWRIFSTVAVLQSFIGDLVDPAGWTPWEGETGLSTL- 396secuencia1 -------------------------------------secuencia2 -LKTLSPIFDFIPCFSAFFFFLGF--FPDLTFVFRFA 228

Los aminoácidos mas conservados en las 3 secuencias son:

W P A

Page 6: bioinformatica

Discusión

La pectinesterasa parte en la célula vegetal siendo solo pectina la cual ocupa un 35% del peso de la pared primaria de la célula en sí. La pectina es un HGA con una ariable cantidad de metilester en el carbono 6, estas pectinas son secretadas a la pared celular estando altamente metilesterificadas, donde luego la pectin-metilesterasa la degrada luego esto provoca una desmetilesterificacion la cual hace que el pH y la carga de la pared celular cambie permitiendo que se unan poliurinidos en la estructura del gel de la pared, incrementando su firmeza (1).Se ha visto que la pectinmetilesterasa proviene del gen llamado QRT1 (2) en las arabidopsis talhiana esto se comprobó al ver que el gen QRT es importante a la hora de la separación del polen dentro de un desarrollo normal en una flor, por lo que esta enzima no solo sirve para dar firmeza a la pared celular, sino que también se utiliza para separar el polen para así poder continuar con su ciclo vital normal. Sin embargo este gen no solo codifica para esta enzima sino que también para algunos tejidos de la planta, así como de células guardianas y néctares florales.También se ha observado que la PME no solo ayuda a regular la rigidez de la pared celular, sino que esta rigidez puede ser selectiva, es decir, puede hacer mas rígida cierta parte de la pared celular, esto provoca que la planta pueda crecer hacia arriba y de una forma “tubular”, ya que estas enzimas actúan de forma que desarrollan una pared más rígida en las zonas laterales de las células(3), mientras que en las formas apicales son mas expandibles y flexibles, lo que ayuda al crecimiento geotrópico negativo de la planta.

Gracias a la metodología informática utilizada y los programas correctamente utilizados se puede decir que los datos son certeros a la hora de una comparación de resultados, ya que estos coinciden cerradamente con lo encontrado, lo que corresponde a una proteína existente en una especie vegetal y de mucha importancia para esta. Sin embargo estos modelos informáticos arrojan mucha información, por lo cual se centro en la pauta entregada para resumir lo más posible estos datos y sacar lo más relevante de cada caso para hacer un informe conciso y preciso sobre la proteína encontrada gracias a estos programas.

En conclusión se puede decir que la bioinformática es una herramienta útil para los biólogos que necesitan de una información rápida y certera para realizar estudios de forma mas rápida y expedita, todo esto gracias a la colaboración de la comunidad científica que esa dispuesta a compartir los resultados ya encontrados por ellos, para así compartirlos con el investigador y para que este pueda hacer una comparación precisa de sus investigaciones con los datos ya publicados y así no perder el tiempo, en si por ejemplo, su investigación ya habría sido hecha, o incluso refutada, gracias a una nueva investigación. Entonces se puede decir que la bioinformática no es solo una herramienta para ordenar, encontrar, y disponer de datos ya estudiados, sino que también es posible utilizarla para analizar estos datos, realizar una investigación, comprobar que es correcta y viable, y finalmente publicarla para compartirla con la comunidad científica y así agregarse a la base de datos para que una próxima investigación tenga como base estos resultados.

Page 7: bioinformatica

Referencias

Digital (páginas Web)

http://pubs.acs.org/doi/pdf/10.1021/jf60173a020 http://blast.ncbi.nlm.nih.gov/Blast.cgi http://ca.expasy.org/cgi-bin/protparam http://www.sbc.su.se/~miklos/DAS/tmdas.cgi http://pubs.acs.org/doi/pdf/10.1021/jf60173a020

papers

1. Overexpression of Pectin Methylesterase Inhibitorsin Arabidopsis Restricts Fungal Infection by Botrytis cinérea (Plant Physiol. Vol. 143, 2007), Vincenzo Lionetti2, Alessandro Raiola2, Laura Camardella, Alfonso Giovane, Nicolai Obel,Markus Pauly, Francesco Favaron, Felice Cervone, and Daniela Bellincampi

2. Separation of Arabidopsis Pollen Tetrads Is Regulatedby QUARTET1, a Pectin Methylesterase Gene (Plant Physiology, November 2006, Vol. 142, pp. 1004–1013, www.plantphysiol.org _ 2006 American Society of Plant Biologists), Kirk E. Francis, Sandy Y. Lam, and Gregory P. Copenhaver

3. Elaborate spatial patterning of cell-wall PME and PMEI at thepollen tube tip involves PMEI endocytosis, and reflects thedistribution of esterified and de-esterified pectins.( Journal compilation ª 2007 Blackwell Publishing Ltd, The Plant Journal, (2008), 53, 133–143), Nina Ro¨ ckel†, Sebastian Wolf†, Benedikt Kost‡, Thomas Rausch and Steffen Greiner

Page 8: bioinformatica

Universidad Andrés BelloFacultad de Ecología y Recursos Naturales Laboratorio de Bioquímica

BioinformáticaDeterminación de una secuencia

nucleotídica

Docente: Nelson Caro

Integrantes: Ernesto Langhaus Alonso Pino

Carrera: Ingeniería En Biotecnología

Curso: Bio267

Sección: 5