trabajo bioinformatica

19
Universidad de Puerto Rico Recinto Universitario de Mayaguez Departamento de Biología BIOL 4368 Fisiología Microbiana Asignacion de bioinformática QUORUMSENSIN I. ¿Cuántos cromosomas tiene un perro, una rata y Arabidopsis? Un perro tiene 38 pares de autosomas y un par de cromosomas del sexo X Y. La rata tiene 20 autosomas, un cromosoma del sexo X y un cromosoma mitocondrial. Arabidopsis tiene 5 cromosomas. II. Utilizando el recuadro de Search, determine en qué cromosoma(s), se encuentran los genes relacionados con lo siguiente: (recuerde presioanar find luego de escribir la premisa) a. Anemia falciforme (sickle cell anemia) cromosoma 11.

Upload: quorumsensin

Post on 06-Aug-2015

290 views

Category:

Documents


0 download

TRANSCRIPT

Universidad de Puerto RicoRecinto Universitario de Mayaguez

Departamento de BiologíaBIOL 4368 Fisiología Microbiana

Asignacion de bioinformática

QUORUMSENSIN

I. ¿Cuántos cromosomas tiene un perro, una rata y Arabidopsis?

Un perro tiene 38 pares de autosomas y un par de cromosomas del sexo X Y. La rata tiene 20 autosomas, un cromosoma del sexo X y un cromosoma mitocondrial. Arabidopsis tiene 5 cromosomas.

II. Utilizando el recuadro de Search, determine en qué cromosoma(s), se encuentran los genes relacionados con lo siguiente: (recuerde presioanar find luego de escribir la premisa)

a. Anemia falciforme (sickle cell anemia) – cromosoma 11.

b. Parkinson – cromosomas 1 2 4 5 6 8 9 11 12 17 18 22 X.

c. Alzheimer – cromosomas 1 3 4 6 7 8 9 10 11 12 14 17 19 20 21 X.

d. fibrosis cística – cromosomas 1, 7, 19 .

e. Diabetes – cromosomas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 X.

f. cancer (seleccione uno de ellos y mencione el cromosoma en el que se encuentra) – el cáncer del seno se encuentra en casi todos los cromosomas menos en el Y.

III. Vaya a http://www.ncbi.nlm.nih.gov/ Usando GenBank, realice una búsqueda de la siguiente secuencia de de acceso:

AF321136. Abra el archivo y conteste:a. organismo del cual proviene la secuencia. Rhodobacter sphaeroidesb. número de genes presentes en la secuenciaSon Dos genes de las proteínas de maduración del citocromo c, CcmF y CcmH de

Rhodobacter sphaeroides.c. función sugerida de alguno de el o los genes Maduración del citocromo c.d. Seleccione 20 nucleótidos de cualquier región de uno de los genes. 721 bccctatgatt gtcgaattcg e. Seleccione los amino ácidos que desee de una de las secuencias de proteínas presentes.

MDYRTIRSTAGRSLPCHARAARVMNALSSRMREELLHAVTEAGTRARALVLTGEGRGFCSGQDLGDARALGVPDFERILREEYEPLLRAIAHCPLPTLAAVNGVAAGAGANLALACDVVIAAESAGFIQAFTRIGLIPDAGGTWTLPRQIGLARAMGATLFADRISAAETRHWGMIYKAVPDEAFETRWQARAAHLAEGPTEAYRGLKQALRASFDNSFEEQLALRGAPAGASA

IV. Vaya a http://www.ncbi.nlm.nih.gov/BLAST/ y determine a qué organismo pertenece la siguiente secuencia de:

a. Realice una búsqueda usando la secuencia de DNA y proteínas que copio en 2d y 2e (arriba).

b. ¿Cuáles fueron los tres primeros “hits” obtenidos de cada una?

- Parte II: Secuencias

Secuencia 1

1 caaaaattcc caatttgttt tttcaaacaa acttgctcag atcctcttct tcttagggat 61 caatcttcaa atcaattgtt gttaaaataa atgggattaa agcgacctta tgatgctgaa 121 gagatgcaaa agtgcaatgc taagcatgca agacagctta gttacaaaaa ccataaccaa 181 tttgacgaag ctattccata tcatcatgct tctatggaga agaagacaaa tgttttagag 241 gatctgattg gtctctgtga gaatcctacg tggactaatg atgcaaatca cgttgacaag 301 ggttttgaaa caaccggttt gtgtcaggaa gattctcagt ctggagtgac gactcagtca 361 gatctttctc atcaatcttc tggttcagat ttcacctgga agccagtgga agatgtttat 421 acttgtttga tgaatcaacc tcctaggaaa caagttcttg ttgggtctaa tcatcaagcg 481 gatattcccg agtttgtcaa ggaagagatt cttgatcagt cagaggctcg aactaaggag 541 gacttagaag ggaagctgat gagaaagtgt gtgataccaa tgtctgactc tgacctttgt 601 ggaaccggtc aaggaagaaa ggaatgtctt tgcctagata aaggctctat tagatgtgtg 661 cggcgacata tcattgaagc cagagagagt ttggttgaaa ctattggata tgaaaggttt 721 atggagctag ggttatgtga gatgggggag gaagttgcga gtttatggac agaggaagaa 781 gaagatctct ttcacaaggt tgtatactcc aatcctttct cagcgggtcg tgacttctgg 841 aagcaattaa agggaacgtt tccttcaaga accatgaagg agttggttag ctactacttc 901 aatgtcttca tcttgcggag acggggtatt cagaatcggt tcaaagccct agatgttaac 961 agtgatgatg acgagtggca agttgaatac aacattttta acagcaccaa atctttagat 1021 gaggaaaaca acaatggaaa tcgctcctca tatgaagata acgaggaaga agaagaaacc 1081 agcagcaatg atgatgatga agaagaagaa gaggaagacg actcatcaag taacgatgct 1141 cattgtgtag atacggataa ggcttcaaga gacggttttg gtgaagaagt aaatgtggaa 1201 gacgactcat gtatgtcctt cgagttacaa gactccaact tgatcttcag tcacaaccca 1261 atcaaaaaca gagagtgcca cagatctggt gaagattcat attcatttga tgatcagaaa 1321 ttcacatcag attgttggaa caagaacaac gatctactac caacttcaaa cattattgag 1381 gagatatttg gtcaagacga ttggggagat aaagatgata ataacttgaa ggagaagtaa 1441 ataaaaagtt ttcttctctt ctttcatgga ttctgcagat tttttttttc ttaagtgaat 1501 tagataaaga tgcagaagtt tgaaagtttc atctttagga gttttgtgtt ggttaaggtt 1561 gaagaagaaa ggacttcctg attgatttga ctctgtaaaa aatgctattc aaatccatga 1621 accttttttt ctctagttgt tttagtcctc aagatctcaa tgtacattat tatggtataa 1681 aa

Secuencia 2

MKVYFESYGCTLNKRDTLYMQAQIENTTNNLEEADVVVINSCIVKQPTETKILYRINQLKKMGKKIVL TGCMVSEPYLKYKELQDISLVNIYNQDRIKEAIERTYKGERVLFLEKKKIYKEFARPLSKARAIIQIQEGCLWRCTYCGTKLARSMFYSYPPKLIKREIEEKLKQGIKIFYLTGPDTATYGKDINYSLADLLKDLIEIEGDFYIRVGMANPTFFLEQIDELIDVFKSNKIFKFFHLPVQSGSNKVLKDMNRPYTIEEYKELIYKLRKFPLATYVTDIIVGYPTETEEDFEQTLELVREIKFDGINISRFWRRPGTIAWNLKQLDPEIVTNRVKRLKEVFLQGAYERNKLWLNWEGEAIIEEKGKNNTWIAKNEMYKQIIVKGNYEEGQKIKVKIKKARAIDLIAMERDLNVTDLELVEKVKSGDRRSFSELVKRHQRSVLRMSLRFVKDMDTAEDVTQEAFIKAYEKLNTFEGRSSFKSWLFQIAVNTARNKLREWKRDTVDIDDVQLAVDAEAETTLVHTAVSDILKNEVEKLPFKQKTALVLRVYEDLSFNEIADIMECPYDTAKANYRHALMKLRQTFEQQAELKNWTEEVGGFFLEVNQRFAEAEG

III. Números de acceso

1. NC_0050142. BX842648

- Vaya a http://www.ncbi.nlm.nih.gov/ Usando GenBank, realice una búsqueda de la siguiente secuencia de de acceso:

NC_005014. Abra el archivo y conteste:a) organismo del cual proviene la secuencia. Salmonella typhimurium plasmid R64b) número de genes presentes en la secuencia.

Se estudiaron 22 genes.c) función sugerida de alguno de el o los genes.

Hay 16 genes que están involucrados en la transferencia de R64, este contiene alrededor de 49 genes que podrían producir 58 diferentes proteínas.

d) Seleccione 20 nucleótidos de cualquier región de uno de los genes. 13861 ccttgagcta ctactgtgate) Seleccione los amino ácidos que desee de una de las secuencias de proteínas presentes.

MREMNFSQRLRRFIVRKTFSAPYRVQFYEALRFLLENKQPLKTALEQMRDAWTDFGRKWHPFAELATDCIESLRENSGENSLEYTLSLWVPQEEAAVISAGIRSGSIVDALQFATTLTDAKEQIHQA

IWQMAIYPVGLLIMMTGTLYVLNTELIPELSKISSPDSWSGALGFLYGLSVFVDNYGAICAVLFAVITGLISWSLPNWKSPDSVRTFADKMPWSIYQDIQGATFLLNMAALLKAKMTTLNSLNILQEFASPWLSTRLDSIIYRVRQGDHLGLALRQCGYQFPSREAANFLSLLQGDGATELISNYGQRWLSQTLQRVKKRANVIRLIMLIFLVMSLMLLVFAIMDIQSISDNSMGNF

- Vaya a http://www.ncbi.nlm.nih.gov/ Usando GenBank, realice una búsqueda de la siguiente secuencia de de acceso:

BX842648. Abra el archivo y conteste:a) organismo del cual proviene la secuencia. Bdellovibrio bacteriovorus complete genome, strain HD100; segment 3/11b) número de genes presentes en la secuencia.

Estudiaron el genoma completo de este organismo.c) función sugerida de alguno de el o los genes.

Lo que vieron fue que B. bacteriovorus no incorpora ninguno de los genes de sus presas al depredarlos.

d) Seleccione 20 nucleótidos de cualquier región de uno de los genes. 1021 cgatgaaaac tttgatgate) Seleccione los amino ácidos que desee de una de las secuencias de proteínas presentes.

MKLTARRQARELALQVLFQTEFAPQISYQTFLEVFEQSLDPEVITYADLIVTGVKSNKEAIDSKIQASSAHWKVERMATIDRNILRIAVYEMRFAADPIKENIAINEAVEIAKKYGTSDSGSFVNGLLDQVGKAH

Secuencia 4gatgaacgctggcggcgtgcttaacacatgcaagtcgaacgatgatcccagcttgctgggggattagtggcgaacgggtgagtaacacgtgagtaacctgcccttaactctgggataagcctgggaaactgggtctaataccggatatgactcctcatcgcatggtggggggtggaaagctttattgtggttttggatggactcgcggcctatcagcttgttggtgaggtaatggctcaccaaggcgacgacgggtagccggcctgagagggtgaccggccacactgggactgagacacggcccagactcctacgggaggcagcagtggggaatattgcacaatgggcgaaagcctgatgcagcgacgccgcgtgagggatgacggccttcgggttgtaaacctctttcagtagggaagaagcgaaagtgacggtacctgcagaagaagcgccggctaactacgtgccagcagccgcggtaatacgtagggcgcaagcgttatccggaattattgggcgtaaagagctcgtaggcggtttgtcgcgtctgccgtgaaagtccggggctcaactccggatctgcggtgggtacgggcagactagagtgatgtaggggagactggaattcctggtgtagcggtgaaatgcgcagatatcaggaggaacaccgatggcgaaggcaggtctctgggcattaactgacgctgaggagcgaaagcatggggagcgaacaggattagataccctggtagtccatgccgtaaacgttgggcactaggtgtgggggacattccacgttttccgcgccgtagctaacgcattaagtgccccgcctggggagtacggccgcaaggctaaaactcaaaggaattgacgggggcccgcacaagcggcggagcatgcggattaattcgatgcaacgcgaagaaccttaccaaggcttgacatgaaccggtaatacctggaaaacaggtgccccgcttgcggtcggtttacaggtggtgcatggttgtcgtcagc

tcgtgtcgtgagatgttgggttaagtcccgcaacgagcgcaaccctcgttctatgttgccagcgcgtgatggcggggactcataggagactgccggggtcaactcggaggaaggtggggacgacgtcaaatcatcatgccccttatgtcttgggcttcacgcatgctacaatggccggtacaaagggttgcgatactgtgaggtggagctaatcccaaaaagccggtctcagttcggattggggtctgcaactcgaccccatgaagtcggagtcgctagtaatcgcagatcagcaacgctgcggtgaatacgttcccgggccttgtacacaccgcccgtcaagtcacgaaagttggtaacacccgaagccggtggcctaaccccttgtgggagggagctgtcgaaggtgggactggcgattgggactaagtcgtaacaaggta

Secuencia 5

aattcgatgcaacgcgaagaaccttacctgggtttgacatgcacaggacgccggcagagatgtcggttcccttgtggcctgtgtgcaggtggtgcatggctgtcgtcagctcgtgtcgtgagatgttgggttaagtcccgcaacgagcgcaacccttgtcctatgttgccagcgggttatgccggggactcgtaggagactgccggggtcaactcggaggaaggtggggatgacgtcaagtcatcatgccccttatgtccagggcttcacacatgctacaatggccggtacaaagggctgcgatgccgtgaggtggagcgaatcctttcaaagccggtctcagttcggatcggggtctgcaactcgaccccgtgaagtcggagtcgctagtaatcgcagatcagcaacgctgcggtgaatacgttcccgggccttgtacacaccgcccgtcacgtcatgaaagtcggtaacacccgaagccggtggcctaacccttgtggagggagccgtcgaaggtgggatcggcgattgg