molecular 3

8
Métodos de secuenciación de ácidos nucleicos' Gonzalo Greif . Unidad de Biología Molecular. lnstitut Pasteur Montevideo' 1. Un Poco de historia 2. Secuenciación por método de Maxxam y Gilbert 3. Secuenciación por método de Sanger a. Avances en el método de Sanger (1936-1996) b. ProYecto Genoma Humano 4. Algunos Métodos de secuenciado masivo a. Pirosecuenciación b. Secuenciado por hibridización (lllumina) c. Otro métodos d. APlicaciones 1. Un Poco de historia' Pasaron 15 años desde el descubrimiento de la estructura de doble hélice del ADN en 1953 hasta la determinación de la primera secuencia de ADN de forma experimental' Algunas de las razones que provocaron esta demora fueron: ').. Las propiedades químicas similares de las diferentes moléculas de ADN dificultaban su aislamiento. 2. El largo de las moléculas de ADN, mucho mayores que las cadenas polipeptídicas de las proteínas, hacían inabordable la secuenciación completa' 3. No se conocían ADNasas específicas. La secuenciación de proteínas se basaba en el uso de proteasas que cortaban en determinados aminoácidos' Sin embargo, algunas moléculas de ARN no ofrecían estas dificultades, en particular las moléculas de ARN de transferencia eran peqtreñas y se podían purificar individualmente' Además se conocían ARNasas base-específicas y se desarrollaron métodos análogos a los utilizados para proteínas. La primer secuencia de un ácido nucleico fue obtenida por Holley y sus colaboradores en 1965 y correspondía al ARN de transferencia de alanina de Escherichio coli. Un evento importante en el desarrollo de los métodos de secuenciación de ADN fue el descubrimiento de las enzimas de restricción de tipo ll en 1970. Estás enzimas reconocen y cortan el ADN en secuencias específicas (en general entre 4 y 6 bases de largo)' Estas enzimas proporcionaron un método general para fragmentar largas moléculas de ADN en pequeñas piezas para luego ser separadas por electroforesis en geles de agarosa' A mediados de la década del 70, Frederick Sanger publica el método "más-menos" ("plus-minus" method) que permitía la secuenciación de fragmentos de ADN utilizando la enzima ADN polimerasa de E' coli. Afines de esta misma década, Maxxam y Gilbert publican un método alternativo de secuenciación de ADN (método químico) y el mismo Frederick Sanger publica el método que luego se convertiría en el más utilizado durante los siguientes 30 años (método enzimático), como veremos en el Punto 3'

Upload: juan-manuel-montoya-salazar

Post on 15-Sep-2015

6 views

Category:

Documents


1 download

DESCRIPTION

hola

TRANSCRIPT

  • Mtodos de secuenciacin de cidos nucleicos'Gonzalo Greif .Unidad de Biologa Molecular. lnstitut Pasteur Montevideo'

    1. Un Poco de historia2. Secuenciacin por mtodo de Maxxam y Gilbert3. Secuenciacin por mtodo de Sanger

    a. Avances en el mtodo de Sanger (1936-1996)b. ProYecto Genoma Humano

    4. Algunos Mtodos de secuenciado masivoa. Pirosecuenciacinb. Secuenciado por hibridizacin (lllumina)c. Otro mtodosd. APlicaciones

    1. Un Poco de historia'

    Pasaron 15 aos desde el descubrimiento de la estructura de doble hlice del ADN en 1953

    hasta la determinacin de la primera secuencia de ADN de forma experimental' Algunas de las

    razones que provocaron esta demora fueron:

    ').. Las propiedades qumicas similares de las diferentes molculas de ADN dificultaban suaislamiento.

    2. El largo de las molculas de ADN, mucho mayores que las cadenas polipeptdicas de lasprotenas, hacan inabordable la secuenciacin completa'

    3. No se conocan ADNasas especficas. La secuenciacin de protenas se basaba en el usode proteasas que cortaban en determinados aminocidos'

    Sin embargo, algunas molculas de ARN no ofrecan estas dificultades, en particular las

    molculas de ARN de transferencia eran peqtreas y se podan purificar individualmente'Adems se conocan ARNasas base-especficas y se desarrollaron mtodos anlogos a losutilizados para protenas. La primer secuencia de un cido nucleico fue obtenida por Holley y

    sus colaboradores en 1965 y corresponda al ARN de transferencia de alanina de Escherichio

    coli.

    Un evento importante en el desarrollo de los mtodos de secuenciacin de ADN fue eldescubrimiento de las enzimas de restriccin de tipo ll en 1970. Ests enzimas reconocen y

    cortan el ADN en secuencias especficas (en general entre 4 y 6 bases de largo)' Estas enzimasproporcionaron un mtodo general para fragmentar largas molculas de ADN en pequeas

    piezas para luego ser separadas por electroforesis en geles de agarosa' A mediados de la

    dcada del 70, Frederick Sanger publica el mtodo "ms-menos" ("plus-minus" method) quepermita la secuenciacin de fragmentos de ADN utilizando la enzima ADN polimerasa de E'

    coli. Afines de esta misma dcada, Maxxam y Gilbert publican un mtodo alternativo desecuenciacin de ADN (mtodo qumico) y el mismo Frederick Sanger publica el mtodo queluego se convertira en el ms utilizado durante los siguientes 30 aos (mtodo enzimtico),como veremos en el Punto 3'

  • Mtodos de secuenciacin de cidos nucleicos'Gonzalo Greif

    2. Secuenciacin qumica'

    El mtodo de secuenciacin qumica propuesto por Maxxam y Gilbert, fue publicado enfebrero de 7977 en el Volumen 74 (no 2) de la revsta PNAS, 10 meses antes que Sangerpublicara el mtodo de secuenciacin enzimtica que veremos en la siguiente seccin'

    En el artculo describen el procedimiento de esta manera: "Desarrollamos una nueva tcnica

    para secuenciar una molcula de ADN. El procedimiento determina la secuencia nucleotdica

    de un ADN marcado radioactivamente en un extremo, cortndolo con agentes qumicos" en

    cada una de las bases. El corte parcial de cada base, genera un set de fragmentos marcados

    desde el extremo marcado hasta la base dnde fueron clivados' Utilizando geles de

    poliacrilamida y separando dichos fragmentos por tamao, es posible determinar la secuencia

    de esta molcula.

    El mtodo propuesto estaba limitado por la capacidad de resolucin de los geles de

    poliacrilamida, y en este primer artculo muestran la posibilidad de secuenciar 100 bases de

    ADN.

    El mtodo utilizaba 4 reacciones qumicas' Una reaccion

    qumica produce cortes especficamente en Citosinas(18M hidracina, 2M NaCl. Una reaccin con 50 mMdimetil-sulfato corta en Adeninas y Guaninas; si luego de

    este tratamiento qumico se calienta la reaccin a 90sC a

    pH neutro, entonces se obtiene un patrn de bandasintenso para las guaninas y tenues para las adeninas' Por

    el contrario, el tratamiento posterior a un pH cidoprovoca un patrn inverso (bandas intensas de adeninasy tenues de guaninas). El ltimo tratamiento (18Mhidracina) produce el clivaje tanto en citosinas como entiminas.

    En la Figura 1, se muestra el patrn de bandas obtenido

    durante la secuenciacin de un fragmento de 64 bases(mostrado en el artculo de7977).

    Figura 1. Se muestran los cuatro carriles del gel depoliacrilamida con cada una de las reacciones de clivaje'lnterpretacin: La secuencia se lee de abajo hacia arriba'Una banda intensa en la primera columna y una bandatenue en la segunda corresponden a una Adenina, mientrasque Ia situacin inversa corresponde a una Guanina en esaposicin. Una banda que aparece en la tercera y cuartacolumna en la misma posicin indica una C' y una bandaslo presente en la ltima columna corresponde a una T'

    T*

    p $*A * S*T

    E"'

    *s"t

    '',r.'*

    AA

    , ,,;.t:t:::r,:

  • Mtodos de secuenciacin de cidos nucleicos'Gonzalo Greif

    3. Secuenciacinenzimtica'

    En diciembre de tg77 se publica el trabajo de sanger, Nicklen y coulson que propone un nuevomtodo para determinar la secuencias de bases en una molcula de ADN' Sanger y Coulson

    haban ya publicado dos aos antes, un mtodo de secuenciacin (mtodo ms-menos) apartir del cual haban logrado obtener dos secuencias de 70 bases del bacterifago QX174' La

    dificultad en la interpretacin de los resultados y algunos errores que podan ocurrir en la

    secuencia hicieron que Sanger y sus colaboradores siguieran trabajando para mejorar losmtodos de secuenciacin de cidos nucleicos'

    As, el mtodo propuesto por sange r en 1977 se convirti en el mtodo ms utilizado de

    secuenciacin de cidos nucleicos hasta la actualidad' La incorporacin de mejoras en los

    aspectos tecnolgicos y metodolgicos (automatizacin, mtodos de deteccin' electroforesiscapilar, etc.) permitieron, como hito fundamental, la secuenciacin del genoma humano(finalizado en el ao 2003) por este mtodo. En 1980 Frederick Sanger obtuvo su segundopremio Nobel en Qumica por la invencin de este mtodo (ver recuadro)' Recin en 2005' conla aparicin de los secuenciadores 454 se dio un cambio en la tecnologa de secuenciacin

    de

    cidos nucleicos. Aun as, muchas de las nuevas tecnologas de secuenciacin masiva utilizan el

    principio de nucletidos terminadores, descrito por sanger, como veremos ms adelante en

    los secuenciadores de lllumina.

    Frederick Sanger (1918-)

    FrederickSangernacienRendcombe,lnglaterraenlgls.Depadremdico,seesperaba que Fred siguiera sus pasos, sin embargo en la universldad de cambridge

    decidi realizar una carrera en ciencias. contnu su formacin en cambridgerealizando un Ph.D. con Albert Neuberger, en metabolismo de aminocidos Luegocontinu trabajando con c. chibnall identificando los aminocidos de la insulina, enel transcurso de la investigacin, sanger imagin las formas en las cules seordenan los aminocidos en la protena'

    Fue la primera persona en obtener la secuencia de aminocidos de una protena (la insulina)' Probque las protenas eran molculas ordenadas y, por analoga, los genes y el ADN que codifica estasprotenas deberan tener un orden o secuencia. Por este trabajo obtuvo su primer premio Nobel(1es8).

    En 1962,5anger comienza a trabajar en el laboratorio de Biologa Molecular, tambin en Cambridge'dnde Francis crick, John Kendrew y otros trabajaban con problemas relacionados con el ADN'Resolver como obtener la secuencia de ADN era la extensin natural de su trabajo anterior' Fue as'como estudiando primero la forma de secuenciar ARN (una molcula ms pequea) logr obteneruna tcnica aplicable luego al ADN (el mtodo de secuenciacin por dideoxinucletidos)' En 1980'obtuvo por ello ,, ,.g*do premio Nobel tambin en Qumica compartido con walter Gilbert(mtodo de secuenciacin qumica) y Paul Berg (ADN recombinante)'

    En 7g92, el wellcome Trust y el Medical Research council establecieron el sanger lnstitute, uno de

    los centros de secuenciacin dnde se llev adelante el proyecto Genoma Humano'

    En 1985 se retir y se dedica principalmente al cuidado de su jardn'

    Fuentes:http://www.dnaftb.orel23lbio.html/ http://www.saneer.ac.uk/about/peoole/biographies/fsaneer.html

    Lecturas recomendadas: Nobel Lecture (Frederick Sanger, 1980)'

  • Mtodos de secuenciacin de cidos nucleicos.Gonzalo Greif

    El mtodo enzimtico de Sanger, utiliza una ADN polimerasa e inhibidores que finalizan lacadena de ADN que est siendo sintetizada en lugares especficos, particularmente utilizadideoxinucletidos (es decir nucletidos que en su carbono 3' no contienen el grupo hidroxilo-Figura 2- ). La incorporacin de una base con estas caractersticas en un molcula naciente deADN impide que una nueva base pueda incorporase y la sntesis de ADN es interrumpida(Figura 3).

    '1'r$ii{A.t*l

    I

    a,t( rrrt:lorir.l.ir&:.i t1{r tf,r.;{'"nsrh.sd A

    Figura 2. Estructura de un nucletido (ej. dATP) y un di-deoxinucletido (ddATP).

    :!tj'r;ne, .":ilt. .-ltr,

    ,1

    \'t*trut\',! :,.. lii{ r

    I ''\it

    Ya.

    Figura 3. Esquema de mecanismo de sntesis de ADN (1), y (2) imposibilidad de continuar elongacin de cadenanaciente luego de Ia incorporacin de un didoxinucletido.

    En el artculo ejemplifican, de forma clara, que sucede cundo utilizan di-deoxiTimina en lareaccin: "Debido a que el ddT no contiene grupo 3' hidroxilo, la cadena no puede continuarextendindose, entonces la terminacin ocurre especficamente en las posiciones dnde dT

    debera haberse incorporado. Si un cebador y un molde son incubados con ADN polimerasa en

    presencia de una mezcla de ddTTP y dTTP, as como los otros tres deoxiribonucleosidostrifosfato (uno de ellos marcado radiactivamente con 32p), se obtiene un mezcla de

    ,F")ior

    -. - ln

    .4 ,o {, "

    , ,u/,:

    "

    !,

    &,

    ,n

  • Mtodos de secuenciacin de cidos nucleicos.Gonzalo Greif

    fragmentos todos con el mismo extremo 5' y con residuos ddT en el extremo 3'. Si esta mezclaes fraccionada por electroforesis desnaturalizante en geles de acrilamida el patrn de bandasmuestra la distribucin de los residuos Timina en el ADN sintetizado. Utilizando terminadorespara cada uno de los cuatro nucletidos en reacciones independientes, y corriendo cadamezcla en paralelo en el gel, se obtiene un patrn de bandas a partir del cual se puede leer lasecuencia de bases" (Figura 4 y 5).

    D*o lr**u*o* .ffiltf p AtF ATItr AfP+ ddATP"r 6fPCT! tjrlrddj:,"P d;?P nPIfP irid1TP T1?

    GfFad{IP ,'f*,f TF,

    |]t-{l-ilti ,t r-l

    !I

    .-Airec'rTdda*ddA

    Figura 5. Esta imagen corresponde a Ia segunda figura del artculo de Sanger (PNAS, 1977).Se trata de un autoradiografa dnde se muestra la migracin de las cuatro diferentesmezclas (una para cada dideoxinucletido terminador utilizado). A la derecha de lamagen se leen las secuencias de ADN (en este caso un fragmento del bacterifago SXll4.Las lecturas se realizan de abajo (fragmentos ms pequeos) hacia arriba (ms grandes),de acuerdo a la aparicin de las bandas. La resolucin del gel, permite separar bandas de 1nucletido de diferencia en tamao.

    Aerylomdt O& l|fi:Plw**

    Fgura 4. Esta imagen se encuentra en la Nobel Lecture de F. Sanger de 1980. En la misma se ejemplifica elprincipio del mtodo de dideoxinucletidos terminadores.

    Las secuencias obtenidas con este mtodo alcanzaban hasta 200 bases de largo.

  • Mtodos de secuenciacin de cidos nucleicos' | 6Gonzalo Greif I

    a.

    l. Secuenciacin con terminadores fluorescentes (dye-terminator sequencing)'

    En 19g6 Hood y colaboradores, en colaboracin con Applied Biosystems (ABl) publican elprimer reporte de automatizacin de la secuenciacin de ADN, que establece la secuenciacin

    con terminadores fluorescentes como variante del mtodo de sanger' Est variante utiliza una

    molcula fluorescente diferente unida a cada dideoxinucletido, y permite realizar la reaccin

    en un nico tubo (Figura ). Asimismo, la secuencia puede ser leda a travs de un computador'Las secuencias obtenidas, con esta nueva variante eran de un largo de entre 500

    y 1000nucletidos.

    b. c.

    Figura 6. En esta figura se ejemplifica como en lugar de 4 carriles (unopJra cada base) (a), se corren todas las reacciones en un nico carrildel gel (cada color representa una base) (b) y se desarrollan algoritmospara'convertir esas seales en "electroferogramas" que representan la,ecuen.a de ADN (c). La flecha a la izquierda indica la direccin delectura 5'-3'.

    -+illfffi

    :'ii:::=it::':$!!.* l' illl'

    t#r

    -x

    *

    GCAY

    ll. Secuenciacin automtica.

    La empresa Applied Biosystems, fue la pionera y lder en instrumentos de secuenciacin' Elprimer secuenciador autmtco (ABl 37OA) aparece en 1987, y con l se logra conocer lasecuencia del primer gen por craig Venter y sus colegas del National lnstitute of Health

    (NlH'usA). La aparicin de los secuenciadores automticos permiti la instalacin de facilidades desecuenciacin. El primero de ellos fue el NlH, dnde se instalaron 6 secuenciadores ABl3700'

    En Lg92, Venter funda el lnstitute for Genomic Research (TIGR) y expande la capacidad desecuenciacin con 30 equiPos.

    Con esta plataforma instalada, se demuestra el poder de la secuenciacin automtica con el

    desarrollo de la estrategia EST (expressed sequence tag) para el descubrimiento de genes' Estaestrategia consste

    "n r."l. copias de ADN a partir del ARN mensajero celular (ADNc=ADN

    copia) y clonarlas de forma aleatoria para luego secuenciar. En 1991, con esta estrategia'Venter reporta 337 genes humanos no conocidos. La base de datos de EST contiene hoy

    ms

    de43millonesdesecuenciascorrespondientesa1300organismosdiferentes.

    W:

    ft:lrlflclala*&sfGJIAA*ATA

  • Mtodos de secuenciacin de cidos nucleicos.Gonzalo Greif

    b. Provecto Genoma humano:

    La secuenciacin del genoma humano se volvi un objetivo realizable una vez establecidas lasmetodologas de secuenciacin de ADN. La discusin formal comenz en 1985 en EstadosUnidos. En 1990, se present un proyecto de 5 aos en el congreso de Estados Unidos (HumanGenome Project). Se estimaba que el proyecto durara 15 aos y el costo rondara los 3 milmillones de dlares. El proyecto estableca el objetivo de mapear y secuenciar diferentesorganismos modelo adems de humano. Entre ellos E. coli, S. cerevisiae, C. elegons, D.melanogoster y el ratn (Mus domesticus). El proyecto se convirti en un esfuerzo decolaboracin internacional entre diversos centros de secuenciacin en Estados Unidos, Europay Japn. Cada centro se focaliz en regiones particulares del genoma, que permitieran obtenerun mapa. En 1994 se public un mapa detallado del genoma humano que inclua el mapeo de5840 loci con una media de espaciado de 0,7 cM (1 centiMorgan = 106 bases).

    En L998, el proyecto pblico, compitiendo ahora con la empresa Celera (propiedad de CraigVenter) adopta los secuenciadores capilares de Applied Biosystems (A813700).

    En 1999 el proyecto Genoma humano haba secuenciado ms de mil millones de bases y sepublic la secuencia completa de un cromosoma humano (el cromosoma22).

    Para el mismo tiempo, Celera, comenz asecuenciar el genoma humano con la estrategiade "whole genome shotgun sequencing"desarrollada por C. Venter (explicada msadelante). La secuenciacin comenz ensetiembre de 1999 y en junio de 2000 se realizun ensamblaje inicial de las secuenciasobtenidas. Los datos de Celera permitieron elensamblaje del genoma humano con unacobertura de 5X (ver Cobertura). Adems seaument la cobertura 3X con los datos pblicos.

    El 25 de junio de 2000, en la Casa Blanca, elpresidente Clinton junto a Francis Collins(responsable del proyecto pblico, NIH) y CraigVenter, anunciaron pblicamente la versinborrador del genoma humano realizada tantopor el esfuerzo pblico como privado (Figura 7).En febrero de 2001-, se publicaron los borradoresdel consorcio pblico y del privado en Science yNature (Figura 8). Finalmente en el ao 2004 sepublic la versin final del genoma humano.

    Cobertura (Coveragel:

    La cobertura es el nmero promedio desecuencias que representan a undeterminado nucletido en la secuenciatotal reconstruida. Puede ser calculada apartir del largo original del genoma (G), elnmero de secuencias (N) y el largopromedio de las secuencias (L) como:

    Cobertura=NxL/G

    Ejemplo. Un genoma hlpottico de 2000bases, secuenciado con 24 secuencias de350 bases de promedio de largo tieneuna cobertura de:

    24x(350/2000) = 4,2Y.

    Este valor significa que el genoma fuesecuenciado 4,2 veces. Cunto mayorcobertura, menor posibilidades deerrores en la secuencia final.

  • Mtodos de secuenciacin de cidos nucleicos.Gonzalo Greif

    Figura 7. Foto de lanzamiento de borrador del genomahumano en Washington (Clnton, Venter, Collins).

    Figura 8. Tapas de revistas Nature y Science de 2001 conIos borradores del genoma humano.

    Whnle genome Shotgun sequencing y Craig Venter:

    El mtodo de Whole Genome Shotgun consiste en la fragmentacin al azar del ADN de todo el genoma,slonarlo en plsmidos y secuenciar ambas hebras (el paso de clonado luego fue eliminado)' Una vezobtenidas, las secuencias se alinean y ensamblan para formar contgs basndose en las secuencias que

    solapan (Figura 9). El mtodo fue utilizado por Sanger en 1982 para ensamblar el fago lambda (48,5 kb),sin embargo Venter fue el primero en utilizarlo para secuenciar un genoma de mayor tamao (H.nfluenzoe,1,8Mb) y proponerlo como estrategia para secuenciar el genoma humano.

    Figura 9. Esquema de secuenciacln con la estrategia de Shotgun, Secuenciacin de fragmentosgenerados al azar y ensamblaje de la secuencia utilizando procesamiento informtico.

    In 1g95, Venter y su grupo deciden utilzar nuevas herramientas computacionales as como los mtodosmejorados de secuenciacin para realizar la primer secuencia de un organismo de vida librelHaemophitus influenzae). En TIGR analizar ms de 50 genomas microbianos. Venter y alguno de suscolaboradores, comenzaron entonces la secuenciacin de genomas de mayor tamao (mosca, rata,ratn).

    n 1006 se fund el J. Craig Venter lnstitute (JCVI) por la unin de varias organizaciones (TlGR, TCAG,JCVS, etc.). Se trata de una organizacin lder en genmica a nivel mundial con ms de 400 cientficostrabajando.

    fu'fw

    \\t

    ,e-. Il

    T\* I

    t\^