proteomica otra cara de la genomica

Upload: camjer

Post on 06-Jan-2016

213 views

Category:

Documents


0 download

DESCRIPTION

Molecular

TRANSCRIPT

  • NovaUniversidad Colegio Mayor de [email protected] ISSN (Versin impresa): 1794-2370COLOMBIA

    2003 Tobas Mojica / Oscar Snchez / Leonardo Bobadilla

    LA PROTEMICA, OTRA CARA DE LA GENMICA Nova, enero-diciembre, ao/vol. 1, nmero 001 Universidad Colegio Mayor de Cundinamarca

    Bogot, Colombia pp. 1-16

    Red de Revistas Cientficas de Amrica Ltina y el Caribe, Espaa y Portugal

    Universidad Autnoma del Estado de Mxico

  • 1 3

    La Protemica, otra cara de la genmica

    Tobas Mojica Ph.D., Oscar Snchez y Leonardo BobadillaInstituto de Gentica, Departamento de Biologa, Facultad de Ciencias, Departamento de Ingeniera de Sistemas, Facultad de

    Ingeniera, Universidad Nacional de Colombia, Bogot.Recibido: 07-07-03; Aceptado: 24-09-03

    anotacin bioinformtica, se calcula que el 17% de

    esas protenas estn involucradas en el metabolismo

    general de la clula de levadura, el 30% funciona en

    organizacin celular y biognesis de organelos y mem-

    branas y el 10% en transporte molecular (3).

    Los tpicos grandes de la protemica son los si-

    guientes:

    a. Perspectiva de la empresa, incluyendo la

    perspectiva de la relacin entre genoma y proteoma.

    b. Fuente y manejo de las protenas, incluyendo el

    organismo donante y la extraccin y almacenamiento

    de la muestra, etc.

    c. Separacin de las protenas, incluyendo, como

    en el caso de las protenas subcelulares, la

    purificacin.

    d. Identificacin de las protenas que se realizan

    actualmente por espectrometra de masas.

    e. Funcin de las protenas, lo cual incluye, adems

    de la funcin propiamente dicha, la localizacin celular,

    interacciones protena-protena, determinacin de la

    estructura terciaria, en alto grado alcanzado por

    cristalografa, la relacin entre estructura y funcin y

    modificaciones postraduccionales.

    ENSAYO

    La sntesis de todas las protenas celulares est

    codificada por los genomas. En la actualidad, tene-

    mos disponibles las secuencias de ms de 150

    genomas celulares, incluyendo varios de organismos

    multicelulares (http://www.tigr.org).

    La protemica es la nueva etapa en la investiga-

    cin biolgica que emana naturalmente de la genmica

    y que incluye la caracterizacin de la expresin de

    las protenas codificadas por un genoma y el estable-

    cimiento de sus propiedades funcionales y estructu-

    rales (2). En cierta manera, la protemica es la con-

    tinuacin de lo que se ha llamado la geonmica o cien-

    cia de los genomas que se ha encargado de estable-

    cer la secuencia de muchos genomas. Los genomas

    definen el contenido informacional de los organismos

    y, por lo tanto, definen la tipologa del organismo. La

    secuencia del genoma no le dice a uno de qu mane-

    ra funciona el organismo; para tener respuestas a la

    pregunta de cmo funciona el organismo es necesa-

    rio estudiar las protenas, es decir, es necesario acer-

    carnos a la protemica. Para dar una idea de la com-

    plejidad del problema de la protemica, consideremos

    que el genoma de levaduras tiene 6.225 protenas cal-

    culadas por bioinformtica y por otros medios. Por

    Las protenas son lo que uno podra llamar los arquitectos de la vida, pues son cruciales en los procesos

    celulares de todos los seres vivos. Las protenas estn implicadas en la catlisis de las reacciones qumicas

    celulares, el transporte de molculas, la transduccin de seales, la segregacin del material gentico, la

    produccin y el manejo de la energa. El programa celular vital necesita del trabajo coordinado de muchos

    tipos diferentes de protenas (1). La mayor parte del peso seco de una clula est constituda por protenas.

    Parece una tautologa, pero tendremos que entender las protenas antes de que podamos entender la clula.

    NOVA - PUBLICACIN CIENTFICA ISSN:1794-2370 VOL.1 No. 1 ENERO - DICIEMBRE DE 2003:1-116

    www.unicolmayor.edu.co

  • 1 4

    f. Aplicaciones que pueden estar en el rea del

    diagnstico de las enfermedades humanas y en el

    descubrimiento de nuevas drogas.

    g. Aplicaciones en informtica que generan mu-

    chas anotaciones basadas en la homologa de las se-

    cuencias, la construccin de bases de datos, genera-

    cin de algoritmos para el anlisis y, por ltimo, la

    estandarizacin.

    h. Otras reas de importancia humana que inclu-

    yen la colaboracin internacional, consideraciones

    ticas, legales, papel de la sociedad en la construc-

    cin y uso del conocimiento nuevo que resulte.

    Gran parte de la empresa de investigacin en bio-

    loga contempornea es llevada a cabo por pases

    avanzados, con economas y personal adecuado. La

    protemica no es la excepcin. Los Institutos Nacio-

    nales de Salud de los Estados Unidos financian una

    actividad investigativa llamada la Iniciativa de la Es-

    tructura de Protenas, llevada a cabo en 9 centros

    universitarios distribuidos por toda la unin. Este es

    un esfuerzo coordinado a 10 aos para producir es-

    tructuras completas de 10.000 protenas. La activi-

    dad est en sus comienzos y se considera un blanco

    importante y difcil llegar a la cristalizacin de 200

    protenas por ao. Laboratorios de industrias que es-

    peran ganar dinero con el desarrollo en conocimiento

    tambin han proliferado recientemente. El problema

    radica en que hay casi tantas protenas en la Tierra

    como estrellas en el cielo. La iniciativa de la estruc-

    tura de protenas ha llevado al desarrollo de nuevas

    tecnologas que incluyen estudios estructurales deta-

    llados por nanotecnologas y procesos rpidos de cris-

    talizacin. Esta es claramente una muestra de la enor-

    me dimensin de la tarea, que contrasta con el reza-

    go tecnolgico de nuestros pases.

    Podemos entonces preguntarnos qu es un

    proteoma? Se trata del complemento protenico ex-

    presado por un genoma o por un tejido. Los proteomas

    son dinmicos y cambian con el tiempo, con el esta-

    dio del desarrollo y con las condiciones intra y

    extracelulares. La protemica es el estudio de los

    proteomas; separa, identifica y caracteriza protenas

    a gran escala, define niveles de protenas

    celularmente, investiga complejos de protenas, eluci-

    da funciones, caminos metablicos e interrelaciones.

    La protemica tiene que analizar un nmero muy gran-

    de de protenas (4) (en organismos eucariticos es

    usualmente un nmero mayor que el nmero de genes

    presentes en el genoma); tambin se encarga de la

    caracterizacin funcional de tales protenas y de sus

    relaciones estructurales. En esencia, podemos decir

    que la genmica produce las estructuras primarias de

    las protenas, mientras que la protemica se encarga-

    r de producir las estructuras secundaria, terciaria y

    cuaternaria.

    La informacin fluye en forma lineal del DNA

    genmico al RNAm por dos conjuntos de procesos

    contiguos llamados transcripcin y procesamiento y

    sigue fluyendo linealmente del RNAm a la protena,

    mediante un conjunto de procesos llamados traduccin

    (5). El resultado de ese flujo de informacin lineal es

    la estructura primaria de la protena y de todas las

    protenas de un genoma. A partir de la estructura

    primaria de la protena, ocurren tres hechos en tres

    dimensiones: todas las protenas se pliegan en

    estructura secundaria y terciaria, algunas sufren

    modificaciones postraduccionales y algunas adquieren

    estructura cuaternaria. Hasta hoy, el pensamiento

    gentico ha sido lineal. La protemica empieza donde

    empiezan los eventos que tenemos que entender en

    tres dimensiones. Ni la estructura primaria del gene

    ni la del RNAm ni de la protena misma dan

    indicaciones claras de la naturaleza del producto

    proteico ni de su funcin; por lo tanto, la primera tarea

    de la protemica consiste en identificar las protenas

    producidas por un genoma. Es decir, principalmente

    problemas tecnolgicos frente a cmo se pueden

    separar y visualizar las protenas en un proteoma,

    cmo se puede utilizar esta informacin para estudiar

    complejos proteicos y caminos metablicos, cmo se

    NOVA - PUBLICACIN CIENTFICA ISSN:1794-2370 VOL.1 No. 1 ENERO - DICIEMBRE DE 2003: 1-116

  • 1 5

    pueden identificar protenas separadas y cmo se

    pueden caracterizar en detalle tales protenas.

    Las principales tecnologas en desarrollo son las

    siguientes: tecnologa reproducible de electroforesis

    en geles en 2D; tecnologa de tincin y anlisis de los

    geles; tecnologa para la identificacin de las prote-

    nas, tal como la espectrometra de masas (2); tecno-

    logas de manejo electrnico, tales como bases de

    datos (de genomas y de protenas); y, tambin,

    algoritmos de bsqueda y de recuperacin de datos.

    El reto principal de la protemica es la automatizacin

    y la integracin de las tecnologas mencionadas. Este

    es un reto cuya respuesta saldr, principalmente, de

    la bioinformtica.

    La electrofresis es la tcnica central para anali-

    zar un nmero grande de protenas al mismo tiempo

    (3). La tcnica electrofortica es relativamente anti-

    gua, fue inventada por Tiselius hace ms de 50 aos

    y, en 1956, Smithies y Poulick describieron el primer

    gel en dos dimensiones, mientras que en 1975, Patrick

    OFarell optimiz el proceso de separacin en 2D,

    tcnica que se utiliza hoy en da. En la primera di-

    mensin se efecta el isoelectroenfoque utilizando

    gradientes inmovilizados de pH, es decir, las prote-

    nas se separan por su carga. En la segunda dimen-

    sin, la separacin de protenas se hace en presencia

    de SDS y las protenas se separan por su masa. Se

    pueden separar miles de protenas en un solo gel. La

    correcta preparacin de la muestra es frecuentemente

    el paso ms importante para un resultado exitoso.

    Las manchas en el gel son extradas y cada una es

    tratada con tripsina para producir un patrn caracte-

    rstico de pptidos, y stos se identifican por

    espectrometra de masas, una tcnica que mide la

    masa (en este caso, la masa de los pptidos produci-

    dos por digestin con tripsina) de las molculas con

    gran precisin. Los espectrmetros de masa tienen

    dos partes: una fuente de iones (como por ejemplo,

    MALDI o ESI, ver el siguiente prrafo) y un aparato

    medidor (como por ejemplo, cuadrupolos, trampas

    inicas y TOF). Las combinaciones de esta tcnica

    que ms se utilizan son las siguientes:

    MALDI-TOF-MS (Matrix Assisted Laser

    Desorption Ionization - Time Of Flight Mass

    Spectrometry) o Espectrometra de masas, basada

    en la desorpcin ionizacin asistida por una matriz

    slida de rpida ocurrencia. Esta identificacin de

    protenas ocurre cuando stas estn inmovilizadas en

    una membrana o en una matriz de un gel. La tcnica

    es de baja eficiencia.

    MALDI o ESI-MS (ElectroSpray Ionization

    Mass Spectrometry) o Espectrometra de masas por

    ionizacin en electroatomizado. Esta tcnica analiza

    protenas inmovilizadas en membranas o eluidas y di-

    geridas en los geles.

    Los datos que salen de la tcnica de espectrometra

    de masas son fingerprints o huellas digitales de

    pptidos separados por masa. La identificacin de las

    protenas se hace por aprendizaje de mquina, refi-

    riendo los patrones particulares de espectrometra de

    masas a una base de datos que sirve para entrena-

    miento.

    Un objetivo ms o menos inmediato de la

    protemica es la aplicacin de las tecnologas y datos

    a la investigacin en clnica humana. Otras reas de

    menor desarrollo en el conocimiento incluyen los es-

    tudios ambientales, investigacin en agricultura y en

    veterinaria, las cuales podrn usar los desarrollos de

    la protemica solo de mediano a largo plazo. Un ob-

    jetivo claro de la protemica clnica es el descubri-

    miento de drogas clnicamente importantes, es decir,

    blancos potenciales para desarrollo farmacolgico, y

    mayor distancia entre los ricos y los pobres.

    En la actualidad, la computacin es un componente

    esencial de la investigacin en biologa. La masa de

    los datos producidos es tan grande que no se puede ni

    siquiera mirar sin la ayuda de un computador. Quizs

    la bioinformtica nunca haya enfrentado un problema

    de magnitud tan grande. Necesitamos bases de datos

    www.unicolmayor.edu.co

    LA PROTEMICA, OTRA CARA DE LA GENMICA: 13-16

  • 1 6

    integradas, eficientes para entrar y sacar datos; as

    mismo, necesitamos mtodos computacionales

    avanzados tales como reconocimiento de patrones y

    otros enfoques de aprendizaje de mquina, para

    analizar y entender los datos.

    La computacin suministra herramientas podero-

    sas para detectar relaciones sutiles entre los datos y

    sugiere hiptesis y rutas para la validacin experi-

    mental. Los genetistas antiguos hacan gentica im-

    pulsada por hiptesis, mientras los nuevos plantean

    hiptesis basados en los datos del computador, lo cual

    aade as una dimensin nueva a la intuicin humana

    capacitndonos para obtener entendimientos adicio-

    nales. Quienes puedan integrar la computacin a sus

    tareas investigativas tendrn mucho xito. Para apro-

    vecharnos de la riqueza de los datos necesitamos dos

    tipos de desarrollos computacionales:

    1. Infraestructura de las bases de datos que per-

    mitan almacenamiento y recuperacin eficientes, que

    sea biolgicamente intuitiva y con una interfase que

    permita la comunicacin entre bases de datos y cien-

    tficos de diferentes disciplinas.

    2. Sistemas inteligentes, agentes y software para

    discernir las relaciones entre los datos, de tal manera

    que se puedan formular hiptesis junto con experi-

    mentos de validacin. Debemos esperar que estos

    desarrollos en bioinformtica ayuden a responder pre-

    guntas fundamentales de toda la biologa, incluyendo

    preguntas que an no se han formulado. Podemos in-

    cluir en este punto la necesidad de entrenar la nueva

    generacin de cientficos multidisciplinarios, en lo cual

    la Universidad Colegio Mayor de Cundinamarca pue-

    de hacer una contribucin importante.

    Conclusin

    La definicin ms amplia de protemica puede ser

    la ms til; de hecho cualquier definicin de

    protemica debe llegarle al alma a los bilogos y los

    cientficos de la computacin. La protemica repre-

    senta la lnea de conocimiento que quiere establecer

    las identidades, las cantidades, las estructuras, las fun-

    ciones bioqumicas y celulares de todas las protenas

    de un organismo, rgano u organelo, y las formas como

    las anteriores propiedades varan en el espacio y el

    tiempo y con el estado fisiolgico y anmico. Una ta-

    rea de mucho tiempo que pueden dejar ms atrasa-

    dos que antes.

    Referencias1. Alberts B, Bray D, Lewis J, Raff M, Roberts K, Watson JD.

    Molecular biology of the cell. New York: Garland Publishing;1994.

    2. Anderson NL, Anderson NG. Proteome and proteomics: newtechnologies, new concepts and new words. Electrophoresis1998;19:1853-61.

    3. Blackstock WP, Weir MP. Proteomics: quantitative andphysical mapping of cellular proteins. Trends in Biotech1999;17:121-7.

    4. Kenyon GL, DeMarinib DM, Fuchs E, Galas DJ, Kirsche JF,Leyh TS, et al. Defining the mandate of proteomics in thepost-genomics era: workshop report. Molecular & CellularProteomics 2002;1:763-80. Disponible en: URL: http://www.nap.edu/catalog/10209.html

    5. Lodish H, Berk A, Zipursky S, Matsudaira P, Baltimore D,Darnell J. Molecular cell biology. New York: W.H. Freemanand Company; 2000.

    6. Wilkins M. editor. New frontiers in functional genomics. NewYork: Springer Verlag; 1997.

    www.unicolmayor.edu.co

    LA PROTEMICA, OTRA CARA DE LA GENMICA: 13-16