proteomica otra cara de la genomica
DESCRIPTION
MolecularTRANSCRIPT
-
NovaUniversidad Colegio Mayor de [email protected] ISSN (Versin impresa): 1794-2370COLOMBIA
2003 Tobas Mojica / Oscar Snchez / Leonardo Bobadilla
LA PROTEMICA, OTRA CARA DE LA GENMICA Nova, enero-diciembre, ao/vol. 1, nmero 001 Universidad Colegio Mayor de Cundinamarca
Bogot, Colombia pp. 1-16
Red de Revistas Cientficas de Amrica Ltina y el Caribe, Espaa y Portugal
Universidad Autnoma del Estado de Mxico
-
1 3
La Protemica, otra cara de la genmica
Tobas Mojica Ph.D., Oscar Snchez y Leonardo BobadillaInstituto de Gentica, Departamento de Biologa, Facultad de Ciencias, Departamento de Ingeniera de Sistemas, Facultad de
Ingeniera, Universidad Nacional de Colombia, Bogot.Recibido: 07-07-03; Aceptado: 24-09-03
anotacin bioinformtica, se calcula que el 17% de
esas protenas estn involucradas en el metabolismo
general de la clula de levadura, el 30% funciona en
organizacin celular y biognesis de organelos y mem-
branas y el 10% en transporte molecular (3).
Los tpicos grandes de la protemica son los si-
guientes:
a. Perspectiva de la empresa, incluyendo la
perspectiva de la relacin entre genoma y proteoma.
b. Fuente y manejo de las protenas, incluyendo el
organismo donante y la extraccin y almacenamiento
de la muestra, etc.
c. Separacin de las protenas, incluyendo, como
en el caso de las protenas subcelulares, la
purificacin.
d. Identificacin de las protenas que se realizan
actualmente por espectrometra de masas.
e. Funcin de las protenas, lo cual incluye, adems
de la funcin propiamente dicha, la localizacin celular,
interacciones protena-protena, determinacin de la
estructura terciaria, en alto grado alcanzado por
cristalografa, la relacin entre estructura y funcin y
modificaciones postraduccionales.
ENSAYO
La sntesis de todas las protenas celulares est
codificada por los genomas. En la actualidad, tene-
mos disponibles las secuencias de ms de 150
genomas celulares, incluyendo varios de organismos
multicelulares (http://www.tigr.org).
La protemica es la nueva etapa en la investiga-
cin biolgica que emana naturalmente de la genmica
y que incluye la caracterizacin de la expresin de
las protenas codificadas por un genoma y el estable-
cimiento de sus propiedades funcionales y estructu-
rales (2). En cierta manera, la protemica es la con-
tinuacin de lo que se ha llamado la geonmica o cien-
cia de los genomas que se ha encargado de estable-
cer la secuencia de muchos genomas. Los genomas
definen el contenido informacional de los organismos
y, por lo tanto, definen la tipologa del organismo. La
secuencia del genoma no le dice a uno de qu mane-
ra funciona el organismo; para tener respuestas a la
pregunta de cmo funciona el organismo es necesa-
rio estudiar las protenas, es decir, es necesario acer-
carnos a la protemica. Para dar una idea de la com-
plejidad del problema de la protemica, consideremos
que el genoma de levaduras tiene 6.225 protenas cal-
culadas por bioinformtica y por otros medios. Por
Las protenas son lo que uno podra llamar los arquitectos de la vida, pues son cruciales en los procesos
celulares de todos los seres vivos. Las protenas estn implicadas en la catlisis de las reacciones qumicas
celulares, el transporte de molculas, la transduccin de seales, la segregacin del material gentico, la
produccin y el manejo de la energa. El programa celular vital necesita del trabajo coordinado de muchos
tipos diferentes de protenas (1). La mayor parte del peso seco de una clula est constituda por protenas.
Parece una tautologa, pero tendremos que entender las protenas antes de que podamos entender la clula.
NOVA - PUBLICACIN CIENTFICA ISSN:1794-2370 VOL.1 No. 1 ENERO - DICIEMBRE DE 2003:1-116
www.unicolmayor.edu.co
-
1 4
f. Aplicaciones que pueden estar en el rea del
diagnstico de las enfermedades humanas y en el
descubrimiento de nuevas drogas.
g. Aplicaciones en informtica que generan mu-
chas anotaciones basadas en la homologa de las se-
cuencias, la construccin de bases de datos, genera-
cin de algoritmos para el anlisis y, por ltimo, la
estandarizacin.
h. Otras reas de importancia humana que inclu-
yen la colaboracin internacional, consideraciones
ticas, legales, papel de la sociedad en la construc-
cin y uso del conocimiento nuevo que resulte.
Gran parte de la empresa de investigacin en bio-
loga contempornea es llevada a cabo por pases
avanzados, con economas y personal adecuado. La
protemica no es la excepcin. Los Institutos Nacio-
nales de Salud de los Estados Unidos financian una
actividad investigativa llamada la Iniciativa de la Es-
tructura de Protenas, llevada a cabo en 9 centros
universitarios distribuidos por toda la unin. Este es
un esfuerzo coordinado a 10 aos para producir es-
tructuras completas de 10.000 protenas. La activi-
dad est en sus comienzos y se considera un blanco
importante y difcil llegar a la cristalizacin de 200
protenas por ao. Laboratorios de industrias que es-
peran ganar dinero con el desarrollo en conocimiento
tambin han proliferado recientemente. El problema
radica en que hay casi tantas protenas en la Tierra
como estrellas en el cielo. La iniciativa de la estruc-
tura de protenas ha llevado al desarrollo de nuevas
tecnologas que incluyen estudios estructurales deta-
llados por nanotecnologas y procesos rpidos de cris-
talizacin. Esta es claramente una muestra de la enor-
me dimensin de la tarea, que contrasta con el reza-
go tecnolgico de nuestros pases.
Podemos entonces preguntarnos qu es un
proteoma? Se trata del complemento protenico ex-
presado por un genoma o por un tejido. Los proteomas
son dinmicos y cambian con el tiempo, con el esta-
dio del desarrollo y con las condiciones intra y
extracelulares. La protemica es el estudio de los
proteomas; separa, identifica y caracteriza protenas
a gran escala, define niveles de protenas
celularmente, investiga complejos de protenas, eluci-
da funciones, caminos metablicos e interrelaciones.
La protemica tiene que analizar un nmero muy gran-
de de protenas (4) (en organismos eucariticos es
usualmente un nmero mayor que el nmero de genes
presentes en el genoma); tambin se encarga de la
caracterizacin funcional de tales protenas y de sus
relaciones estructurales. En esencia, podemos decir
que la genmica produce las estructuras primarias de
las protenas, mientras que la protemica se encarga-
r de producir las estructuras secundaria, terciaria y
cuaternaria.
La informacin fluye en forma lineal del DNA
genmico al RNAm por dos conjuntos de procesos
contiguos llamados transcripcin y procesamiento y
sigue fluyendo linealmente del RNAm a la protena,
mediante un conjunto de procesos llamados traduccin
(5). El resultado de ese flujo de informacin lineal es
la estructura primaria de la protena y de todas las
protenas de un genoma. A partir de la estructura
primaria de la protena, ocurren tres hechos en tres
dimensiones: todas las protenas se pliegan en
estructura secundaria y terciaria, algunas sufren
modificaciones postraduccionales y algunas adquieren
estructura cuaternaria. Hasta hoy, el pensamiento
gentico ha sido lineal. La protemica empieza donde
empiezan los eventos que tenemos que entender en
tres dimensiones. Ni la estructura primaria del gene
ni la del RNAm ni de la protena misma dan
indicaciones claras de la naturaleza del producto
proteico ni de su funcin; por lo tanto, la primera tarea
de la protemica consiste en identificar las protenas
producidas por un genoma. Es decir, principalmente
problemas tecnolgicos frente a cmo se pueden
separar y visualizar las protenas en un proteoma,
cmo se puede utilizar esta informacin para estudiar
complejos proteicos y caminos metablicos, cmo se
NOVA - PUBLICACIN CIENTFICA ISSN:1794-2370 VOL.1 No. 1 ENERO - DICIEMBRE DE 2003: 1-116
-
1 5
pueden identificar protenas separadas y cmo se
pueden caracterizar en detalle tales protenas.
Las principales tecnologas en desarrollo son las
siguientes: tecnologa reproducible de electroforesis
en geles en 2D; tecnologa de tincin y anlisis de los
geles; tecnologa para la identificacin de las prote-
nas, tal como la espectrometra de masas (2); tecno-
logas de manejo electrnico, tales como bases de
datos (de genomas y de protenas); y, tambin,
algoritmos de bsqueda y de recuperacin de datos.
El reto principal de la protemica es la automatizacin
y la integracin de las tecnologas mencionadas. Este
es un reto cuya respuesta saldr, principalmente, de
la bioinformtica.
La electrofresis es la tcnica central para anali-
zar un nmero grande de protenas al mismo tiempo
(3). La tcnica electrofortica es relativamente anti-
gua, fue inventada por Tiselius hace ms de 50 aos
y, en 1956, Smithies y Poulick describieron el primer
gel en dos dimensiones, mientras que en 1975, Patrick
OFarell optimiz el proceso de separacin en 2D,
tcnica que se utiliza hoy en da. En la primera di-
mensin se efecta el isoelectroenfoque utilizando
gradientes inmovilizados de pH, es decir, las prote-
nas se separan por su carga. En la segunda dimen-
sin, la separacin de protenas se hace en presencia
de SDS y las protenas se separan por su masa. Se
pueden separar miles de protenas en un solo gel. La
correcta preparacin de la muestra es frecuentemente
el paso ms importante para un resultado exitoso.
Las manchas en el gel son extradas y cada una es
tratada con tripsina para producir un patrn caracte-
rstico de pptidos, y stos se identifican por
espectrometra de masas, una tcnica que mide la
masa (en este caso, la masa de los pptidos produci-
dos por digestin con tripsina) de las molculas con
gran precisin. Los espectrmetros de masa tienen
dos partes: una fuente de iones (como por ejemplo,
MALDI o ESI, ver el siguiente prrafo) y un aparato
medidor (como por ejemplo, cuadrupolos, trampas
inicas y TOF). Las combinaciones de esta tcnica
que ms se utilizan son las siguientes:
MALDI-TOF-MS (Matrix Assisted Laser
Desorption Ionization - Time Of Flight Mass
Spectrometry) o Espectrometra de masas, basada
en la desorpcin ionizacin asistida por una matriz
slida de rpida ocurrencia. Esta identificacin de
protenas ocurre cuando stas estn inmovilizadas en
una membrana o en una matriz de un gel. La tcnica
es de baja eficiencia.
MALDI o ESI-MS (ElectroSpray Ionization
Mass Spectrometry) o Espectrometra de masas por
ionizacin en electroatomizado. Esta tcnica analiza
protenas inmovilizadas en membranas o eluidas y di-
geridas en los geles.
Los datos que salen de la tcnica de espectrometra
de masas son fingerprints o huellas digitales de
pptidos separados por masa. La identificacin de las
protenas se hace por aprendizaje de mquina, refi-
riendo los patrones particulares de espectrometra de
masas a una base de datos que sirve para entrena-
miento.
Un objetivo ms o menos inmediato de la
protemica es la aplicacin de las tecnologas y datos
a la investigacin en clnica humana. Otras reas de
menor desarrollo en el conocimiento incluyen los es-
tudios ambientales, investigacin en agricultura y en
veterinaria, las cuales podrn usar los desarrollos de
la protemica solo de mediano a largo plazo. Un ob-
jetivo claro de la protemica clnica es el descubri-
miento de drogas clnicamente importantes, es decir,
blancos potenciales para desarrollo farmacolgico, y
mayor distancia entre los ricos y los pobres.
En la actualidad, la computacin es un componente
esencial de la investigacin en biologa. La masa de
los datos producidos es tan grande que no se puede ni
siquiera mirar sin la ayuda de un computador. Quizs
la bioinformtica nunca haya enfrentado un problema
de magnitud tan grande. Necesitamos bases de datos
www.unicolmayor.edu.co
LA PROTEMICA, OTRA CARA DE LA GENMICA: 13-16
-
1 6
integradas, eficientes para entrar y sacar datos; as
mismo, necesitamos mtodos computacionales
avanzados tales como reconocimiento de patrones y
otros enfoques de aprendizaje de mquina, para
analizar y entender los datos.
La computacin suministra herramientas podero-
sas para detectar relaciones sutiles entre los datos y
sugiere hiptesis y rutas para la validacin experi-
mental. Los genetistas antiguos hacan gentica im-
pulsada por hiptesis, mientras los nuevos plantean
hiptesis basados en los datos del computador, lo cual
aade as una dimensin nueva a la intuicin humana
capacitndonos para obtener entendimientos adicio-
nales. Quienes puedan integrar la computacin a sus
tareas investigativas tendrn mucho xito. Para apro-
vecharnos de la riqueza de los datos necesitamos dos
tipos de desarrollos computacionales:
1. Infraestructura de las bases de datos que per-
mitan almacenamiento y recuperacin eficientes, que
sea biolgicamente intuitiva y con una interfase que
permita la comunicacin entre bases de datos y cien-
tficos de diferentes disciplinas.
2. Sistemas inteligentes, agentes y software para
discernir las relaciones entre los datos, de tal manera
que se puedan formular hiptesis junto con experi-
mentos de validacin. Debemos esperar que estos
desarrollos en bioinformtica ayuden a responder pre-
guntas fundamentales de toda la biologa, incluyendo
preguntas que an no se han formulado. Podemos in-
cluir en este punto la necesidad de entrenar la nueva
generacin de cientficos multidisciplinarios, en lo cual
la Universidad Colegio Mayor de Cundinamarca pue-
de hacer una contribucin importante.
Conclusin
La definicin ms amplia de protemica puede ser
la ms til; de hecho cualquier definicin de
protemica debe llegarle al alma a los bilogos y los
cientficos de la computacin. La protemica repre-
senta la lnea de conocimiento que quiere establecer
las identidades, las cantidades, las estructuras, las fun-
ciones bioqumicas y celulares de todas las protenas
de un organismo, rgano u organelo, y las formas como
las anteriores propiedades varan en el espacio y el
tiempo y con el estado fisiolgico y anmico. Una ta-
rea de mucho tiempo que pueden dejar ms atrasa-
dos que antes.
Referencias1. Alberts B, Bray D, Lewis J, Raff M, Roberts K, Watson JD.
Molecular biology of the cell. New York: Garland Publishing;1994.
2. Anderson NL, Anderson NG. Proteome and proteomics: newtechnologies, new concepts and new words. Electrophoresis1998;19:1853-61.
3. Blackstock WP, Weir MP. Proteomics: quantitative andphysical mapping of cellular proteins. Trends in Biotech1999;17:121-7.
4. Kenyon GL, DeMarinib DM, Fuchs E, Galas DJ, Kirsche JF,Leyh TS, et al. Defining the mandate of proteomics in thepost-genomics era: workshop report. Molecular & CellularProteomics 2002;1:763-80. Disponible en: URL: http://www.nap.edu/catalog/10209.html
5. Lodish H, Berk A, Zipursky S, Matsudaira P, Baltimore D,Darnell J. Molecular cell biology. New York: W.H. Freemanand Company; 2000.
6. Wilkins M. editor. New frontiers in functional genomics. NewYork: Springer Verlag; 1997.
www.unicolmayor.edu.co
LA PROTEMICA, OTRA CARA DE LA GENMICA: 13-16