adanay m pertello/bioinfo/sesion16.pdf · adanay martÍn p. (cinvestav) genómica funcional 1 de...

56
Genómica funcional Adanay MARTÍN PÉREZ CINVESTAV 1 de agosto del 2013 Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 1 / 56

Upload: others

Post on 04-Jul-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Genómica funcional

Adanay MARTÍN PÉREZ

CINVESTAV

1 de agosto del 2013

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 1 / 56

Page 2: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Introducción

Introducción

El campo de la genómica abarca dos áreas principales, lagenómica estructural y la genómica funcional.

La primera se ocupa principalmente de las estructuras delgenoma, con un enfoque en el estudio del mapeo y ensamble delmismo, así como su anotación y comparación.

La última hace énfasis principalmente en las funciones de losgenes en todo el genoma. El énfasis aquí está en el altorendimiento, que es el análisis simultáneo de todos los genes enun genoma.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 2 / 56

Page 3: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Introducción

Introducción

Esta función es de hecho lo que separa a la genómica de labiología molecular tradicional, que estudia sólo un gen a la vez.

El análisis de alto rendimiento de todos los genes expresadostambién se denomina análisis de transcriptoma, que es el análisisde la expresión de todo el conjunto de moléculas de ARNproducidas por una célula bajo un conjunto de condiciones dadas.

En la práctica, el ARN mensajero (ARNm) es la única especie deARN que se estudia.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 3 / 56

Page 4: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Introducción

Introducción

El análisis de transcriptoma facilita nuestra comprensión de cómolos conjuntos de genes trabajan juntos para formar las víasmetabólicas, de regulación y señalización dentro de la célula.

Además revela los patrones de genes coexpresados ycorregulados y permite la determinación de las funciones de losgenes que fueron caracterizados con anterioridad.

En resumen, la genómica funcional ofrece información sobre lasfunciones biológicas de todo el genoma a través del análisis deexpresión automatizado de alto rendimiento.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 4 / 56

Page 5: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

Etiquetas de secuencias expresadas

Uno de los enfoques de alto rendimiento es la secuenciación deetiquetas de secuencias expresadas (expressed sequence tags)(EST).

Las EST son secuencias cortas obtenidas a partir de clones deADNc (ADN complementario) y sirven como identificadores cortosde genes.

Las EST son típicamente del rango de 200 a 400 nucleótidos delongitud obtenidos a partir de ya sea el extremo 5’ o 3’ de losinsertos de ADNc.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 5 / 56

Page 6: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

Etiquetas de secuencias expresadas

Existen varias bibliotecas de clones de ADNc que se preparanmediante la transcripción inversa de poblaciones aisladas deARNm utilizando diferentes técnicas. Para generar datos de EST,se seleccionan al azar clones de las bibliotecas de ADNc.

Los datos de EST son capaces de proporcionar una estimaciónaproximada de los genes que se expresan de forma activa en ungenoma bajo una condición fisiológica en particular.

Esto es debido a que las frecuencias de EST particulares reflejanla abundancia del ARNm correspondiente en una célula, que a suvez corresponde a los niveles de expresión génica bajo lacondición dada.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 6 / 56

Page 7: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

Desventajas

Las secuencias EST suelen ser de baja calidad, ya que segeneran de forma automática y sin verificación; y por lo tantocontienen altos porcentajes de errores. Muchas bases sondeterminadas como ambiguas y representadas por N.

Las secuencias de genes en el extremo 3’ tienden a ser másfuertemente representadas que aquellas en el extremo 5’, debidoa las técnicas utilizadas de transcripción inversa.

Por desgracia, las secuencias del extremo 3’ son también máspropensas a errores, debido a la baja calidad de base alcomienzo de la secuencia.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 7 / 56

Page 8: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

Desventajas

Otro problema de las EST es la presencia de clones quiméricosdebido a artefactos de clonación en la construcción de labiblioteca, en la que más de una transcripción se liga a un clonresultante del extremo 5’ de un gen y el extremo 3’ de otro gen.Se ha estimado que hasta el 11 % de los clones de ADNc puedenser quiméricos.

Además, principalmente representan transcripciones abundantesy altamente expresadas. Los genes débilmente expresadosapenas se encuentran en una secuenciación EST.

A pesar de estas limitaciones, la tecnología EST sigue siendoampliamente utilizada.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 8 / 56

Page 9: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

Ventajas

Las bibliotecas EST se pueden generar fácilmente a partir dediversas líneas de células, tejidos y órganos en diversas etapasde desarrollo.

Aunque las EST individuales son propensas a errores, toda unacolección de EST contiene información valiosa. A menudo,después de la consolidación de múltiples secuencias EST, sepuede derivar un ADNc de longitud completa.

La rápida acumulación de secuencias EST ha llevado a lacreación de bases de datos públicas y privadas para archivar losdatos.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 9 / 56

Page 10: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

dbEST

La base de datos dbEST (www.ncbi.nlm.nih.gov/dbEST/) contienecolecciones de EST para un gran número de organismos (> 250). Labase de datos se actualiza regularmente para reflejar el progreso devarios proyectos de secuenciación EST. Cada secuencia EST reciénpresentada es sujeta a una búsqueda de similitud en base de datos. Sise encuentra una fuerte similitud con un gen conocido, es anotado enconsecuencia.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 10 / 56

Page 11: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

Construcción de índices EST

Uno de los objetivos de la bases de datos de EST es organizar yconsolidar los datos de EST en gran medida redundantes, paramejorar la calidad de la información de secuencias y que los datospuedan ser utilizados para extraer el ADNc de longitud completa.

El proceso incluye una etapa de preprocesamiento que eliminalos vectores contaminantes. Por ejemplo, para detectarsecuencias de vectores bacterianos se puede utilizar Vecscreen.

Esto es seguido por una etapa de agrupamiento que asociasecuencias EST con genes únicos.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 11 / 56

Page 12: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

Construcción de índices EST

El siguiente paso es derivar secuencias de consenso por fusiónredundante, EST superpuestas y corregir errores, dando comoresultado secuencias EST más largas. El procedimiento es algosimilar al ensamble de genoma.

Por último, las regiones de codificación se definen a través de lautilización de algoritmos de búsqueda de genes basados enHMM. Esto ayuda a excluir intrones potenciales y secuencias 3’no traducidas.

Una vez que se identifica la secuencia de codificación, ésta puedeser anotada traduciéndola en secuencias de proteínas parabúsquedas de similitud en base de datos.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 12 / 56

Page 13: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

Construcción de índices EST

Las EST compiladas también se pueden alinear con la secuenciagenómica si está disponible para identificar el locus del genomadel gen expresado, así como los límites intrón-exón del gen. Estose realiza generalmente mediante el programa SIM4(http://pbil.univ-lyon1.fr/sim4.php).

El proceso de agrupación que reduce la redundancia de EST yproduce una colección de secuencias EST no redundantes yanotadas se conoce como índice de construcción genética.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 13 / 56

Page 14: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

UniGene

UniGene (www.ncbi.nlm.nih.gov/UniGene/) es una base de datosde clústeres EST. Cada grupo es un conjunto de secuencias ESTsuperpuestas que se procesan computacionalmente pararepresentar un único gen expresado.

La base de datos se construye sobre la base de informacióncombinada de dbEST, GenBank, bases de datos de ARNm y ADNgenómico. Sólo se agrupan EST de extremos 3’ para minimizar elproblema de quimerismo.

El siguiente paso es eliminar las secuencias contaminantes queincluyen vectores bacterianos.

Las EST resultantes se utilizan para la búsqueda contra una basede datos de genes únicos conocidos (base de datos EGAD) conel programa BLAST.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 14 / 56

Page 15: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

UniGene

La etapa de compilación identifica secuencias solapadas y derivasecuencias de consenso utilizando el programa de CAP3.Durante este paso, los errores en EST individuales se corrigen; ylas secuencias son entonces divididas en grupos y ensambladasen contigs.

El resultado final es un conjunto de agrupaciones no redundantesy orientadas a genes, conocidas como UniGene.

Cada clúster UniGene representa un gen único anotando sufunción e información del locus del gen, así como informaciónrelacionada con el tipo de tejido donde el gen se ha expresado. Elprocedimiento de agrupación se resume en la siguiente figura.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 15 / 56

Page 16: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

Pasos para procesar secuencias EST para laconstrucción de la bases de datos UniGene

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 16 / 56

Page 17: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

TIGR Gene Indices

TIGR Gene índices (www.tigr.org/db /tgi.shtml) es una base dedatos de EST que utiliza un método de agrupación diferente deUniGene.

En este caso se recopilan datos de dbEST, GenBank ARNm ydatos de ADN genómico, además de la propia base de datos desecuencia TIGR. Las secuencias sólo se agrupan si son más del95 % idénticas en las comparaciones por pares de regiones denucleótidos de longitud mayor a 40. Se utiliza BLAST y FASTApara identificar las secuencias que se solapan.

En la etapa de ensamble de secuencias, se utilizan tanto TIGRAssembler como CAP3 para construir contigs, produciendo elllamado consenso provisional o tentativo (TC).

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 17 / 56

Page 18: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias Etiquetas de secuencias expresadas

TIGR Gene Indices

Para evitar el quimerismo, se agrupan transcripciones sólo sicoinciden plenamente con los genes conocidos.

La asignación funcional se da luego al TC y se basa fuertementeen búsquedas BLAST en bases de datos de proteínas.

Los índices de genes TIGR sirven como una alternativa a lasagrupaciones UniGen y muestran secuencias recopiladas EST,anotación funcional y resultados de búsqueda de similitud enbases de datos.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 18 / 56

Page 19: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias SAGE

SAGE

El análisis en serie de la expresión génica (serial analysis of geneexpression) (SAGE) es otro enfoque de alto rendimiento basadoen secuencias para el análisis de la expresión global de genes.

En este método, se toman fragmentos cortos de ADN (por logeneral 15 pares de bases [pb]) a partir de secuencias de ADNc yse utilizan como marcadores únicos de las transcripciones degenes.

Los fragmentos de secuencias se denominan etiquetas, queposteriormente son analizadas computacionalmente de maneraconsecutiva (en serie).

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56

Page 20: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias SAGE

Ventajas

Si un clon promedio tiene un tamaño de 700 pb, puede contenerhasta 50 etiquetas de secuencias (15 pb cada una), lo quesignifica que el método SAGE puede ser al menos cincuentaveces más eficiente que la secuenciación EST.

Por lo tanto, el análisis SAGE ofrece mejores oportunidades dedetectar los genes expresados débilmente.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 20 / 56

Page 21: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias SAGE

Desventajas

La escala y el coste de la secuenciación requerida para el análisisSAGE son prohibitivos para la mayoría de los laboratorios.

Es sensible a los errores de secuenciación debido al pequeñotamaño de las etiquetas de oligonucleótidos para larepresentación de la transcripción.

Además, una etiqueta SAGE correcta a veces puedecorresponder a varios genes o a ningún gen en absoluto.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 21 / 56

Page 22: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en secuencias SAGE

Herramientas de software para el análisis SAGE

SAGEmap (www.ncbi.nlm.nih.gov/SAGE/)

SAGE xProfiler (www.ncbi.nlm.nih.gov/SAGE/sagexpsetup.cgi)

SAGE Genie (http://cgap.nci.nih.gov/SAGE)

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 22 / 56

Page 23: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays

Enfoque basado en micro-arrays

El método de perfiles de expresión génica global más utilizado enla investigación genómica actual es el enfoque basado enmicro-arrays de ADN.

Un micro-array (o chip génico) es una superficie sólida (de vidrio oplástico) a la cual se une una matriz de alta densidad deoligómeros de ADN que representan la totalidad del genoma de laespecie en estudio.

Cada oligómero sirve como una sonda para la unión a un únicoADNc. Toda la población de ADNc, marcada con colorantesfluorescentes o radioisótopos, se hibridizan con las sondas deoligonucleótidos en el chip.

La cantidad de fluorescentes o marcadores radiactivos en cadaposición refleja la cantidad de ARNm correspondiente en la célula.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 23 / 56

Page 24: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Diseño de oligonucleótidos

Diseño de oligonucleótidos

Los micro-arrays de ADN se generan mediante la fijación deoligonucleótidos sobre un soporte sólido, tal como unportaobjetos de vidrio, utilizando un dispositivo robótico.

Un oligonucleótido es una secuencia corta de ADN o ARN. Sulongitud está típicamente en el intervalo de veinticinco hastasetenta bases de largo.

Para diseñar secuencias óptimas de oligonucleótidos paramicro-arrays, se utilizan los siguientes criterios.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 24 / 56

Page 25: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Diseño de oligonucleótidos

Criterios para el diseño de oligonucleótidos

Las sondas deben ser lo suficientemente específicas paraminimizar la hibridación cruzada con los genes no específicos.Esto requiere búsquedas BLAST contra bases de datos degenomas para encontrar regiones de secuencias con menossimilitud con los genes no objetivo.

Las sondas deben ser sensibles y carentes de regiones de bajacomplejidad (una cadena de nucleótidos idénticos).

Las secuencias de oligonucleótidos no deben formar estructurasinternas secundarias estables, tales como una estructura dehorquilla (hairpin), lo que podría interferir con la reacción dehibridación. Programas como como Mfold pueden ayudar adetectar estructuras secundarias.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 25 / 56

Page 26: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Diseño de oligonucleótidos

Criterios para el diseño de oligonucleótidos

El diseño debe estar cerca del extremo 3’ del gen debido a que lacolección de ADNc a menudo está predispuesta para el extremo3’.

Además, por conveniencia, todas las sondas deberían tener unatemperatura de fusión aproximadamente igual y un contenido deGC de 45 % a 65 %.

Actualmente se han desarrollado varios programas que utilizanestas normas en el diseño de secuencias de sondas demicro-arrays.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 26 / 56

Page 27: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Diseño de oligonucleótidos

Herramientas de software para el diseño deoligonucleótidos

Actualmente se han desarrollado varios programas que utilizanestas normas en el diseño de secuencias de sondas demicro-arrays.

OligoWiz (www.cbs.dtu.dk/services/OligoWiz/)

OligoArray (http://berry.engin.umich.edu/oligoarray2/)

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 27 / 56

Page 28: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Colecciones de datos

Colecciones de datos

El tipo más común de protocolo de micro-arrays es el micro-arrayde dos colores, que consiste en etiquetar un conjunto de ADNc apartir de una condición experimental con un colorante (Cy5,fluorescencia roja) y otro conjunto de ADNc a partir de unacondición de referencia (los controles) con otro colorante (Cy3,fluorescencia verde).

Cuando las dos muestras de ADNc etiquetadas de formadiferente se mezclan en igual cantidad y se dejan hibridizar conlas sondas de ADN en los chips, los patrones de expresión degenes de ambas muestras se pueden medir simultáneamente.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 28 / 56

Page 29: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Colecciones de datos

Colecciones de datos

La imagen del micro-array hibridado es capturada mediante unescáner láser que escanea cada punto del micro-array. Doslongitudes de onda del haz de láser se utilizan para excitar lostintes fluorescentes rojos y verdes y producir fluorescencia roja yverde, que se detecta mediante un tubo fotomultiplicador.

Por lo tanto, para cada punto del micro-array, se registran señalesde fluorescencia verde y roja. Las dos imágenes de fluorescenciase superponen para crear una imagen compuesta, que indica losniveles relativos de expresión de cada gen.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 29 / 56

Page 30: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Colecciones de datos

Colecciones de datos

Si un gen se expresa a un nivel más alto en la condiciónexperimental (rojo) que en el control (verde), el punto muestra uncolor rojo plato.

Si el gen se expresa a un nivel inferior que el control, el puntoaparece verdoso. Si se tiene la misma cantidad de fluorescenciaverde y roja, da como resultado una mancha amarilla.

La imagen de color se almacena como un archivo de ordenador(en formato TIFF) para su posterior procesamiento.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 30 / 56

Page 31: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Procesamiento de imágenes

Procesamiento de imágenes

El procesamiento de imágenes consiste en localizar y cuantificarlos puntos de hibridación y separar las señales de hibridaciónverdaderas del ruido de fondo.

El ruido de fondo y los artefactos producidos en este pasoincluyen la hibridación no específica, las irregularidades de lasuperficie de deslizamiento, y la presencia de contaminantes talescomo el polvo.

Los programas de ordenador se utilizan para localizarcorrectamente los límites de las manchas y medir las intensidadesde las imágenes in situ después de restar los píxeles de fondo.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 31 / 56

Page 32: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Procesamiento de imágenes

Procesamiento de imágenes

Luego, las señales se convierten en números y se informan comoproporciones entre Cy5 y Cy3 para cada punto.

Esta proporción representa los cambios relativos de expresión yrefleja el cambio en la cantidad de ARNm en condicionesexperimentales versus condiciones de control.

Los datos se presentan a menudo como falsos colores dediferentes intensidades de rojo y verde en función de si lasrelaciones están por encima o por debajo de 1 respectivamente.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 32 / 56

Page 33: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Procesamiento de imágenes

Procesamiento de imágenes

Las regiones con cantidades igual de ARNm experimental y decontrol (amarillo en los datos en bruto), se muestran en negro.

Las imágenes en falso color se presentan en cuadros en unamatriz de genes versus condiciones, para que los genesexpresados pueden ser analizados más fácilmente.

Los fabricantes de escáneres de micro-arrays suelen ofrecerprogramas de software para llevar a cabo el análisis de imágenesde micro-arrays. También existe un pequeño número deprogramas de software libre de procesamiento de imágenesdisponibles en Internet.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 33 / 56

Page 34: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Herramientas de procesamiento de imágenes

Herramientas de procesamiento de imágenes

ArrayDB (http://genome.nhgri.nih.gov/arraydb/)

ScanAlyze (http://rana.lbl.gov/EisenSoftware.htm)

TIGR Spotfinder (http://www.tigr.org/softlab/)

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 34 / 56

Page 35: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Transformación y normalización de datos

Transformación y normalización de datos

Tras el procesamiento de imágenes, los datos de expresión degenes digitalizados tienen que ser procesados antes de poderidentificar los genes expresados diferencialmente.

Este proceso se conoce como normalización de los datos y estádiseñado para corregir el sesgo debido a las variaciones en larecopilación de datos de micro-arrays como consecuencia de lasdiferencias biológicas intrínsecas.

Cuando la intensidad de fluorescencia Cy5 se representa frente aCy3, la mayoría de los datos se agrupan cerca de la parte inferiorizquierda del diagrama, que muestra una distribución no normalde los datos en bruto.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 35 / 56

Page 36: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Transformación y normalización de datos

Transformación y normalización de datos

Se cree que esto es un resultado del desequilibrio de intensidadesde rojo y verde durante el muestreo in situ, lo que resulta ineficazen la discriminación de los genes expresados diferencialmente.

La normalización de los datos ofrece una manera mucho másfácil para su comparación y visualización.

A veces, los datos no se ajustan a una relación lineal, debido aerrores de muestreo sistemático. En este caso, una regresión nolineal puede producir un mejor ajuste y ayudar a eliminar el sesgo.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 36 / 56

Page 37: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Transformación y normalización de datos

Diagrama de dispersión del análisis de expresióngénica que muestra el proceso de normalización dedatos.

Intensidad de la señal de fluorescencia de Cy5 frente Cy3.

Los mismos datos después de la transformación a logaritmo debase 2.

Intensidad media logarítmica frente a la relación de las dosintensidades de fluorescencia.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 37 / 56

Page 38: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Transformación y normalización de datos

Herramientas de transformación y normalización dedatos

Los dos programas siguientes están disponibles gratuitamente.Los mismos se especializan en el análisis de imágenes y lanormalización de datos.

Arrayplot(www.biologie.ens.fr/fr/genetiqu/puces/publications/arrayplot/index.html)

SNOMAD(http://pevsnerlab.kennedykrieger.org/snomadinput.html)

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 38 / 56

Page 39: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Análisis estadístico

Análisis estadístico

La única manera de asegurar que un gen que parece estarexpresado diferencialmente lo está realmente es llevando a cabomúltiples experimentos replicados y pruebas estadísticas.

Los experimentos repetidos proporcionan puntos de datosreplicados que ofrecen información sobre la variabilidad de losdatos de expresión en una condición particular.

Para estas pruebas, es común el uso de un nivel de confianza del95 % para distinguir los grupos de datos.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 39 / 56

Page 40: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Análisis estadístico

Análisis estadístico

El principal obstáculo para la obtención de múltiples conjuntos dedatos replicados es el costo: los experimentos de micro-arraysson extremadamente caros para los laboratorios de investigaciónregulares.

Si los conjuntos de datos replicados están disponibles, laspruebas estadísticas rigurosas como ast-test y el análisis de lavarianza (ANOVA) pueden llevarse a cabo para probar la hipótesisnula de que un punto de datos dado no es significativamentediferente de la media de la distribución de los datos.

La información sobre la distribución de los puntos de datos encondiciones particulares puede ayudar a responder a la cuestiónde si la diferencia es significativa.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 40 / 56

Page 41: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Análisis estadístico

Herramientas para el análisis estadístico

MA-ANOVA (www.jax.org/staff/churchill/labsite/software/anova/)

Cyber-T (http://visitor.ics.uci.edu/genex/cybert/)v

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 41 / 56

Page 42: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Clasificación de datos de micro-arrays

Clasificación de datos de micro-arrays

Una de las características clave del análisis de micro-arrays deADN es el estudio de la expresión de muchos genes en paralelo yla identificación de grupos de genes que exhiben patrones deexpresión similares.

Los patrones de expresión similares son a menudo un resultadodel hecho de que los genes implicados están en la misma víametabólica y tienen funciones similares.

Para descubrir los genes con patrones de expresión similares serequiere dividir los datos en subconjuntos de acuerdo a susimilitud.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 42 / 56

Page 43: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Clasificación de datos de micro-arrays

Medidas de distancia

El primer paso hacia la clasificación de genes es definir unamedida de la distancia o diferencia entre los genes.

Esto requiere la conversión de la matriz de la expresión génica enuna matriz de distancia.

La distancia puede ser expresada como la distancia euclidiana oel coeficiente de correlación de Pearson.

La distancia euclidiana está dada por la siguiente fórmula

d =√∑n

i=1(xi − yi)2

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 43 / 56

Page 44: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Clasificación de datos de micro-arrays

Medidas de distancia

Las distancias euclidianas son ampliamente utilizadas perocuando las variaciones entre los genes son muy pequeñas, losperfiles de genes pueden ser muy difíciles de diferenciar.

Como alternativa, se puede utilizar un coeficiente de correlaciónde Pearson entre dos grupos de puntos de datos.

Éste mide la similitud general entre las tendencias o formas de losdos conjuntos de datos.

En esta medida, una correlación positiva perfecta es 1 y unacorrelación negativa perfecta es -1.

d = 1/n∑n

i=1((xi − x)/(sdi))((yi − y)/(sdi))

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 44 / 56

Page 45: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Clasificación de datos de micro-arrays

Clasificación supervisada y no supervisada

En base a las distancias calculadas entre los genes en un perfilde expresión, los genes con patrones de expresión similarespueden ser agrupados.

El análisis de clasificación puede ser con o sin supervisión.

Un análisis supervisado se refiere a la clasificación de los datosen un conjunto de categorías predefinidas.

Un análisis no supervisado no asume categorías predefinidas,pero identifica las categorías de datos de acuerdo a la similitud delos patrones reales.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 45 / 56

Page 46: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Clasificación de datos de micro-arrays

Clasificación supervisada y no supervisada

Los algoritmos de agrupamiento se pueden dividir en dos tipos,aglomerantes y divisivos.

Un método de aglomeración comienza agrupando dos puntos yva fusionando sucesivamente los grupos de datos de acuerdo asu similitud, hasta que se combinan todos los grupos.

Un método de división funciona al revés, agrupando todos lospuntos de datos en un solo grupo y dividiendo sucesivamente losdatos en grupos más pequeños según su diversidad, hasta quese resuelvan todos los niveles jerárquicos.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 46 / 56

Page 47: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Clasificación de datos de micro-arrays

Método de agrupación jerárquico

En un método de agrupación jerárquico se produce unaestructura arbórea que representa una jerarquía.

En las hojas de los árboles se colocan los perfiles de expresiónde genes que están más cerca entre sí.

El patrón de ramificación del árbol ilustra el grado de relaciónentre los grupos de genes relacionados.

Es importante señalar que a pesar de que se produce unaestructura de árbol como resultado final, éste no tiene sentidoevolutivo, sino que simplemente representa las agrupaciones depatrones de similitud en la expresión génica.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 47 / 56

Page 48: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Clasificación de datos de micro-arrays

Método de agrupación k-means

En contraste con los algoritmos de agrupación jerárquica, laagrupación k-means no produce un dendrograma, en su lugarclasifica los datos particionándolos en cada paso. Por lo tanto, esun enfoque de división.

En este método, los datos se dividen en k grupos. El valor de k sedefine normalmente al azar, pero se puede ajustar si losresultados son insatisfactorios.

El patrón de ramificación del árbol ilustra el grado de relaciónentre los grupos de genes relacionados.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 48 / 56

Page 49: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Clasificación de datos de micro-arrays

Método de agrupación k-means

En cada paso del algoritmo los puntos se asignan al azar a cadagrupo y se calcula la media del grupo (centroide). También secalculan las distancia desde cada punto hacia el centroide.

Si se encuentra un punto de datos más cerca del centroide de ungrupo determinado que de cualquier otro centroide, se retiene enla partición. De lo contrario, está sujeto a reasignación en lasiguiente iteración.

Este proceso se repite hasta que las distancias entre los puntosde datos y los nuevos centroides ya no disminuyan.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 49 / 56

Page 50: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Clasificación de datos de micro-arrays

Método de agrupación k-means

El método de k-means puede no ser tan preciso como laagrupación jerárquica, dado que es sensible a la selección delnúmero arbitrario inicial de clústeres.

Si no se consideran todas las particiones iniciales posibles, sepuede alcanzar una solución subóptima.

Sin embargo, computacionalmente hablando, es más rápido quela agrupación jerárquica y sigue siendo ampliamente utilizado.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 50 / 56

Page 51: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Clasificación de datos de micro-arrays

Mapas de auto-organización

Este método es en principio similar al método de k-means. Es unalgoritmo de reconocimiento de patrones que emplea redesneuronales.

Se inicia mediante la definición de un número de nodos. Lospuntos de datos se asignan inicialmente a los nodos al azar. Secalcula la distancia entre los puntos de datos de entrada y loscentroides.

Después de muchas iteraciones, se alcanza un patrón deagrupamiento estabilizado con distancias mínimas de los puntosde datos a los centroides.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 51 / 56

Page 52: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Clasificación de datos de micro-arrays

Mapas de auto-organización

Las diferencias entre SOM (self-organizing mappings) y k-meanses que en SOM los nodos no son tratados como entidadesaisladas, sino que considera las conexiones a otros nodos.

El cálculo de los valores de los centroides de SOM tiene encuenta no sólo la información dentro de cada grupo, sino tambiénla información de grupos adyacentes. Esto permite que el análisissea mejor en el manejo de datos ruidosos.

Este tipo de algoritmo también es mucho más lento que el métodode k-means.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 52 / 56

Page 53: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Enfoque basado en micro-arrays Clasificación de datos de micro-arrays

Programas de agrupamiento

Cluster (http://rana.lbl.gov/EisenSoftware.htm)

EPCLUST (www.ebi.ac.uk/EP/EPCLIST)

TIGR TM4 (www.tigr.org/tm4)

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 53 / 56

Page 54: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Conclusiones

Conclusiones

El análisis de transcriptoma utilizando EST, SAGE y micro-arraysde ADN constituye el núcleo de la genómica funcional y es clavepara la comprensión de las interacciones de los genes y suregulación a nivel de todo el genoma.

El muestreo EST, aunque ampliamente utilizado, tiene una seriede inconvenientes en cuanto a las tasas de errores, la eficiencia yel costo.

El alto rendimiento de SAGE y los enfoques de micro-arrays deADN proporcionan una medida más cuantitativa de la expresióngénica global.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 54 / 56

Page 55: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Conclusiones

Conclusiones

SAGE mide los niveles de expresión de ARNm absolutos,mientras que los micro-arrays indican los niveles de expresiónrelativos del ARNm.

Los micro-arrays de ADN actualmente gozan de mayorpopularidad debido a la relativa facilidad de la experimentación.

Las técnicas de agrupación de datos de micro-arrays máspopulares incluyen la agrupación jerárquica, SOM, y k-means.

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 55 / 56

Page 56: Adanay M Pertello/bioinfo/sesion16.pdf · Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 19 / 56. Enfoque basado en secuencias SAGE Ventajas Si un clon promedio

Conclusiones

Conclusiones

En conclusión, entre las tres técnicas para el estudio de laexpresión génica global, la más popular es micro-arrays de ADN,el cual tiene la capacidad de proporcionar información que no esposible con las técnicas tradicionales.

Sin embargo, también hay que ser conscientes de suslimitaciones.

Esta técnica es un procedimiento de múltiples etapas en queerrores y sesgos se pueden introducir en cada paso(secuenciación, procesamiento de imágenes, normalización, yelección del método de clasificación).

Adanay MARTÍN P. (CINVESTAV) Genómica funcional 1 de agosto del 2013 56 / 56