1 genoma mitocondrial completo del chigüiro hydrochoerus

35
1 Genoma mitocondrial completo del chigüiro Hydrochoerus hydrochaeris 1 obtenido a partir de las tecnologías de ensamblaje de nueva generación 2 DISCOVAR de novo y datos Hi-C. 3 4 Juanita Herrera Torres 1* , Santiago Herrera Álvarez 1 , Andrew J. Crawford 1,2 5 1 Departamento de Ciencias Biológicas, Facultad de Ciencias, Universidad de los Andes, 6 A.A. 4976, Bogotá D.C., Colombia. 7 2 Museo de Historia Natural ANDES, Departamento de Ciencias Biológicas, Facultad de 8 Ciencias, Universidad de los Andes, Bogotá D.C., Colombia. 9 10 * [email protected] 11 12

Upload: others

Post on 25-Oct-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

1

Genoma mitocondrial completo del chigüiro Hydrochoerus hydrochaeris 1

obtenido a partir de las tecnologías de ensamblaje de nueva generación 2

DISCOVAR de novo y datos Hi-C. 3

4

Juanita Herrera Torres 1*, Santiago Herrera Álvarez1, Andrew J. Crawford 1,2 5

1 Departamento de Ciencias Biológicas, Facultad de Ciencias, Universidad de los Andes, 6

A.A. 4976, Bogotá D.C., Colombia. 7

2 Museo de Historia Natural ANDES, Departamento de Ciencias Biológicas, Facultad de 8

Ciencias, Universidad de los Andes, Bogotá D.C., Colombia. 9

10

* [email protected] 11

12

Page 2: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

2

Genoma mitocondrial del chigüiro Hydrochoerus hydrochaeris obtenido a 13

partir de las tecnologías de ensamblaje de nueva generación DISCOVAR 14

de novo y datos Hi-C. 15

16

Resumen 17

El chigüiro (Hydrochoerus hydrochaeris) es el roedor viviente más grande del planeta y es 18

endémico de Suramérica. Este estudio utilizó la tecnología de secuenciación de nueva 19

generación DISCOVAR de novo del Broad Institute y datos Hi-C obtenidos a partir del 20

método bibliotecas ChicagoTM de Dovetail Genomics, para obtener el genoma nuclear y 21

mitocondrial (mt) de este roedor. El contig donde se encontró el genoma mt de H. 22

hydrochaeris tenía una longitud de 17,347 pares de bases (pb) pero hasta el momento solo 23

15,735 pb han sido anotados. El contenido de GC del contig fue de 38.8 %. La estructura, 24

organización y orientación de los genes mt de H. hydrochaeris es similar a la del genoma 25

mt de Cavia porcellus (Cuy) y a la de la mayoría de mito-genomas de mamíferos, los cuales 26

contienen 37 genes: 2 genes de ARN ribosomal (ARNr), 13 genes codificantes para 27

proteínas, 22 genes de ARN de transferencia (ARNt), un origen de replicación de la cadena 28

ligera y una región control (D-Loop). Sin embargo, la longitud del 12S y el D-Loop del 29

genoma de H. hydrochaeris no han sido determinadas del todo. A partir de los trece genes 30

codificantes para proteínas del genoma mt de H. hydrochaeris y doce especies de roedores, 31

se generó un árbol filogenético por inferencia Bayesiana a partir del cual se determinó que 32

el tiempo de divergencia del ancestro común de H. hydrochaeris y C. porcellus es de 19 33

millones de años (Ma). 34

35

Palabras clave: Hydrochoerus hydrochaeris, Rodentia, Caviidae, chigüiro, genoma 36

mitocondrial, ADNmt, análisis estructural, filogenética. 37

Page 3: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

3

38

Abstract 39

The capybara (Hydrochoerus hydrochaeris) is the biggest rodent in the world and is 40

endemic of South America. This study used the next-generation sequencing (NGS) 41

technologies DISCOVAR de novo from Broad Institute and Hi-C data obtained with the 42

Chicago LibraryTM method from the Dovetail Genomics, in order to obtain the nuclear and 43

mitochondrial (mt) genomes of this rodent. The contig containing the mt genome of H. 44

hydrochaeris had a length of 17,347 base pairs (bp) and we were able to annotate 15,735 45

pb. The GC content of this fragment was 38.8%. The structure, organization and orientation 46

of the mt genes are very similar to the mt genome of Cavia porcellus (Guinea Pig) and most 47

other mammalian mitogenomes, containing 37 genes: 2 ribosomal RNAs (rRNAs), 13 48

protein-coding genes, 22 transfer RNAs (tRNA), origin of replication of L-strand and 49

control region (D-Loop). However, the length of 12S and D-Loop of the H. hydrochaeris 50

genome have not been completely determined. With the thirteen protein-coding genes of H. 51

hydrochaeris and twelve species of rodent, a phylogenetic tree was generated using 52

Bayesian inference and it was determined that the divergence time of the common ancestor 53

of H. hydrochaeris and C. porcellus was 19 million years ago (My). 54

55

Introducción 56

El chigüiro (Hydrochoerus hydrochaeris) pertenece al orden Rodentia y a la familia 57

Caviidae. Es una especie endémica de Sudamérica que se encuentra distribuida desde los 58

llanos venezolanos hasta la boca del río de la plata en Argentina (Mesa González & López 59

Arévalo, 2014; Moreira et al., 2013). En la actualidad, los chigüiros son los roedores más 60

grandes del mundo, su cuerpo puede alcanzar 1.5 m de largo y 0.70 m de altura a la cruz. El 61

peso de los individuos adultos varia entre 40 y 80 kilogramo (kg), dependiendo de la 62

Page 4: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

4

alimentación y la zona que habita, ya que la masa corporal de estos animales se incrementa 63

hacia el sur del continente, siendo los del sur de Brasil y Argentina los que alcanzan un 64

mayor tamaño (Mesa González & López Arévalo, 2014; Sarango V, Ordoñez, Noboa, & 65

Valladares, 2011). Generalmente esta especie habita ecosistemas semi-acuáticos de tierras 66

bajas como sabanas inundables, bosques riparios y esteros (Moreira et al., 2013). Su dieta 67

es estrictamente herbívora y la eficiencia de producción de carne por kg es 2.6 veces mayor 68

que la del ganado vacuno (Giraldo Hernández & Ramírez Perilla, 2001), lo que hace a estos 69

roedores un eslabón clave de la cadena trófica en sus ecosistemas y un recurso económico 70

importante para las poblaciones humanas con las que habita (Aldana Domínguez et al., 71

2007. pág 13-14). 72

A la fecha, la información genética disponible de H. hydrochaeris en el Centro 73

Nacional para la Información Biotecnológica (NCBI) es reducida. A pesar de que H. 74

hydrochaeris es la especie más abundante de mamíferos herbívoros en los ecosistemas de 75

sabanas inundables (Correa Ospina & García Pinzón, 2014), y es considerada una especie 76

con una importancia económica elevada, el conocimiento que se tiene acerca de la 77

estructura y diversidad genética de esta especie es mínimo (Sánchez Isaza & Jiménez 78

Robayo, 2014). Por tal razón, se planteó generar un aporte al entendimiento de la genética 79

de H. hydrochaeris, a partir del uso de nuevas tecnologías de secuenciación para la 80

obtención de su genoma nuclear y mitocondrial (mt). 81

Pero, ¿Por qué el genoma mitocondrial?. La mitocondria es una estructura 82

subcelular presente en todas las células eucariotas, en donde se llevan a cabo varios 83

procesos metabólicos cruciales para el funcionamiento celular (Yoon, Koob, & Yoo, 2010). 84

El principal proceso que se lleva a cabo dentro de este orgánulo es la producción de energía 85

química, también conocida como ATP, el cual es obtenido a partir de la fosforilación 86

Page 5: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

5

oxidativa (Bernt, Braband, Schierwater, & Stadler, 2013; Boore, 1999; Taanman, 1999). 87

Otros de los proceso en los cuales está involucrada la mitocondria son la autorregulación de 88

la destrucción celular (apoptosis), la producción de sustancias como el colesterol y el grupo 89

hemo de la hemoglobina, algunas enfermedades metabólicas y el envejecimiento (Boore, 90

1999; Crimi & Rigolio, 2008; Susin et al., 1999; Wang, 2001; Wolstenholme, 1992). La 91

mitocondria de los metazoa contiene su propio material genético (ADNmt), el cual es 92

varios órdenes de magnitud más corto que el genoma nuclear (ADNn) ya que generalmente 93

tiene un tamaño aproximado de 15-20 kilo-bases (kb), tiene un contenido de genes 94

altamente conservado y se hereda únicamente por la línea germinal materna en la mayoría 95

de animales (Boore, 1999; Crimi & Rigolio, 2008; Malka, Lombès, & Rojo, 2006; 96

Taanman, 1999). Además, el ADNmt tiene una tasa de mutación aproximadamente 10 97

veces mayor que la del ADNn (Brown, George, & Wilson, 1979; Crawford, 2003; Correa 98

Ospina & García Pinzón, 2014; Malka et al., 2006) por lo que es ampliamente utilizado en 99

las reconstrucciones filogenéticas, filogeografía y la inferencia de las historias de vida de 100

las poblaciones de las cuales se estudia su ADNmt (Avise et al., 1987; Harrison, 1989; 101

Tomasco & Lessa, 2011). 102

Por medio de la unión de dos tecnologías de nueva generación, la primera del Broad 103

Institute la cual consiste en bibliotecas Ilumina paired end mas su algoritmo de ensamblaje 104

DISCOVAR de novo, y la segunda implementada por la compañía Dovetail Genomics 105

usando su método de bibliotecas ChicagoTM, la cual usa datos Hi-C basados en ligación y 106

secuenciación de segmentos de ADN cercanos en un cromosoma para obtener información 107

sobre distancia física entre fragmentos de ADN previamente secuenciados (Korbel and Lee, 108

2013). Con estos datos, se obtuvo un ensamblaje consenso, producto de ambas tecnologías, 109

que contenía el genoma nuclear y mt de H. hydrochaeris. 110

Page 6: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

6

El objetivo principal de este estudio fue evaluar la calidad de estas tecnologías de 111

secuenciación de nueva generación como recurso para la obtención de información del 112

ADNmt; para esto se planteó realizar la caracterización del genoma mt de H. hydrochaeris. 113

Como segundo objetivo, se espera que el genoma mt de H. hydrochaeris brinde 114

información de la variabilidad genética de la especie y pueda ser utilizado como una 115

herramienta a futuro en el planteamiento de procedimientos adecuados para el manejo 116

sostenible y conservación de esta especie insignia de la Orinoquía. 117

118

Materiales y métodos 119

Secuenciación, ensamblaje y calidad del genoma 120

El Broad Institute secuenció el genoma completo de H. hydrochaeris. La muestra 121

para esta secuenciación fue tomada de una hembra del San Diego Zoo, California. El 122

método de ensamblaje utilizado por el Broad Institute llamado DISCOVAR de novo, 123

requiere únicamente como entrada reads de Illumina de un tamaño de 250 pares de bases 124

(pb) provenientes de una biblioteca paired end libre de PCR. Este nuevo método de 125

ensamblaje a partir de pequeñas regiones provee información muy completa y continua, lo 126

que optimiza la calidad de los ensamblajes obtenidos (Computational Research and 127

Development Group, 2013; Jaffe, 2013). 128

Posteriormente, para mejorar el primer ensamblaje obtenido por la tecnología 129

DISCOVAR de novo, se aplicó el método de bibliotecas ChicagoTM de la compañía Dovetail 130

Genomics, el cual utiliza secuencias cortas provenientes de experimentos Hi-C para obtener 131

información de largo alcance. Finalmente los contigs del Broad Institute fueron 132

combinados con los datos Hi-C y ensamblados utilizando el software HiRiseTM pipeline. 133

Este programa utiliza tres entradas: la primera un borrador del genoma en formato FASTA, 134

Page 7: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

7

la segunda las secuencias cortas obtenidas de las bibliotecas shotgun en formato FASTQ y 135

la tercera las secuencias de las bibliotecas ChicagoTM en formato FASTQ. El software 136

HiRiseTM pipeline de Dovetail Genomics mejora los ensamblajes debido a que ordena y 137

orienta los contigs en scaffolds pequeños, mapea las bibliotecas ChicagoTM en el 138

ensamblaje de entrada para borrar posibles uniones erróneas en el ensamblaje y llena los 139

huecos que se generan entre contigs, al construir los scaffolds con las secuencias pequeñas 140

obtenidas de la secuenciación por shotgun (Dovetail Genomics, 2015). 141

Como resultado de la unión de estas dos tecnologías (DISCOVAR de novo + 142

bibliotecas ChicagoTM, lo que se ha llamado “DISCO-Dove” ) se obtuvo un ensamblaje 143

final, al que se le analizó la calidad por medio de la herramienta QUAST del Centro de 144

biotecnología algorítmica (CAB) de la Universidad Estatal de San Petersburgo, Rusia 145

(Gurevich, Saveliev, Vyahhi, & Tesler, 2013). 146

147

Búsqueda genoma mitocondrial 148

Una vez se obtuvo el genoma completo del chigüiro, se planteó buscar la presencia 149

del genoma mitocondrial (mt) dentro de este. Lo primero que se hizo para identificar el 150

genoma mt, fue realizar un BLASTn (https://blast.ncbi.nlm.nih.gov/Blast.cgi ) utilizando 151

como entrada 17 secuencias de genes mt de H. hydrochaeris disponibles en GenBank 152

(Tabla 1) y como base de datos el archivo FASTA del genoma completo del chigüiro. 153

Posteriormente, se realizó un segundo BLASTn para identificar el contig donde se 154

encontraba el genoma mt del chigüiro, con el genoma mt de C. porcellus (Cuy; GenBank 155

ID AJ222767.1) como base de datos y las secuencias de los contigs determinados a partir 156

del primer BLASTn como entrada. Finalmente, se realizó una búsqueda de genes mt dentro 157

del contig identificado a partir del segundo BLASTn, esto con el propósito de confirmar 158

Page 8: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

8

definitivamente que allí se encontraba el genoma mt. Este tercer BLASTn, se realizó con los 159

37 genes mt anotados de C. porcellus cada uno por separado (2 RNAr, 22 RNAt y 13 genes 160

codificantes para proteínas), las 17 secuencias de genes mt de H. hydrochaeris (Tabla 1) y 161

la secuencia del contig como base de datos. 162

163

Anotación genoma mitocondrial (ADNmt) 164

La identificación de la presencia, posiciones, longitudes y orientación de los genes 165

mt en el genoma de H. hydrochaeris se llevó a cabo con el servidor de anotación de 166

genomas mitocondriales (MITOS). Un pipeline de libre acceso, totalmente automático, 167

especializado en la anotación de novo de genomas mitocondriales de metazoa (Bernt, 168

Donath, et al., 2013) (http://mitos.bioinf.uni-leipzig.de/index.py). La información obtenida a 169

partir de MITOS fue anotada en el software Geneious 8.1.3 (Kearse et al., 2012). Por 170

último, se verificó que los genes mt anotados fueron funcionales y tuvieran una 171

composición similar a la de otros roedores filogenéticamente cercanos, a partir del 172

alineamiento múltiple de los genes mt de H. hydrochaeris, doce especies de roedores y 173

Oryctolagus cuniculus (conejo común, como outgroup; Tabla 2). Los alineamientos de 174

estos genes se hicieron en Geneious 1.8.3 que utiliza como programa de alineamiento 175

MUSCLE (Edgar, 2004). El número de iteraciones utilizadas para estos alineamientos fue 176

de 500 para cada comparación. 177

La posición del origen de replicación de la hebra ligera (hebra-L) en el genoma mt 178

de H. hydrochaeris se determinó por la posición del grupo de cinco ARNt entre el 3’ de 179

NADH2 y el 5’ de COI, donde generalmente se ubica esta región en la gran mayoría de 180

genomas mt de mamíferos (Taanman, 1999). Por otra parte, la región control (D-Loop) se 181

determinó por el alineamiento obtenido a partir de un BLAST entre la secuencia del D-Loop 182

Page 9: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

9

de C. porcellus y el contig identificado del segundo BLASTn (ver: Búsqueda genoma 183

mitocondrial). 184

185

Construcción árbol filogenético por inferencia Bayesiana 186

Para determinar el tiempo de divergencia del grupo compuesto por H. hydrochaeris 187

y C. porcellus se construyó un árbol filogenético por inferencia Bayesiana a partir de los 188

alineamientos múltiples de los trece genes codificantes para proteínas (NADH1, NADH2, 189

NADH3, NADH4, NADH4L, NADH5, NADH6, COI, COII, COIII, ATPasa 6, ATPase 8 y 190

CYTB) de H. hydrochaeris, doce especies de roedores y O. cuniculus (conejo común), el 191

cual se escogió como outgroup debido a que pertenece al orden de los lagomorfos y no al 192

orden Rodentia. Posteriormente, se concatenaron los trece alineamientos múltiples en un 193

solo archivo, el cual se utilizó para construir un árbol de máxima verosimilitud por RAxML 194

8.2.9 (Stamatakis, 2014) en el que se utilizó un modelo GTRGamma y 100 iteraciones de 195

bootstrap. 196

El árbol obtenido por máxima verosimilitud se utilizó como soporte para la construcción de 197

un árbol por inferencia Bayesiana (BEAST v1.8.0; Drummond & Rambaut, 2007). Se 198

generó un archivo en BEAUti v1.8.0 en el que se especificaron los nodos de calibración, el 199

primero Ratones: Mus musculus y Rattus rattus, con una edad de 20.9 Ma, el segundo 200

Roedores: C. porcellus, Chinchilla lanigera, Ctenomys leucodon, Ct. sociabilis, H. 201

hydrochaeris, M. musculus, Octodon degus, Proechimys longicaudatus, R. rattus, 202

Spalacopus cyanus, Sphiggutus insidiosus, Trinomys dimidiatus y Tympanoctomys 203

barrerae, con una edad de 73 Ma y el tercero Caviomorpha: C. porcellus, Ch. lanigera, Ct. 204

leucodon, Ct. sociabilis, H. hydrochaeris, O. degus, P. longicaudatus, Sp. cyanus, Sph. 205

insidiosus, Tr. dimidiatus y Ty. barrerae, con una edad de 36 Ma. Los tres taxones fueron 206

Page 10: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

10

considerados como monofiléticos y las edades fueron determinadas por fósiles (Hedge, 207

Dudley, & Kumar, 2006; Hedges, Marin, Suleski, Paymer, & Kumar, 2015) 208

(http://www.timetree.org). Se escogió un modelo evolutivo de sustitución: GTR, un modelo 209

de calibración: reloj relajado lognormal, un proceso de especiación con un prior Yule y la 210

distribución escogida para los tres priors en edad de nodo fue uniforme. Las edades para la 211

distribución de Ratones: upper 23.4 y lower 18.3; para Roedores: upper 79 y lower 67 y 212

para Caviomorpha: upper 38 y lower 33. Este análisis se corrió con 100,000,000 213

generaciones y se especificó que recogiera datos cada 1,000 generaciones. El Burnin 214

utilizado en TreeAnnotator v1.8.0 fue 1001 árboles y el límite de probabilidad posterior 0.7. 215

216

Resultados y discusión 217

Secuenciación, ensamblaje y calidad del genoma completo 218

Se obtuvo un ensamblaje final a partir de la unión de los ensamblajes DISCOVAR 219

de novo del Broad Institute y el obtenido con los datos Hi-C de Dovetail Genomics, que 220

midió 2.59 Gb incluyendo los espacios entre contigs dentro de los scaffolds. Este valor se 221

comparó con el de la especie filogenéticamente más cercana con disponibilidad de su 222

genoma nuclear y mitocondrial completos en GenBank que es Cavia porcellus (Cuy), y se 223

observó que los genomas de estas dos especies, tienen tamaños muy similares, debido a que 224

el ensamblaje del genoma completo de C. porcellus provisto por el Broad Institute y 225

reportado en e!Ensembl (http://www.ensembl.org/Cavia_porcellus/Info/Annotation) mide 226

2.72 Gb incluyendo los espacios entre contigs dentro de los scaffolds. Por otra parte, se 227

evaluó la calidad del ensamblaje por medio de la herramienta QUAST (Gurevich et al., 228

2013) y se obtuvo un contig N50 de 12.8 megabases (Mb) y un contenido de Guanina-229

Citocina (GC) de 39.79 %. 230

Page 11: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

11

231

Búsqueda del genoma mitocondrial 232

A partir del primer BLASTn, en el que se utilizaron 17 secuencias de genes mt de H. 233

hydrochaeris obtenidas de GenBank (Tabla 1) contra el genoma completo del chigüiro 234

obtenido, se identificaron 20 posibles contigs donde se podría encontrar el genoma mt. De 235

estos 20 contigs se descartaron 11 debido a que tenían un tamaño mayor a 68,000 pb (Tabla 236

3), lo que es 4 veces un genoma mt de un tamaño promedio de 17,000 pb. 237

Con las secuencias de los 9 contigs que quedaron de este primer BLASTn y el 238

genoma mt completo de C. porcellus como base de datos, se hizo un segundo BLASTn en el 239

que se obtuvo un alineamiento de 15,011 pb con un porcentaje de identidad de 81.4 % con 240

el contig identificado como Sceky8L_11183, el cual tenía un tamaño total de 19,929 pb. El 241

tamaño de este alineamiento y de este contig eran cercanos al tamaño esperado para el 242

genoma mt del chigüiro, el cual era aprox. 16,800 pb con base en el tamaño del genoma mt 243

de C. porcellus que es de 16,801 pb. 244

El tercer BLASTn tenía como objetivo confirmar que en el contig Sceky8L_11183 se 245

encontraba el genoma mt, razón por la cual utilizamos las 17 secuencias de los genes mt de 246

chigüiro (Tabla 1) y las 37 secuencias de los genes mt anotados de C. porcellus contra la 247

secuencia del contig. Como resultado se encontraron 14 genes mt: 2 RNAr (12S parcial y 248

16S completo), 8 ARNt completos (los que corresponden a valina, metionina, cisteína 249

complementario, serina complementario, histidina, serina 1, leucina 1, ácido glutámico 250

complementario), 4 genes codificantes (COI parcial, NADH4 completo, NADH5 completo 251

y CYTB completo) y una parte de la región control (498 pb), lo que confirmó que este 252

contig corresponde al genoma mt de H. hydrochaeris. 253

254

Page 12: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

12

Anotación y composición del genoma mitocondrial 255

El contig Sceky8L_11183 donde se encontró el genoma mt de H. hydrochaeris mide 256

19,929 pb y es el resultado de la unión de tres contigs más pequeños, esto se evidenció 257

debido a que el contig tiene tres bloques de ácidos nucleicos unidos por dos grupos de 100 258

pares de bases (pb) designados con la letra N. Los bloques miden 2,482 pb, 15,852 pb y 259

1,396 pb. Las 100 pb de N´s son secuencias cortas utilizadas en el ensamblaje para la 260

construcción de contigs grandes a partir de contigs más pequeños. A partir de los resultados 261

obtenidos por MITOS, el BLASTn en el que se utilizaron 17 secuencias parciales de genes 262

mt de H. hydrochaeris, las secuencias de los 37 genes mt de C. porcellus y una búsqueda 263

general en la base de datos NCBI, se dilucidó que el primer contig no hacía parte del 264

genoma mt, por lo que únicamente se trabajó con las 17,347 pb siguientes a este primer 265

contig que fue descartado. Este nuevo contig de 17,347 pb tiene un contenido de GC de 266

38.8%, lo que es muy parecido a la longitud y contenido de GC de mamíferos, 267

específicamente de doce especies de roedores y el conejo común (Tabla 4). 268

La composición y organización del genoma mt de H. hydrochaeris es muy similar a 269

la de la mayoría de mito genomas de mamíferos, 13 genes codificantes para proteínas, 22 270

RNA de transferencia (ARNt), 2 ARN ribosomales (ARNr), una región de origen de 271

replicación de la hebra ligera (hebra-L) y una región control conocida como D-Loop 272

(Figura 1 y Tabla 5). La mayoría de genes están codificados en la cadena pesada, 273

únicamente NADH6 y 8 ARNt son codificados por la cadena ligera. Al comparar el 274

genoma mt de H. hydrochaeris con el genoma mt de C. porcellus (ID AJ222767.1; Figura 275

2), se observó que la estructura general del genoma mt de H. hydrochaeris es similar a la de 276

C .porcellus, pero la longitud del 12S y el D-Loop anotados hasta el momento es más corta 277

(Figura 2a y 2b). 278

Page 13: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

13

279

Genes codificantes para proteínas 280

El genoma mt de H. hydrochaeris contiene los trece genes codificantes para 281

proteínas (ARN mensajero, ARNm) que generalmente tiene todos los genomas mt de 282

mamíferos: NADH1, NADH2, NADH3, NADH4, NADH4L, NADH5, NADH6, COI, 283

COII, COIII, ATPasa 6, ATPasa 8 y CYTB (Figura 1, Tabla 5). Los trece genes 284

codificantes para proteínas tienen una longitud, orden y orientación similar a los genes mt 285

de C. porcellus (Figura 2). Diez de estos genes (NADH1, COI, COII, ATPasa 8, ATPasa 6, 286

COIII, NADH4L, NADH4, NADH6 y CYTB) tienen como codón de inicio ATG, los genes 287

NADH2 y NADH5 su codón de inicio es ATT y el de NADH3 es ATC (Tabla 5). Estos tres 288

codones (ATG, ATT y ATC) se han reportado como codones de inicio para mamíferos 289

(Wolstenholme, 1992, p. 188). El marco de lectura de NADH1, NADH2, COI, NADH5, y 290

NADH6 terminan con el codón TAG, el de COII, ATPasa 6, ATPasa 8 y NADH4L finaliza 291

con TAA y el de CYTB con AGA (Tabla 5). Estos tres codones (TAG, TAA y AGA) son 292

codones de parada para en el genoma mt de otros mamíferos (Wolstenholme, 1992, p. 188). 293

El codón final de NADH3 es TA y el de COIII y NADH4 es una T (Tabla 5), estos codones 294

de terminación incompletos son comunes en los ARNm de los metazoa, debido a que la 295

poliadenilación de los ARNm mitocondriales se lleva a cabo en su extremo 3’ después de la 296

transcripción, lo que genera el codón de terminación TAA, el cual es un codón de parada 297

(Bibb, Van Etten, Wright, Walberg, & Clayton, 1981, p. 175; Montoya & Attardi, 1986; 298

Wolstenholme, 1992, p. 188). 299

Dentro de los genomas mt de vertebrados se observa que algunos genes codificantes 300

para proteínas se superponen, generalmente esto ocurre en genes que están codificados en 301

cadenas opuestas como es el caso de NADH5 y NADH6, los cuales están superpuestos en 302

Page 14: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

14

el genoma mt de H. hydrochaeris por 4 pb. No obstante, existen dos casos reportados en 303

genomas mt de vertebrados que involucran genes que están codificados en la mismas 304

cadena y se superponen, el primero es ATPasa 8 y ATPasa 6 los cuales presentan una 305

superposición de 2 a 46 pb y en el genoma mt de H. hydrochaeris se solapan por 43 pb. Y 306

el segundo caso, es el de NADH4L y NADH4 que generalmente presenta una 307

superposición de 7 pb y en el genoma mt de H. hydrochaeris se solapan por 7 pb 308

(Wolstenholme, 1992, p. 182). 309

A partir del alineamiento múltiple de cada uno de los trece genes codificantes para 310

proteínas, se evidenció que las secuencias de ácidos nucleicos de COII presenta dos gaps en 311

las posiciones 114 y 115 del gen y COIII cuatro gaps en las posiciones 558 a 561 de la 312

secuencia del gen. Posiblemente estos gaps provengan de errores de secuenciación, por lo 313

que se planea realizar un mapeo de todos los reads relacionados con el contig 314

Sceky8L_11183 y de este modo analizar la cobertura de estas posiciones específicamente. 315

316

Genes de ARN de transferencia 317

La información de los ARNt está resumida en la Figura 1 y la Tabla 5. El 318

mitogenoma de H. hydrochaeris codifica veintidós ARNt, de los cuales ocho (Gln, Ala, 319

Asn, Cys, Tyr, Ser2 [TGA], Glu y Pro) son codificados por la cadena ligera, los otros 320

catorce ARNt son codificados por la cadena pesada. La longitud de estos genes está entre 321

58 pb (ARNtSer 1) y 74 pb (ARNtLeu 2). 322

Comúnmente los genomas mt del orden Rodentia y de los vertebrados en general, 323

presentan tres conjuntos de ARNt altamente conservados IQM, WANCY y HSL (Oh et al., 324

2007; Oh et al., 2011). El genoma mt de H. hydrochaeris posee los tres, el primero IQM se 325

encuentra entre el extremo 3’ de NADH1 y el extremo 5’ de NADH2: Isoleucina (I) 68 pb, 326

Page 15: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

15

glutamina (Q) 70 pb y metionina (M) 68 pb, el segundo WANCY, esta entre el extremo 3’ 327

de NADH2 y el extremo 5’ de COI: triptófano (W) 69 pb, alanina (A) 68 pb, asparagina 328

(N) 72 pb, cisteína (C) 66 pb y tirosina (Y) 68 pb, y el tercer grupo HSL se encuentra entre 329

el extremo 3’ de NADH4 y el extremo 5’ de NADH5: histidina (H) 68 pb, serina 1 (S1) 58 330

pb y leucina 1 (L1) 68 pb. 331

Dentro de los ARNt del genoma mt de H. hydrochaeris, se identificaron dos formas 332

para los aminoácidos: serina (ARNtSer1 (GCT) y ARNtSer2 (TGA)) y para leucina (ARNtLeu1 (TAG) 333

y ARNtLeu2 (TAA)), estas dos formas de serina y leucina, que tienen diferente anticodón, son 334

comunes en la mayoría de mito genomas de vertebrados (Boore, 1999). 335

Por otra parte, el ARNt que está ubicado después del 3’ del gen NADH3 presente el 336

mismo anticodón que el ARNt que va después del 3’ del gen NADH2, lo que podría sugerir 337

que el genoma mt H. hydrochaeris presenta dos ARNtTrp. Generalmente los genomas mt de 338

vertebrados, y específicamente el genoma mt de C. porcellus, presenta después del 3’ de 339

NADH3 un ARNtArg (Figura 2c). Para verificar la veracidad de esta observación, se 340

realizaron 3 alineamientos múltiples (Figura 3) en el primero se compararon las secuencias 341

de los ARNt que van después de NADH2 del chigüiro y 13 especies de mamíferos (Figura 342

3A), en el segundo se alinearon las secuencias del ARNt que va inmediatamente después de 343

NADH3 (en las mismas 14 especies, Figura 3B) y en el tercero se compararon las 344

secuencias de los dos ARNtTrp de H. hydrochaeris (Figura 3C). A partir de estos 345

alineamientos se determinó que la secuencia del segundo ARNtTrp de H. hydrochaeris es 346

más parecida a las secuencias del ARNtArg que se encuentra en esta misma posición, que al 347

primer ARNtTrp del mismo genoma. Por otra parte se realizaron tres comparaciones de las 348

secuencias de los ARNt por medio de BLAST para verificar el porcentaje de similitud entre 349

las secuencias. La primera comparación se hizo entre el segundo ARNtTrp de H. 350

Page 16: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

16

hydrochaeris y la secuencia ARNtArg de C. porcellus, la segunda entre la secuencia de 351

ARNtTrp de H. hydrochaeris y el ARNtTrp de C. porcellus y la tercera entre los dos ARNtTrp 352

de H. hydrochaeris. Como resultados de estas comparaciones se obtuvo un porcentaje de 353

similitud para ARNtTrp de H. hydrochaeris vs. ARNtArg de C. porcellus del 84%, para 354

ARNtTrp de H. hydrochaeris vs. ARNtTrp de C. porcellus del 90% y para ARNtTrp1 de H. 355

hydrochaeris vs ARNtTrp2 de H. hydrochaeris no se encontró una similitud significativa. Al 356

unir los resultados de ambos análisis se confirma que este segundo ARNtTrp en el genoma 357

de H. hydrochaeris proviene del ARNtArg y no del primer ARNtTrp, es decir este segundo 358

ARNtTrp no es una duplicación del primer ARNtTrp. sino más bien es un error de 359

secuenciación o ensamblaje que causó la variación en el tercer ácido nucleico del anticodón 360

del ARNt, lo que origina un cambio en el aminoácido que no es real. Por esta razón es 361

necesario confirmar la secuencia de este ARNt a partir del mapeo de los reads relacionados 362

con el contig Sceky8L_11183 para observar su cobertura y/o amplificar por PCR y 363

secuenciar por método Sanger la región específica donde se encuentra este ARNt. 364

365

Genes de ARN ribosomal (ARNr) 366

El genoma mt de H. hydrochaeris codifica para dos ARNr, 12S y 16S. El gen 12S 367

está ubicado entre los ARNtPhe y el ARNtVal y mide 757 pb, el gen 16S está ubicado entre el 368

ARNtVal y el ARNtleu 2 y mide 1,567 pb (Figura 1 y Tabla 5). La ubicación y orientación de 369

estos dos genes en el genoma mt de H. hydrochaeris, es la misma reportada en la estructura 370

común de los genomas mt de vertebrados (Boore, 1999; Cao & Xia, 2015; D. Oh et al., 371

2011; Wolstenholme, 1992). Al comparar la longitud de estos dos genes en doce especies 372

de roedores y el conejo común (Tabla 6), la longitud del gen 12S está entre 943 pb (C. 373

porcellus) y 962 pb (S. insidiosus) y la longitud del 16S está entre 1,555 (C. lanigera) y 374

Page 17: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

17

1,582 pb (M. musculus). Es decir, la longitud del 16S de H. hydrochaeris es muy similar a 375

la de los otros mamíferos comparados. Sin embargo el 12S de H. hydrochaeris (anotado 376

hasta el momento) es más corto; específicamente al comparar la longitud del 12S de C. 377

porcellus que mide 943 pb, el 12s de H. hydrochaeris es 186 pb más corto (Figura 2a). 378

Además antes del 5’ del 12S hay 401 pb que aún no han sido identificadas. Por estas 379

razones, se plantea que la anotación del 12S de H. hydrochaeris aun no está determinada 380

del todo y es necesario estudiar y dilucidar su longitud real. Para este fin, se plantea 381

nuevamente mapear los reads relacionados con el contig Sceky8L_11183 para observar la 382

cobertura del gen y/o amplificar por PCR y secuenciar por método Sanger la región del 12S 383

en H. hydrochaeris. 384

385

Secuencias no codificantes 386

El origen de replicación de la cadena ligera (hebra-L) del genoma mt de H. 387

hydrochaeris mide 35 pb y se encuentra entre los ARNtAsn (N) y ARNtCys (C). La posición 388

de este origen de replicación se encuentra en la mitad del grupo de 5 ARNt conocido como 389

WANCY, lo cual es consistente con lo reportado para genomas mt de vertebrados (Bernt, 390

Braband, et al., 2013; Fernández Silva, Enriquez, & Montoya, 2003; Taanman, 1999). La 391

región control (D-Loop), determinada hasta el momento mide 498 pb y está entre el 392

ARNtPro y el ARNtPhe, lo que coincide con la ubicación del D-Loop en la mayoría de 393

genomas mt de vertebrados (Taanman, 1999, p. 106; Wolstenholme, 1992, p. 201). Sin 394

embargo, se piensa que esta región es más larga debido a que aún no se ha determinado la 395

identidad de 360 pb ubicadas entre ARNtPro y el lugar de inicio del D-Loop anotado, y 498 396

pb ubicados entre el final del D-Loop anotado y el ARNtPhe (Figura 2b); Es necesario 397

resaltar que entre las primeras 360 pb que no han sido identificadas, las últimas 100 pb son 398

Page 18: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

18

N´s, las cuales corresponden a las secuencias cortas de unión entre contigs. Si la secuencia 399

de ácido nucleicos entre ARNtPro y el ARNtPhe corresponden en su totalidad al D-Loop, el 400

chigüiro H. hydrochaeris tendría una región control de un tamaño de 1,256 pb, longitud 401

muy similar al D-Loop de C. porcellus el cual mide 1,356 pb. 402

403

Regiones sin identificar dentro del genoma mitocondrial 404

El contig donde se encontró el genoma mt de H. hydrochaeris mide 17,347 pb y 405

hasta el momento se tienen anotadas 15,735 pb, es decir aprox. 1,612 pb aún no han sido 406

identificadas. El primer bloque que no ha sido identificado, son las primeras 401 pb de la 407

secuencia del genoma mt que están antes del 5’ del ARNr 12S. El segundo bloque mide 408

355 pb y está ubicado entre el ARNtPro y el inicio de la anotación del D-Loop, dentro de 409

estas 355 pb, 100 pb de bases son N´s. El tercer bloque esta ubicado entre la cola del D-410

Loop y el ARNtPhe y mide 499 pb. El cuarto bloque y último, mide 331 pb y está ubicado 411

entre el ARNtPhe y el final de la secuencia del genoma. 412

413

Árbol filogenético por inferencia Bayesiana 414

El árbol filogenético por inferencia Bayesiana se construyó con los trece genes 415

codificantes para proteínas de H. hydrochaeris, doce especies de roedores y O. cuniculus 416

(outgroup). A partir de este árbol filogenético, se determinó que el tiempo de divergencia 417

del ancestro común del grupo conformado por H. hydrochaeris y C. porcellus es de 19 Ma 418

y tiene una probabilidad posterior bayesiana de 0.96 (Figura 4). Upham & Patterson (2012) 419

estimaron el tiempo de divergencia para los roedores pertenecientes al infra orden 420

Hystricognathi a partir de la combinación de 4 genes (12S ARNr + GHR + vWF + RAG1) 421

y el tiempo de divergencia que obtuvieron para el grupo donde se encuentra H. 422

Page 19: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

19

hydrochaeris y C. porcellus fue de 19 Ma (Mioceno), lo cual apoya lo encontrado en la 423

filogenia construida en este trabajo. 424

425

Conclusiones 426

Las técnicas de secuenciación de nueva generación han hecho que la secuenciación 427

y ensamblaje de un genomas mt completo de alta calidad hoy día sea rápido, fácil y 428

económico. Sin embargo, a partir de la obtención y caracterización del genoma mt del 429

chigüiro H. hydrochaeris, se evaluó la tecnología DISCO-Dove (DISCOVAR de novo + el 430

método Hi-C) como recursos para la obtención de genomas mt y se presentaron tres 431

problemas importantes con las secuencias obtenidas. El primero consiste en que las 432

secuencias de COII y COIII presentan 2 y 4 gaps respectivamente, los cuales generan un 433

desplazamiento del marco de lectura y posiblemente la presencia de codones de parada en 434

la mitad del gen, lo que no permitiría la correcta traducción de la proteína y por 435

consiguiente la muerte del animal. El segundo es el cambio del tercer ácido nucleico del 436

anticodón del ARNt que va después del 3’ de NADH3, este cambio produce que el genoma 437

mt de H. hydrochaeris tenga dos ARNtTrp y ningún ARNtArg, situación que biológicamente 438

parece poco viable, debido a que esto significaría para la especie vivir sin la presencia del 439

aminoácido arginina dentro de las proteínas fabricadas en la mt. El tercero es la falta de 440

claridad en la longitud del ARNr 12S, puesto que aún no se ha determinado la identidad de 441

732 pb ubicadas entre el ARNtPhe y el ARNr 12S. Como solución a estos tres 442

inconvenientes se planea dos soluciones: la primera, consiste en mapear los reads 443

relacionados con el contig Sceky8L_11183 para observar la cobertura del genoma mt de H. 444

hydrochaeris, y la segunda amplificar por PCR y realizar secuenciación por método Sanger 445

de las regiones problema. 446

Page 20: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

20

Agradecimientos 447

Quiero agradecerle a Colciencias por su soporte económico para el proyecto Conservation 448

Genomics of the Capybara: building the foundations for its sustainable (Código 1204-659-44334 y 449

número de contrato FP44842-557-2014, a AJC). También me gustaría darle un agradecimiento 450

especial a Camila Martínez por su apoyo incondicional y explicaciones, a Lucas Barrientos por sus 451

consejos, y a Alejandro Reyes por su asesoría en el análisis bioinformática.452

Page 21: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

21

Referencias 453

Aldana Domínguez, J., Vieira Muñoz, M. I., Ángel Escobar, D. C., Jarvis, A., Páyan 454

Garrido, E., Lozada Perdomo, P. A., Mulligan, M., Burke, S., Vega Orduz, L. F., 455

Stevenson, P. (2007). Estudios sobre la ecología del chiguiro (Hydrochoerus 456

hydrochaeris) enfocados a su manejo y uso sostenible en Colombia. (J. Aldana 457

Dominguez, M. I. Vieira Muñoz, & D. C. Ángel Escobar, Eds.). Bogotá D.C., 458

Colombia: Instituto de Investigación de Recursos Biológicos Alexander von 459

Humboldt-2007. 460

Bernt, M., Braband, A., Schierwater, B., & Stadler, P. F. (2013). Genetic aspects of 461

mitochondrial genome evolution. Molecular Phylogenetics and Evolution, 69(2), 328–462

338. http://doi.org/10.1016/j.ympev.2012.10.020 463

Bernt, M., Donath, A., Jühling, F., Externbrink, F., Florentz, C., Fritzsch, G., Pütz, J., 464

Middendorf, M., Stadler, P. F. (2013). MITOS: Improved de novo metazoan 465

mitochondrial genome annotation. Molecular Phylogenetics and Evolution, 69(2), 466

313–319. http://doi.org/10.1016/j.ympev.2012.08.023 467

Bibb, M. J., Van Etten, R. a, Wright, C. T., Walberg, M. W., & Clayton, D. A. (1981). 468

Sequence and gene organization of mouse mitochondrial DNA. Cell, 26(October), 469

167–180. http://doi.org/0092-8674(81)90300-7 [pii] 470

Boore, J. L. (1999). Animal mitochondrial genomes. Nucleic Acids Research, 27(9), 1767–471

1780. 472

Brown, W. M., George, M., & Wilson, A. C. (1979). Rapid evolution of animal 473

mitochondrial DNA. Proc. Natl. Acad. Sci. USA, 76(4), 1967–1971. 474

Cao, W., & Xia, Y. (2015). The complete mitochondrial genome of the Cavia aperea. 475

Mitochondrial DNA, 1736(October), 1–2. 476

http://doi.org/10.3109/19401736.2015.1089557 477

Correa Ospina, C., & García Pinzón, L. F. (2014). Caracterización genética de poblaciones 478

silvestres de chigüiro en el Casanare. In H. F. López Arévalo, P. Sánchez Palomino, & 479

O. L. Montenegro (Eds.), El chigüiro Hydrochoerus hydrochaeris en la Orinoquía 480

colombiana: Ecología, manejo sostenible y conservación (pp. 169–184). Bogotá D.C., 481

Colombia: Universidad Nacional de Colombia, Sede Bogotá. Instituto de Ciencias 482

Naturales. 483

Page 22: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

22

Crimi, M., & Rigolio, R. (2008). The mitochondrial genome, a growing interest inside an 484

organelle. International Journal of Nanomedicine, 3(1), 51–57. 485

http://doi.org/10.2147/IJN.S2482 486

Dovetail De Novo Genome Assembly Service Procces. (2015). Retrieved November 20, 487

2016, from https://dovetailgenomics.com/wp-content/uploads/2016/01/Dovetail-488

White-Paper.pdf 489

Drummond, A. J., & Rambaut, A. (2007). BEAST: Bayesian evolutionary analysis by 490

sampling trees. BMC Evolutionary Biology, 7(1), 214. http://doi.org/10.1186/1471-491

2148-7-214 492

Edgar, R. C. (2004). MUSCLE: Multiple sequence alignment with high accuracy and high 493

throughput. Nucleic Acids Research, 32(5), 1792–1797. 494

http://doi.org/10.1093/nar/gkh340 495

Fernández Silva, P., Enriquez, J. A., & Montoya, J. (2003). Replication and transcription of 496

mammalian mitochondrial DNA. Experimental Physiology, 41–56. 497

Giraldo Hernández, D., & Ramírez Perilla, J. A. (2001). Guía para el manejo, cria y 498

parovechamiento sostenible del chigüiro, chiguüire o capibara Hydrochoerus 499

hydrochaeris (Linneo). (H. Y. Bernal, Ed.). Bogotá: Convenio Andrés Bello: Serie 500

ciencia y tecnología. 501

Gissi, C., Gullberg, A., & Arnason, U. (1998). The complete mitochondrial DNA sequence 502

of the rabbit, Oryctolagus cuniculus. Genomics, 50(2), 161–169. 503

http://doi.org/10.1006/geno.1998.5282 504

Group, C. R. and D. (2013). DISCOVAR Genome variant discovery through assembly: 505

Manual. Broad Institute of MIT and Harvard. Cambridge, MA. Retrieved from 506

https://docs.google.com/document/d/1U_o-507

Z0dJ0QKiJn86AV2o_YHiFzUtW9c57eh3tYjkINc/edit# 508

Gurevich, A., Saveliev, V., Vyahhi, N., & Tesler, G. (2013). QUAST: Quality assessment 509

tool for genome assemblies. Bioinformatics, 29(8), 1072–1075. 510

http://doi.org/10.1093/bioinformatics/btt086 511

Harrison, R. G. (1989). Animal mitochondrial DNA as a genetic marker in population and 512

evolutionary biology. Trend.Ecol.Evolut., 4(7), 6–11. 513

Hedge, S. B., Dudley, J., & Kumar, S. (2006). TimeTree: A public knowledge-base of 514

Page 23: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

23

divergence times among organisms. Bioinformatics, 22(23), 2971–2972. 515

Hedges, S. B., Marin, J., Suleski, M., Paymer, M., & Kumar, S. (2015). Tree of Life 516

Reveals Clock-Like Speciation and Diversification. Molecular Biology and Evolution, 517

32(4), 835–845. http://doi.org/10.1093/molbev/msv037 518

Jaffe, D. (2013). FAQ: Assemble genomes and find variants with DISCOVAR & 519

DISCOVAR de novo. Retrieved November 13, 2016, from 520

https://software.broadinstitute.org/software/discovar/blog/?page_id=23 521

Kearse, M., Moir, R., Wilson, A., Stones-Havas, S., Cheung, M., Sturrock, S., Buxton, S., 522

Cooper, A., Markowitz, S., Duran, C., Thierer, T., Ashton, B., Meintjes, P., 523

Drummond, A. (2012). Geneious Basic: An integrated and extendable desktop 524

software platform for the organization and analysis of sequence data. Bioinformatics, 525

28(12), 1647–1649. http://doi.org/10.1093/bioinformatics/bts199 526

Malka, F., Lombès, A., & Rojo, M. (2006). Organization, dynamics and transmission of 527

mitochondrial DNA: Focus on vertebrate nucleoids. Biochimica et Biophysica Acta - 528

Molecular Cell Research, 1763(5–6), 463–472. 529

http://doi.org/10.1016/j.bbamcr.2006.04.001 530

Mesa González, E., & López Arévalo, H. F. (2014). El chigüiro Hydrochoerus hydrochaeris 531

(Linnaeus, 1766). In O. L. Montenegro, H. F. López-Arévalo, & P. Sánchez-Palomino 532

(Eds.), El chigüiro Hydrochoerus hudrochaeris en la Orinoquía colombiana: 533

Ecologia, manejo sostenible y conservación (pp. 21–41). Bogotá, Colombia: 534

Universidad Nacional de Colombia, Sede Bogotá. Instituto de Ciencias Naturales. 535

Montoya, J., & Attardi, G. (1986). ADN mitocondrial humano. Investigación Y Ciencia, 536

119, 1–20. Retrieved from http://www.investigacionyciencia.es/revistas/investigacion-537

y-ciencia/numero/118/adn-mitocondrial-humano-1854 538

Moreira, J. R., Alvarez, M. R., Tarifa, T., Pacheco, V., Taber, A., Tirira, D. G., Herrera, E. 539

A., Ferraz, K. M., Aldana Domínguez, J., Macdonald, D. W. (2013). Taxonomy, 540

Natural History and Distribution of the Capybara. In J. R. Moreira, A. Ferraz, E. A. 541

Herrera, & D. W. Macdonald (Eds.), Capybara: Biology, use and conservation of an 542

exceptional Neotropical species (pp. 3–37). New York, NY: Springer New York. 543

http://doi.org/10.1007/978-1-4614-4000-0 544

Oh, D.-J., Kim, J.-Y., Lee, J.-A., Yoon, W.-J., Park, S.-Y., & Jung, Y.-H. (2007). Complete 545

Page 24: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

24

mitochondrial genome of the rabbitfish Siganus fuscescens (Perciformes, Siganidae). 546

DNA Sequence : The Journal of DNA Sequencing and Mapping, 18(4), 295–301. 547

http://doi.org/doi:10.1080/10425170701248525 548

Oh, D., Kim, T., Chang, M., Han, S., Oh, H., & Kim, S. (2011). The mitochondrial genome 549

of Apodemus peninsulae ( Rodentia , Muridae ), 22(August), 99–101. 550

http://doi.org/10.1186/1471-2164-8-24.Doda 551

Sánchez Isaza, C. A., & Jiménez Robayo, L. M. (2014). Estudio citogenético del chigüiro 552

(Hydrochoerus hydrochaeris) de la orinoquía colombiana. In H. F. López Arévalo, P. 553

Sánchez Palomino, & O. L. Montenegro (Eds.), El chigüiro Hydrochoerus 554

hydrochaeris en la Orinoquía colombiana: Ecología, manejo sostenible y 555

conservación (pp. 147–168). Bogotá D.C.: Universidad Nacional de Colombia, Sede 556

Bogotá. Instituto de Ciencias Naturales. 557

Sarango V, V., Ordoñez, L., Noboa, D., & Valladares, B. (2011). Manual para manejo de 558

capibaras (Hidrochaeris hidrochaeris) (Gavilanes). Quito, Ecuador.: Organización de 559

las Naciones Unidas para la Alimentación y la Agricultura (FAO). 560

Stamatakis, A. (2014). RAxML version 8: A tool for phylogenetic analysis and post-561

analysis of large phylogenies. Bioinformatics, 30(9), 1312–1313. 562

http://doi.org/10.1093/bioinformatics/btu033 563

Susin, S. A., Lorenzo, H. K., Zamzami, N., Marzo, I., Snow, B. E., Brothers, G. M., 564

Mangion, J., Jacotot, E., Castantini, P., Loeffler, M., Larochette N., Goodlett, D., 565

Aebersold, R., Siderovski, D., Penninger, J. M., Kroemer, G. (1999). Molecular 566

characterization of mitochondrial apoptosis-inducing factor. Nature, 397(6718), 441–567

446. Retrieved from http://dx.doi.org/10.1038/17135 568

Taanman, J. W. (1999). The mitochondrial genome: structure, transcription, translation and 569

replication. Biochimica Et Biophysica Acta, 1410(2), 103–123. 570

http://doi.org/10.1016/S0005-2728(98)00161-3 571

Tomasco, I. H., & Lessa, E. P. (2011). The evolution of mitochondrial genomes in 572

subterranean caviomorph rodents: Adaptation against a background of purifying 573

selection. Molecular Phylogenetics and Evolution, 61(1), 64–70. 574

http://doi.org/10.1016/j.ympev.2011.06.014 575

Upham, N. S., & Patterson, B. D. (2012). Diversification and biogeography of the 576

Page 25: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

25

Neotropical caviomorph lineage Octodontoidea (Rodentia: Hystricognathi). Molecular 577

Phylogenetics and Evolution, 63(2), 417–429. 578

http://doi.org/10.1016/j.ympev.2012.01.020 579

Voloch, C. M., Vilela, J. F., Loss-Oliveira, L., & Schrago, C. G. (2013). Phylogeny and 580

chronology of the major lineages of New World hystricognath rodents: insights on the 581

biogeography of the Eocene/Oligocene arrival of mammals in South America. BMC 582

Research Notes, 6, 160. http://doi.org/10.1186/1756-0500-6-160 583

Wang, X. (2001). The expanding role of mitochondria in apoptosis. Gene Dev, 15(214), 584

2922–33. 585

Wolstenholme, D. R. (1992). Animal Mitochondrial DNA : Structure and Evolution. 586

Department of Biology, University of Utah, Salt Lake City, Utah 841 12. 587

Yoon, Y. G., Koob, M. D., & Yoo, Y. H. (2010). Re-engineering the mitochondrial 588

genomes in mammalian cells. Anatomy & Cell Biology, 43(2), 97–109. 589

http://doi.org/10.5115/acb.2010.43.2.97 590

591

Anexos 592

Page 26: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

26

593Figura 1. Representación en forma circular de la anotación del genoma mt de H. hydrochaeris. La 594

anotación de este genoma se realizó a partir del servidor web MITOS, alineamientos múltiples de 595

todos los genes y BLASTn. La imagen se generó en Geneious version 8.1.3. Este genoma mt mide 596

17,347 pb y contiene 37 genes: 2 genes de ARN ribosomal (bloques color amarillo), 13 genes 597

codificantes para proteínas (boques color naranja) y 22 genes de ARN de transferencia (triángulos 598

pequeños color café), una región reguladora conocida como D-Loop (bloque color verde) y el 599

origen de replicación de la cadena ligera (triangulo color azul claro). Las líneas azules ubicadas 600

entre CYTB, D-Loop y 12S indican las regiones que aún no han sido determinadas. 601

602

Page 27: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

27

(I) Representación lineal del genoma mt de C. porcellus 603

604

605

(II) Representación lineal del genoma mt de H. hydrochaeris 606

607

608 609Figura 2. Comparación entre el genoma mt de H. hydrochaeris (I) y el genoma mt de C. 610

porcellus (II) tomado de GenBank (ID: AJ222767.1). Debido a que C. porcellus es el 611

roedor filogenéticamente más cercano al chigüiro con genoma mt completo disponible en 612

GenBank, su genoma fue tomado como referencia para la anotación de nuestro genoma mt. 613

El genoma mt de H. hydrochaeris mide 17,347 pares de bases (pb) y presenta diferencias 614

con respecto al genoma mt de C. porcellus que mide 16,801 pb. [a] El gen 12S anotado de 615

H. hydrochaeris mide 757 pb y el de C. porcellus 942 pb. [b] El D-Loop anotado de H. 616

hydrochaeris mide 498 pb y el de C. porcellus 1,356 pb. [c] El genoma mt de H. 617

hydrochaeris tiene un segundo ARNtTrp en donde C. porcellus presenta un ARNtArg, esto 618

se debe al cambio del tercer ácido nucleico del anticódon de H. hydrochaeris (ARNtTrp: 619

UCA; ARNtArg: UCG). 620

621

Page 28: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

28

A. 622

623

B. 624

625

C. 626

627

Figura 3. Alineamientos múltiples de las secuencias de ARNtTrp y ARNtArg de H. 628

hydrochaeris, doce especies de roedores y O. cuniculus (conejo común, outgroup). Las 629

especies utilizadas se encuentran especificadas con su respectivo número de acceso a 630

GenBank en la Tabla 2 de este mismo documento. Estas imágenes fueron generadas a partir 631

de Geneious 1.8.3 (A) Alineamiento múltiple de las secuencias del ARNtTrp ubicado 632

después del 3’ final del gen NADH2. (B) Alineamiento múltiple de las secuencias del 633

ARNtArg ubicado después del 3’ final del gen NADH3 que en el caso de H. hydrochaeris es 634

un segundo ARNtTrp . (C) Alineamiento múltiple de las dos secuencias de los dos ARNtTrp 635

que presenta H. hydrochaeris, la primera secuencia corresponde al ARNtTrp que está 636

Page 29: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

29

ubicado después del 3’ del gen NADH2 y la segunda secuencia corresponde al ARNtTrp que 637

se encuentra después del 3’ del gen NADH3, que en C. porcellus es un ARNtArg. 638

639

640

Figura 4. Árbol filogenético por inferencia Bayesiana para los trece genes codificantes 641

para proteínas (ARNm) del genoma mt de H. hydrochaeris, doce especies de roedores y el 642

conejo común (Outgroup). Se utilizó un modelo de sustitución GTR y un reloj relajado log-643

normal. Las barras de error de cada nodo representan los intervalos de densidad posterior 644

del 95%. Los tres nodos rojos designados con las letras: [a] roedores, [b] ratones y [c] 645

caviomorpha, indican los prior de calibración por fósiles utilizados en la construcción del 646

árbol. La datación de los fósiles utilizada en esta filogenia se obtuvo de la base de datos 647

TimeTree.org (Hedge et al., 2006; Hedges et al., 2015). 648

Page 30: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

30

649

Tabla 1. Secuencias de genes mitocondriales de Hydrochoerus hydrochaeris disponibles en 650

GenBank. Con estas 17 secuencias se realizó la primera búsqueda del genoma mitocondrial 651

dentro de todo el genoma de H. hydrochaeris. 652

653Secuencias de Hydrochoerus

hydrochaeris No. Acceso GenBank

Cytochrome B (cytb) gene, complete cds; mitochondrial GU136721.1

Cytochrome B (cytb) gene, partial cds; mitochondrial FJ430787.1

12S ribosomal RNA gene, partial sequence, and tRNA-Val gene, complete sequence

U61081.1

Cytochrome oxidase subunit I (COI) gene, partial cds; mitochondrial KF771219.1

Mitochondrial isovaleryl-CoA dehydrogenase (Ivd) gene, intron 8 KF129554.1

Mitochondrial serine-pyruvate aminotransferase (Agxt) gene, intron 10

KF129531.1

16S ribosomal RNA gene, complete sequence AF069533.1

12S ribosomal RNA, mitochondrial gene U12454.1

12S ribosomal RNA gene, partial sequence AF433925.1

12S ribosomal RNA gene, partial sequence AF433924.1

12S ribosomal RNA gene, partial sequence; and tRNA-Val gene, complete sequence

AY012122.1

16S ribosomal RNA gene, partial sequence AY011154.1

12S ribosomal RNA gene, partial sequence U02573.1

Haplotype H14 D-loop, partial sequence GU456376.1

Haplotype 1 D-loop, partial sequence EU149767.1

Haplotype 7 D-loop, partial sequence EU149773.1 Haplotype H1 D-loop, partial sequence GU456363.1

654

Page 31: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

31

Tabla 2. Número de acceso de GenBank y artículos de referencia de donde se obtuvieron 655

secuencias de los genomas mitocondriales completos de doce especies de roedores y de O. 656

cuniculus (conejo común, outgroup). Las secuencias de los mito genomas de Mus musculus 657

y de Rattus rattus fueron obtenidas directamente de la base de datos de genomas mt de 658

NCBI. Estos trece genomas mt se utilizaron para varias comparaciones a lo largo de todo 659

este trabajo. 660

661

Familia Especie No. Acceso GenBank Referencia

Caviidae Cavia porcellus AJ222767.1 (Voloch, Vilela, Loss-Oliveira, & Schrago,

2013) Erethizontidae Sphiggurus insidiosus JX312693.1 (Voloch et al., 2013) Chinchillidae Chinchilla lanígera NC_021386.1 (Voloch et al., 2013) Echimyidae Trinomys dimidiatus NC_021388.1 (Voloch et al., 2013)

Echimyidae Proechimys longicaudatus NC_020657.1 (Tomasco & Lessa, 2011; Voloch et al., 2013)

Ctenomyidae Ctenomys leucodon HM544131.1 (Tomasco & Lessa, 2011) Ctenomyidae Ctenomys sociabilis HM544129.1 (Tomasco & Lessa, 2011)

Octodontidae Tympanoctomys barrerae HM544132.1 (Tomasco & Lessa, 2011; Voloch et al., 2013)

Octodontidae Spalacopus cyanus HM544133.1 (Tomasco & Lessa, 2011; Voloch et al., 2013)

Octodontidae Octodon degus HM544134.1 (Tomasco & Lessa, 2011; Voloch et al., 2013)

Leporidae Oryctolagus cuniculus AJ001588.1 (Gissi, Gullberg, &

Arnason, 1998; Voloch et al., 2013)

Mus Mus musculus AY172335.1 - Muridae Rattus rattus EU273707.1 -

662

Page 32: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

32

Tabla 3. Nombre y tamaño de los 20 contigs donde posiblemente se encontraba el genoma 663

mt de H. hydrochaeris. Estos contigs fueron identificados a partir del BLAST con las 17 664

secuencias de genes mt de H. hydrochaeris obtenidas de GenBank. Se descartaron las 665

últimas once secuencias identificadas con (*), debido a que presentaban un tamaño mayor a 666

68,000 pb, lo que es 4 veces un genoma mt de un tamaño promedio de 17,000 pb. 667

Finalmente, se identificó a partir de un BLAST entre los 9 contigs restantes y los 37 genes 668

mt de C. porcellus, que el contig Sceky8L_11183 (subrayado y en negrilla) es el contig 669

donde se encontraba el genoma mt de H. hydrochaeris. 670

Nombre contig Tamaño contig flattened_line_390074 392 flattened_line_149032 678 flattened_line_120866 870 flattened_line_111203 969 Sceky8L_4562 1075 Sceky8L_15960 1496 Sceky8L_3776 2503 Sceky8L_9637 4899 Sceky8L_11183 19929 Sceky8L_9572* 1108412 Sceky8L_14060* 2504216 Sceky8L_6887* 2558631 Sceky8L_11206* 3674861 Sceky8L_2250* 6489165 Sceky8L_23578* 9864454 Sceky8L_4456* 10928252 Sceky8L_14839* 25812760 Sceky8L_1889* 32648974 Sceky8L_16349* 42043349 Sceky8L_17929* 42606405 671

Page 33: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

33

Tabla 4. Tamaño y contenido de GC de los genomas mitocondriales completos de doce 672

especies de roedores, O. cuniculus y de H. hydrochaeris. El tamaño y contenido de GC de 673

H. hydrochaeris es el del contig completo. 674

Especie Tamaño genoma mitocondrial (pb) % GC

Cavia porcellus 16,801 39.3 Sphiggurus insidiosus 16,571 35.3 Chinchilla lanigera 16,580 40.9 Trinomys dimidiatus 16,580 38.9 Proechimys longicaudatus 16,816 35.8 Ctenomys leucodon 16,216 34.8 Ctenomys sociabilis 17,016 34.2 Tympanoctomys barrerae 16,863 37 Spalacopus cyanus 16,830 37 Octodon degus 16,798 37.4 Oryctolagus cuniculus 17,245 40.2 Mus musculus 16,299 36.7 Rattus rattus 16,305 38.1 Hydrochoerus hydrochaeris 17,347 38.8 675

Page 34: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

34

Tabla 5. Anotación del genoma mt de H. hydrochaeris a partir de MITOS y alineamientos 676

múltiples por Geneious+MUSCLE. Nombre del gen, posiciones inicial y final, tamaño 677

total, codón de inicio y parada para los genes codificantes para proteínas (ARNm), 678

anticodón para los ARNt y ubicación del gen en la hebra pesada (+) o ligera (-). El ARNt 679

Triptófano (W)* es el segundo ARNtTrp que presenta el genoma mt de de H. hydrochaeris, 680

en esta posición en la mayoría de mito genomas de mamíferos se codifica un ARNtArg. 681

Gen Empieza Termina Tamaño Codón

de inicio

Codón de parada Anticodón Hebra

ARNt Fenilalanina (F) 16,950 17,016 66 GAA +

ARNr 12S 401 1,158 757 ARNt Valina (V) 1,156 1,224 68 TAC + ARNr 16S 1,223 2,790 1,567 ARNt Leucina 2 (L2) 2,792 2,866 74 TAA + NADH1 2,870 3,829 959 ATG TAG + ARNt Isoleucina (I) 3,828 3,896 68 GAT + ARNt Glutamina (Q) 3,894 3,964 70 TTG - ARNt Metionina (M) 3,967 4,035 68 CAT + NADH2 4,036 5,080 1,044 ATT TAG + ARNt Triptófano (W) 5,079 5,148 69 TCA +

ARNt Alanina (A) 5,151 5,219 68 TGC - ARNt Asparagina (N) 5,221 5,293 72 GTT -

Origen de replicación de cadena ligera 5,295 5,330 35 -

ARNt Cisteína (C ) 5,332 5,398 66 GCA - ARNt Tirosina (Y) 5,401 5,469 68 GTA - COI 5,476 7,017 1,541 ATG TAG + ARNt Serina 2 (S2) 7,021 7,089 68 TGA - ARNt A. aspártico (D) 7,097 7,165 68 GTC +

COII 7,167 7,848 681 ATG TAA + ARNt Lisina (K) 7,849 7,915 66 TTT + ATPasa 8 7,917 8,120 203 ATG TAA + ATPasa 6 8,078 8,758 680 ATG TAA + COIII 8,758 9,537 779 ATG T + ARNt Glicina (G) 9,538 9,606 68 TCC + NADH3 9,607 9,953 346 ATC TA + ARNt Triptófano (W)* 9,954 10,022 68 TCA +

NADH4L 10,024 10,320 296 ATG TAA + NADH4 10,314 11,691 1,377 ATG T +

Page 35: 1 Genoma mitocondrial completo del chigüiro Hydrochoerus

35

ARNt Histidina (H) 11,692 11,760 68 GTG + ARNt Serina 1 (S1) 11,764 11,822 58 GCT + ARNt Leucina 1 (L1) 11,823 11,891 68 TAG + NADH5 11,892 13,703 1,811 ATT TAG + NADH6 13,700 14,230 530 ATG TAG - ARNt A. glutámico (E ) 14,231 14,299 68 TTC -

CYTB 14,307 15,446 1,139 ATG AGA + ARNt Treonina (T) 15,450 15,516 66 TGT + ARNt Prolina (P) 15,523 15,592 69 TGG - D-Loop 15,953 16,451 498 682

Tabla 6. Longitudes de los genes 12S y 16S de doce especies de roedores, O. cuniculus y 683

de H. hydrochaeris. 684

Especie 12S (pb) 16S (pb)

Cavia porcellus 943 1,565 Sphiggurus insidiosus 962 1,573 Chinchilla lanigera 954 1,555 Trinomys dimidiatus 950 1,567 Proechimys longicaudatus 949 1,558 Ctenomys leucodon 946 1,567 Ctenomys sociabilis 947 1,568 Tympanoctomys barrerae 953 1,573 Spalacopus cyanus 954 1,571 Octodon degus 953 1,570 Oryctolagus cuniculus 957 1,578 Mus musculus 955 1,582 Rattus rattus 956 1,569 Hydrochoerus hydrochaeris 758 1,568

685