![Page 1: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/1.jpg)
Tarea 2: Proteınas transmembranales
Dpto. Ciencias de la Computacion e Inteligencia ArtificialUniversidad de Sevilla
![Page 2: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/2.jpg)
Base de datos UniProt
Incluimos el codigo asignado
![Page 3: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/3.jpg)
Secuenciacion de la proteına
En la pagina con la informacion sobre la proteına asignada
• Localizamos la seccion ’Sequences’
![Page 4: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/4.jpg)
Secuenciacion de la proteına
Descargamos la secuenciacion de la proteına en formato FASTA
![Page 5: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/5.jpg)
Topologıa de la proteına
Volvemos a la pagina con la informacion sobre la proteına asignada
• Localizamos la seccion ’Topology’ (a traves de ’Feature table’)
![Page 6: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/6.jpg)
Anotacion de la proteına
Descargamos la descripcion de la topologıa de la proteına enformato GFF
![Page 7: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/7.jpg)
Se trata de una ’Hoja de calculo’
Si utilizamos ’LibreOffice Calc’ para procesar el fichero
![Page 8: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/8.jpg)
Separadores de los datos
Elegimos como separadores de los datos: ’Tabulador’, ’Punto ycoma’ e ’=’.
![Page 9: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/9.jpg)
Edicion previa del fichero GFF
Si elegimos otra herramienta que no nos permita seleccionar losseparadores de los datos, tipo ’Excel’
• Sera necesario editar el fichero reemplazando cada ’;’ y cada’=’ por un tabulador (copia primero algun tabulador).
![Page 10: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/10.jpg)
Edicion previa del fichero GFF (II)
No olvides incluir el tabulador en ’Reemplazar por:’
![Page 11: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/11.jpg)
Procesado del fichero GFF
Con la ’Hoja de calculo’, eliminamos solo las filas innecesarias...
![Page 12: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/12.jpg)
Procesado del fichero GFF (II)
y eliminamos solo las columnas innecesarias.
![Page 13: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/13.jpg)
Fichero CSV
Guardamos los datos (posicion de inicio y finalizacion de cada tipode region, y el tipo de region) en formato CSV
![Page 14: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/14.jpg)
RStudio
En R, obtenemos la tabla a partir del fichero CSV
![Page 15: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/15.jpg)
Regiones en la proteına
Generamos el etiquetado de la secuenciacion de la proteına con losdistintos tipos de region asociados a cada aminoacido.
![Page 16: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/16.jpg)
Proteınas similares
Volvemos a la pagina con la informacion sobre la proteına asignada
• Localizamos la seccion ’Similar proteins’ (y expandimos latabla de resultados)
![Page 17: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad](https://reader033.vdocuments.co/reader033/viewer/2022042411/5f290c3ddbd4d70ccb6cf38d/html5/thumbnails/17.jpg)
Revisadas
Descargamos tambien la informacion de aquellas que estenrevisadas.