jornadas técnicas de rediris 2014 (cáceres) sistema ... openstack, proxmox … uso de

54
Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema automático de creación de nodos de cómputo virtuales en la nube Alfonso Pardo [email protected]

Upload: lyhuong

Post on 28-Jul-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Jornadas Técnicas de RedIRIS 2014 (Cáceres)

Sistema automático de creación de nodos de cómputo virtuales en la nube

Alfonso [email protected]

Page 2: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Quiénes somos?

San Francisco Convent2

Page 3: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Quiénes somos?❖ CETA-CIEMAT: Es una iniciativa conjunta del Gobierno de España y el Gobierno

de Extremadura.

San Francisco Convent2

Page 4: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Quiénes somos?❖ CETA-CIEMAT: Es una iniciativa conjunta del Gobierno de España y el Gobierno

de Extremadura.

❖ Es una institución pública financiada por PGE y FEDER

San Francisco Convent2

Page 5: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Quiénes somos?❖ CETA-CIEMAT: Es una iniciativa conjunta del Gobierno de España y el Gobierno

de Extremadura.

❖ Es una institución pública financiada por PGE y FEDER

❖ Misión: Consolidar y diseminar la e-Ciencia y las IT, especialmente la GRID y las e-Infraestructuras:

San Francisco Convent2

Page 6: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Quiénes somos?❖ CETA-CIEMAT: Es una iniciativa conjunta del Gobierno de España y el Gobierno

de Extremadura.

❖ Es una institución pública financiada por PGE y FEDER

❖ Misión: Consolidar y diseminar la e-Ciencia y las IT, especialmente la GRID y las e-Infraestructuras:

San Francisco Convent2

❖ GRID, HPC y cloud.

❖ Contribuir la expansion de la e-Ciciencia

❖ Facilitar el uso de recursos.

Page 7: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Quiénes somos?

3

Page 8: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿HPC?

❖ HPC: High performance computing

❖ Resolución de problemas de gran envergadura usando paralelismo.

❖ Grupo de nodos de cómputo trabajando a la vez para resolver un problema/s.

4

Page 9: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

5

Page 10: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

❖ Un cluster dispone de una serie de nodos fijos.

5

Page 11: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

❖ Un cluster dispone de una serie de nodos fijos.

❖ Está gobernado por un gestor de recursos.

5

Page 12: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

❖ Un cluster dispone de una serie de nodos fijos.

❖ Está gobernado por un gestor de recursos.

❖ TOP 500:

5

Page 13: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

❖ Un cluster dispone de una serie de nodos fijos.

❖ Está gobernado por un gestor de recursos.

❖ TOP 500:

❖ Ampliación del cluster para afrontar mayores trabajos o procesar un mayor número de estos requiere adquirir nuevo hardware (y más dinero) y reconfigurar el cluster.

5

Page 14: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cloud?

6

Page 15: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cloud?

❖ ¿De verdad a estas alturas es necesario definirla?

6

Page 16: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cloud?

❖ ¿De verdad a estas alturas es necesario definirla?

❖ IaaS (Infrastructure as a service). Poder crear maquinas virtuales a petición. Nuestra elección:

6

Page 17: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Unificando conceptos

7

Page 18: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Unificando conceptos

❖ Yo tengo un cluster que quiero ampliar, y tu tienes una cloud para ofrecerme máquinas virtuales.

7

Page 19: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Unificando conceptos

❖ Yo tengo un cluster que quiero ampliar, y tu tienes una cloud para ofrecerme máquinas virtuales.

❖ Poder levantar nodos de cluster en IaaS para ampliar el cluster.

7

Page 20: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Unificando conceptos

❖ Yo tengo un cluster que quiero ampliar, y tu tienes una cloud para ofrecerme máquinas virtuales.

❖ Poder levantar nodos de cluster en IaaS para ampliar el cluster.

❖ Pero: ¿Cómo? y ¿Cuándo?

7

Page 21: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Unificando conceptos

❖ Yo tengo un cluster que quiero ampliar, y tu tienes una cloud para ofrecerme máquinas virtuales.

❖ Poder levantar nodos de cluster en IaaS para ampliar el cluster.

❖ Pero: ¿Cómo? y ¿Cuándo?

Servidores físicos

Alta demanda IaaS

Servidores físicos

7

Page 22: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

8

Page 23: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

❖ Cuándo: En momentos puntuales de alta carga. Necesitaremos alguien o algo que nos diga cuándo sucede esto.

8

Page 24: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

❖ Cuándo: En momentos puntuales de alta carga. Necesitaremos alguien o algo que nos diga cuándo sucede esto.

❖ Cómo: Mediante el uso de API para levantar máquinas pre-configuradas. Necesitaremos alguien o algo que haga esta llamada automáticamente por nosotros.

8

Page 25: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

❖ Cuándo: En momentos puntuales de alta carga. Necesitaremos alguien o algo que nos diga cuándo sucede esto.

❖ Cómo: Mediante el uso de API para levantar máquinas pre-configuradas. Necesitaremos alguien o algo que haga esta llamada automáticamente por nosotros.

❖ ¿Y después? Eliminar la máquina cuando ya no es necesaria. Necesitaremos alguien que haga este trabajo sucio por nosotros.

8

Page 26: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Quién hará todo esto?

9

Page 27: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Quién hará todo esto?

❖ Necesitaremos un agente que sea “consciente” de la carga del cluster es el gestor de colas (SLURM).

9

Page 28: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Quién hará todo esto?

❖ Necesitaremos un agente que sea “consciente” de la carga del cluster es el gestor de colas (SLURM).

❖ Otro agente será el encargado de levantar/destruir máquinas según sean necesarias o no.

9

Page 29: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Quién hará todo esto?

❖ Necesitaremos un agente que sea “consciente” de la carga del cluster es el gestor de colas (SLURM).

❖ Otro agente será el encargado de levantar/destruir máquinas según sean necesarias o no.

9

Page 30: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cómo?

10

Page 31: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cómo?1.El gestor de colas envía trabajos a los nodos, por lo que es “consciente” del indice

de carga y del estado de las colas.

10

Page 32: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cómo?1.El gestor de colas envía trabajos a los nodos, por lo que es “consciente” del indice

de carga y del estado de las colas.

2.El gestor de colas tiene una serie de nodos virtuales dados de alta en estado “no disponibles”.

10

Page 33: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cómo?1.El gestor de colas envía trabajos a los nodos, por lo que es “consciente” del indice

de carga y del estado de las colas.

2.El gestor de colas tiene una serie de nodos virtuales dados de alta en estado “no disponibles”.

3.Una aplicación desarrollada por el CETA-CIEMAT sondea el estado de las colas y de la carga, gracias a la información facilitada por el gestor de colas.

10

Page 34: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cómo?1.El gestor de colas envía trabajos a los nodos, por lo que es “consciente” del indice

de carga y del estado de las colas.

2.El gestor de colas tiene una serie de nodos virtuales dados de alta en estado “no disponibles”.

3.Una aplicación desarrollada por el CETA-CIEMAT sondea el estado de las colas y de la carga, gracias a la información facilitada por el gestor de colas.

4.Cuando la carga o el número de trabajos supera cierto umbral, levantar nodos pre-configurados en la Cloud mediante API.

10

Page 35: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cómo?1.El gestor de colas envía trabajos a los nodos, por lo que es “consciente” del indice

de carga y del estado de las colas.

2.El gestor de colas tiene una serie de nodos virtuales dados de alta en estado “no disponibles”.

3.Una aplicación desarrollada por el CETA-CIEMAT sondea el estado de las colas y de la carga, gracias a la información facilitada por el gestor de colas.

4.Cuando la carga o el número de trabajos supera cierto umbral, levantar nodos pre-configurados en la Cloud mediante API.

5.El gestor de colas detecta estos nuevos nodos al levantarse y los añade.

10

Page 36: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cómo?1.El gestor de colas envía trabajos a los nodos, por lo que es “consciente” del indice

de carga y del estado de las colas.

2.El gestor de colas tiene una serie de nodos virtuales dados de alta en estado “no disponibles”.

3.Una aplicación desarrollada por el CETA-CIEMAT sondea el estado de las colas y de la carga, gracias a la información facilitada por el gestor de colas.

4.Cuando la carga o el número de trabajos supera cierto umbral, levantar nodos pre-configurados en la Cloud mediante API.

5.El gestor de colas detecta estos nuevos nodos al levantarse y los añade.

6.Nuevos trabajos llegan a los nodos virtuales liberando de carga al cluster físico y a las colas.

10

Page 37: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cómo? (II)

11

Page 38: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cómo? (II)7. El software de gestión detecta que ha bajado la carga y

marca los nodos virtuales para que no entren más trabajos en ellos.

11

Page 39: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cómo? (II)7. El software de gestión detecta que ha bajado la carga y

marca los nodos virtuales para que no entren más trabajos en ellos.

8. El software de gestión detecta que en los nodos virtuales no hay nada en ejecución y los marca para destruirlos.

11

Page 40: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cómo? (II)7. El software de gestión detecta que ha bajado la carga y

marca los nodos virtuales para que no entren más trabajos en ellos.

8. El software de gestión detecta que en los nodos virtuales no hay nada en ejecución y los marca para destruirlos.

9. Mediante API destruye los nodos virtuales y pone dichos nodos en el gestor de colas como “no disponibles” de nuevo.

11

Page 41: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¿Cómo? (II)7. El software de gestión detecta que ha bajado la carga y

marca los nodos virtuales para que no entren más trabajos en ellos.

8. El software de gestión detecta que en los nodos virtuales no hay nada en ejecución y los marca para destruirlos.

9. Mediante API destruye los nodos virtuales y pone dichos nodos en el gestor de colas como “no disponibles” de nuevo.

10.Volvemos a empezar…

11

Page 42: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Esquema general

12

Page 43: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Otras especificaciones

13

Page 44: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Otras especificaciones

❖ Gestor escrito en C++. Interfaces escrito en python.

13

Page 45: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Otras especificaciones

❖ Gestor escrito en C++. Interfaces escrito en python.

❖ Uso de un interface para la llamada a las API que lo hace compatible con cualquier cloud: Amazon, Openstack, Proxmox…

13

Page 46: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Otras especificaciones

❖ Gestor escrito en C++. Interfaces escrito en python.

❖ Uso de un interface para la llamada a las API que lo hace compatible con cualquier cloud: Amazon, Openstack, Proxmox…

❖ Uso de interface para consulta del gestor de colas, lo que lo hace compatible con cualquier gestor de colas: SLURM, OGE,…

13

Page 47: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de
Page 48: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

❖ Generación de gráficas de uso (GNUPlot):

Page 49: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

❖ Generación de gráficas de uso (GNUPlot):

❖ Configuración de umbrales de creación/destrucción de máquinas virtuales adaptable.

Page 50: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

❖ Generación de gráficas de uso (GNUPlot):

❖ Configuración de umbrales de creación/destrucción de máquinas virtuales adaptable.

❖ Y más…

Page 51: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Resultados

15

Page 52: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Resultados

15

Sin acelerar

Page 53: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

Resultados

15

Con 10maquinas virtuales

Sin acelerar

Page 54: Jornadas Técnicas de RedIRIS 2014 (Cáceres) Sistema ... Openstack, Proxmox … Uso de

¡GRACIAS!

¿Alguna pregunta?

CETA-Ciemat agradece la aportación del Fondo Europeo de Desarrollo Regional

16