taller grid computing

24
TALLER GRID COMPUTING 1. Objetivos El objetivo final del grid es poder utilizar recursos remotos que nos permitan realizar tareas que no podríamos abordar en nuestra máquina o centro de trabajo. La idea va más allá del simple intercambio de ficheros, se trata del acceso directo a software, ordenadores y datos remotos, así como el acceso y control de otros dispositivos (sensores, telescopios, etc.). El verdadero interés del grid radica en el uso eficiente de los recursos. Se necesitan mecanismos para repartir el trabajo de forma automática y eficiente entre una gran cantidad de recursos, reduciendo las colas de espera de los distintos usuarios. En principio, tendremos información sobre los diferentes trabajos que se han enviado y, ya que todo se está ejecutando en ordenadores, podemos calcular cuál sería la asignación óptima de recursos. Puesto que los recursos que son compartidos pertenecen a personas muy distintas, la seguridad es esencial, y se centra en los siguientes aspectos: política de accesos (qué es lo que se va a compartir, a quién se le permite el acceso, y bajo qué condiciones), autenticación (mecanismos para garantizar la identidad de un usuario o de un recurso concreto), y autorización (procedimiento para averiguar si una determinada operación es consistente con las relaciones que se han definido previamente de cara a compartir recursos). Todas las aplicaciones que se ejecuten en un grid, deben poder funcionar en cualquier otro (estandarización).

Upload: gloria-roa

Post on 31-Jan-2016

234 views

Category:

Documents


0 download

DESCRIPTION

Funcionalidades de Grid Computing

TRANSCRIPT

Page 1: Taller Grid Computing

TALLER GRID COMPUTING

1. Objetivos

El objetivo final del grid es poder utilizar recursos remotos que nos permitan realizar tareas que no podríamos abordar en nuestra máquina o centro de trabajo. La idea va más allá del simple intercambio de ficheros, se trata del acceso directo a software, ordenadores y datos remotos, así como el acceso y control de otros dispositivos (sensores, telescopios, etc.).

El verdadero interés del grid radica en el uso eficiente de los recursos. Se necesitan mecanismos para repartir el trabajo de forma automática y eficiente entre una gran cantidad de recursos, reduciendo las colas de espera de los distintos usuarios. En principio, tendremos información sobre los diferentes trabajos que se han enviado y, ya que todo se está ejecutando en ordenadores, podemos calcular cuál sería la asignación óptima de recursos.

Puesto que los recursos que son compartidos pertenecen a personas muy distintas, la seguridad es esencial, y se centra en los siguientes aspectos: política de accesos (qué es lo que se va a compartir, a quién se le permite el acceso, y bajo qué condiciones), autenticación (mecanismos para garantizar la identidad de un usuario o de un recurso concreto), y autorización (procedimiento para averiguar si una determinada operación es consistente con las relaciones que se han definido previamente de cara a compartir recursos).

Todas las aplicaciones que se ejecuten en un grid, deben poder funcionar en cualquier otro (estandarización).

En la segunda generación de la red de acceso multimedia de banda ancha basado en ADSL, supone la consolidación de ésta tecnología y se pretende emplear servicios basados sólo en IP: como difusión de video sobre IP o telefonía de calidad sobre IP. Hoy en día, las interfaces Ethernet son mucho más baratas que las ATM y prácticamente igual de eficientes; además, es una tecnología menos compleja y más conocida. Precisamente, la introducción de ADSL se ha visto ralentizada, sobre todo en sus inicios, debido a los costes de infraestructura, así como a la lentitud y coste de su instalación y configuración.

Renata que es la red de tecnologia avanzada colombiana, constituida por las demas redes regionales, tiene como objetivo principal promover el desarrollo de la infraestructura y servicios de la red de alta velocidad, su uso y apropiación, así como articular y facilitar acciones para la ejecución

Page 2: Taller Grid Computing

de proyectos de educación, innovación e investigación científica y tecnológica que propugnen por el desarrollo de la sociedad del conocimiento y de la información en Colombia

Uno de los objetivos de las redes de tecnologia avanzada es facilitar el traajo colaborativo, permitiendo compartir información, acceder a equipos de laboratorio, transferir altos volumenes de datos, soportar experimentos complejos, entre otros.

2. Redes de tecnologia avanzada

Las redes de tecnologia avanzada surgieron con el fin de dar respuesta a las actividades generadas por una red robusta, ofreciendo servicios y anchos de banda superiores a los de internet comercial, siendo exclusivas para el desarrollo academico, cientifico y producción del conocimiento.

Estas redes creadas con el fin de ofrecer servicios a las actividades de investigación y desarrollo, se conectan unas con otras por medio de proveedores de servicios como ISP(Provedores de servicios de internet) o empresas prestadoras de servicios de conexión, transmitiendose en la red información relacionada con proyectos de investigacion o desarrollo.

Los medios fisicos de conexion usados por las redes de tecnologia avanzada, esta conformado en su mayoria por enlaces de fibra optica, y se puede encontrar tambien fibra oscura(puede ampliar los anchos de banda disponible cuando se requiere), los canales de anchos de banda de estas redes van desde los 2 Mbps, alcanzando los 10 Gbps.

La mayoria de redes de instituciones que participan en redes de tecnologia avanzada son redes locales LAN, buscando por medio de los ISP, un punto de salida hacia la red nacional, y de allí a las redes internaconales.

Las redes academicas avanadas, puedesn entregar servicios como desarrollo de proyectos colaborativos, no solo nacionales si no inernacionales, intercambio de culturas, calidad de servicio(QoS), para operaciones criticas sobre la red, soporte para aplicaciones multicast, tele-medicina, oficinas virtuales, supercomputacion, acceso a laboratorios reales remotos, entre otros, algunos que aun son inimaginables.

Caracteristicas:

Facilitan el trabajo coaborativo academico

Page 3: Taller Grid Computing

Permiten compartir información, transferir altos volumenes de datos, acceder a equipos de laboratorio, desarrollar aplicaciones con procesamiento distribuido, y entre las mas importantes estas redes soportan experimentos complejos , cruciales para la investigación.

Facilitan la comunicacion y el trabajo en equipo entre investigadores que se encuentran distribuidos en diferentes sitios geograficos.

En Colombia podemos encontrar las siguientes redes de tecnologia avanzada:

Renata

Red Nacional Academica de Tenologia Avanzada, fue desarrollada gracias al programa de cooperación LIS(Alianza por la Sociedad de la Información), esta red conecta, comunica, y proporciona la colaboración entre la comunidad academica y cientifica de Colombia con los centros de investigación mas desarrollados del mundo y la comunidad academica internacional.

Renata esta administrada por la corporacion RENATA, de la cual son miembros el ministerios de educación, colciencias, el ministerio de comunicación y las redes academmicas regionales.

Renata esta conformada por los tres miembros de Gobierno (Ministerio de Educación, Ministerio de Tecnologías de la Información y las Comunicaciones y Departamento Administrativo de Ciencia, Tecnología e Innovación, Colciencias) y las ocho Redes Académicas Regionales (RADAR, RIESCAR, RUANA, RUAV, RUMBO, RUP, RUTA Caribe y UNIRED) a las cuales están conectadas más de 163 instituciones del país entre instituciones de Educación Superior, Salud, Cultura y Centros de I+D+i

Caracteristicas:

La principal caracteristica de Renta es el poder de colaboracion y comunicacion entre sus miembros

su labor esta regida por los principios de colaboración, innivación, desarrollo tecnologico y calidad de servicio.

Garantiza el funcionamiento, mantenimiento, crecimiento y renovación tecnológica de la red.

Promeve la circulación de avances y resultados de proyectos, respetando los derechos de autor y de propiedad intelectual.

Page 4: Taller Grid Computing

promover el establecimiento de vínculos con RedCLARA, GEANT2, internet2 y demás redes nacionales de investigación y educación del mundo con el fin de facilitar la relación entre pares, el desarrollo de proyectos conjuntos y la participación de la academia y los grupos de investigación nacionales en programas marco de cooperación internacional.

Caracteriticas tecnicas de la infraestructura:

RENATA transita sobre un ancho de banda de 200 Mbps. La infraestructura de la Red Nacional Académica de Tecnología Avanzada, RENATA, está basada en una topología de estrella jerárquica donde el punto central es la sede Morato de Colombia Telecomunicaciones en Bogotá, los puntos de la estrella los conforman los nodos principales de las Redes Académicas Regionales de las ciudades de Cali, Barranquilla, Medellín, Bucaramanga, Pereira (Eje Cafetero), Popayán y Bogotá, en donde se interconectan a cada uno de los operadores locales que manejan las redes metropolitanas de las universidades.

La transmisión se realiza por la red MPLS de Colombia Telecomunicaciones a nivel de E1´s con un tiempo de convergencia de la red MPLS del anillo nacional de fibra óptica de 50 ms de acuerdo con el modelo planteado

Entre los mecanismos de acceso soportados se cuenta con servicios para interfaces “Ethernet 10/100/1000” tanto en los multiplexores como en los enrutadores.

Igualmente, los puertos sobre los servicios soportan transporte transparente (“Port Mode”) o a través de VLANs (cubre “Stacked VLANs”) para conexiones virtuales a través de un mismo puerto.

Los nodos de acceso con interfaces “10/100BASET” son los encargados de recibir los enlaces de los operadores locales de cada red regional.

Cada nodo de la red se interconecta a través de una interfaz “GigaEthernet” o “FastEthernet” de acuerdo con la topología de cada operador local.

Cada nodo de acceso maneja 200Mbps hacia el nodo de concentración en Morato-Bogotá garantizando los tiempos de convergencia de 40 ms en caso de falla de la red MPLS.

La capacidad actual de cada uno de los enlaces a nivel nacional es de 200 Mbps en MPLS. Esta capacidad es entregada por la red MPLS de Colombia Telecomunicaciones a nivel de 5*E1´s en cada uno de los nodos de las diferentes redes como Barranquilla, Bucaramanga, Cali, Popayán, Medellín, Eje cafetero y Bogotá.

Page 5: Taller Grid Computing

La red MPLS entrega su capacidad en E1´s a un equipo multiplexor Metro 500 a nivel nacional, Metro 1000 en Bogotá en interfase G703, el equipo multiplexor agrupa los E1´s y los entrega en interfase Ethernet al equipo enrutador Cisco 7606 conformando así la red nacional.

Los operadores entregan en interfase Ethernet a un puerto “FastEthernet” del Cisco 7206, en el caso Bogotá la interconexión se realiza directamente al puerto “FastEthernet” del equipo a nivel de 802.1q.

RADAR Es la red de alta velocidad del región centro occidental del país (Eje Cafetero) que tiene como objetivo la promoción del trabajo en colaboración entre las instituciones educativas de la región con las del resto del país y los centros de investigación más prestigiosos del mundo, mediante una asociación de instituciones educativas y de investigación que busca contribuir a la generación de conocimientos y al desarrollo regional, a través de las tecnologias de la información y la comunicación.

Pertenecen a Radar Caldas, Huila, Quindío, Risaralda y Tolima.

Caracteristicas:

Page 6: Taller Grid Computing

permite el trabajo colaborativo entre las comunidades académicas e investigativas para desarrollar proyectos conjuntos de investigación, elaborar planes de inversión, optimización de recursos tanto humanos, técnicos y tecnológicos, lo que genera una reducción significativa de costos para sus afiliados

Promueve también el trabajo con la educación virtual y con proyectos de colaboración en tiempo real.

Permite trabajar como región, compartiendo recursos con el fin de fortalecer proyectos de investigación

Cuenta con 21 Universidades conectadas

RIESCARRed de instituciones de educación superior del caribe, es una red local al servicio de la educación y de la investigación que mediante la interconexión genera capacidad e infraestructura tecnológica y facilita el intercambio de proyectos, programas y servicios entre sus miembros. Con sede en Barranquilla, capital del departamento del Atlántico, en la región norte de Colombia, RUTA Caribe tiene como fin incluir a todas las instituciones de Educación Superior, IES, de la zona Metropolitana de Barranquilla y de la Costa Caribe Colombiana.

RUANALa Red Universitaria Antioqueña, RUANA, es la presencia educativa e investigativa del mundo en Antioquia y de Antioquia en el mundo. Con sede en la ciudad de Medellín, capital del departamento de Antioquia, tiene como objetivo fundamental contribuir al desarrollo integral del país mediante el desarrollo de proyectos de investigación y desarrollo, de contenidos educativos en modalidad virtual con alta calidad y de servicios a través de una red de alta velocidad compartida por las instituciones.

RUANA tiene como objetivo fundamental:Contribuir al desarrollo integral del país mediante el desarrollo de proyectos de investigación y desarrollo, de contenidos educativos en modalidad virtual con alta calidad y de servicios a través de una red de alta velocidad compartida por las instituciones.

La red cuenta con una interconexión a través de Fibra óptica en configuración estrella desde el proveedor (actualmente Global Crossing) a cada una de las Universidades participantes con una velocidad de 80 Mbps.

RUAVLa Red Universitaria de Alta velocidad del Valle del Cauca, RUAV, con sede en Cali, promueve el intercambio de información entre universidades y centros de investigación utilizando nuevas tecnologías de telecomunicaciones y facilitando el desarrollo de proyectos interinstitucionales de investigación y educación, que mejoren la competitividad y el desarrollo social de la región.

Page 7: Taller Grid Computing

RUAV aumenta la interacción entre sus instituciones afiliadas para compartir información, experiencias y recursos, apoyando y originando soluciones prácticas y oportunas que dinamizan e incentivan el desarrollo tecnológico de las instituciones, para integrar una red de alta velocidad que las interconecta, con el fin de participar activamente en el proyecto de la Red Nacional Académica de Tecnología Avanzada, promovido por el Ministerio de Tecnologías de la Información y las Comunicaciones.

RUMBOLa Red Universitaria Metropolitana de Bogotá – RUMBO, es una red académica de alta velocidad que agrupa a las instituciones de educación superior, instituciones hospitalarias, centros de desarrollo tecnológico y bibliotecas, con el objetivo de trabajar colaborativamente y brindar servicios y herramientas que le generen valor a sus asociados y permitan apoyar las actividades de académicos e investigadores. Actualmente, RUMBO está conformada por 38 instituciones.

RUPLa Red Universitaria de Popayán ( RUP) es una red regional que tiene como objeto promover y coordinar el desarrollo de aplicaciones avanzadas de redes de telecomunicaciones y cómputo en la región, enfocadas al desarrollo científico y educativo de la sociedad, así como el desarrollo de la infraestructura necesaria para que dichas aplicaciones se lleven a cabo. Esta Red tiene su sede en la ciudad de Popayán, departamento del Cauca.

UNIREDEs una corporación mixta, sin ánimo de lucro, conformada por instituciones de educación, investigación y desarrollo del oriente colombiano, integrada por los departamentos Santander, Boyacá y Norte de Santander. Se fundamenta en el trabajo colaborativo entre sus asociados en pro del desarrollo de la academia y la investigación a nivel regional. Además de promover la consolidación de alianzas estratégicas entre la academia, el sector productivo y el Estado, ofreciendo soluciones a las necesidades latentes en áreas como la innovación, la investigación y el desarrollo.

Objetivos:

Facilitar el acceso de la información a los usuarios Promover la diseminación de las bases de datos Descentralizar la información Compartir recursos Fortalecer las bibliotecas del país Desarrollar nuevas tecnologías Racionalizar la adquisición de documentos

3. Grids en el mundo

Page 8: Taller Grid Computing

Existen muchos proyectos que han sido desarrollados en esta línea algunos de ellos son:

GriPhyN: Proyecto que aúna investigadores de las Tecnologías de la Información y la Física Experimental con el objetivo de crear Data Grids (Petascale Virtual Data Grids o PVDG) que satisfagan los requerimientos de manejo de datos a gran escala a científicos en todo el mundo.

CERN: El Centro Europeo para la Investigación Nuclear (CERN) uno de los mayores centros de investigación física del mundo, desarrollo el proyecto “DataGrid”, que tiene como objetivo unir a grandes bases de datos y usuarios en una futura red informática de alta velocidad.

El acuerdo, firmado, prevé que la Unión Europea aportará en un periodo de tres años, 9,8 millones de euros para el desarrollo de la nueva red. Los especialistas en informática consideran que el proyecto es “el banco de pruebas ideal de un nuevo modelo de tratamiento informático a escala mundial y la evolución natural de la WWW”.

Según el CERN, DataGrid unirá a superordenadores, procesadores, sistemas informáticos y usuarios en una red de alta velocidad. DataGrid se define pues como una alternativa para superar los límites de capacidad de tratamiento de datos que padece la WWW y su lentitud debido a la multiplicación del número de usuarios. DataGrid ofrecerá a los científicos de todo el mundo y a todos los usuarios, un acceso rápido a los recursos informáticos.

Condor Project: Desarrolla, implementa y evalúa mecanismos para dar soporte a la computación de altas prestaciones a través de largas colecciones de recursos computacionales distribuidas. Provee herramientas para el manejo de colas de tareas, políticas de planificación, esquemas de prioridades, monitoreo de recursos etc.

Existen varias soluciones comerciales en forma de empresas, por ejemplo:

Enterprise Grid Alliance (EGA):Se crea en California, en abril de 2004, por un grupo de empresas líderes en tecnología para desarrollar soluciones comerciales-empresariales de informática distribuida y para acelerar el despliegue de esta tecnología en las empresas. Es un consorcio abierto enfocado en el desarrollo y promoción de soluciones de mallas empresariales.

Sun Microsystems: El software Grid Engine de Sun hace más fácil agregar máquinas al grid y automáticamente toma ventaja de la energía incrementada, por lo que ahorra tiempo y recursos a través de un grid rápido, eficiente y confiable para el manejo y despliegue.

JPPF: El software JPPF habilita las aplicaciones con altos requerimientos de procesamiento para ser ejecutadas en varias computadoras con diferentes

Page 9: Taller Grid Computing

características (heterógeneas) gracias a su arquitectura basada en Java, de manera escalable (agregando o disminuyendo computadoras participantes) de manera dinámica, distribuyendo la aplicación en tareas (jobs).

Andago: Con el objetivo de acercar la tecnología grid a los entornos industriales y de negocio, Andago añadió a su oferta de soluciones su experiencia en proyectos Grid.

Las soluciones middleware, todas ellas de código abierto, utilizadas (por ejemplo por Andago) son:

EGEE (Enabling Grids for E-sciencE): Desarrollado dentro del EU ResearchNetwork une expertos de más de 27 países con el fin de aprovechar los avances de la tecnología Grid para proveer a los investigadores acceso a recursos de cómputo independientemente de su ubicación geográfica.

SETI@home: Ha sido el proyecto de computación distribuida más popular de la historia, cuyo objetivo era la búsqueda de vida extraterrestre mediante la detección de su tecnología de comunicaciones, buscando patrones que demuestren inteligencia en las ondas de radio procedentes del espacio. Para ello, cualquier persona que quisiera colaborar podía descargarse un salvapantallas gratuito (de este modo aprovechaba los ciclos del ordenador sólo cuando éste no estaba en uso), que instalado en su ordenador analiza señales del espacio captadas con el radiotelescopio de Arecibo en Puerto Rico. El software se hizo público el 17 de mayo del 1999 y, desde entonces hasta su finalización el 15 de diciembre de 2005, más de 5 millones de voluntarios han instalado el programa en su ordenador, se han conseguido un total acumulado de dos millones de años de tiempo de CPU y se han analizado alrededor de 50 TB de datos, convirtiendo al proyecto en el mayor computador virtual de la historia de la humanidad por análisis realizados.

En la actualidad, SETI@Home sigue en funcionamiento pero integrado en BOINC (Berkeley Open Infrastructure for Network Computing), un proyecto basado en recursos de redes abiertas con los mismos principios que el proyecto original. La nueva infraestructura continuará con la búsqueda de señales de radio extraterrestres, pero ahora además la potencia de CPU de los participantes se dedicará también a investigar sobre otras tareas, como el cambio climático, la astronomía y la cura de enfermedades.

IRISGrid: Iniciativa española en Grids, nació en el año 2002, a partir de la proposición de diversos grupos nacionales interesados en esta tecnología en España. A día de hoy, IRISGrid cuenta con la participación de más de 50 grupos en España, dentro de todos los ámbitos de conocimiento. Los objetivos de IRISGrid son:

Page 10: Taller Grid Computing

Integrar a los diferentes grupos interesados en las tecnologías grid en España, y su interés.

Mantener unas infraestructuras nacionales Grid, que permitan la correcta operatividad y uso de un Grid de investigación, y que facilite el desarrollo de middleware y aplicaciones por parte de los grupos españoles y que asegure asimismo la integración y acercamiento a esta nueva infraestructura.

Coordinación de los diferentes proyectos Grid en España y sus infraestructuras con el objeto de asegurar la interoperatividad de estos.

Distributed.net: Emplea miles de ordenadores distintos para crackear códigos de encriptación (RC5-64, CSC, DES-III, DES-II-1, DES-II-1, RC5-56, etc.). Fundado en 1997, el proyecto ha crecido hasta abarcar hoy en día más de 60.000 usuarios alrededor de todo el mundo. El poder de cómputo de Distributed.net ha ido creciendo hasta llegar a ser el equivalente a más de 160.000 computadoras PII 266MHz trabajando 24 horas al día, 7 días a la semana, y 365 días al año.

Globus Project: Es una iniciativa multi-institucional para la investigación y el desarrollo de tecnologías fundamentales para Grids, con la activa participación de la empresa IBM, cuya intención principal es crear una plataforma completa donde compartir aplicaciones y recursos informáticos en Internet. Uno de sus primeros productos es el Globus Toolkit, que está siendo utilizado en varios proyectos de aplicación y despliegue de Grid en los Estados Unidos, Europa y el resto del mundo. El Proyecto Globus tiene su sede central en el Laboratorio Nacional Argonne y la Universidad del Instituto de Ciencias de Información de California del Sur.

El proyecto busca llevar las redes Grid más allá de las habituales aplicaciones técnicas y científicas para que pueda ser de utilidad en aplicaciones reales de negocio, conectando muchos superordenadores dispersos geográficamente mediante Internet y unos protocolos específicos de código abierto creados por la organización internacional Globus.

OGSA: La Arquitectura de Servicios Abiertos Grid presenta un conjunto de especificaciones y estándares que combina los beneficios de la informática Grid y los servicios web. Así, los clientes pueden, por primera vez, compartir y acceder a los recursos informáticos que necesitan en Internet, contando con el soporte de una infraestructura muy resistente, con capacidad de autogestión y siempre disponible; pueden integrar aplicaciones y compartir datos y potencia de

Page 11: Taller Grid Computing

procesado, consiguiendo unos niveles de eficiencia muy altos, así como muy bajos costos.

Este conjunto de especificaciones OGSA completa los estándares XML, WDSL y SOAP , con los estándares desarrollados por Globus para tecnologías de redes Grid, utilizados para localizar, planificar y asegurar recursos informáticos.

OGSA cuenta con el apoyo de empresas de diferentes industrias, incluyendo AVAKI, proveedor de soluciones comerciales de software Grid; Entropía, proveedor de informática de redes Grid distribuida basada en PC; Microsoft; y Platform Computing, proveedor de software de informática distribuida.

IBM tiene como objetivo la implantación de OGSA como punto clave en su "Proyecto eLiza". El proyecto eLiza es la iniciativa de informática autonómica de IBM para construir un servidor de infraestructura autogestionable, abierto y heterogéneo para el comercio electrónico y la puesta en práctica de Grids comerciales.

TeraGrid: Es un proyecto estadounidense, llevado adelante por la Fundación Nacional de Ciencias (NSF). Dedicado a la investigación científica abierta, tiene el objetivo de interconectar instalaciones y centros de investigación académica en puntos distantes geográficamente, está considerado como una de las infraestructuras más grandes y más rápidas del mundo. Integra ordenadores, bases de datos y herramientas a lo largo de todo el país. Cuenta con más de 102 teraflops de capacidad computacional y más 15 petabytes de datos organizados en alrededor de 100 bases de datos sobre diferentes disciplinas.

A fin de permitir que los investigadores lleven a cabo proyectos de investigación y colaboren en ellos, se archivan datos de varias disciplinas científicas y de ingeniería. Los proyectos de esta magnitud son de valor crítico y fundamental para la comunidad científica y la recompensa que surja de la integración de soluciones para los investigadores a esta escala podría ser enorme, al reducir los costos y el tiempo de desarrollo y al crear productos más seguros.

Mediante el proyecto TeraGrid, los científicos tendrán la capacidad para simular actividades sísmicas en estructuras a fin de diseñar edificios y puentes más seguros, los astrónomos podrán compartir datos desde sus telescopios y los investigadores médicos tendrán la posibilidad de compartir ideas y datos para quizá curar una enfermedad, lo que asegura que las oportunidades que se ofrecen a los científicos son incalculables.

CrossGrid: Con el fin de poder ejecutar aplicaciones interactivas en un entorno Grid, se modifica el middleware adaptándolo para ello. En este proyecto se han definido cuatro aplicaciones que utilizarán desarrollos Grid comunes, que son: 1) Simulación interactiva y visualización de un sistema biomédico; 2) Sistema de

Page 12: Taller Grid Computing

apoyo a un equipo de crisis por inundaciones; 3) Análisis de datos distribuidos en Física de Altas Energías y 4) Previsión meteorológica y modelización de la contaminación atmosférica.

Los proyectos científicos relacionados con áreas como el análisis de la física de partículas, la biología computacional, la medicina, las ciencias medioambientales y la astrofísica, se nuclean en el Reino Unido bajo el nombre de e-Ciencia, la cual sólo puede ser comprendida con el avance de la tecnología Grid o de computación distribuida. Precisamente, en torno a esta tecnología y a la e-Ciencia han surgido numerosos proyectos y múltiples centros de investigación se han centrado en su desarrollo.

Por su parte, CrossGrid, también proyecto de la Unión Europea nacido en 2001, tiene como fin el desarrollo, entre los años 2002 y 2005, de aplicaciones interactivas en entornos Grid y la extensión del banco de ensayo (testbed) de DataGrid.

OpenMolGRID: Desarrollado por ComGenex Inc., un proveedor de descubrimientos químicos avanzados, tiende a proporcionar información unificada y extensible del entorno para solucionar las cuestiones moleculares de diseño e ingeniería con relación a la química, la farmacia y la bioinformática. El proyecto utiliza un set de aplicación con herramientas orientadas a establecer servicios centrales Grid y funciones provistas por la infraestructura Eurogrid, y se desarrollan herramientas para aumentar el acceso a las bases de datos heterogéneas y de distribución y para adaptar las herramientas de software existentes

UK e-Science: Un equipo de científicos del Reino Unido dio a conocer en una conferencia de gran magnitud, un elemento clave de la computación Grid que facilitará a los investigadores aprovechar enormes recursos informáticos de todo el mundo para afrontar los desafíos científicos clave en campos como el genoma humano y la física de partículas. Los responsables de la iniciativa elaboraron un conjunto de procedimientos que permitirán que los científicos que utilicen Grid accedan a las bases de datos de los resultados de investigación procedentes de sistemas que se encuentren en cualquier parte del mundo.La intención es que las nuevas especificaciones sirvan para crear sistemas de prototipos de Grid, así como aplicaciones comerciales y científicas.

LHC Grid: por sus siglas en ingles LHC significa Gran Colisionador de Hadrones, un acelerador de partículas a gran escala construido por el laboratorio CERN en Suiza. El volumen de datos resultado de sus experimentos pretende ser tan grande como 15 petabytes por año, tal cantidad necesita de un sistema enorme de almacenamiento, por esto implantaron un grid que hasta la fecha incluye más de 140 centros de computación en 33 países. Los datos producidos por el LHC se almacenan y distribuyen entre los miembros del grid.

Page 13: Taller Grid Computing

Grid5000: Este proyecto tiene por objeto la construcción de una plataforma experimental de recogida de cuadrícula 8 sitios distribuidos geográficamente en Francia. El principal objetivo de esta plataforma es la de servir como banco de pruebas experimentales para la investigación en Grid Computing.

Los planes actuales son para montar una plataforma física con 9 grupos, cada uno con 100 a mil ordenadores, conectados por la Educación y la Red de Investigación Renater. Todos los grupos estarán conectados a Renater a 1 Gb / s (10 Gb / s se espera en un futuro próximo).

Este gran esfuerzo de investigación en colaboración es un proyecto financiado por el Ministerio francés de Educación e Investigación, INRIA, CNRS, las Universidades de todos los sitios y algunos consejos regionales.

EGEE: (Enabling Grids for e-Science in Europe) El proyecto utilizará la tecnología Grid para interconectar recursos computacionales de veintisiete países europeos, con el objeto primordial de unir los recursos de los equipos informáticos de las instituciones participantes y crear de este modo un supercomputador virtual, aprovechando la infraestructura de comunicación de banda ancha proporcionados por la Red Europea de Investigación Géant. [EGEE] En el proyecto se plantea coordinar el uso conjunto de recursos de computación en forma distribuida entre los diferentes centros, constituyendo una plataforma donde aplicaciones de gran importancia en Informática Biomédica y en Física de Altas Energías funcionarán a máximo rendimiento. El centro que dirige el proyecto es el Laboratorio Europeo de Física de Partículas (CERN) que se encuentra en Ginebra (Suiza).

El Grupo de Redes y Computación de Altas Prestaciones de Valencia (GRyCAP) ha coordinado en los últimos años unos diez proyectos, la mayor parte de ellos europeos, orientados al desarrollo de aplicaciones informáticas avanzadas para el diagnóstico por imagen o la planificación quirúrgica. El GRyCAP se encargará en el proyecto EGEE de identificar, seleccionar y apoyar el despliegue de aplicaciones informáticas de apoyo a la asistencia sanitaria de forma que los usuarios médicos puedan tener acceso a las más avanzadas herramientas para el diagnóstico, la prevención o la simulación de la terapia tanto para la investigación clínica como la práctica diaria.

Asimismo, cuenta con una avanzada infraestructura informática formada por un Grupo de computadoras para el Grid y con facilidades de almacenamiento de datos. El objetivo es participar en la puesta a punto de un sistema computacional internacional montado en Grid que cubra las necesidades informáticas generadas por el procesado de datos procedentes de los experimentos de física de partículas. Esta iniciativa consiste en aglutinar los recursos informáticos con el fin de ser compartidos por investigadores de diferentes áreas científicas como la Astrofísica, la Meteorología, la Biología, la Nanofotónica, etc.

Uno de los campos donde se han centrado más los esfuerzos de compañías comerciales es en el de la supercomputación. Empresas con un amplio abanico de

Page 14: Taller Grid Computing

productos, como HP y Sun, y otras especializadas como ENTROPIA o GridSystems, ofrecen desarrollos para la instalación de grids con altas capacidades de cómputo. Así por ejemplo, HP conectó al grid del DOE (DOE Science Grid) una máquina Linux de 9,2 teraflops. Este grid se usa para llevar a cabo simulaciones, analizar datos y coordinar experimentos. Sobre la máquina se instalará el software de Globus para permitir la gestión de recursos, el movimiento de datos y el control de la seguridad entre los grupos de investigación que hagan uso de él. Los usuarios se identificarán en el grid mediante las credenciales de autenticación del GSI (Grid Security Infraestructure). El estándar de seguridad de Globus. El supercomputador de HP será puesto a disposición del grid a través del Globus MDS (Monitoring and Discovery Service), un catálogo seguro de todos los recursos del grid.

En el caso de Sun son conocidas sus instalaciones en Ford Motor's Engine and Transmission Groups que cuentan con 500 workstation Sun Blade con procesador dual o SAAB Automovile AB que cuenta con 100 workstation de Sun. En estas instalaciones se llevan a cabo las simulaciones sobre aerodinámica de los nuevos modelos. Ambas instalaciones hacen uso del Sun ONE Grid Engine (que es capaz de ejecutar 7000 grids con unas 47 CPU's por grid). Este software puede utilizarse sobre Linux o Sun OS y tiene una versión de libre distribución en www.Sun.com y cuya versión comercial comienza a partir de 20.000 dólares.

GridSystems es una compañía española fundada en Febrero de 2000 que ha desarrollado el productor InnerGrid para la aplicación de la tecnología grid en entornos empresariales, académicos y de investigación. Este software divide datos y procesos en pequeñas unidades que se ajustan dinámicamente a los recursos conectados a la red. El sistema es multiplataforma (Windows y todos los sistemas UNIX). Esta empresa ha desarrollado trabajos para diversas empresas pero su desarrollo más conocido es la red grid de la Universidad Politécnica de Valencia. En esta red se integra el servidor de la serie ALTIX 3000 de Silicon Graphics, con 48 procesadores Itanium 2, el cluster de IBM con 64 nodos, biprocesador Xeon, y, las 3000 CPU's con las que cuenta la universidad en aulas y departamentos. Este proyecto sitúa a la UPV a la cabeza de España en lo que se refiere a capacidad de cálculo disponible.

ENTROPIA: Es una empresa centrada en el PC Grid Computing, uno de sus trabajos más interesante es el que ha llevado a cabo en el centro de supercomputación de San Diego. El producto que desarrolla se denomina DCGrid Platform que permite utilizar una red de CPUs para aprovechar los ciclos libres de CPU aumentando la capacidad de cómputo global con un bajo coste. De esta manera los ciclos libres son utilizados por aplicaciones que consumen muchos recursos y necesitarían de un supercomputador o por trabajos puntuales e intensivos en una fracción de tiempo. La instalación del producto en una empresa permite la utilización de máquinas que han quedado obsoletas y la instalación de nuevas máquinas sin que se interfiera en el trabajo de la compañía, ya que el software es fácilmente escalable.

Page 15: Taller Grid Computing

Otra de las grandes áreas de aplicación es el almacenamiento masivo de datos. Dentro de esta área se encuentran los nuevos productos de Oracle: Oracle Database 10g, Oracle Application Server 10g, Oracle Enterprise Manager 10g y Oracle 10g Development Tools. Estas nuevas versiones se centran en la aplicación de las ideas de Grid Computing al almacenamiento de datos. La nueva versión parte de la arquitectura actual en la que se encuentran la mayoría de los sistemas de información (véase Figura 5). Cada una de las capas es de uso dedicado a cada sistema de información. Evidentemente, el fallo de alguno de los componentes de los tres niveles (Application Server, Database y Storage) supondría una pérdida del servicio.

Otros países cuentan con programas para el desarrollo de la tecnología Grid como los japoneses Ninf Project (Tokyo Institute of Techology) y NAREGI (National Research Grid Initiative), APAC Grid en Australia, en China el China National Grid y en la India el proyecto conocido como Kerala Education Grid.Edonkey, Emule o Limewire son programas para compartir datos a nivel mundial entre diferentes máquinas.

4. Conclusiones

Grid responde al modelo de “computación bajo demanda”, donde el usuario puede tener acceso a los recursos computacionales de la misma forma que la energía eléctrica, es decir, desde cualquier lugar, con un funcionamiento y un costo adecuados.

La Computación Grid fue pensada para proveer capacidad de proceso y de almacenamiento de datos, y a la vez, fomentar el uso compartido de información, aplicaciones y conocimiento, favoreciendo la colaboración científica y tecnológica y resultando ser por lo expresado, un entorno especialmente propicio para intercambios entre comunidades científicas y el sector empresarial e industrial.

La puesta en marcha y la participación de agrupaciones mundiales en proyectos Grid podrán significar la implementación de un desarrollo tecnológico de vanguardia, la “World Wide Grid”, lo cual supondrá una nueva revolución en la llamada Sociedad de la Información en los comienzos del siglo XXI, equivalente a la que supuso la World Wide Web en los años 90.

Lo que busca la GC es virtualizar, administrar y asignar recursos físicos distribuidos, tales como potencia de procesamiento, capacidad de memoria y almacenamiento y acceso a redes para publicaciones y usuarios con necesidades particulares(on demamand) sin importar el lugar geográfico donde se ubiquen los recursos físicos las redes en malla trascienden a sus componentes físicos sus unidades organizacionales , su infraestructura empresarial o fronteras geográficas

Page 16: Taller Grid Computing

naturalmente , el software juega un papel determinante en el éxito de la GC y es allí en donde linux está empezando a tomar ventaja.

A pesar de que la tecnología Grid no es madura y se está trabajando mucho en ella, vemos como ésta ya es una realidad, y diferentes centros utilizando aplicaciones adaptadas a este modelo distribuido pueden obtener muchos beneficios.

La computación en grid es actualmente un fenómeno en emergencia al que Globus Project ha proporcionado una implementación estándar que es utilizada por multitud de investigadores y empresas. La estandarización del grid, fruto de la unión de investigadores y empresas en el Global Grid Forum, ha permitido que los sistemas que hacen uso del grid salgan del ámbito puramente investigador y se integren como sustento de aplicaciones empresariales.

Las aplicaciones empresariales se han centrado fundamentalmente en el aumento de la capacidad de cómputo en empresas que así lo requerían y en la adaptación de sistemas de almacenamiento comerciales (como Oracle) a los estándares del grid. Esta rápida absorción de las ideas del grid computing por parte de las empresas es lo que hace pensar que puede ser una de las tecnologías que en los próximos años aparezca en alza.

Esta percepción se basa tanto en la aplicabilidad de las ideas como en la estrecha relación de esta tecnología con las nuevas versiones de Internet que permitirán que el flujo de datos entre los ordenadores aumente, hecho del que se verán beneficiados los desarrollos basados en grid.

Las redes de alta tecnologia potencian el desarrollo de la educación, la ciencia, la innovación y la investigación facilitando la labor de academicos e investigaciones y ampliando las posibilidades para el desarrollo delos proyectos asociados en los diferentes campos de desempeño.

Estas redes sirven de canal para el acceso a recursos a distancia como instrumentación remota, robots, telescopios, mocroscopios, equipos de medicion, laboratorios virtuales, entre otros.

Brindan la posibilidad de crear mallas computacionales(GRID), supercomputacion, cluster, haciendo posible altos niveles de procesamiento y almacenamiento de información mediante la cooperación y paralelización de recursos disimiles y distantes fisicamente.

A medida de la investigación se evidencio que las redes de altas tecnologias son el medio propicio para compartir recursos de citacion y publicación como bibliotecas digitales, sistemas de indexación audiovisual, directorios digitales, manejadores de contenido y bases de datos digitales.