Sei sulla pagina 1di 42

Antoine’s

Grid Computig

Observatorio Tecnológico Abril 2003


Antoine’s Grid Computing

Índice
Definición (I y II) GAF4J: modelo de
La “nueva” ola tecnológica funcionamiento
Tecnología Grid: concepto DRMAA
Tecnología Grid: alcance Domain Services
Una métrica del problema Evolución (I y II)
Una visión global Del mundo científico/académico
Entorno distribuido Al mundo empresarial
Arquitectura La realidad del sector (I a III)
El proyecto Globus HPC en el sector financiero (I y
El proyecto Condor (I y II) II)
Arquitectura OGSA Interés para el sector financiero
Grid Services: OGSA Interés para el banco (I a III)
Grid Services El mercado (I y II)
Infraestructura Grid: OGSI Casos de aplicación
GAF4J: definición GridSystems (I a III)
Pasos a seguir
Antoine’s Grid Computing

Definición (I)
El término Grid se acuñó a mediados de los años 1990, para designar una
infraestructura distribuida para la ejecución de aplicaciones científicas y de
ingeniería. Según se ha ido avanzando en la construcción de esa
infraestructura, el término ha ido ganando popularidad, a la vez que se
extendía abarcando desde el networking hasta la inteligencia artificial.

El hecho importante es que existe un problema concreto al que responde,


que es “la compartición coordinada de recursos y la resolución de
problemas en organizaciones virtuales multinstitucionales
dinámicas”*

Esos recursos pueden ser máquinas, datos, software... Cualquier tipo de


recurso necesario en cualquier proceso cooperativo orientado a la resolución
de algún problema en un entorno, que puede ser científico, ingenieril,
corporativo o institucional. Una compartición que debe estar estrictamente
controlada, en términos de quién está compartiendo qué, y bajo qué
condiciones. La definición está autorreferenciada, puesto que el conjunto de
personas o instituciones definidas por esas “reglas” de compartición,
*“The Anatomy of the Grid”
formarán lo que se conoce como organización virtual.
http://www.globus.org//research/papers/anatomy.pdf
Antoine’s Grid Computing

Definición (y II)
El concepto de Grid está por tanto muy unido al de organización virtual,
virtual también
muy ambigüo. En el mundo empresarial, con la difusión de los modelos orgánicos,
como sucesores de los antiguos modelos mecanicistas con origen en la primera
revolución industrial, se ha popularizado la idea del ecosistema de negocio como el
ámbito natural donde las empresas desarrollan su actividad; un entorno turbulento,
necesariamente abierto; donde las fronteras interorganizacionales se difuminan,
ante la alternativa de constituirse como obstáculos para la necesaria colaboración
entre los individuos que componen aquel ecosistema.

Los ejemplos de organizaciones virtuales (OV) que se pueden encontrar son


interminables: los proveedores de servicios (ASP, SSP, ISP... xSP), los socios
(consultoras que se embarcan en una joint venture, organizaciones que concurren en
escenarios B2B), equipos de proyecto, gabinetes de crisis, ingeniería concurrente,
consorcios sectoriales, cuerpos de estandarización... Pero analizados los requisitos
tecnológicos de estas organizaciones, es posible identificar un conjunto de aspectos
que preocupan a todas, y que se pueden ver como la especificación de una
plataforma tecnológica.

Esas OV necesitan relaciones de compartición muy flexibles (C/S – P2P), niveles


de control muy precisos (control de acceso, delegación, aplicación por políticas) y
C/S: Client/Serv
mecanismos para compartir recursos muy variados (aplicaciones, ordenadores, P2P: Peer-to-Pe
xSP: (A
A, Application. S, Storage. I, Internet) Service Provid
Antoine’s Grid Computing

La “nueva” ola tecnológica

“Virtual, adaptable, open, on-demand”

Mainframe PC Client/Server Internet Distributed


70s 80s 90s Late 90s Computing
21st
Century
Antoine’s Grid Computing

Tecnología Grid: concepto


“Resource sharing & coordinated problem solving in dynamic,
multi-institutional virtual organizations” *

“When the network is as fast as the computer's


internal links, the machine disintegrates across
the net into a set of special purpose appliances”
(George Gilder)

* “The Anatomy of the Grid”


Antoine’s Grid Computing

Tecnología Grid: alcance

SCM ERP CRM


Bus de Aplicaciones

DM
DWh
Intranet
B2E BI (Empleados) KM B2E
Extranet Internet
(Proveedores Wfw Engine BPM System (Clientes)
B2B Partners)
Procesos de Negocio  BPA
B2C

Extra-Grid Intra-Grid Inter-Grid


Antoine’s Grid Computing

Una métrica del problema


En torno al alcance de esta tecnología, a uno se le ocurre que sería interesante ofrecer el servicio
de una plataforma Grid en Internet: Parabon Computation se dedica a ese negocio (da servicio
con su plataforma Frontier y clientes en Internet a los que se distribuye Pioneer). La pregunta
evidente que surge es si cualquier trabajo es susceptible de distrubuirse para su ejecución en
Internet. La gente de Parabon ofrece una respuesta, un criterio para decidir si vale la pena la
distribución sobre un Grid: la relación c2d (Cumputing-to-Data ratio) definida como la relación
entre la capacidad de procesamiento necesaria (“carga computacional” por máquina individual)
para realizar un trabajo, y la cantidad de datos y código que se deben distribuir para soportar esa
ejecución.

Habitualmente, la carga computacional se suele estimar por el número de instrucciones en coma


flotante (Miles de millones de instrucciones, GFLOPS), que en una hora serán 3,6 billones de
instrucciones (1 GFH). La cantidad de datos (o código) que es necesario mover se suele medir en
GigaBytes (GB). En Parabon han considerado que el umbral se puede establecer en 1,5 GFH/GB.
GFH/GB
Es decir, que con relaciones c2d < 1,5 no vale la pena plantearse la utilización de un servicio
Grid para resolver un problema.

Aplicaciones con una relación c2d alta son candidatas a priori para la utilización de un servicio
Grid de procesamiento distribuido.
Frontier Platform Internet Pioneer Engine
Computing
Antoine’s Grid Computing

Una visión global


Antoine’s Grid Computing

Entorno distribuido
Hoy, si se pretende representar el entorno en el que desarrolla su actividad una gran empresa,
tendríamos que visualizar un entorno distribuido, desde el punto de vista de los sistemas y de las
aplicaciones, en el cual observaríamos una separación clara entre las funciones que residen en los
servidores centrales de los ASP/SSP, y las que se asignan a los elementos perimetrales de la red.

ASP: Application Service Provider


SSP: Storage Service Provider
Antoine’s Grid Computing

Arquitectura

Application

Application
Collective

Resource

Transport
Connectivity
Network

Fabric Link

Grid Protocol Architecture Internet Protocol Architecture


Antoine’s Grid Computing

El proyecto Globus

Es EL referente a nivel mundial. Se trata de un proyecto


OpenSource que se originó en los laboratorios de IBM en
1996, y que ha ido evolucionando su Globus Toolkit, hasta
llegar a la reciente estandarización* de su versión GT 3.0,
compatible con la especificación de la OGSA.

Constituye una de las piezas del puzle de la infraestructura


Grid. Está constituido por un conjunto modular de protocolos
+ API + SDK, y sirve como capa de middleware para
“ocultar” la semántica de todo el proceso de virtualización
en que se apoya la tecnología Grid. La clave de su
efectividad está en su estandarización, puesto que la única
forma de explotar todo el potencial de la tecnología es
desarrollando estándares abiertos (Open Standard ≠ Open
Source). Los esfuerzos más importantes se llevan a cabo en
el seno del GGF (Global Grid
* Realmente Forum)
aun no es un estándar, de donde
pero ya surge
se ha remitido el último la OGSA.
borrador tras la última
recogida de sugerencias.
Antoine’s Grid Computing

El proyecto Condor (I)

Otro proyecto académico, muy relacionado con Globus. En


este caso, iniciado en la universidad de Wisconsin-Madison,
hacen hincapié en la diferencia entre HPC (High Performance
Computing), donde siempre se ha hablado del número de
MFLOPS para medir ese rendimiento, y HTC (High Througput
Computing) que se ocupa de los sistemas capaces de
proporcionar una gran capacidad de procesamiento de forma
sostenida; una idea mucho más en la línea de la tecnología
Grid y el Utility Computing (fundamento del On Demand e-
Business de IBM).

El equipo de Condor está muy relacionado con esfuerzos de


I+D en el entorno del procesamiento en paralelo, y gran
parte de sus desarrollos están orientados a su
compatibilidad con MPI (una biblioteca para escribir
aplicaciones que se ejecutan en paralelo sobre un número
MPI Message Passing Interface
PVM Paralell Virtual Machine
Antoine’s Grid Computing

El proyecto Condor (y II)


Esta ilustración de su arquitectura modular,
sólo pretende mostrar que sigue la misma
filosofía de Globus respecto a la virtualización
de los recursos y la ocultación de la semántica
con una capa de middleware.
Antoine’s Grid Computing

Arquitectura OGSA

Aquí se trata de destacar la


arquitectura modular que se Grid
propone desde el GGF, que nos Services
GT
permite apreciar cómo los servicios Data
del Grid se van a apoyar en un
Services
conjunto de servicios básicos del
middleware correspondiente -- cuya GT Base Services
posible evolución intentamos mostrar
en la ilustración de abajo -- y en un GT Core
bloque de servicios específicos para
servicio de datos.

“Open Grid Services Infrastructure”


http://www.gridforum.org/ogsi-wg/drafts/draft-ggf-ogsi-gridservice-26_2003-03-13.pdf
“The Physiology of the Grid”
http://www.globus.org/research/papers/ogsa.pdf
Antoine’s Grid Computing

Grid Services (OGSA)


Se reconstruye la pila de protocolos de Globus de forma que se constituye
una capa común de funcionalidades básicas.

Se busca una orientación hacia el concepto de servicio (SOA, Service-


Oriented Architecture)* que permita virtualizar los recursos y unificar
servicios, recursos e información.

Para la adopción de un IDL estándar, se apoyan en la tecnología de Web


Services; con la idea de potenciar los esfuerzos comerciales hechos en ese
terreno y conseguir así ofrecer una serie de interfaces y comportamientos
estándar para la gestión de recursos distribuidos, que es básicamente en lo
que consisten los Grid Services.

Lo que ocurre es que los desarrollos relacionados con Web Services se


ocupan sólo del descubrimiento e invocación de servicios “persistentes”, y
en un entorno Grid, se deben soportar instancias de servicio “transitorias”,
que se crean y destruyen de forma dinámica: esas instancias pueden ser
interfaces con el estado de actividades distribuidas (e.g. Wfw, Vconf, DDM).
Esa componente dinámica tendrá implicaciones importantes en cómo se
nombran, se descubren, se gestionan y se usan los servicios.
* Es distinto de una arquitectura basada en servicios. Es importante la distinción entre las expresiones ‘service-oriented’
y ‘service-based’.
Antoine’s Grid Computing

Grid Services
CreateService Enlace (Bind)
Grid Service Handle (GSH)
Destroy Invocación fiable
SetTerminationTime
(Autenticación)
Interfaces Estándar
… otras interfaces … Notificación
Acceso a los datos del sercio
Destrucción (explícita) GridService (opcional) Autorización
Vida del servicio Creación
Mantenimiento del estado (Soft- Registro
FindServiceData
state)
Estos elementos son
Datos Datos Datos Gestión
trozos de XML Del Del Del Concurrencia
encapsulados en un Servicio Servicio Servicio
formato estándar +
<name,type,TTL-info> Interfaces para
Incluyen información
interna, datos Implementación Aplicaciones específica
específicos de la =
interfaz y datos de perfil de WS (WSDL
aplicación
Entorno de desarrollo/ejecución
(C,C#, J2EE, .NET, …)
Grid Services = Interfaces + Datos del
Antoine’s Grid Computing

Infraestructura Grid: OGSI


Open Grid Services Infrastructure

La visión de IBM apoyada en estándares abiertos

Application

Professional Services
System Grid Services
Capabilities
Autonomic

Management
OGSI

Web Services

Grid-enabled Database, Network,


Security...
Grid Enabled Servers
Antoine’s Grid Computing

GAF4J: definición
Grid Application Framework for Java

Se trata de crear una capa de


abstracción que oculte la
semántica Grid a las
Aplicación Aplicación Java aplicaciones Java multiproceso
(multi-thread); mientras que les
Java
permite utilizar los servicios de
Grid GAF4J
GAF4J la infraestructura Grid mediante
un modelo de programación
Java.
Globus Java CoG (Commodity Grid) Toolkit
La creación de “hebras”
(threads) se convierte en la
GTK creación de objetos (task
Infraestructura de Servicios Grid
objects), que encapsulan los
trabajos que se quieren ejecutar
Recursos distribuidos sobre el Grid, con todas las
dependencias con referencia
absoluta a cada nodo de
Antoine’s Grid Computing

GAF4J: modelo de funcionamiento


1. Envío de las tareas
TaskExecutiveClient
Aplicación
Notificación de estado de la ejecución
Cliente 3. Añadir tareas a la cola
Task_1

TaskDispatcher 4. Lanzamiento
de los trabajos
Task_2 sobre el Grid
2. Mostrar consola seleccionado

Console JobStarter
Task_3
7. Distribuir los
Componentes 5. Encontrar los recursos más adecuados
trabajos a los nodos
• Client Framework del Grid

TaskDispatcher
TaskExecutiveClient ResourceBroker Grid
Console 6. Comprobar los
registros de esos
• Server Framework recursos
TaskExecutiveServer
• Services Framework
ResourceInformationServices
ResourceInformationServices
Antoine’s Grid Computing

DRMAA
Distributed Resource
Management Application API
El alcance de la especificación DRMAA se limita al envío de trabajos, su
monitorización y control así como la recepción del estado de los trabajos
terminados. La reserva de recursos, la seguridad y demás aspectos del Grid
se especifican en otros grupos de trabajo del GGF. Es una iniciativa,
copresidida por Sun Microsystems e Intel, que pretende fomentar la
interoperabilidad de aplicaciones Grid desarrolladas por distintos ISVs. En el
desarrollo de la especificación, que ha entrado el pasado 28 de marzo en el
último periodo de recepción de comentarios sobre la versión 1.0, han
participado actores como Cadence Design Systems, HP, IBM, Platform
Computing, Robarts Research Institute o Veridian Systems.
Antoine’s Grid Computing

Service Domain
Una tecnología de la que vienen hablando los desarrolladores de IBM desde principios de
año. Se trata de permitir que un conjunto de Web Services (WS) o Grid Services (GS)
trabajen de forma cooperativa, ofreciendo mecanismos para garantizar un funcionamiento
coordinado y con ciertas garantías de servicio. Estos ‘service domains’ (SD) se constituyen
como una capa de servicios suplementarios para entornos WS, que permite crear, filtrar,
encontrar (descubrir), agregar, compartir, organizar, seleccionar, encaminar, restituir y
conmutar WS con cierta autonomía.

Un dominio (SD) representa una colección de servicios, de alguna forma relacionados, o


comparables, ofreciendo un punto de entrada común al conjunto. Se busca potenciar el
valor que puede aportar la gestión agregada de WS, implementando un conjunto de
servicios orientados a ocultar la complejidad del funcionamiento interno del agregado.

Estos dominios se estructuran a partir de una unidad básica, que se conoce como ‘service
desk’, que se pueden agrupar en un ‘service hub’. Estos bloques constructivos, que se
pueden ver como unidades autónomas para el procesamiento de servicios, forman
estructuras anidadas más complejas, que son los ‘service domains’.

En la arquitectura que se ha propuesto, se describe un modelo para la agregación y


compartición de servicios, mediante la definición de una interfaz de entrada al servicio, una
interfaz para la suscripción (adhesión a diferentes servicios) y una interfaz para la política
del servicio. Un modelo que se apoya en la infraestructura estándar de Grid y WS, i.e.
puertos OGSI, SOAP, XML, UDDI, WSDL, WSIL, WSIF.
Antoine’s Grid Computing

Evolución (I)
Unidades de Negocio
De la visión estratificada por
niveles de la organización
empresarial “tradicional”, en
que se contemplan la
virtualización de los recursos

Colaboración Dinámica
a nivel físico, la distribución
de la carga de trabajo, Financiero Optimización de costes
basada en la delegación de
tareas a nivel operativo, la
automatización de los
procesos de negocio, la
optimización de los recursos
Lógica del negocio Procesos de negocio
financieros ... para llegar a
unas ‘ratio’ de eficiencia y
unos niveles de
productividad aceptables a
nivel de negocio, pasamos a
Operativa Actividades
ver a la organización
virtual como un contínuo
con diferentes grados de
colaboración entre Recursos Físicos y Lógicos
Antoine’s Grid Computing

Evolución (y II)
Integración
On Demand
Grid Services
Dynamic Sourcing
(pay as you use)

Web Services Utility


(capacity at a price)

Recursos Virtualizados Granjas de Servidores

Clusters

Provisión
Recursos Dedicados
a
del
ic ga os da

t
ca
r
a d
a n servicio
es de a ci m
i ón eo o ci de
nac an
c
eg aj
o
ig al N B
Antoine’s Grid Computing

Del mundo científico/académico

Globus Toolkit 3.0 Condor 6.5.0 for Linux&Solaris


03/2003

Search for ExtraTerrestrial Intelligence

UNiform Interface to COmputing REsour

IST Programme
Meteo GRID
Bio GRID
CAE GRID
Technology Development
HPC Research GRID
01/11/2000 – 31/10/2003
Antoine’s Grid Computing

Al mundo empresarial
Las primeras aplicaciones de la tecnología Grid nacen, como era de esperar, en
entornos académicos, de investigación científica; entornos que típicamente han
requerido gran capacidad de procesamiento, y donde también se originaron en su
momento las primeras ideas sobre procesamiento distribuido, “computación” en
paralelo (e.g. PVM) y virtualización de recursos computacionales: simuladores, entornos
de CAD/CAE, ingeniería concurrente... El paso al mundo empresarial se produce de
forma natural buscando entornos afines: el sector financiero, el de las
telecomunicaciones, la industria de los contenidos, la bioingeniería, las
administraciones públicas o la industria aeroespacial. Se trata de sectores industriales
donde se hace un uso intensivo de datos y capacidad de procesamiento.
Antoine’s Grid Computing

La Realidad del sector (I)

TCO (equipos y Utilización de la capacidad


sistemas) de procesamiento en el
entorno empresarial
32% integración
30% mantenimiento Sistemas Centrales 60%
16% software Servidores
12% hardware Departamentales10%
10% servicios Puestos de Trabajo 2-5%
El mayor problema,
problema al menos operativo con el que se encuentra la
tecnología Grid hoy es, por un lado la incipiente toma de contacto de los
fabricantes de software con la tecnología, lo cual redunda en que no todas
las aplicaciones comerciales son “gridables”; y por otro lado está el hecho
de que el actual sistema de licencias de software no contempla la
ejecución distribuida como algo habitual. Esta última es la mayor barrera
que se está salvando gracias a la existencia de licencias corporativas para
las grandes empresas del sector financiero, y la creciente actividad de
colaboración con los fabricantes para hacer que las nuevas versiones de sus
Antoine’s Grid Computing

La Realidad del sector (II)


El verdadero problema es de índole política. Es un problema que surge del choque
de la cultura corporativa con un cambio de paradigma, que inevitablemente va
asociado a la introducción de la tecnología Grid en el panorama empresarial. Dos
conceptos fundamentales en los que se apoya, la virtualización, y la orientación al
servicio, se oponen diametralmente a algunas actitudes heredadas de culturas
corporativas medievales que se apoyan en el poder asociado directamente a los
recursos que se gestionan. Es un problema sobre el que ha querido llamar la atención
Platform, publicando una encuesta que ha realizado en diversas compañías que
utilizan soluciones Grid, o que se han mostrado interesadas en su introducción a nivel
corporativo. En este informe hemos querido destacar algunos resultados. Aquí
mostramos, a título general una participación por sectores, y una pregunta de fondo
para situarnos.
Antoine’s Grid Computing

La Realidad del sector (y III)


Cerca del 90% de los encuestados respondieron afirmativamente a la
pregunta de si los problemas políticos constituían una barrera para la
introducción de la tecnología Grid en la empresa. Al pedirles que clasificaran
los aspectos más problemáticos, destacó, con casi un 45%, la pérdida del
control sobre los recursos; que han sido tradicionalmente un elemento de
poder dentro de las (grandes) organizaciones.

El resultado completo de la encuesta, así como información más completa sobre la inicativa de Platform se puede encontrar
Antoine’s Grid Computing

HPC en el sector Financiero (I)


Las aplicaciones que, en el
sector financiero, Simulación de carteras
tradicionalmente han
demandado sistemas con gran

Modelo de mercado
capacidad de procesamiento

Valoración de activos
(HPC, High Performance
Computing) se pueden
encuadrar en alguna de las
cuatro actividades que
aparecen a la derecha. Es
decir la realización, a partir de
los precios de mercado, la
dinámica del mismo y los
precios teóricos, es habitual
realizar simulaciones de
cartera, valoraciones de
activos, o la simulación de
mercados a partir de un Simulación de mercados
modelo, que se ha diseñado y
Antoine’s Grid Computing

HPC en el sector Financiero (y II)


Los esfuerzos de optimización, que inicialmente se centraron en la
modelización y el diseño de algoritmos que implementaran ese modelo; una
labor de ingeniería financiera (en el buen sentido de la palabra), hoy se
traslada a los sistemas (recursos en general) sobre los que se ejcutan esos
algoritmos.

De lo que se trata es de pasar de la “computación en paralelo, donde el


problema era distribuir una carga de trabajo, conocida a priori, sobre unos
recursos dedicados, a una situación en la que debemos compartir la
capacidad de una serie de recursos no dedicados, cuyas características
quedan totalmente ocultas tras el concepto de Grid (virtualización), para la
realización de tareas con unas restricciones de tiempo (como medida de su
criticidad) muy diferentes. Este enfoque sólo es posible en un entorno en
que la criticidad de un proceso no implica el uso de recursos dedicados.

Realmente no es nada nuevo; la idea que hay detrás de Grid es integrar lo


mejor de dos paradigmas bien conocidos, como son el NIC (Network
Integrated Computing) que hace énfasis en la “federación” dinámica de
recursos, y las SOA (Service-Oriented Architectures) orientadas a facilitar la
Antoine’s Grid Computing

Interés para el sector financiero


La tecnología Grid encuentra aplicación en tres áreas básicas del sector:

- Continuidad de negocio: Robustez, flexibilidad, tolerancia a fallos y ‘escalabilidad’


como características más apreciadas desde el punto de vista de TI.
- Reducción de costes:
costes aumento de la productividad/eficiencia, y transformación de
costes fijos en variables (en línea con el concepto de eBusiness On demand y de Utility
Computing. Aquí se enmarcarían todos los esfuerzos de optimización operacional y
rentabilización del TCO de los equipos existentes, buscando responder a mayores
demandas de rendimiento, seguridad y confianza.
- Customer Centricity:
Centricity aplicaciones masivas en datos (DM, DWh, BI, CRM...)CRM... y
fidelización del cliente. En esta área se ha detectado mucha actividad debido a los
esfuerzos de las entidades financieras para diferenciarse y personalizar sus servicios,
ante la creciente competitividad en el sector.

Las aplicaciones más valoradas entre los usuarios son:

- El cálculo numérico intensivo (e.g.VaR por el método de Montecarlo) VaR: Value at Risk
- El tratamiento masivo de datos de tesorería DM: Data Minning
DWh: Data Warehouse
- Aplicaciones J2EE migrables BI: Business Intelligence
CRM: Customer Relationship Management
- Servicios de replicación de aplicaciones TCO: Total Cost of Ownership
J2EE: Java 2 Enterprise Edition
Antoine’s Grid Computing

Interés para el banco (I)


Independientemente del indudable interés que presenta para
instituciones que quieran convertirse en ‘utilities’ de TI ofreciendo a
sus clientes capacidad de procesamiento bajo demanda desde sus
propias instalaciones, y sin olvidar las múltiples aplicaciones que
encuentra en los entornos de eScience, tanto académicos como
institucionales, la tecnología Grid ofrece a las grandes empresas una
forma de sacarle partido a toda la capacidad de proceso
desaprovechada de sus estaciones de trabajo y PC de sobremesa;
también puede ser una forma reutilizar equipos obsoletos.

Hay muchos procesos de negocio en el sector financiero que se


apoyan en pesados cálculos matemáticos, realizados
tradicionalmente en máquinas dedicadas, que además invierten un
tiempo considerable en su realización. Los ejemplos típicos son los
cálculos relativos a carteras de inversión, cálculo de riesgos... Las
propuestas de valor se pueden plantear en términos de la
amortización de la inversión realizada en ese hardware, así como el
impacto que tiene la utilización de esta tecnología en la eficiencia de
Antoine’s Grid Computing

Interés para el banco (II)


Si planteamos un despliegue de la tecnología Grid, como solución para
distribuir aplicaciones que ahora se ejecutan en servidores dedicados,
utilizando un ‘pool’ determinado de máquinas (e.g. Los PC de los puestos de
algún edificio singular) debemos tener en cuenta el coste de los servicios
profesionales necesarios para trasladar las aplicaciones, codificadas en su
mayoría en algún lenguaje para ejecución secuencial, o con una
dependencia muy compleja entre procesos – o en casos muy particulares
programadas para alguna plataforma de procesamiento en paralelo (PVM,
PVM+MPI, LAM) – a la plataforma Grid. Ese coste dependerá de cada caso,
puesto que el paso supondrá modificar el código fuente, en mayor o menor
medida, y compilar para el nuevo entorno de ejecución. Es decir, que
pueden darse casos en que ese coste suponga un obstáculo insalvable, si el
único argumento de venta que hemos preparado es un simple ahorro de
costes. Lo que ocurre es que hay muchos cálculos en entorno financiero que
se basan en la aplicación repetitiva de un algoritmo sobre un rango
específico de un conjunto de parámetros determinado, y con una
granularidad variable; y ese tipo de ejecuciones paramétricas son ideales
para un entorno Grid, puesto que se trata de la misma ejecución sobre un
conjunto de datos que se puede trocear fácilmente para su distribución.
Antoine’s Grid Computing

Interés para el banco (y III)


Debemos tener en cuenta que la tecnología Grid no se queda en la
distribución de la ejecución de ciertos procesos entre un conjunto de
recursos que se gestionan de forma homogénea. Las sinergias que surgen
de la convergencia de esta tecnología con los avances en los Web Services o
la Web Semántica, tienen una trascendencia que no podemos pasar por alto.
Las posibilidades que ofrecerán los Grid Services (Grid Computing + Web
Services) o el Cognitive Grid (Gird Services + Knowledge [Ontologies +
Inteligent Agents]) tienen un alcance que apenas comenzamos a vislumbrar;
y la oportunidad está en el hecho de que las aplicaciones reales, a día de
hoy, de esta tecnología, pueden suponer un beneficio palpable para el
negocio.

También debemos contemplar aplicaciones en el ámbito del


almacenamiento distribuido, con servicios DataGrid; una tecnología que
surge del mismo concepto de Grid. Un concepto que tenemos que entender
en un sentido amplio: lo mismo que la WWW le dio sentido a Internet como
red global de contenidos, y el desarrollo de los Web Services y Semantic
Web junto con los avances en el diseño de ontologías están permitiendo el
paso de la información al conocimiento, el Grid va a permitir que los
recursos (de cualquier tipo) estén accesibles en la red como servicios.
Antoine’s Grid Computing

El mercado (I)
El impulsor del resurgimiento de la “computación” distribuida, una idea nada nueva, ha sido un
actor bien conocido, IBM, con su proyecto Globus. Lo que sí ha sido realmente destacable, es la
convergencia con el desarrollo de la tecnología Web (Web Services). Juntando la virtualización con
la distribución han surgido nuevas oportunidades, a las que se han apuntado clásicos de los
sistemas como Intel, Sun, HP; que ya en sus tiempos habían hecho sus apuestas en el terreno del
procesamiento en paralelo y la supercomputación (un terreno tradicionalmente dominado por
Cray). Ahora, lo que ha sucedido, es que todos los grandes han resucitado viejas ideas del mundo
del HPC (High Performance Computing) asociándose con desarrolladores pioneros del sector como
DataSynapse y Platform en el universo anglosajón, o GridSystems en el viejo continente).
Obviamente, con el alcance que promete esta tecnología, se han apuntado actores que, viniendo
del mundo de los datos, han visto las posibilidades del DataGrid, como son Avaki o MountainView.
Tratándose de un sector emergente, estamos en plena consolidación del mismo, observándose
una actividad de partnership y adquisiciones estratégicas importante, buscando conformar una
cartera de productos apetecible, o una posición de salida ventajosa en una carrera por un mercado
muy jugoso, y que no ha hecho más que anunciarse.

LiveCluster LSF 5.1

Synergy 1.0

EnFuzion 7.2
InnerGrid 2.0

Grid Engine Portal


HPC SAN
Antoine’s Grid Computing

El mercado (y II)
Otro de los partners de IBM con peso específico en la tecnología Grid es Entropia,
especializada en la explotación de la capacidad de máquinas PC, con su solución
DCGRID. Dell también se ha apuntado, con su programa HPCC (High Performance
Cluster Computing), aliándose con Platform, y vendiendo soluciones para Windows
2000. Otro gigante, Silicon Graphics Inc. está potenciando su tecnología de
visualización remota (Visual Area Networking) y acceso a grandes volúmenes de datos
apoyándose en sus plataformas de alto rendimiento (también aliándose con líderes del
mercado como Platform). También surgen iniciativas como la de Parabon Computation,
que ofrece el servicio Grid en Internet (Frontier + Pioneer), y que sirve, por ejemplo,
para apoyar la investigación contra el cancer, en el sector biofarmacéutico,
asociándose con Celera genomics.
genomics En el mundo del OpenSource, cabe destacar
globusWorld,
globusWorld que surge del proyecto del mismo nombre orientado a la estandarización
(Open Standard ≠ Open Source).

DCGRID 5.1
Antoine’s Grid Computing

Casos de Aplicación
Charles Schwab
La reducción del tiempo de ejecución de una aplicación de gestión de patrimonios de 4 minutos a
15 segundos, le permitió utilizarla para dar servicio telefónico a sus clientes.
CapitalOne
Utilizan SAS para modelado de datos y estimación de características de cliente. Se consiguió
paralelizar el proceso, utilizando Grid para lanzar la ejecución sobre diferentes conjuntos de datos.
Royal Bank of Canada
Un proceso de valoración para pólizas de seguros (una aplicación APL) que se salía de la ventana
de ejecución (18 h); se ejecutaba sobre 4 nodos NT, y requería un operario (75%). Con su
ejecución sobre Grid se bajó a 34 minutos y se eliminó ese operario al 75%, que ya podía
dedicarse a hacer otras cositas más útiles.
JP Morgan Chase
Han trasladado sus cálculos de valoración de carteras a una infraestructura Grid de IBM.
SCH
Los cálculos a realizar consistían en la calibración de volatilidades, para con éstas valorar
‘swaptions’ bermudas. El objetivo de la calibración era parametrizar el árbol binomial con el
objetivo de reproducir las volatilidades implícitas correspondientes al mercado. Como datos de
entrada, se especificaban las volatilidades implícitas, tipos de interés, y ciertos parámetros que
describen los detalles del tipo de cálculo. Toda la información era introducida manualmente por el
usuario en una hoja Excel. El cálculo tardaba varias horas. Se sustituyó el cálculo local por
llamadas a un sistema InnerGrid (GridSystems) formado por varios PCs de sobremesa. El tiempo
de ejecución se rebajó a unos pocos minutos (hablamos de un orden de magnitud menos).
Deutsche Bank&JP Morgan Chase
Estos dos gigantes han llegado recientemente a un acuerdo con IBM, en el que le contratan
capacidad de procesamiento para satisfacer los picos de demanda que sobrepasen su propia
Antoine’s Grid Computing

GridSystems (I)
Un fabricante, español, de referencia a nivel europeo y mundial. Son partner
de IBM para la tecnología Grid. Su producto InnerGrid ya ha recibido un
premio de investigación en el marco del programa IST de la UE.

Han optado por abrir mercado en el área del Intra-Grid; en lugar de intentar
vender soluciones con todo el alcance de la tecnología Grid, han preferido
salvar las barreras culturales que impone la desconfianza en el entorno
empresarial (aun hoy a los CIOs les genera cierto rechazo pensar en ejecutar
sus aplicaciones de negocio fuera de sus instalaciones, con las implicaciones
que eso tiene sobre la seguridad de las comunicaciones). Han optado
también por el desarrollo ligero que, minimice la interferencia con las tareas
prioritarias de las máquinas que actuan como nodos del Grid; lo cual les ha
llevado a realizar desarrollos nativos para cada plataforma (AIX, Linux, Mac
OS X, HP-UX, Windows, Solaris, IRIX).

InnerGrid se compone de un servidor central o maestro que distribuye los


trabajos, monitoriza su ejecución y recopila los resultados; y una serie de
agentes instalados en cada nodo del Grid (un agente por cada CPU), que se
ocupan de monitorizar la actividad de los procesadores, informando al
maestro de la disponibilidad de cada uno de ellos y aplicando las políticas
que se hayan definido para cada trabajo.
Antoine’s Grid Computing

GridSystems (II)
Antoine’s Grid Computing

GridSystems (y III)
Estructura Maestro/Esclavo Distribuida de
InnerGrid

GridSystems se hizo acreedor en noviembre de 2002 del premio IST,


concedido por un comité de expertos de Euro-CASE (European Council
of Applied Sciences and Engineering) por la excelencia técnica,
componente de innovación y capacidad para generar valor en el
mercado, de su producto InnerGrid. Esto lo convierte en un referente
de esta tecnología a nivel mundial, de ahí que IBM lo haya elegido
como partner tecnológico, y que nosotros le prestemos tanta atención
en este informe. Puede ser el candidato ideal para una prueba de
Antoine’s Grid Computing

Pasos a seguir
Entendemos que, tras una primera fase, que concluye con la entrega de este documento a
modo de informe o presentación (Executive Briefing) para una primera toma de contacto con
la tecnología Grid, su alcance, sus posibilidades reales y su interés para el banco, lo más
recomendable sería realizar un inventario de las aplicaciones (Application Assesment*) que
sean susceptibles de distribuirse sobre una infraestructura Grid, y en las que ese cambio
aporte algún valor a la unidad de negocio que las explota, en cuanto a productividad o
eficiencia operativa.

Una vez se hayan identificado y evaluado sería conveniente elegir una para la realización de
un piloto que nos serviría, por un lado como prueba de concepto (Proof of concept), y por otro
como entrada para la elaboración de una propuesta de valor (Value Proposition), pensando
en un eventual paso a producción.

La propuesta que debería reflejar el impacto que la optimización en la utilización de los


recursos de la plataforma tecnológica del banco, tiene en los procesos de negocio, y lo que
eso supone desde el punto de vista de la reducción de costes. Una reducción de costes que
tendría que permitirnos argumentar la instrumentación de una estrategia de autofinanciación
para la posterior extensión del despliegue a nivel corporativo.

Ni que decir tiene que el peso específico del BBVA en el sector, hace que cobre aun mayor
importancia la decisión que se tome con respecto a la adopción de una tecnología con el
alcance
* IBM disponeque
de unatiene el Grid.
metodología propia, GVT (Grid Value Tool), que define el camino a seguir por cada empresa para la adopción de la tecnología Grid. Es una
metodología que se implanta vía los servicios profesionales de BCS (Business Consulting Services), unidad que surge con la incorporación de PwC a IBM.

Potrebbero piacerti anche