ComputacionGrid

download ComputacionGrid

of 51

Transcript of ComputacionGrid

  • 8/9/2019 ComputacionGrid

    1/51

    C o m p u t a c i n G r i d

    Herbert Hoeger

    [email protected]

    *Centro de Clculo Cientfico

    *Universidad de Los Andes

    *EELA-2

    CLCAR 2009

    Mrida - Venezuela21 de septiembre de 2009

  • 8/9/2019 ComputacionGrid

    2/51

    2

    Conceptos Preliminares

    Supercomputacin: Fue definida para hacerreferencia a computadoras con capacidades muysuperiores a las de otras mquinas disponibles.

    Sistemas tpicos: DEC VAX: 1-10 Mflops

    (nada en el medio performance gap)

    Supercomputadoras: Crays, CDCs: ~100 Mflops

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009

  • 8/9/2019 ComputacionGrid

    3/51

    3

    Conceptos Preliminares

    Hoy en da la distincin ya no es clara (tabla hasta 1990!).

    10

    1

    100

    1000

    1965 1970 1975 1980 1985 1990

    Supercomputadores

    Mainframes

    Minicomputadores

    Microprocesadores

    E

    f

    i

    c

    ie

    n

    c

    i

    a

    M

    F

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009

  • 8/9/2019 ComputacionGrid

    4/51

    4

    Conceptos Preliminares

    Computacin de Alto Rendimiento: Es aquella queproporciona un mayor capacidad de cmputo quela que se puede obtener de computadoresindividuales.

    Sistemas de memoria compartida.

    Sistemas distribuidos.

    Clusters.

    Mquinas paralelas

    En ingls: High Performance Computing o HPC.

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009

  • 8/9/2019 ComputacionGrid

    5/51

    5

    Computacin Paralela: Es la utilizacin de mltiplesprocesadores para resolver una tarea comn.

    Se divide el problema es trozos ms pequeos y seasignan a diferentes procesadores.

    Conceptos Preliminares

    ... ...

    ...

    CPUs

    Mecanismo de switches o bus

    Bancos de

    Memoria

    Dispositivos de

    Entrada/Salida

    MemoriaCompartida

    ...Mecanismo de enrutamiento

    Memorias Locales

    CPUs

    MemoriaDistribuida

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009

  • 8/9/2019 ComputacionGrid

    6/51

    6

    Usamos computacin paralela ya que

    Los monoprocesadores limitan:El rendimiento.

    La memoria disponible.

    La mquinas paralelas permiten:

    Resolver problemas ms grandes.

    Resolver problemas ms rpido.

    Resolver ms problemas.

    Hoy en da HPC es prcticamente computacinparalela.

    Ejemplo: modelado y prediccin climtica.

    Conceptos Preliminares

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009

  • 8/9/2019 ComputacionGrid

    7/51

    7

    Computacin Distribuida: Es la utilizacin de

    mltiples sistemas, de alguna forma organizada,para trabajar en un objetivo comn.

    Conceptos Preliminares

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009

  • 8/9/2019 ComputacionGrid

    8/51

    8

    Computacin Distribuida

    Requiere software para la coordinacin derecursos y tareas.

    Computacin paralela / HPC es computacindistribuida.

    Computacin Grid es computacin distribuida.

    Conceptos Preliminares

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009

  • 8/9/2019 ComputacionGrid

    9/51

    9

    Sistemas Operativos Distribuidos Caractersticas

    Transparencia: Provee la visin de una solamquina

    (mquina virtual)

    Acceso: a recursos remotos igual que a locales.

    Ubicacin:

    Independencia de nombre ubicacin.

    Independencia de mquina recurso.

    Replicacin: Las replicaciones mejoran el

    rendimiento y la disponibilidad el uso, nombre ycontrol de replicas debe ser transparente.

    Conceptos Preliminares

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009

  • 8/9/2019 ComputacionGrid

    10/51

    10

    Migracin: por rendimiento, seguridad ydisponibilidad, los objetos (procesos y/o datos)pueden migrar.

    Concurrencia: cada usuario tiene la impresin deser el nico usuario as existan muchos.

    Escalabilidad: el sistema puede crecer sinafectar las actividades de los usuarios.

    Heterogeneidad: Soportar diferentes tipos dehardware y software.

    Seguridad: Proteccin contra destruccin y usosno autorizados.

    Conceptos Preliminares

  • 8/9/2019 ComputacionGrid

    11/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 11

    Disponibilidad: debe operar todo el tiempo an

    bajo fallas (quizs con cierta degradacin).Evitar fallas: usar componentes de calidad.

    Tolerar fallas: redundancia de componentes

    Detectar y recuperar fallas: usar hardware y software

    para descubrir y reparar fallas.

    Flexibilidad: Facilidad para reemplazar, modificar oagregar componentes.

    Rendimiento: Las aplicaciones deben correr mejor

    (o al menos igual) que en monoprocesadores.

    Conceptos Preliminares

  • 8/9/2019 ComputacionGrid

    12/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 12

    Los objetivos generales son los mismos que vimospara sistemas operativos distribuidos pero a unnivel superior.

    Debe operar con distintos sistemas operativos.

    Computacin Grid

    Grid

    Middleware

    Linux A Solaris AIX HPUX IRIX Windows Linux B Mac OS AIX

  • 8/9/2019 ComputacionGrid

    13/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 13

    Computacin Grid es computacin distribuidallevada a un nivel multi-organizacional / multi-

    sistemas.

    Computacin Grid

    Dpto.

    Dpto.

    Dpto.

    Organizacin

    Dpto.

    Dpto.

    Dpto.

    Organizacin

    Dpto.

    Dpto.

    Dpto.

    Organizacin

    Dpto.

    Dpto.

    Dpto.

    Organizacin

    Son muchos sistemas locales, manejados porotras personas/organizaciones, cooperando.

  • 8/9/2019 ComputacionGrid

    14/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 14

    Computacin Grid

    Hoy en da tenemos: Conectividad global a travs de Internet.

    Disponibilidad y confiabilidad en el ancho

    de banda.

    La velocidad de las redes se duplica cada 9

    meses.

  • 8/9/2019 ComputacionGrid

    15/51

    15

    Computacin Grid

    Usar Internet como unaplataforma de servicios de

    computacin y no solocomo una fuente de

    informacin.

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009

  • 8/9/2019 ComputacionGrid

    16/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 16

    Aplicaciones

    Grid Middleware

    Recursos

    Computacin Grid

    Caractersticas

    Manejo de Recursos

    Balanceo de cargas

    Manejo de Fallas

    Monitoreo Garantizar elrendimiento

    Deteccin de intrusos

    Escalabilidad, etc

    Autentificacin

    Polticas deAutorizacin

    Descubrimiento derecursos

    Ubicacin de recursos

    Acceso a data remota

    Alta velocidad de

    transferencia de data

  • 8/9/2019 ComputacionGrid

    17/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 17

    Un Grid debe prestar servicios en forma:

    Extendida: muchos recursos en muchos lugares Constante: 365 das x 24 horas Confiable: utilizacin de canales seguros

    Simple: fcil de usar Transparente: no importa donde se almacenanlos datos o donde se ejecutan los programas. Econmica: utiliza los recursos actuales y es

    sencillo adicionar nuevos recursos.

    Ms Propiedades del Grid

  • 8/9/2019 ComputacionGrid

    18/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 18

    Cluster vs. Grid

    CLUSTER

    Equipos homogneos. Sistema operativo nico.

    Administracin y manejo

    centralizado - nica.

    Equipos estn concentrados. Objetivo: mejorar el

    rendimiento dedicando ms

    recursos.

    GRID

    Equipos heterogneos.

    Mltiples sistemas operativos.

    Administracin y manejo

    descentralizado multidominio

    Equipos estn dispersos.

    Objetivo: mejorar el rendimiento

    compartiendo recursos sub-

    utilizados en otras partes.

  • 8/9/2019 ComputacionGrid

    19/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 19

    Cluster

  • 8/9/2019 ComputacionGrid

    20/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 20

    Grid

  • 8/9/2019 ComputacionGrid

    21/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 21

    Cloud vs. Grid

    CLOUD

    Foco: Comercial Servicio. Muchos basados en grids.

    Fciles de usar.

    Compartir no es objetivo.

    No colaborativo. Los usuarios no posen la

    infraestructura: no inviertas

    en recursos, alqulalos.

    GRID

    Foco: HPC.

    Ms complicados de usar.

    Compartir recursos, datos,

    conocimiento y trabajo (a travsde VO - Virtual Organizations).

    Los usuarios aportan a la

    infraestructura: comparte/aporta

    recursos y podrs tener muchosms de lo que podras adquirir

    por tu cuenta

  • 8/9/2019 ComputacionGrid

    22/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 22

    Tipos de Grid

    Grid Computacional: Dedicadas al procesamientode datos y cmputos intensivos aprovechando lacapacidad ociosa de las diferentes mquinas delGrid.

    Grid de Datos: Proporciona una interfaz integradapara manejar grandes volmenes de datosalmacenados en diferentes repositorios.

    Grid Hbridas:Tienen caractersticas de las dos

    anteriores.

  • 8/9/2019 ComputacionGrid

    23/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 23

    Analoga

    Grid (en ingls) ~ red elctrica.

    Grid de Computo ~ red de recursos y servicios

    de computacin.

  • 8/9/2019 ComputacionGrid

    24/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 24

    EL CERN(Centro Europeo de Investigaciones Nucleares)

    Esta a la vanguardia en tecnologa de redes. Su lema: where the web was born

    Lidera algunos de los proyectos en Grid ms

    ambiciosos del mundo.

  • 8/9/2019 ComputacionGrid

    25/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 25

    CERN - LHC: Large Hadron Collider

  • 8/9/2019 ComputacionGrid

    26/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 26

    CERN - LHC: Large Hadron Collider

    63.6Km

  • 8/9/2019 ComputacionGrid

    27/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 27

    CERN - LHC: Large Hadron Collider

    63.6Km

  • 8/9/2019 ComputacionGrid

    28/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 28

    CERN - LHC: Large Hadron Collider

    63.6Km

  • 8/9/2019 ComputacionGrid

    29/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 29

    CERN: Large Hadron Collider

    Instrumento cientfico ms grande del mundo.

    Los datos son una mina de oro para fsicos

    alrededor del mundo.

    Descubrir partculas fundamentales de lamateria.

  • 8/9/2019 ComputacionGrid

    30/51

  • 8/9/2019 ComputacionGrid

    31/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 31

    CERN

    1 CD 700 MB 10 PB 14.285.714 CDs

    7 CDs 1 cm

    10 PB 20,

    4K

    ms de CDs1 DVD 6,7 CDs

    3Kms de DVDs

    Suponiendo los CDs o DVDs llenos!

  • 8/9/2019 ComputacionGrid

    32/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 32

    CERN

  • 8/9/2019 ComputacionGrid

    33/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 33

    CERN

    La solucin posible para manejar/procesar estaenorme cantidad de informacin parece ser la

    computacin Grid.

    Comentario de William Gropp: Con lacomputacin Grid hay un fenmeno particular,

    la necesidad surgi antes que la tecnologa.

  • 8/9/2019 ComputacionGrid

    34/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 34

    CERN

    El problema no es solo el manejo de datos.

    Se estima que son necesarios unos 100.000

    PCs actuales para analizar estos datos.

    Al pasar los aos, la data se acumula!

  • 8/9/2019 ComputacionGrid

    35/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 35

    LHC Computing Grid

  • 8/9/2019 ComputacionGrid

    36/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 36

    Estndares

    Si distintas organizaciones deciden implementar un

    Grid, es muy probable que cuenten con plataformasdiferentes.

    Se hace necesario la utilizacin de estndares para

    coordinar eficazmente los recursos a compartir.

  • 8/9/2019 ComputacionGrid

    37/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 37

    Estndares

    Se ha definido y se esta actualizando un estndar

    para las tecnologas Grid:

    Open Grid Services Architecture (OGSA)

    Este se enfoca en la integracin de servicios atravs de organizaciones virtuales distribuidas,heterogneas y dinmicas, para obtener servicios decalidad utilizando diferentes plataformas.

  • 8/9/2019 ComputacionGrid

    38/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 38

    Estndares

    OGSA es el producto de personas que pertenecen ams de 60 compaas e instituciones deinvestigacin, congregadas en una comunidadvirtual de usuarios y desarrolladores denominada

    Global Grid Forum (GGF)

    http://www.ggf.org

  • 8/9/2019 ComputacionGrid

    39/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 39

    Servicios especificados en OGSA

    Servicios de infraestructura: Proporcionan lacomunicacin entre diferentes plataformas.

    Servicios de gestin de recursos: Supervisin,reservacin, configuracin, etc.

    Servicios de contexto: describen losrequerimientos de recursos y las polticas deutilizacin del Grid.

    Servicios de informacin: proporciona informacin

    sobre el Grid y sus recursos, su estado ydisponibilidad de un determinado recurso.

    i i ifi d

  • 8/9/2019 ComputacionGrid

    40/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 40

    Servicios especificados en OGSA

    Servicios de autogestin: automatizar procesospara reducir costos de administracin.

    Servicios de Datos: Proporciona el movimiento delos datos al lugar donde se necesiten.

    Servicios de Seguridad.

    Servicios de gestin de ejecucin: administracinde tareas, flujo de procesos.

    d OGS

  • 8/9/2019 ComputacionGrid

    41/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 41

    Estructura de OGSA

    Servidores

    Seguridad

    Almacenamiento Redes

    Procesa-

    miento

    Bases de

    Datos

    Sistemas

    DeArchivos

    Directorios

    Envo de

    Mensajes

    Web Services

    WSRF (Globus Toolkit)

    OGSA

    Aplicaciones

    C d OGSA

  • 8/9/2019 ComputacionGrid

    42/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 42

    Componentes de OGSA

    Open Grid Services Architecture se fundamenta en

    dos tecnologas

    Globus Toolkit

    Web Services

    Gl b T lkit

  • 8/9/2019 ComputacionGrid

    43/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 43

    Globus Toolkit

    Globus Toolkit es un conjunto de bibliotecasde software de arquitectura abierta y open

    source que soporta aplicaciones Grid

    Gl b T lkit

  • 8/9/2019 ComputacionGrid

    44/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 44

    Globus Toolkit se encarga de la gestin de:

    Seguridad

    Descubrimiento de la informacin

    Administracin de los recursos compartidos

    Administracin de los datos

    La comunicacin

    Deteccin de fallas Portatibilidad

    Globus Toolkit

    Gl b T lkit

  • 8/9/2019 ComputacionGrid

    45/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 45

    Globus Toolkit

    Gl b T lkit

  • 8/9/2019 ComputacionGrid

    46/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 46

    Los componentes ms relevantes Globus Toolkit que

    soportan al OGSA son:

    GRAM: Grid Resources Allocation and Management

    MDS: Meta Directory Service

    GSI: Grid Security Infrastructure

    Globus Toolkit

    Gl b T lkit

  • 8/9/2019 ComputacionGrid

    47/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 47

    GRAM Proporciona la administracin ycreacin remota de procesos en forma

    segura y confiable

    Globus Toolkit

    Glob s Toolkit

  • 8/9/2019 ComputacionGrid

    48/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 48

    MDS Proporciona un marco uniforme para el

    descubrimiento y acceso a la configuracin desistemas.

    Supervisa el estado de los sistemas de cmputo, la

    disponibilidad de las redes y localizacin deconjuntos de datos.

    Globus Toolkit

    Globus Toolkit

  • 8/9/2019 ComputacionGrid

    49/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 49

    GSI Se basa en PKI (certificados X.509) y

    proporciona servicios de autenticacin nica,proteccin en las comunicaciones y soporte inicialen la delegacin.

    Este ltimo trmino se refiere a delegar lascredenciales del usuario de forma restringida a losproxy para que solicite servicios en nombre delusuario.

    Globus Toolkit

    Algunas Entidades que Trabajan en Grid

  • 8/9/2019 ComputacionGrid

    50/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 50

    Cactus Code

    Algunas Entidades que Trabajan en Grid

    Finalmente

  • 8/9/2019 ComputacionGrid

    51/51

    Herbert Hoeger - San Jos - Costa Rica - 27 de mayo de 2009 51

    Finalmente

    Que los recursos estn disponibles en

    cualquier lugar, en cualquier momento, enforma confiable y segura, que la ubicacinde los procesos y datos sea transparenteal usuario, y que el Grid sea fcil de usar,

    son metas en las que an se trabajaarduamente.

    La implementacin, operacin y

    mantenimiento de un Grid no es fcil,pero el software esta madurandorpidamente.