Prof. Gilberto Díaz [email protected] Departamento de...

Universisdad de Los AndesFacultad de IngenieríaEscuela de Sistemas

Introducción a los sistemas deMultiprocesamiento

Prof. Gilberto Dí[email protected]

Departamento de Computación, Escuela de Sistemas, Facultad de IngenieríaUniversidad de Los Andes, Mérida 5101 Venezuela

mailto:[email protected]

Arquitectura de Von Neumann

El procesador ejecuta un programa que especifica una secuencia de lecturas y escrituras sobre la memoria

Depto Computación – Escuela de Sistemas – Universidad de Los Andes – Mérida – Venezuela - Gilberto DiazDepto Computación – Escuela de Sistemas – Universidad de Los Andes – Mérida – Venezuela - Gilberto Diaz

Sistemas multiprocesamiento

CPUCPU

fetchfetch

executeexecute

MemoriaRAM


La memoria es utilizada para almacenar tanto el programa como los datosEl programa son datos codificados que indican al procesador qué hacer



fetchfetch

executeexecute

MemoriaRAM

MemoriaRAM CPUCPU


Los datos es la información utilizada por el programaEl procesador obtiene las instrucciones y los datos de la memoria, decodifica las instrucciones y las ejecuta secuencialmente



CPUCPU

fetchfetch

executeexecute

MemoriaRAM

Taxonomia de Flynn

Distingue las arquitecturas multiprocesamiento de cuerdo a las instrucciones y datos. Cada uno de estos criterios puede tomar dos estados:

SencilloMúltiple



SISD: Single Instruction Single Data


Instrucción

Datos Resultado

Taxonomia de Flynn

CPU

SISD: Single Instruction Single Data


Taxonomia de Flynn

Load ALoad BC = A + BStore CA = B * 2Store A

Tiempo

Tiempo

P1P1

SIMD: Single Instruction Multiple Data


Taxonomia de Flynn

Instrucciones

Datos

CPUCPU

Resultados

CPUCPUCPU

SIMD: Single Instruction Multiple Data


Taxonomia de Flynn

Load A(1)Load B(1)C(1)=A(1)+B(1)Store C(1)

Tiempo

Tiempo


Load A(n)Load B(n)C(n)=A(n)+B(n)Store C(n)

P1P1 P2P2 PnPn

MISD: Multiple Instruction Single Data


Instrucciones

Datos

CPUCPU

Resultados

Taxonomia de Flynn

CPUCPUCPU

SIMD: Multiple Instruction Single Data


Taxonomia de Flynn

Load A(1)C(1)=A(1)*1Store C(1)

Tiempo

Tiempo

Load A(1)C(2)=A(1)*2Store C(2)

Load A(1)C(n)=A(1)*nStore C(n)

P1P1 P2P2 P3P3

MIMD: Multiple Instruction Multiple Data


Instrucciones

Datos

CPUCPU

Resultados

Taxonomia de Flynn

CPUCPUCPU

SIMD: Multiple Instruction Multiple Data


Taxonomia de Flynn

Tiempo

Tiempo

Call funcAX = W*ZStore X

Do 10 i=1,Nvar=i+10Var2 = C(i)

P1P1 P2P2 P3P3


Los sistemas paralelos se distinguen en 3 categorias de acuerdo a la forma como los procesadores utilizan la memoria para gestionar los datos

Memoria CompartidaMemoria DistribuidaMemoria Compartida Distribuida


Modelos de Memoria

Memoria Compartida

Los procesos tienen acceso a la misma memoria física. Los procesos pueden correr en un sólo procesador (tiempo compartido)


Modelos de Memoria

Proceso1

Proceso2

Memoria

Procesador1

Memoria Compartida

Los procesos pueden correr en procesadores distintos dentro del mismo computador


Modelos de Memoria

Proceso1 Proceso2

MemoriaProcesador1 Procesador2

Memoria Compartida

Se debe tener cuidado en esta categoría con la consistencia de los datos.

Se debe utilizar mecanismos como: semáforos, barreras, etc. para tal fin.


Modelos de Memoria

Memoria Distribuida

En esta categoría cada procesador tiene su propia memoria.


Modelos de Memoria

Red

Procesador1 Procesador2

Memoria Distribuida

Si un procesador require un dato que se encuentra en una localidad de memoria remota, debe solicitarlo.


Modelos de Memoria

Red

Procesador1 Procesador2

Memoria Compartida Distribuida

Se utiliza una capa implantada en software para crear un espacio de memoria compartida virtual. Cada procesador aporta un espacio de memoria


Modelos de Memoria

Red

Memoria Compartida Distribuida

Las implantaciones son generalmente bibliotecas: LINDA, munin, etc.


Modelos de Memoria

Red

Dentro del modelo de memoria compartida existen varias categorías.

Uniform Memory Access (UMA)

Non Uniform Memory Access (NUMA)

Cache Only Memory Access (COMA)

Cache Coherent Non-Uniform Memory Access (ccNUMA)


Modelos de Memoria Compartida


Todos los procesadores tienen acceso directo a un sólo bloque de memoria compartida.



MemoriaMemoria

Procesadores


Todas las localidades de memoria son equidistantes en términos de tiempo de acceso



MemoriaMemoria

Procesadores


En esta arquitectura cada procesador tiene su propio espacio de memoria



MemoriaMemoriaMemoriaMemoriaMemoriaMemoriaMemoriaMemoria

Procesadores

bus


Algunas regiones de memoria se encuentran físicamente en buses distintos a otras regiones




Procesadores

bus

Shared Memory Paradigm

In the Shared Memory paradigm there are different categories:



Cache Coherent Non-Uniform Memory Access (ccNUMA)

Cache Only Memory Access (COMA)

Super Computing and Distributed Systems Camp - Universidad de Costa Rica Turrialba – Costa Rica

Memory



All processors have direct access to a common block of memory.

Processors

Bus




All locations in memory are equidistant in terms of access time.

Memory

Processors

Bus



There are some caveats:

Bus could be a bottle neck.

More than one processor could need the data placed in the same memory location.


Memoria Shared Memory Paradigm

One of the mechanisms added by developers to keep busy the processors was faster memory placed near of them (cache memory)



Non Uniform Memory Access (NUMA)Each processor has its own local memory

Memory

Processors

Bus

CacheCacheCacheCache



Some memory regions are located in different buses, therefore, terms like local memory and remote memory are used.



Una vez más, más de un proceso puede necesitar el mismo dato y para gestionar esto una máquina NUMA incluye hardware especializado que mueve la información desde una memoria cache a otra.

Procesadores

Bus

CacheCacheCacheCache


Modelos de Memoria

Sin embargo, esta operación puede afectar seriamente el rendimiento de una aplicación.

Por esto, el incremento en la acelearción de la ejecución de un proceso, debido al uso de NUMA, depende en gran medida de la naturaleza de la aplicación.


Modelos de Memoria

Controlar la ubicación de los procesos o hebras a priori puede mejorar el rendimiento de la ejecución. Para esto el usuario debe aprovechar su

conocimiento de la arquitectura de la máquina para hacer una asignación adecuada.


Modelos de Memoria

Cache Coherence NUMA (ccNUMA)En los casos en que más de un proceso utilice un mismo dato, se debe mantener la consistencia entre las múltibples copias.

Procesadores

Bus

CacheCacheCacheCache3 3 3 3

Lectura


Modelos de Memoria

Cache Coherence NUMA (ccNUMA)Cuando uno de los procesadores cambia una copia, se debe invalidar el resto.

Procesadores

Bus

CacheCacheCacheCache3 3 3 4

Escritura

Invalidar



Por esto se utilizan los términos memoria local y memoria remota




Procesadores

bus

Prof. Gilberto Díaz [email protected] Departamento de...

Documents

Transcript of Prof. Gilberto Díaz [email protected] Departamento de...