PROBLEMAS CAPITULO 2
Segmentación de cauce y procesadores
segmentados
PROBLEMA 1
Un circuito que implementaba una
operación en Top= 450 ns se ha segmentado
mediante un cauce lineal con cuatro etapas
de duración T1=100 ns, T2=125 ns, T3=125
ns, T4=100 ns, respectivamente separadas
por un registro de desacoplo que introduce
un retardo de 25 ns ¿Cuál la máxima
ganancia de velocidad posible? ¿Cuál es la
máxima productividad del cauce? ¿A partir
de que números de operación ejecutadas se
consigue una productividad al 90 % de la
productividad máxima?
SOLUCION PROBLEMA 1
En nuestro caso:
T2 = T3 = 125ns , seriael tiempo máximo deprocesamiento
Mas el retardo delregistro de desacoploque seria
d = 25 ns
t = 125 ns + 25 ns = 150 ns
SOLUCION PROBLEMA 1
Máxima ganancia
Máxima productividad
A partir de que números de operación ejecutadas se consigue una productividad al 90 % de la productividad máxima
PROBLEMA 2
Supongamos que las etapas de una unidad
funcional segmentada S1, S2, S3, S4 y S5 se
utilizan en el orden S1 , S3, S5, S1, S3, S4, S1,
S3, S2, S5 ,S4, S2. ¿Cuál es el tiempo ( en numero
de ciclos ) de latencia de inicio del cauce? ¿Cuál es
la tabla de reservas y el vector de colisión inicial?
¿Si se supone el cauce vacio inicialmente y se
introduce una operación, es posible introducir
otra pasados 5 ciclos? ¿Cuál es el numero mínimo
de ciclos que hay que esperar?
S1,S3,S5,S1,S3,S4,S1,S3,S2,S5,S4,S2
SOLUCION PROBLEMA 2
S1
S2
S3
S4
S5
t2 t4t3 t5 t6 t7 t8t1 t9 t12t10 t11
X
X
X
X
X
X
X
X
X X
X
X
TLI=12 ciclos
SOLUCION PROBLEMA 2
¿Cuál es el tiempo ( en numero de ciclos ) de latencia de inicio del cauce? TLI= 12 Ciclos
¿Si se supone el cauce vacio inicialmente y se introduce una operación, es posible introducir otra pasados 5 ciclos? Latencias prohibidas
F=(3 ,6 ,5 ,7)
Vector de colisiones V=(1110100)
No es posible introducir una instrucción a los 5 ciclos ya que es una latencia prohibida.
¿Cuál es el numero mínimo de ciclos que hay que esperar? Tenemos (1,2,4,) que no son latencias prohibidas entonces
el numero mínimo para esperar un instrucción seria de 1 ciclo
PROBLEMA 3
Se pretende utilizar un cauce con cuatro etapasA, B, C, D, para aumentar el rendimiento en laejecución de la unidad funcional F. las etapas sepueden utilizar según una de las dos secuenciasS1 y S2 siguientes:
S1: ABACACABD S2: ADBCCABD
Si la duración de cada etapa (incluyendo elregistro de acoplo) es de 50 ns, y la operación queimplementa la unidad funcional F sin pipelinetarda 350 ns en ejecutarse ¿Cuál de las dosposibilidades es mejor? ¿Por qué? ¿Cuáles son losvalores máximos para la productividad, laeficacia y la ganancia del cauce en cada una delas secuencias de utilización, S1 y S2?
SOLUCION PROBLEMA 3
S1: ABACACABD S2: ADBCCABD
S1: TLI = t*k = 50ns * 9 = 450 ns
S2: TLI = t*k = 50ns * 8 = 400 ns
Donde:
k= número de etapas
t = tiempo de ejecución de una etapa
SOLUCION PROBLEMA 3
n = número de operaciones
TLI = tiempo de latencia de inicio
t = tiempo de ejecución de una etapa
PRODUCTIVIDAD
S1
S2
SOLUCION PROBLEMA 3
S1
S2
EFICIENCIA
SOLUCION PROBLEMA 3
S1
S2
GANANCIA
PROBLEMA 5
Se tiene un cauce multifuncional con 4 etapas S1,
S2, S3, S4, que permite ejecutar dos tipos de
operaciones, A y B. Las instrucciones del tipo A
recorren el cauce según la secuencia:
S1, S3, S2, S3, S1, S4
Y las del tipo B según:
S1, S4, S1, S2, S3, S4
¿Cuál es la mínima latencia media para la
secuencia de operaciones ABABABAB…? Si la
frecuencia de reloj es de 1 GHz ¿Cuál es la
productividad máxima del cauce para esta
secuencia?
SOLUCION PROBLEMA 5
t0 t1 t2 t3 t4 t5
S1 A B B A
S2 A B
S3 A A B
S4 B AB
A: S1, S3, S2, S3, S1, S4 B: S1, S4, S1, S2, S3, S4
FAA = (2,4)
FBA = (2,4)
FAB = (1,2,3)
FBB = (2,4)
SOLUCION PROBLEMA 5
Vectores de colisiones cruzadas:
VAA=(1010) VAB=(0111)
VBA=(1010) VBB=(1010)
Matrices de Colisión:
FAA = (2,4)
FBA = (2,4)
FAB = (1,2,3)
FBB = (2,4)
SOLUCION PROBLEMA 5
Diagrama de estados
Latencias no prohibidas
A1, A3
B1, B3, B4
1010
1010
0111
1010
1111
1111
A1
SOLUCION PROBLEMA 5
1010
1010A1
0101
0101OR
1010
1010
1111
1111
1010
1010
0111
1010
SOLUCION PROBLEMA 5
1010
1010A3
0001
0001OR
1010
1010
1011
1011
1010
1010
0111
1010
1111
1111
A1
1011
1011
A3
SOLUCION PROBLEMA 5
1010
1010A5
0000
0000OR
1010
1010
1010
1010
1010
1010
0111
1010
1111
1111
A1
1011
1011
A3
A5
A5
SOLUCION PROBLEMA 5
1111
1111A5
0000
0000OR
1010
1010
1010
1010
1010
1010
0111
1010
1111
1111
A1
1011
1011
A3
A5
SOLUCION PROBLEMA 5
1011
1011A3
0001
0001OR
1010
1010
1011
1011
1010
1010
0111
1010
1111
1111
A1
1011
1011
A3
A5
A5
A3
A5
SOLUCION PROBLEMA 5
1011
1011A5
0000
0000OR
1010
1010
1010
1010
1010
1010
0111
1010
1111
1111
A1
1011
1011
A3
A5
A5
A3
SOLUCION PROBLEMA 5
1010
1010B1
0101
0101OR
0111
1010
0111
1111
1010
1010
0111
1010
1111
1111
A1
1011
1011
A3
A5
A5
A3
A5
0111
1111
B1
0111
1011
B3
SOLUCION PROBLEMA 5
1010
1010B3
0001
0001OR
0111
1010
0111
1011
1010
1010
0111
1010
1111
1111
A1
1011
1011
A3
A5
A5
A3
A5
0111
1111
B1
SOLUCION PROBLEMA 5
1010
1010
0111
1010
1111
1111
A1
1011
1011
A3
A5
A5
A3
A5
0111
1111
B1
0111
1011
B3
A4,5+
B3
B5B3
B1
B5
A4,5+
A4,5+
SOLUCION PROBLEMA 5
1010
1010
0111
1010
1111
1111
A1
1011
1011
A3
A5
A5
A3
A5
0111
1111
B1
0111
1011
B3
A4,5+
B3
B5B3
B1
B5
A4,5+
A4,5+
SOLUCION PROBLEMA 5
Para la secuencia de operaciones ABABABAB…
tenemos las latencias medias:
LM = 3.5 LM = 2.5
Siendo la mínima latencia media: 2.5
Y la máxima latencia media:
MLM = 3.5
SOLUCION PROBLEMA 5
Como la frecuencia es de 1 GHz el tiempo por
ciclo será el inverso de la frecuencia, para este
caso: t = 1 ns.
Usando la fórmula de la productividad:
La productividad máxima será de:
2.85 x 108
Top Related