4atc 5seg 4 Enfriadas

Universidad
de
Oviedo
Arquitectura y Tecnologa de Computadores (09/10)
Area de Arquitectura
y Tecnologa
de Computadores
Riesgos de Control
Problemas con el Control de Flujo

Saltos en el MIPS R3000
Mtodos de Resolucin
Reduccin de la Latencia
Prediccin de Salto
Salto Retardado
53
Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares
Universidad
de
Oviedo
y Tecnologa
de Computadores
Problemas con el Control de Flujo
Provocados por las rupturas en la ejecucin secuencial de los

programas:

Se traducen en una indeterminacin a la hora de emitir las

siguientes Instrucciones a ejecutar mientras no se conoce el
nuevo punto de ejecucin (el resultado del salto)
54
Universidad
de
Oviedo
y Tecnologa
de Computadores
Saltos en el MIPS R3000
i
i+1
BUS
D/L
ALU
BUS
D/L
Comparacin
ALU
Salto
}
i+2
La direccin efectiva del salto no se conoce hasta despus de dos ciclos

(
Las instrucciones de salto representan entre el 15 y el 30% del total de instrucciones
55
Universidad
de
Oviedo
y Tecnologa
de Computadores
Instrucciones de Control
DLX
2%
Incondicionales
11%
Condicionales
7%
8086
VAX
14%
8%
17%
Frecuencia de instrucciones de control en varias arquitecturas

(53% de saltos condicionales efectivos en DLX)
56
Universidad
de
Oviedo
y Tecnologa
de Computadores
Retardos de Salto
TeX
Spice
GCC
4%
Salto
4%
Carga
3%
4%
11%
4%
Porcentaje de los ciclos de reloj en los retardos (de carga y salto)

frente a los consumidos por ejecucin de Instrucciones
57
Universidad
de
Oviedo
y Tecnologa
de Computadores
Mtodos de Resolucin
Parada del cauce (
Anticipar las operaciones que se puedan dentro del proceso de ejecucin de
las instrucciones de salto
Efectuar la bsqueda de Instrucciones por las dos ramas

Ahorro del ciclo de bsqueda de instruccin una vez resuelto el salto
Prediccin de Salto
Esttica
Dinmica
Salto Retardado
Hacer visible la latencia al nivel de lenguaje mquina
(
58
Universidad
de
Oviedo
y Tecnologa
de Computadores
Averiguar antes si el salto es o no efectivo
Calcular antes la direccin de destino del salto
Ejemplo:
Instruccin de salto que chequea nicamente si el valor de un registro es 0
Adicin de un sumador a la etapa D/L
Resultado: reduccin de la latencia (HUECO DE RETARDO DE SALTO) a
59
Universidad
de
Oviedo
y Tecnologa
de Computadores
Prediccin de Salto
Tipos de prediccin:
Esttica (
Dinmica (
Prediccin SALTO NO EFECTIVO

Se contina la bsqueda de instrucciones normalmente
Si el salto NO es finalmente efectivo
Si el salto es finalmente efectivo
Prediccin SALTO EFECTIVO

Se calcula la direccin destino y se comienza la bsqueda a partir de ella

Si el salto es finalmente efectivo
Si el salto NO es finalmente efectivo
Intil en nuestro cauce (
De aplicacin en caso de tener condiciones de salto complejas
60
Universidad
de
Oviedo
y Tecnologa
de Computadores
Prediccin SALTO NO EFECTIVO

Ciclo de Reloj
Salto NO Efec.
BUS
D-L
EJE
MEM
ESC
BUS
D-L
EJE
MEM
ESC
BUS
D-L
EJE
MEM
ESC
BUS
D-L
EJE
MEM
ESC
BUS
D-L
EJE
MEM
Instruccin i+1
Instruccin i+2
Instruccin i+3
Instruccin i+4
Ciclo de Reloj
Salto Efectivo
Instruccin i+1
Instruccin i+2
Instruccin i+3
Instruccin i+4
9 ...
ESC
9 ...
BUS
D-L
EJE
MEM
ESC
BUS
BUS
D-L
EJE
MEM
ESC
BUS
D-L
EJE
MEM
ESC
BUS
D-L
EJE
MEM
ESC
BUS
D-L
EJE
MEM
ESC
61
Universidad
de
Oviedo
(1) Desde Antes
y Tecnologa
de Computadores
Salto Retardado
ADD R1, R2, R3

si R2=0 entonces
El hueco se rellena con instrucciones

anteriores a la de salto
Los saltos NO deben depender de las
instrucciones replanificadas
si R2=0 entonces
62
Universidad
de
Oviedo
y Tecnologa
de Computadores
Salto Retardado
(2) Desde Destino
SUB, R4, R5, R6
ADD R1, R2, R3

si R1=0 entonces
El hueco se rellena con instrucciones a partir

de la direccin de salto
La ejecucin de las instrucciones
replanificadas cuando NO es efectivo el salto
solo debe implicar trabajo desperdiciado,
NUNCA resultados incorrectos
Puede ser necesario duplicar instrucciones
ADD R1, R2, R3

si R1=0 entonces
63
Universidad
de
Oviedo
(3) Desde Siguiente
y Tecnologa
de Computadores
Salto Retardado
ADD R1, R2, R3

si R1=0 entonces
SUB, R4, R5, R6
El hueco se rellena con instrucciones que

siguen a la de salto
La ejecucin de las instrucciones
replanificadas cuando es efectivo el salto solo
debe implicar trabajo desperdiciado,
NUNCA resultados incorrectos
ADD R1, R2, R3

si R1=0 entonces
64
Universidad
de
Oviedo
y Tecnologa
de Computadores
Salto Retardado
50%
Tex
Spice
GCC
60%
tiles
Rellenos
45%
53%
48%
58%
Frecuencia con la que se rellenan los huecos de retardo de salto

y frecuencia con la que son tiles para la computacin
65
Universidad
de
Oviedo
y Tecnologa
de Computadores
Problema de Riesgos de Control

A partir de las grficas y datos relativos a riesgos de control para la arquitectura del procesador
segmentado visto en clase, y considerando un CPI ideal sin riesgos de 1, se pide:
1)
2)
3)
4)
Cul es la frecuencia total de instrucciones de control?

Qu porcentaje de las instrucciones de control cambia realmente el contador de programa?
Qu porcentaje medio de saltos retardados hace realmente trabajo til?
Rellenar la tabla siguiente relativa a los costes asociados a varios esquemas de planificacin de salto:
Esquema de
planificacin
1 - Detencin
2 - Prediccin
salto efectivo
3 - Prediccin
salto no efectivo
4 - Salto retardado
Penalizacin
CPI
Aceleracin
de salto
efectivo
de la
o real segmentacin
Aceleracin respecto
a la estrategia de
detencin
2
1
1
1
66
Universidad
de
Oviedo
Solucin:
1)
y Tecnologa
de Computadores
(11% de saltos condicionales + 2% de saltos incondicionales)
2)
53% de saltos condicionales efectivos total de saltos efectivos = (11 * 0.53 + 2)/13 = 0.6
3)
frecuencia media de saltos retardados que realizan trabajo util = (0.50 + 0.45 + 0.48) / 3 = 0.48
4) Aceleracin = CPI Ideal * Prof. Seg. / (CPI Ideal + frecuencia saltos * penalizacin salto)
= 1 x 5 / CPI real
= 5 / CPI real
Detencin
= 1.26 Aceleracin = 5/1.26 =
CPI real = 1 + 0.13*2
Pred. efectivo
CPI real = 1 + 0.13*1
= 1.13 Aceleracin
=
Pred. no efectivo CPI real = 1 + (0.13*0.60)*1 = 1.08 Aceleracin
=
Salto retardado:
Frecuencia media de saltos retardados que provocan penalizacin =
1 - frecuencia media de saltos retardados que realizan trabajo util = 1 - 0.48 = 0.52
CPI real = 1 + (0.13*0.52)*1 = 1.07 Aceleracin
Aceleracin de la estrategia n respecto a la 1 = Aceleracin de n / Aceleracin de 1:

Aceleracin 1/1 = 3.97 / 3.97 =
Aceleracin 2/1 = 4.43 / 3.97 =
Aceleracin 3/1
=
Aceleracin 4/1
=
67

4atc 5seg 4 Enfriadas

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

4atc 5seg 4 Enfriadas

Caricato da

Copyright:

Formati disponibili

Universidad

Arquitectura y Tecnologa de Computadores (09/10)

Problemas con el Control de Flujo

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Arquitectura y Tecnologa de Computadores (09/10)

Problemas con el Control de Flujo

Provocados por las rupturas en la ejecucin secuencial de los

Se traducen en una indeterminacin a la hora de emitir las

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Arquitectura y Tecnologa de Computadores (09/10)

Saltos en el MIPS R3000

La direccin efectiva del salto no se conoce hasta despus de dos ciclos

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Arquitectura y Tecnologa de Computadores (09/10)

Frecuencia de instrucciones de control en varias arquitecturas

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Arquitectura y Tecnologa de Computadores (09/10)

Porcentaje de los ciclos de reloj en los retardos (de carga y salto)

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Arquitectura y Tecnologa de Computadores (09/10)

Efectuar la bsqueda de Instrucciones por las dos ramas

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Arquitectura y Tecnologa de Computadores (09/10)

Adicin de un sumador a la etapa D/L

Resultado: reduccin de la latencia (HUECO DE RETARDO DE SALTO) a

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Arquitectura y Tecnologa de Computadores (09/10)

Prediccin SALTO NO EFECTIVO

Prediccin SALTO EFECTIVO

Se calcula la direccin destino y se comienza la bsqueda a partir de ella

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Arquitectura y Tecnologa de Computadores (09/10)

Prediccin SALTO NO EFECTIVO

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

(1) Desde Antes

Arquitectura y Tecnologa de Computadores (09/10)

ADD R1, R2, R3

El hueco se rellena con instrucciones

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Arquitectura y Tecnologa de Computadores (09/10)

SUB, R4, R5, R6

ADD R1, R2, R3

El hueco se rellena con instrucciones a partir

ADD R1, R2, R3

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

(3) Desde Siguiente

Arquitectura y Tecnologa de Computadores (09/10)

ADD R1, R2, R3

SUB, R4, R5, R6

El hueco se rellena con instrucciones que

ADD R1, R2, R3

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Arquitectura y Tecnologa de Computadores (09/10)

Frecuencia con la que se rellenan los huecos de retardo de salto

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Arquitectura y Tecnologa de Computadores (09/10)

Problema de Riesgos de Control

Cul es la frecuencia total de instrucciones de control?

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Arquitectura y Tecnologa de Computadores (09/10)

(11% de saltos condicionales + 2% de saltos incondicionales)

Aceleracin de la estrategia n respecto a la 1 = Aceleracin de n / Aceleracin de 1:

Arquitecturas paralelas, Leccin 5 Procesadores Segmentados y Superescalares

Potrebbero piacerti anche