Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
(Frmulas)
Tema 1. Introduccin
- Ley de Amdahl:
Aceleracin rendimiento=
1
tiempo
n
tiempo ejecucin X =tiempo ejecucinY
100
tiempo ejecucinY
n
=1+
tiempo ejecucion X
100
En trminos de rendimiento:
1
tiempo ejecucinY RendimientoY Rendimiento X
n
1+
=
=
=
100 tiempo ejecucin X
1
RendimientoY
RendimientoX
n=100
Rendimiento X Rendimiento Y
RendimientoY
- Incremento anual:
- Ley de Amdahl:
Fraccin mejorada: (siempre menor o igual a 1)
Aceleracin mejorada: (mayor que 1)
Tiempo de ejecucin nuevo:
TE nuevo=TEantiguo ((1Fraccinmejorada )+
Aceleracin global =
TE antiguo
=
TE nuevo
Fraccinmejorada
)
Aceleracinmejorada
1
(1Fraccin mejorada)+
Fraccin mejorada
Aceleracin mejorada
Coste de oblea
Dados por oblearendimiento dado
rea deldado
(2rea dado)
Rendimiento oblea1
(1+ Defectos por unidad de reareadado) N
- Tiempo de programa/CPU/CPI:
TiempoCPU =Ciclosreloj CPU para un programaDuracin ciclo de reloj
TiempoCPU =
CPI=
Recuento Instrucciones=
MIPS=
MIPS=
Recuento Instrucciones
Tiempo ejecucin10
tiempo ejecucin
CPIciclo de reloj
Frecuencia de reloj
CPI10
Tiemporeferencia
MIPS referencia
Tiempono estimado
MFLOPS
10
1
Tiempoi
n i=1
n
wiTiempo i
donde:
i=1
Tiempoi
i=1
MG( x i )
xi
=MG ( )
MG ( y i)
yi
16
Cod. op.
RS1
RD
Inmediato
11
Cd. op.
RS1
RS2
RD
func
26
Cd. op.
Desplazamiento aadido al PC
Instrucciones de salto
J Salto incondicional
Trap - Interrupciones
Tema 4. Segmentacin
- Segmentacin: el comienzo de una tarea en una etapa slo requiere la finalizacin de la tarea
anterior en esa etapa.
Tiempo secuencial para 100 nmeros: T secuencial =100(2T c +T s )=200T sSi T c 1/2T s
Tiempo segmentado para 100 nmeros: T segmentado=3T s+ 99Ts =102Ts
- Segmentacin de instrucciones: consiste en solapar la ejecucin de las instrucciones.
- Anlisis de prestaciones:
T SEC
nkCLK
nk
=
=
T SEG (k +n1)CLK k +n1
G
knCLK
n
=
= k
k (k +n1)CLK k +n1 k
E
n
= k
( k +n1)CLK CLK
La segmentacin puede entenderse como una mejora del CPI, que es lo que tpicamente
entendemos o como una reduccin del ciclo de reloj.
- Rendimiento de la segmentacin con detenciones
G s=
G s=
G s=
CPI con segmentacin=CPI ideal +Ciclos reloj detencin segmentacin por instruccin
Profundidad de la segmentacin
CPI con segmentacin
Profundidad de la segmentacin=
NM FF PF
NI
NM
FF PF ) T reloj
NI
lgunos diseadores prefieren medir los fallos por instruccin en lugar de los fallos por
acceso a memoria:
T CPU =N I (CPI ejec +
fallos
PF) T reloj
instruccin
- Optimizaciones:
Tasa de Fallo = N Fallos / N de Accesos
Reducir la penalizacin de fallos con cachs multinivel:
TMA=TA L1 + FF L1PF L 1
PF L1=TA L2 + FF L2PF L2
n de fallos
n de accesos a lacach
FF global =
n de fallos
n total de accesos realizados por la CPU
En general se cumple:
FF localFF global
Y en particular:
FF local . L 1=FF global . L1