Sei sulla pagina 1di 8

Resumen final - Arquitectura de los Computadores

(Frmulas)
Tema 1. Introduccin
- Ley de Amdahl:
Aceleracin rendimiento=

Rendimiento con mejora Tiempo ejecucin sin mejora


=
Rendimiento sin mejora Tiempo ejecucin con mejora

Tema 2. Anlisis del Rendimiento


- Concepto de rendimiento: el tiempo es la medida ms fiable del rendimiento
Rendimiento=

1
tiempo

- Relacin de rendimientos entre mquinas:


X es ms rpida que Y tex < tey
X es n% ms rpida que Y tex n% < tey
Porcentaje incremental: tiempo ejecucin X +
Aceleracin:

n
tiempo ejecucin X =tiempo ejecucinY
100

tiempo ejecucinY
n
=1+
tiempo ejecucion X
100

En trminos de rendimiento:
1
tiempo ejecucinY RendimientoY Rendimiento X
n
1+
=
=
=
100 tiempo ejecucin X
1
RendimientoY
RendimientoX
n=100

Rendimiento X Rendimiento Y
RendimientoY

Expresado en tiempos de ejecucin: n=100

- Incremento anual:

Tiempo ejecucinY Tiempo ejecucin X


Tiempo ejecucin X

- Ley de Amdahl:
Fraccin mejorada: (siempre menor o igual a 1)
Aceleracin mejorada: (mayor que 1)
Tiempo de ejecucin nuevo:
TE nuevo=TEantiguo ((1Fraccinmejorada )+
Aceleracin global =

TE antiguo
=
TE nuevo

Fraccinmejorada
)
Aceleracinmejorada
1

(1Fraccin mejorada)+

Fraccin mejorada
Aceleracin mejorada

fraccin mejorada=1aceleracin global =aceleracinmejorada


fraccin mejorada =0aceleracin global =1

- Coste de un circuito integrado:


Coste de CI=

Coste dado+Coste dado prueba+ Coste empaquetado y final test


Prueba rendimiento final

Coste del dado=


Dados por oblea=
Rendimiento dado=

Coste de oblea
Dados por oblearendimiento dado

( Dimetro oblea/2) Dimetro oblea

rea deldado
(2rea dado)

Rendimiento oblea1
(1+ Defectos por unidad de reareadado) N

- Tiempo de programa/CPU/CPI:
TiempoCPU =Ciclosreloj CPU para un programaDuracin ciclo de reloj

TiempoCPU =
CPI=

Ciclos reloj CPU paraun programa


Frecuencia de reloj

Ciclos de reloj CPU para un programa


Recuento de instrucciones

TiempoCPU =Recuento de InstruccionesCPIDuracin del ciclo de reloj


TiempoCPU =RICPICLK

- Alternativas para la medida del rendimiento:


MIPS: Millones de instrucciones por segundo:
Considerando:

Recuento Instrucciones=
MIPS=

MIPS=

Recuento Instrucciones
Tiempo ejecucin10

tiempo ejecucin
CPIciclo de reloj

Frecuencia de reloj
CPI10

- MIPS relativos y MIPS nativos:


Tiempo de referencia: tiempo ejecucin de un programa en la mquina de referencia
Tiempo no estimado: tiempo ejecucin del mismo programa en la mquina que se va a
medir.
MIPS: Estimacin de los MIPS en la mquina de referencia
MIPS relativos=

Tiemporeferencia
MIPS referencia
Tiempono estimado

Los MIPS relativos se apoyan en el tiempo de ejecucin.


- FLOPS:
Flops: Operaciones de punto flotante por segundo.
MFLOPS=

Nmero de operaciones en puntoflotante de un programa


Tiempo ejecucin10
GFLOPS=

MFLOPS
10

- Resmenes del rendimiento:


n

Tiempo medio de ejecucin:

1
Tiempoi
n i=1
n

Tiempo de ejecucin ponderado:

wiTiempo i

donde:

i=1

wi = frecuencia del programa i-simo de la carga de trabajo


Tiempoi = tiempo ejecucin del programa i-simo
Media geomtrica:

Tiempoi
i=1

MG( x i )
xi
=MG ( )
MG ( y i)
yi

Tema 3. Diseo del repertorio de instrucciones


-Codificacin de las instrucciones (DLX):
Instruccin tipo I: (aritmtico-logicas)
6

16

Cod. op.

RS1

RD

Inmediato

Cargas y almacenamientos (byte, media palabra, palabra)

ALU's con operandos inmediatos

Instrucciones de salto condicional (BQEZ, BNEZ) RS1 registro implicado, RD no


se utiliza.

Saltos a registro RD=0; Inmediato=0; RS1=destino

Instruccin tipo R: (acceso a memoria, saltos condicionales, inmediatas)

11

Cd. op.

RS1

RS2

RD

func

Aritmticas y lgicas entre registros: RS1=fuente1, RS2=fuente2,


RD=RegistroDestino,func=operacin del flujo de datos
Instruccin tipo J: (saltos incondicionales)
6

26

Cd. op.

Desplazamiento aadido al PC

Instrucciones de salto

Desplazamiento de 26 bits con signo aadido al PC

JAL Salto incondicional y enlace R31

J Salto incondicional

Trap - Interrupciones

Tema 4. Segmentacin
- Segmentacin: el comienzo de una tarea en una etapa slo requiere la finalizacin de la tarea
anterior en esa etapa.

- Segmentacin aritmtica: sumador de tres bits con propagacin de acarreo

Tiempo secuencial para 100 nmeros: T secuencial =100(2T c +T s )=200T sSi T c 1/2T s
Tiempo segmentado para 100 nmeros: T segmentado=3T s+ 99Ts =102Ts
- Segmentacin de instrucciones: consiste en solapar la ejecucin de las instrucciones.

- Anlisis de prestaciones:

Periodo del reloj del cauce: CLK =max [t i ]ki=1+ t r


Sesgo de reloj (retardo del pulso): CLK max [t i ]ki=1+ t r + s
Tiempo para procesar n tareas: T SEG=kCLK +(n1)CLK
Tiempo equivalente para un proceso no encauzado: T SEC =kCLKn
Ganancia de velocidad de un cauce de k etapas: Gk =
Eficiencia: T ocupado=knCLK
Ek =

T SEC
nkCLK
nk
=
=
T SEG (k +n1)CLK k +n1

T total =k( k+ n1)CLK

G
knCLK
n
=
= k
k (k +n1)CLK k +n1 k

Productividad: (n instrucciones por unidad de tiempo) Pk =

E
n
= k
( k +n1)CLK CLK

- Segmentacin bsica de MIPS


Iniciar una instruccin cada ciclo introduce problemas. Hay que determinar que
operacin esta realizando la mquina en cada ciclo, para asegurarnos que no esta
intentando realizar dos operaciones diferentes con el mismo recurso.
Mquina sin segmentacin:
Tiempo de ejecucin medio por instruccin=T emi=CLKCPI
Implementacin segmentada: El ciclo de reloj debe ir a la velocidad de la etapa ms lenta
ms sobrecargas. Por eso la ganancia para la segmentacin es:
G s=

tiempo medio instruccinsin segmentacin


tiempo medioinstruccin con segmentacin

La segmentacin puede entenderse como una mejora del CPI, que es lo que tpicamente
entendemos o como una reduccin del ciclo de reloj.
- Rendimiento de la segmentacin con detenciones
G s=

tiempo medio instruccinsin segmentacin


tiempo medioinstruccin con segmentacin

G s=

CPI sin segmentacinCiclo de reloj sin segmentacin


CPI con segmentacinCiclo de reloj con segmentacin

G s=

Ciclo de reloj sin segmentacin CPI sin segmentacin

Ciclo de reloj con segmentacin CPI con segmentacin

CPI con segmentacin=CPI ideal +Ciclos reloj detencin segmentacin por instruccin

Si ignoramos el incremento potencial en el ciclo de reloj debido a la segmentacin, y


asumimos que las etapas estn equilibradas, podemos igualar el ciclo de reloj de las dos
mquinas:
G s=

CPI sin segmentacin


CPI ideal +Ciclos reloj detencin segmentacin por instruccin
G s=

Profundidad de la segmentacin
CPI con segmentacin

Profundidad de la segmentacin=

Ciclo de reloj sin segmentacin


Ciclo de reloj con segmentacin

Tiempo medio por instruccin ideal sin detenciones=Ciclode reloj ideal

Tema 5.Rendimiento de la jerarqua de memoria


- Definiciones:
Un acierto (hit) es un acceso con xito a memoria del nivel superior, en caso
contrario se produce un fallo (miss)
La tasa de aciertos (Hit Ratio) es el porcentaje de aciertos en accesos a memoria del nivel
superior
La tasa de fallos (Miss Ratio) se define como: Miss Ratio: 1 Tasa de aciertos
El tiempo de acierto (TA) = T. empleado en determinar si la informacin esta a
ese nivel + T. empleado en acceder a esa informacin
La penalizacin de Fallo (PF) = T. empleado en sustituir un bloque del nivel
superior por el bloque correspondiente del nivel inferior + T. proporcionar el
bloque al dispositivo que lo ha pedido (CPU).
Se distingue: Tiempo de acceso (para acceder a la primera palabra del bloque) y tiempo
de transferencia (para transferir el resto del bloque)
El tiempo medio de acceso a memoria (TMA) = tiempo de acierto + tasa de fallos *
penalizacin de fallo
- Memoria cach:
Correspondencia directa: cada bloque slo puede aparecer en un lugar en la cach
lnea = direccin de la estructura de bloque MOD n de lneas
Correspondencia asociativa por conjuntos: un bloque se puede colocar en un conjunto
restringido de lugares en la cach:
lnea = direccin de la estructura de bloque MOD n de conjuntos
Correspondencia completamente asociativa: un bloque se puede colocar en cualquier
parte de la cach
- Rendimiento de la cach:
Tiempo medio de acceso a memoria: TMA = TA + FF * PF
Tiempo de ejecucin: Tcpu = NI * CPI * Treloj = NI * (CPIejec + CPImem) * Treloj
CPImem: ciclos en espera de CPU por referencias a memoria:
CPI mem=

ciclos detencin debido a fallos


=CPI mem (lecturas)+CPI mem (escrituras)
NI

CPI mem (lecturas)=


CPI mem (escrituras)=

fallos en lecturas PF lecturas lecturas FF lecturas PF lecturas


=
NI
NI

fallos escritura PF escritura escrituras FF escrituras PF escrituras


=
NI
NI
CPI mem=

NM FF PF
NI

T CPU =N I (CPI ejec +CPI mem ) T reloj=N I (CPI ejec +

NM
FF PF ) T reloj
NI

lgunos diseadores prefieren medir los fallos por instruccin en lugar de los fallos por
acceso a memoria:
T CPU =N I (CPI ejec +

fallos
PF) T reloj
instruccin

- Optimizaciones:
Tasa de Fallo = N Fallos / N de Accesos
Reducir la penalizacin de fallos con cachs multinivel:
TMA=TA L1 + FF L1PF L 1
PF L1=TA L2 + FF L2PF L2

Hay que diferenciar:


FF local =

n de fallos
n de accesos a lacach

FF global =

n de fallos
n total de accesos realizados por la CPU

En general se cumple:
FF localFF global
Y en particular:
FF local . L 1=FF global . L1

FF local . L 2> FF global . L2

Potrebbero piacerti anche