Resumen Formulas Arquitectura

Resumen final - Arquitectura de los Computadores
(Frmulas)
Tema 1. Introduccin
- Ley de Amdahl:
Aceleracin rendimiento=
Rendimiento con mejora Tiempo ejecucin sin mejora

=
Rendimiento sin mejora Tiempo ejecucin con mejora
Tema 2. Anlisis del Rendimiento

- Concepto de rendimiento: el tiempo es la medida ms fiable del rendimiento
Rendimiento=
1
tiempo
- Relacin de rendimientos entre mquinas:

X es ms rpida que Y tex < tey
X es n% ms rpida que Y tex n% < tey
Porcentaje incremental: tiempo ejecucin X +
Aceleracin:
n
tiempo ejecucin X =tiempo ejecucinY
100
tiempo ejecucinY
n
=1+
tiempo ejecucion X
100
En trminos de rendimiento:
1
tiempo ejecucinY RendimientoY Rendimiento X
n
1+
=
=
=
100 tiempo ejecucin X
1
RendimientoY
RendimientoX
n=100
Rendimiento X Rendimiento Y
RendimientoY
Expresado en tiempos de ejecucin: n=100
- Incremento anual:
Tiempo ejecucinY Tiempo ejecucin X

Tiempo ejecucin X
- Ley de Amdahl:
Fraccin mejorada: (siempre menor o igual a 1)
Aceleracin mejorada: (mayor que 1)
Tiempo de ejecucin nuevo:
TE nuevo=TEantiguo ((1Fraccinmejorada )+
Aceleracin global =
TE antiguo
=
TE nuevo
Fraccinmejorada
)
Aceleracinmejorada
1
(1Fraccin mejorada)+
Fraccin mejorada
Aceleracin mejorada
fraccin mejorada=1aceleracin global =aceleracinmejorada

fraccin mejorada =0aceleracin global =1
- Coste de un circuito integrado:

Coste de CI=
Coste dado+Coste dado prueba+ Coste empaquetado y final test

Prueba rendimiento final
Coste del dado=

Dados por oblea=
Rendimiento dado=
Coste de oblea
Dados por oblearendimiento dado
( Dimetro oblea/2) Dimetro oblea
rea deldado
(2rea dado)
Rendimiento oblea1
(1+ Defectos por unidad de reareadado) N
- Tiempo de programa/CPU/CPI:
TiempoCPU =Ciclosreloj CPU para un programaDuracin ciclo de reloj
TiempoCPU =
CPI=
Ciclos reloj CPU paraun programa

Frecuencia de reloj
Ciclos de reloj CPU para un programa

Recuento de instrucciones
TiempoCPU =Recuento de InstruccionesCPIDuracin del ciclo de reloj

TiempoCPU =RICPICLK
- Alternativas para la medida del rendimiento:

MIPS: Millones de instrucciones por segundo:
Considerando:
Recuento Instrucciones=
MIPS=
MIPS=
Recuento Instrucciones
Tiempo ejecucin10
tiempo ejecucin
CPIciclo de reloj
Frecuencia de reloj
CPI10
- MIPS relativos y MIPS nativos:

Tiempo de referencia: tiempo ejecucin de un programa en la mquina de referencia
Tiempo no estimado: tiempo ejecucin del mismo programa en la mquina que se va a
medir.
MIPS: Estimacin de los MIPS en la mquina de referencia
MIPS relativos=
Tiemporeferencia
MIPS referencia
Tiempono estimado
Los MIPS relativos se apoyan en el tiempo de ejecucin.

- FLOPS:
Flops: Operaciones de punto flotante por segundo.
MFLOPS=
Nmero de operaciones en puntoflotante de un programa

Tiempo ejecucin10
GFLOPS=
MFLOPS
10
- Resmenes del rendimiento:

n
Tiempo medio de ejecucin:
1
Tiempoi
n i=1
n
Tiempo de ejecucin ponderado:
wiTiempo i
donde:
i=1
wi = frecuencia del programa i-simo de la carga de trabajo

Tiempoi = tiempo ejecucin del programa i-simo
Media geomtrica:
Tiempoi
i=1
MG( x i )
xi
=MG ( )
MG ( y i)
yi
Tema 3. Diseo del repertorio de instrucciones

-Codificacin de las instrucciones (DLX):
Instruccin tipo I: (aritmtico-logicas)
6
16
Cod. op.
RS1
RD
Inmediato
Cargas y almacenamientos (byte, media palabra, palabra)
ALU's con operandos inmediatos
Instrucciones de salto condicional (BQEZ, BNEZ) RS1 registro implicado, RD no

se utiliza.
Saltos a registro RD=0; Inmediato=0; RS1=destino
Instruccin tipo R: (acceso a memoria, saltos condicionales, inmediatas)
11
Cd. op.
RS1
RS2
RD
func
Aritmticas y lgicas entre registros: RS1=fuente1, RS2=fuente2,

RD=RegistroDestino,func=operacin del flujo de datos
Instruccin tipo J: (saltos incondicionales)
6
26
Cd. op.
Desplazamiento aadido al PC
Instrucciones de salto
Desplazamiento de 26 bits con signo aadido al PC
JAL Salto incondicional y enlace R31
J Salto incondicional
Trap - Interrupciones
Tema 4. Segmentacin
- Segmentacin: el comienzo de una tarea en una etapa slo requiere la finalizacin de la tarea
anterior en esa etapa.
- Segmentacin aritmtica: sumador de tres bits con propagacin de acarreo
Tiempo secuencial para 100 nmeros: T secuencial =100(2T c +T s )=200T sSi T c 1/2T s
Tiempo segmentado para 100 nmeros: T segmentado=3T s+ 99Ts =102Ts
- Segmentacin de instrucciones: consiste en solapar la ejecucin de las instrucciones.
- Anlisis de prestaciones:
Periodo del reloj del cauce: CLK =max [t i ]ki=1+ t r

Sesgo de reloj (retardo del pulso): CLK max [t i ]ki=1+ t r + s
Tiempo para procesar n tareas: T SEG=kCLK +(n1)CLK
Tiempo equivalente para un proceso no encauzado: T SEC =kCLKn
Ganancia de velocidad de un cauce de k etapas: Gk =
Eficiencia: T ocupado=knCLK
Ek =
T SEC
nkCLK
nk
=
=
T SEG (k +n1)CLK k +n1
T total =k( k+ n1)CLK
G
knCLK
n
=
= k
k (k +n1)CLK k +n1 k
Productividad: (n instrucciones por unidad de tiempo) Pk =
E
n
= k
( k +n1)CLK CLK
- Segmentacin bsica de MIPS

Iniciar una instruccin cada ciclo introduce problemas. Hay que determinar que
operacin esta realizando la mquina en cada ciclo, para asegurarnos que no esta
intentando realizar dos operaciones diferentes con el mismo recurso.
Mquina sin segmentacin:
Tiempo de ejecucin medio por instruccin=T emi=CLKCPI
Implementacin segmentada: El ciclo de reloj debe ir a la velocidad de la etapa ms lenta
ms sobrecargas. Por eso la ganancia para la segmentacin es:
G s=
tiempo medio instruccinsin segmentacin

tiempo medioinstruccin con segmentacin
La segmentacin puede entenderse como una mejora del CPI, que es lo que tpicamente
entendemos o como una reduccin del ciclo de reloj.
- Rendimiento de la segmentacin con detenciones
G s=
tiempo medio instruccinsin segmentacin

tiempo medioinstruccin con segmentacin
G s=
CPI sin segmentacinCiclo de reloj sin segmentacin

CPI con segmentacinCiclo de reloj con segmentacin
G s=
Ciclo de reloj sin segmentacin CPI sin segmentacin
Ciclo de reloj con segmentacin CPI con segmentacin
CPI con segmentacin=CPI ideal +Ciclos reloj detencin segmentacin por instruccin
Si ignoramos el incremento potencial en el ciclo de reloj debido a la segmentacin, y

asumimos que las etapas estn equilibradas, podemos igualar el ciclo de reloj de las dos
mquinas:
G s=
CPI sin segmentacin

CPI ideal +Ciclos reloj detencin segmentacin por instruccin
G s=
Profundidad de la segmentacin
CPI con segmentacin
Profundidad de la segmentacin=
Ciclo de reloj sin segmentacin

Ciclo de reloj con segmentacin
Tiempo medio por instruccin ideal sin detenciones=Ciclode reloj ideal
Tema 5.Rendimiento de la jerarqua de memoria

- Definiciones:
Un acierto (hit) es un acceso con xito a memoria del nivel superior, en caso
contrario se produce un fallo (miss)
La tasa de aciertos (Hit Ratio) es el porcentaje de aciertos en accesos a memoria del nivel
superior
La tasa de fallos (Miss Ratio) se define como: Miss Ratio: 1 Tasa de aciertos
El tiempo de acierto (TA) = T. empleado en determinar si la informacin esta a
ese nivel + T. empleado en acceder a esa informacin
La penalizacin de Fallo (PF) = T. empleado en sustituir un bloque del nivel
superior por el bloque correspondiente del nivel inferior + T. proporcionar el
bloque al dispositivo que lo ha pedido (CPU).
Se distingue: Tiempo de acceso (para acceder a la primera palabra del bloque) y tiempo
de transferencia (para transferir el resto del bloque)
El tiempo medio de acceso a memoria (TMA) = tiempo de acierto + tasa de fallos *
penalizacin de fallo
- Memoria cach:
Correspondencia directa: cada bloque slo puede aparecer en un lugar en la cach
lnea = direccin de la estructura de bloque MOD n de lneas
Correspondencia asociativa por conjuntos: un bloque se puede colocar en un conjunto
restringido de lugares en la cach:
lnea = direccin de la estructura de bloque MOD n de conjuntos
Correspondencia completamente asociativa: un bloque se puede colocar en cualquier
parte de la cach
- Rendimiento de la cach:
Tiempo medio de acceso a memoria: TMA = TA + FF * PF
Tiempo de ejecucin: Tcpu = NI * CPI * Treloj = NI * (CPIejec + CPImem) * Treloj
CPImem: ciclos en espera de CPU por referencias a memoria:
CPI mem=
ciclos detencin debido a fallos

=CPI mem (lecturas)+CPI mem (escrituras)
NI
CPI mem (lecturas)=

CPI mem (escrituras)=
fallos en lecturas PF lecturas lecturas FF lecturas PF lecturas

=
NI
NI
fallos escritura PF escritura escrituras FF escrituras PF escrituras

=
NI
NI
CPI mem=
NM FF PF
NI
T CPU =N I (CPI ejec +CPI mem ) T reloj=N I (CPI ejec +
NM
FF PF ) T reloj
NI
lgunos diseadores prefieren medir los fallos por instruccin en lugar de los fallos por
acceso a memoria:
T CPU =N I (CPI ejec +
fallos
PF) T reloj
instruccin
- Optimizaciones:
Tasa de Fallo = N Fallos / N de Accesos
Reducir la penalizacin de fallos con cachs multinivel:
TMA=TA L1 + FF L1PF L 1
PF L1=TA L2 + FF L2PF L2
Hay que diferenciar:

FF local =
n de fallos
n de accesos a lacach
FF global =
n de fallos
n total de accesos realizados por la CPU
En general se cumple:
FF localFF global
Y en particular:
FF local . L 1=FF global . L1
FF local . L 2> FF global . L2

Resumen Formulas Arquitectura

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Resumen Formulas Arquitectura

Caricato da

Copyright:

Formati disponibili

Resumen final - Arquitectura de los Computadores

Rendimiento con mejora Tiempo ejecucin sin mejora

Tema 2. Anlisis del Rendimiento

- Relacin de rendimientos entre mquinas:

Expresado en tiempos de ejecucin: n=100

Tiempo ejecucinY Tiempo ejecucin X

fraccin mejorada=1aceleracin global =aceleracinmejorada

- Coste de un circuito integrado:

Coste dado+Coste dado prueba+ Coste empaquetado y final test

Coste del dado=

( Dimetro oblea/2) Dimetro oblea

Ciclos reloj CPU paraun programa

Ciclos de reloj CPU para un programa

TiempoCPU =Recuento de InstruccionesCPIDuracin del ciclo de reloj

- Alternativas para la medida del rendimiento:

- MIPS relativos y MIPS nativos:

Los MIPS relativos se apoyan en el tiempo de ejecucin.

Nmero de operaciones en puntoflotante de un programa

- Resmenes del rendimiento:

Tiempo medio de ejecucin:

Tiempo de ejecucin ponderado:

wi = frecuencia del programa i-simo de la carga de trabajo

Tema 3. Diseo del repertorio de instrucciones

Cargas y almacenamientos (byte, media palabra, palabra)

ALU's con operandos inmediatos

Instrucciones de salto condicional (BQEZ, BNEZ) RS1 registro implicado, RD no

Saltos a registro RD=0; Inmediato=0; RS1=destino

Instruccin tipo R: (acceso a memoria, saltos condicionales, inmediatas)

Aritmticas y lgicas entre registros: RS1=fuente1, RS2=fuente2,

Desplazamiento de 26 bits con signo aadido al PC

JAL Salto incondicional y enlace R31

- Segmentacin aritmtica: sumador de tres bits con propagacin de acarreo

Periodo del reloj del cauce: CLK =max [t i ]ki=1+ t r

T total =k( k+ n1)CLK

Productividad: (n instrucciones por unidad de tiempo) Pk =

- Segmentacin bsica de MIPS

tiempo medio instruccinsin segmentacin

tiempo medio instruccinsin segmentacin

CPI sin segmentacinCiclo de reloj sin segmentacin

Ciclo de reloj sin segmentacin CPI sin segmentacin

Ciclo de reloj con segmentacin CPI con segmentacin

Si ignoramos el incremento potencial en el ciclo de reloj debido a la segmentacin, y

CPI sin segmentacin

Ciclo de reloj sin segmentacin

Tiempo medio por instruccin ideal sin detenciones=Ciclode reloj ideal

Tema 5.Rendimiento de la jerarqua de memoria

ciclos detencin debido a fallos

CPI mem (lecturas)=

fallos en lecturas PF lecturas lecturas FF lecturas PF lecturas

fallos escritura PF escritura escrituras FF escrituras PF escrituras

T CPU =N I (CPI ejec +CPI mem ) T reloj=N I (CPI ejec +

Hay que diferenciar:

FF local . L 2> FF global . L2

Potrebbero piacerti anche