Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Organizacin
Criterios de clasificacin
v.2014
http://electro.fisica.unlp.edu.ar/arq/
Arquitectura de Computadoras
Objetivos de la materia.
Arquitectura de Computadoras
Introduccin
COMPUTADORA
Dispositivo electrnico, digital y programable, utilizado para el
procesamiento y/o manipulacin de informacin.
Arquitectura de Computadoras
Stallings
1-2
A
8
3
9-10
4-5
6
7
11-16
Tanenbaum
1
A-B
3
2-3
4-5
2
2
6
8
Null
1
2
3
4
5
6
7
8
9-10
Arquitectura de Computadoras
Arquitectura II
Diferentes formas de paralelismo
PRIMERA PARTE: PARALELISMO DENTRO DEL PROCESADOR
Arquitectura RISC, segmentacin y sistema de cach
Procesadores superescalares y VLIW
DSP y GPU
SEGUNDA PARTE: PARALELISMO ENTRE PROCESADORES
Procesadores SIMD y Vectoriales
Arquitecturas MIMD
Clusters
Arquitectura de Computadoras
Definicin
Diseode
computadoras
LGICA (Software?)
IMPLEMENTACIN (Hardware?)
Ejemplos
Aplicacin de procesamiento de seales:
La ARQUITECTURA, dispone de MAC, MUL o nada? (ISA); cuntos ciclos
demora? (ORG); cul es la frecuencia de trabajo/consumo de potencia?
(TEC).
Procesadores Intel
Arquitectura de Computadoras
IBM PC
10
Arquitectura de Computadoras
CACHE
Arquitectura de Computadoras
CACHE
13
14
Arquitectura de Computadoras
Clasificaciones
Segn la arquitectura del repertorio de
instrucciones (ISA)
Segn la organizacin
Segn la tecnologa
Segn la aplicacin
16
Arquitectura de Computadoras
ORTOGONALIDAD
Todos los modos de direccionamiento y
todos los tipos de datos disponibles
para todas las instrucciones.
Gran ventaja para los compiladores.
Almacenamiento de operandos
Add A,B,C
18
Nmero de operandos
19
20
Sobretresarquitecturasdiferentes:
MM
Arquitectura Memoria-Memoria
RM
Arquitectura Registro-Memoria
RR
Arquitectura Registro-Registro
21
M3=M1+M2
MM
ADDM1,M2,M3
9c
FDCO1TR1C02TR2ECO3TR3=9c
RM
LOADR1,M1
ADDR1,M2
STORER1,M3
(4c)
(5c)
(4c)
LOAD:FDCOTR=4c
13c
ADD:FDCOTRE=5c
RR
LOADR1,M1
LOADR2,M2
ADDR1,R2,R3
STORER3,M3
(4c)
(4c)
(3c)
(4c)
15c
LOAD:FDCOTR=4c
ADD:FDE=3c
22
M3=M1+M2
Bn=(An+An1)/2
MM
ADDM1,M2,M3
9c
MM
ADDAn,An1,Bn
DIVBn,#2,Bn
18c
FDCO1TR1C02TR2ECO3TR3=9c
RM
LOADR1,M1
ADDR1,M2
STORER1,M3
(4c)
(5c)
(4c)
13c
LOAD:FDCOTR=4c
RM
LOADR1,An1
ADDR1,An
DIVR1,#2
STORER1,Bn
(4c)
(5c)
(5c)
(4c)
18c
ADD:FDCOTRE=5c
RR
LOADR1,M1
LOADR2,M2
ADDR1,R2,R3
STORER3,M3
(4c)
(4c)
(3c)
(4c)
LOAD:FDCOTR=4c
ADD:FDE=3c
15c
RR
LOADR1,An
ADDR1,R2,R3
DIVR3,#2,R3
STORER3,Bn
ADDR1,#0,R2
(4c)
(3c)
(3c)
(4c)
(3c)
17c
23
M3=M1+M2
Bn=(An+An1)/2
MM
ADDM1,M2,M3
9c
MM
ADDAn,An1,Bn
DIVBn,#2,Bn
18c
FDCO1TR1C02TR2ECO3TR3=9c
RM
LOADR1,M1
ADDR1,M2
STORER1,M3
(4c)
(5c)
(4c)
13c
LOAD:FDCOTR=4c
RM
LOADR1,An1
ADDR1,An
DIVR1,#2
STORER1,Bn
(4c)
(5c)
(5c)
(4c)
18c
ADD:FDCOTRE=5c
RR
LOADR1,M1
LOADR2,M2
ADDR1,R2,R3
STORER3,M3
(4c)
(4c)
(3c)
(4c)
LOAD:FDCOTR=4c
ADD:FDE=3c
15c
RR
LOADR1,An
ADDR1,R2,R3
DIVR3,#2,R3
STORER3,Bn
ADDR1,#0,R2
(4c)
(3c)
(3c)
(4c)
(3c)
17c
2.5
24
Modos de direccionamiento
25
Repertorio de instrucciones
RISC vs CISC
(largo fijo vs.
variable)
Arquitectura de Computadoras
PARALELISMO ...
28
CU & Datapath
29
Registros
Para llevar a cabo el ciclo de instruccin (CAPTACIONDECODIFICACION-EJECUCION-INTERRUPCION) la CPU necesita
registros de almacenamiento temporario.
Registros visibles
30
Registros
Para llevar a cabo el ciclo de instruccin (CAPTACIONDECODIFICACION-EJECUCION-INTERRUPCION) la CPU necesita
registros de almacenamiento temporario.
Registros visibles
31
El ciclo de instruccin
MEMORIA
CAPTACION DE
CAPTACION DE
LA INSTRUCCION
LA INSTRUCCION
UC
DECODIFICACION
DECODIFICACION
ALU
CALCULO DIR
CALCULO DIR
DEL OPERANDO
DEL OPERANDO
CO
MEMORIA
CAPTACION DEL
CAPTACION DEL
OPERANDO
OPERANDO
FO
ALU
EJECUCION DE
EJECUCION DE
LA INSTRUCCION
LA INSTRUCCION
32
Arquitectura de Computadoras
33
Tecnologa de integracin
Tecnologa del proceso CMOS ( celda DRAM, expected average halfpitch of a memory cell).
180nm
180nm
130nm
130nm
90nm
90nm
65nm
65nm
45nm
45nm
32nm
32nm
22nm
22nm
14nm
14nm
10nm
10nm
2000
2000
2001
2001
2003
2003
2006
2006
2008
2008
2010
2010
2012
2012
2014?
2014?
2015?
2015?
PII
PII
PIII
PIII
P4yPPC
P4yPPC
Core2,PS3
Core2,PS3
Xeon,PS3slim,Power7
Xeon,PS3slim,Power7
Corei3i5,AMDFX
Corei3i5,AMDFX
Corei7
Corei7
LIMITE?gate5nm
LIMITE?gate5nmtunneling
tunneling
nanoelectrnica
nanoelectrnica
35
36
37
Arquitectura de Computadoras
Diseo costo/rendimiento
DESKTOP ($500) [debe incluir sw!]
Mvil: ARM
Consolas de mano
Tablets y PDA
Desktop: Intel/AMD
PC, laptop.
39
Consolas de juego
Ao
Bits
4ta Generacin
1990
16b
5ta Generacin
1995
32b
6ta Generacin
2000
64b
7ma Generacin
2005
128b
8va Generacin
2013
64b
SEGA
Sega Gnesis
Motorola 68000
Sega Saturn
Sega Dreamcast
Hitachi SupeH RISC Hitachi SuperH RISC
NINTENDO
Super Nintendo
WDC W65C816
Nintendo 64
MIPS R4200
Nintendo Gamecube
POWER Gekko
Nintendo Wii
POWER Broadway
Nintendo Wii U
POWER7
PlayStation
MIPS 3000
PlayStation II
Emotion Eng. (MIPS)
PlayStation III
POWER Cell
PlayStation 4
AMD Jaguar x86-64
AMD Radeon
Xbox
Pentium III
Xbox 360
POWER Xenon
Xbox One
AMD Jaguar x86-64
AMD Radeon
DVD
Ethernet
PIII/PIV/AMD K7
Bluray
WiFi
Core/ADM64
Bluray/Internet
Gigabit Ethernet
Athlon
SONY
MICROSOFT
Soporte
Cartridge
Conectividad
PC Equiv
IBM POWER
Broadway
90nm
Xenon
65nm
Cell
45nm
CD
PII/PowerPC
730MHz Gekko ??
3.2GHz
3 PPE simtrico
3.2GHz
1 PPE + 7 SPE
40
Arquitectura de Computadoras
RESMEN
SW
Arquitectura
de
computadoras
HW
Implementacin
ORGANIZACION
TECNOLOGIA
41
PRCTICA DE REPASO
Arquitecturas ARM
CLASIFICAR, SEGN LOS CRITERIOS EXPUESTOS, LOS PROCESADORES
ARM7, ARM7TDMI, ARM9, ARM11
ARM Cortex-A7/8/9/15, ARM Cortex-M0/1/3/4, ARM Cortex-R
42
ARM Cortex
Quad-core 1.2 GHz / Dual-core 1.7 GHz
45
46
47
48
OTRO EJEMPLO
Apple A5X SoC
2 ARM Cortex-A9 cores and 4 GPU cores
nVidia Tegra 3 SoC
4 ARM Cortex-A9 cores and 12 GPU cores
Apple dice que el suyo es More powerful
http://geeknizer.com/ipad-a5x-vs-tegra-3/
49
AGOSTO 2014
http://m.v3.co.uk/v3-uk/news/2359539/ibm-unveils-brain-inspired-truenorth-chip-with-supercomputer-power
50