Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Y SUS APLICACIONES
Presentación
Posibilidades
Capacidades
Promueve Prestaciones
Posibilidades Demanda
Restricciones
Nuevas Económicas
Restricciones Generación
Mercado
Fundamental
Fuerte
Aplicaciones y Mercados:
• Aplicaciones que demandan velocidades y capacidad de
memoria fuera del alcance de las plataformas monoprocesador
(Grand Challenge)
• Demanda elevada de disponibilidad (Internet: mantenimiento y
amplicación sin tiempos muertos)
Tecnología:
• Posibilidades
Procesadores y redes de altas prestaciones
• Limitaciones previsibles en la tecnología (retardos relativos crecientes
y limitaciones en el consumo de potencia)
Capacidades
Promueve Prestaciones
Posibilidades Demanda
• Aplicaciones que
Restricciones
Nuevas Económicas
Restricciones demandan velocidad
Generación y
memoria (Grand Challenge)
Mercado
• Demanda elevada Fundamental
de
disponibilidad Fuerte
Visible
Adaptado de Vajapeyam/Valero (Computer, Abril 2001)
• Procesamiento de transacciones
• Sistemas de control en entornos médicos,
medios de transporte, ambientes seguros
Aplicaciones
• Aplicaciones de internet
- Mercados financieros continuos
- Acceso a bases de datos e
información
Mercado - Computación móvil
- No hay tiempos muertos (para
mantenimiento, ampliación,...)
100000
TOP500
(Nov2001) TOP500
10000 Genoma Humano (Nov2002)
Cambio Climático
Dinámica de Fluidos Viscosos 1
1000 Modelado de Semiconductores
Aplicaciones 100
Modelado de Superconductores
Cromodinámica cuántica
Circulación de Océanos
10 Biología 3
Estructural
2
1 Tiempo Diseño
72 horas Farmacéutico
Modelado
0.1 Plasma 3D
Tiempo Dinámica
48-horas química
0.01
Mercado
Teraflops Petaflops
2. Si no prosigue:
Mercado Usar varios procesadores es la opción para
configurar plataformas con mejores
prestaciones.
Mejora de la Tecnología de
Fabricación de CI basada en el
Silicio Reducción del
tamaño de los transistores
TCPU = NI x CPI x Tciclo
+ Aumento del tamaño del
dado
T Segmentado
Inst. 1 IF ID EX MEM WB
CPI=1
Inst. 2 IF ID EX MEM WB
Inst. 3 IF ID EX MEM WB
Inst. 4 IF ID EX MEM WB
T
Inst. 1 IF ID EX MEM WB Superescalar o VLIW
Inst. 2 IF ID EX MEM WB CPI=0.5
Inst. 3 IF ID EX MEM WB
Inst. 4 IF ID EX MEM WB
BTB Unidad de
Enteros
Buffer de
Cola de Banco de Registros
Reorden
Instrucciones
Ventana de
Decodificador
Instrucciones
Unidad de
Flotantes
Buffer de
Banco de Registros
Reorden
Ventana de
Instrucciones
Buffer de Buffer de
Almacen. Carga
1720
Las mejoras tecnológicas no
permitirán más de un factor de
mejora anual del 12% anual en
las prestaciones de los
procesadores hasta el 2014.
Esto supone incrementar las
prestaciones en 7.4 veces
(El factor de mejora actual del
55% anual llevaría a
prestaciones 1700 veces las
actuales)
Antesala
de Saltos TLB Cache L1 I IPG
L1I
Núcleo
Detección Registros
de Riesgos
Registros para Enteros
FP
REG
¿? - Superescalares
- VLIW
I2 I3 I3 I6 X X
I4 I7 I1 I4 I5 I4 I7 I1 X I7 I4
I9 I7 I8 I9 I4 I5 X X I9
I8 I10 I4 I7 I8 I7 I8 I8 X X
I2 I3 I9 10 I6 X I10 X
I1 I4 I5 I8 I10 I9 I10 X I2 I3
I7 I8 I6 I11 I1 I4 I5
Superescalar Multihebra Multihebra VLIW
Simultánea
Curso de Doctorado RAPyA (2004/05)
Ejemplo de Arquitectura Multihebra: Pentium 4
Hyper-Threading
Intel ha desarrollado el Pentium 4 a 3.06 GHz con
características de un procesador SMT (Simultaneous Multi-
threading).
La denominación de Intel para esta arquitectura es Hyper-
Threading (HT).
El procesador puede ejecutar simultáneamente dos hebras que
pueden corresponder a una misma tarea (programada en varias
hebras) o a tareas diferentes.
SPECint_base2000= 1099; SPECfp_base2000=1077
Adobe Photoshop se ejecuta un 21% más rápido cuando se
ejecuta al mismo tiempo en antivirus de McAfee.
Otros ejemplos
UltraSPARC IV (2 UltraSPARC III)
70
60
¿Se puede mantener
este ritmo de
50
mejora?
40
32 Analizar el origen de
30
las mejoras que se
20
han conseguido y ver
10 las tendencias
0 previsibles
0 1,5 3 4.5 6 7.5 9
80% Clusters
Constelac
60%
SIMD
40% UniProc.
MPP
20% SMP
0%
19 )
19 )
20 )
20 )
19 )
19 )
)
(2
(1
(1
(2
(1
(2
(1
94
96
99
00
93
97
02
19