Sei sulla pagina 1di 16

Universidad Politcnica Salesiana-Sede Cuenca.

Christian Pucha Cabrera, Pablo Urgils Len Wong, Anthony Yanza


cpuchac@est.ups.edu.ec, purgilesl@est.ups.edu.ec, ayanzav@est.ups.edu.ec
Universidad Politcnica Salesiana - Sede Cuenca
Sistemas Microprocesados.

Microprocesadores:

Resumen--- En el siguiente informe se presentar una


investigacin sobre los microprocesadores AMD 64, Phenom
I y II y AMD FUSION, donde se tratarn sus principales
caractersticas.

La tecnologa AMD64, que dobla el nmero de


registros del procesador y aumenta drsticamente la
accesibilidad a la memoria del sistema.

El Athlon 64 tambin presenta una tecnologa de


reduccin de la velocidad del procesador
llamada Cool'n'Quiet. La potencia se reduce de 89 a
22 W.

Hay dos variantes del Athlon 64: El Athlon 64 y


el Athlon 64 FX.

Un mejor soporte para las instrucciones multimedia,


incluyendo la tecnologa 3Dnow Professional y
SSE2.

Un bus de sistema de hasta 2300 MHz, empleando la


tecnologa HyperTransport, 800 MT/s a 1000 MT/s.
(millones de transferencias por segundo).

Ejecucin nativa del software de 32 bits, lo que


permite proporcionar un excelente rendimiento con el
software para PC de la actualidad, al mismo tiempo
que realizar una migracin sencilla hacia el software
de 64 bits.

Viene en diferentes tipos de zcalos.

Palabras Claves AMD, caractersticas, Phenom, FUSION.

INTRODUCCIN

Los microprocesadores han ido avanzando ao tras ao,


ofreciendo cada vez ms prestaciones mucho ms agradables
para l usuario, los microprocesadores AMD ciertamente no
son los nmero uno en el mercado, sin embargo estos
microprocesadores son acogidos de una manera favorable,
gracias a sus grandes prestaciones y sobre todo a los precios
econmicos que ofrece frente a su rival de Intel, de esta
manera AMD ha ido creciendo con cada ao, ganando cada
vez ms una mayo acogida de parte del cliente, de esta manera
ha surgido distintas arquitecturas y modelos de
microprocesadores AMD, en este caso, se pondr nfasis en
los microprocesadores AMD ATHOL 64, AMD PHENON I,
AMD PHENON II y la serie de AMD FUSION, est ltima no
cabe duda en ser la que mejor le hace competencia hoy en da
a la compaa Intel, estos microprocesadores se centran ms
en el procesamiento de grficos, mbito el cual l cliente pone
ms nfasis, ya que suelen usarlos ms para emplearlas en
video juegos o videos de alta resolucin, a continuacin se
profundizar ms sobre estos microprocesadores, aclarando
as,
todas
las
prestaciones
que
ofrecen
estos
microprocesadores.

Socket 754.

Socket 939.

Socket 940.

Socket AM2. (940pines)

Socket AM2+

MARCO TERICO

A. AMD ATHLON 64.


Es el primer procesador para PC de 64 bits o x86 lanzado el 23
de Septiembre del 2003, compatible con Windows. El
procesador AMD Athlon 64 funciona sobre AMD64, una
tecnologa que permite al procesador, ejecutar las aplicaciones
de 32 bits a una alta velocidad, al mismo tiempo, facilita la
implementacin de una nueva generacin de potentes
aplicaciones de software de 64 bits en aquellas pocas. Al
lanzamiento de ste procesador se comunic el lanzamiento de
sistemas operativos de 64 bits para la plataforma AMD64 por
parte de Microsoft, Red Hat, SuSE y TurboLinux, y que
nicamente funcionarn en procesadores con tecnologa
AMD64 que existieron en aquellas pocas.
AMD Athlon 64 es el primer procesador para PC de 64 bits,
compatible con Windows. Entre las avanzadas tecnologas del
procesador AMD Athlon 64, se incluyen:

1) Modelos de AMD Athlon


caractersticas principales.

64

Clawhammer (130 nm SOI)

CPU-Stepping: C0, CGTerminacin: AR, AP o AS

L1-Cache: 64 + 64 KiB (Data + Instructions)

L2-Cache: 1024 KiB, fullspeed

Universidad Politcnica Salesiana-Sede Cuenca.

MMX, Extended 3DNow!, SSE, SSE2, AMD64,


Cool'n'Quiet, Bit NX (nicamente CG)

Socket 754, HyperTransport (800 MHz, HT800)

Socket 939, HyperTransport (1000 MHz, HT1000)

L1-Cache: 64 + 64 KB (Data + Instructions)

L2-Cache: 512 KB, fullspeed

MMX, Extended 3DNow!, SSE, SSE2, AMD64,


Cool'n'Quiet, Bit NX.

VCore: 1,5 V

Socket 939, HyperTransport (1000 MHz, HT1000)

Thermal Design Power (TDP): 89 W max

VCore: 1,4 V

Lanzamiento: 23 de septiembre de 2003

Thermal Design Power (TDP): 67 W max

Frecuencia del reloj: 1800 - 2400 MHz

Lanzamiento: septiembre de 2004

Frecuencia del reloj: 1800 / 2200 MHz

Newcastle (130 nm SOI)


Es un Clawhammer mejorado, con solo 512KB L2-Cache
posibles.

Mostro (90 nm SOI)

CPU-Stepping: CG

CPU-Stepping: E4

Terminacin: AX o AW

Terminacin:...BN

L1-Cache: 64 + 64 KiB (Data + Instructions)

L1-Cache: 64 + 64 KiB (Data + Instructions)

L2-Cache: 512 KB, fullspeed

L2-Cache: 1024 KiB, fullspeed

MMX, Extended 3DNow!, SSE, SSE2, AMD64,


Cool'n'Quiet, Bit NX.

Socket 754, HyperTransport (800 MHz, HT800)

Socket 939, HyperTransport (1000 MHz, HT1000)

VCore: 1,5 V

Thermal Design Power (TDP): 89 W max

Lanzamiento: 2004

Frecuencia del reloj: 1800 - 2400 MHz

Winchester (90 nm SOI)

CPU-Stepping: D0

Terminacin:...BI

MMX,
Extended 3DNow!, SSE, SSE2, SSE3, AMD64, Cool'n'Q
uiet, Bit NX

Socket 939, HyperTransport (1000 MHz, HT1000)

VCore: 1,35 V 1,4 V

Thermal Design Power (TDP): 89 W max.

Lanzamiento: 15 de abril de 2005

Frecuencia del reloj: 2200 - 3000 MHz.

Orleans (90 nm SOI)

CPU-Stepping: F2

L1-Cache: 64 + 64 KiB (Data + Instructions)

L2-Cache: 512 KiB, fullspeed

Universidad Politcnica Salesiana-Sede Cuenca.

MMX,
Extended 3DNow!, SSE, SSE2, SSE3, AMD64, Cool'n'Q
uiet, Bit NX

Direccionamiento de memoria de 64 bits.

Registros internos del procesador de 64 bits.

Socket AM2, 1000 MHz HyperTransport (HT1000)

Aumento de prestaciones.

VCore: 1,35 V o 1,4 V

Compatibilidad
existentes.

Thermal Design Power (TDP): 62 W max

Lanzamiento: 23 de mayo de 2006

La computacin de 64 bits no tiene sentido en


todas las aplicaciones.

Escalabilidad

Frecuencia del reloj: 2000 - 3200 MHz

2) Arquitectura X86-64(x64, AMD 64)


Durante mucho tiempo de la historia, AMD ha producido y
distribuido procesadores basados en los diseos originales de
Intel, pero en un giro de la historia, Intel, al ver la
oportunidad, adopt la arquitectura x86-64 de AMD, creada
como una extensin de la lnea de procesadores x86 propios
de Intel. Como AMD luego renombr su arquitectura a
AMD64, Intel de igual manera renombr la suya, Intel 64.
AMD64 representa un cambio con el pasado de AMD cuyo
comportamiento era seguir los estndares de Intel, aunque
mantiene los comportamientos anteriores de Intel extendiendo
la arquitectura del x86, desde los 16 bits 8086 hasta los 32
bits 80386, siempre sin eliminar compatibilidad hacia atrs. La
arquitectura del AMD64 la arquitectura de 32 bits del x86 (IA32) aadiendo registros de 64 bits, con modos de total
compatibilidad de 32 bits y 16 bits para software ya existente.
Incluso el modo de 64 bits permite compatibilidad haca atrs,
facilitando
a las herramientas
del
x86, como
los compiladores pueden ser modificados a la arquitectura
AMD64 con un esfuerzo mnimo. La arquitectura del AMD64
dispone de caractersticas como el bit NX
a)

las

arquitecturas

Mltiples threads de ejecucin.

Mltiples ncleos del procesador.

Virtualizacin.

pre-

La empresa Intel desarroll una arquitectura compatible bajo


el nombre Intel 64 (antes EM64T). La cual ha sido utilizada en
el Pentium 4 y posteriores microprocesadores de la compaa.

Limitaciones de arquitectura de 32 bits.

Repertorio de instrucciones de 32 bits.

Direccionamiento de memoria con 32 bits.


o

Capacidad de memoria limitada a 4Gb.

Registro del propsito general del procesador de


32 bits.
o

b)

con

Tipos de datos enteros de 32 bits.

Transicin a la arquitectura de 64 bits.

Repertorio de instrucciones de 64 bits.

Figura 1 Diagrama de bloques de la arquitectura de AMD Athlon

c)

Caractersticas Importantes de la arquitectura x86.

Nuevos registros.

Registros MMX (SSE) adicionales.

Espacio de direcciones mayor.

Instruccin de acceso a datos relativa al puntero.

Llamadas al sistema ms rpidas.

Universidad Politcnica Salesiana-Sede Cuenca.

Instrucciones SSE.

AMD Opteron

Bit NX.

AMD Turion 64 X2

AMD Turion 64

AMD Sempron (todos


sockets 754, 939 y AM2)

d) Modos de utilizacin.

Modo Largo.

Es el utilizado por algunos BSDs, GNU/Linux


(x86_64), Solaris 10, y por las ediciones de 64 bits de
Windows XP Professional, Windows Vista, Windows 7
y Windows 8.Dado que el conjunto de instrucciones es
el mismo, no hay una penalizacin importante en la
ejecucin del cdigo x86. Esto no sucede en la
arquitectura de Intel IA-64, donde las diferencias en
el ISA subyacente implican que la ejecucin de cdigo
de 32 bits equivale a utilizar un procesador
completamente diferente. En todo caso, en AMD 64,
las aplicaciones de 32 bits del x86 podran todava
beneficiarse de una recompilacin a 64 bits. Los
registros adicionales disponibles en el cdigo de 64
bits, pueden ser utilizados por un compilador de alto
nivel para la optimizacin.
Usando el modo largo, un sistema operativo de 64 bits
puede ejecutar aplicaciones de 32 bits y 64 bits
simultneamente. Tambin un x86-64 incluye un
soporte nativo para ejecutar las aplicaciones de 16 bits
del x86. Microsoft ha excluido explcitamente el
soporte para aplicaciones de 16 bits en la edicin x64
de Windows XP Professional debido a los problemas de
conseguir que el cdigo de 16 bits del x86 pueda
funcionar con su emulador WoW64.

Modo de Herencia

El modo utilizado por los sistemas operativos de 16


bits, como MS-DOS, y los sistemas operativos de 32
bits, como Windows XP. En este modo, slo se puede
ejecutar cdigo de 16 bits o de 32 bits. Los sistemas
operativos de 64 bits como Windows XP Professional
x64 y Windows Server 2003 x64 no se ejecutarn.
e)

Implementaciones.

Los procesadores siguientes implementan la


arquitectura AMD64:

AMD Phenom (K10)

AMD Phenom II

AMD Athlon II

los

Core i7

Core i5

Core i3

Core 2 Quad

Core 2 Extreme

Core 2 Duo

Intel Pentium Dual Core

Intel Atom

Xeon Serie 7xxx

Xeon Serie 5xxx

Xeon LV

AMD 64 (K8 - KRYPTONITE)

Serie 9xxiop

AMD PHENOM
ATHLON 64

Serie 8xx

AMD ATHLON 64 X2

Pentium DCeleron M serie 5xx

Pentium 4 720 Extreme Edition

AMD Athlon 64 FX

QUADAMD

utilizan

AMD FX (Bulldozer,
Piledriver,
Steamroller, Excavator)
A continuacin, se muestra los microprocesadores en
Intel, que tambin utilizan la arquitectura x64 (Intel
64).

64

que

Universidad Politcnica Salesiana-Sede Cuenca.

Pentium 4 630

Serie 6xx

Pentium 4 524

Serie 5x6

Serie 5x1

Celeron D 355

Celeron D 331

Serie 3x6

Serie 3x1

5
Es una tecnologa de fabricacin microelectrnica en la
que se sustituye el sustrato tradicional de fabricacin
de obleas de silicio monocristalino, por un sndwich de
capas de semiconductor-aislante-semiconductor.
Esta tcnica reduce las capacidades parsitas de
circuitos fabricados, y mejora la escalabilidad
los circuitos integrados. El aislante empleado suele
tpicamente dixido de silicio o, en aplicaciones en
que se busca resistencia frente a la radiacin.

Es un zcalo de CPU diseado para microprocesadores


AMD en equipos de escritorio, es utilizado en el
procesador Phenom
debido a que soporta
HyperTransport 3.0 y es compatible con memorias
DDR2.

Phenom es el nombre dado por Advanced Micro


Devices (AMD) a la primera generacin de procesadores de
tres y cuatro ncleos basados en la microarquitectura K10.
Este nombre fue dado a conocer a finales de abril del 2007,
reemplazando as a la serie de alto rendimiento de AMD
(Athlon 64 X2). AMD afirma que mejoran el rendimiento
hasta en un 30% respecto a un microprocesador AMD de
doble ncleo a igual frecuencia.

HyperTransport
Tambin conocido como Lightning Data Transport
(LDT) es
una tecnologa
de comunicaciones
bidireccional, que funciona tanto en serie como en
paralelo, y que ofrece un gran ancho de banda en
conexiones punto a punto de baja latencia. Ayuda a
reducir el nmero de buses en un sistema, lo que puede
disminuir los cuellos de botella y posibilitar que los
microprocesadores ms rpidos de la actualidad utilicen
la memoria de manera ms eficiente en sistemas ms
sofisticados

Un mes antes del lanzamiento oficial, AMD ya comercializaba


procesadores
de
tres
ncleos
basados
en
el
escalonamiento "B2", los cuales tenan un fallo cuando se
realizaba una aceleracin de reloj. Para el diseo del Phenom
se incluy la tecnologa de manejo de cache destepping "B3",
la cual corrige todos los bugs de su versin prototipo.

Como caracterstica comn todos los Phenom tienen


tecnologa de 65 nanmetros lograda a travs de
tecnologa de fabricacin Silicon on insulator (SOI). No
obstante, Intel, principal competencia de AMD a nivel
mundial, ya se encontraba fabricando mediante la ms
avanzada tecnologa de proceso de 45 nm en 2008.

Silicon on insulator (SOI)

La serie Phenom utiliza el socket AM2+ cuya principal


novedad es la integracin de la ltima versin
de HyperTransport y unidades de coma flotante de
128 bits, para incrementar la velocidad y el rendimiento
de los clculos de coma flotante

Sokcet AM2

B. AMD PHENOM

1) Caractersticas

los
de
ser
las

Poseen controlador de memoria DDR2 integrado,

Con el diseo nativo de cuatro ncleos ofrecido por los


procesadores Phenom, los ncleos se comunican dentro
del mismo sustrato de silicio prescindiendo de un bus
externo al procesador, poseen un ptimo acceso al
controlador integrado de memoria, logrando un ancho
de banda de 16 Gb/s para intercomunicacin de
los ncleos del microprocesador y
la
tecnologa
HyperTransport,

Universidad Politcnica Salesiana-Sede Cuenca.

Tiene cach L3 compartida para un acceso ms rpido a


los datos, adems de compatibilidad de infraestructura
de los socket AM2, AM2+ y AM3 para permitir un
camino de actualizacin sin sobresaltos.

Cuentan con cuatro ncleos con uno de ellos


desactivado, estos aseguran que se tenga un ptimo
acceso al controlador integrado de memoria.
3) Modelos.

2) Arquitectura del AMD PHENOM

Phenom est constituido por procesadores de tres y


cuatro ncleos basados en la microarquitectura K10.
La familia AMD 10h, o K10, es una arquitectura para
microprocesadores diseada por la empresa AMD.

Figura 3 Modelos del microprocesador Phenom.

Kuma
Kuma es un diseo de doble ncleo basado en el
diseo Agena de cuatro ncleos con dos
deshabilitados de 65 nm. Poseen soporte de
memoria DDR2 SDRAM. Todos los modelos
soportan: MMX, SSE, SSE2, SSE3, SSE4a, Enhan
ced
3DNow!, NX
bit, AMD64, Cool'n'Quiet, AMD-V.

Agena es un diseo nativo de cuatro ncleos, sin


ncleos deshabilitados. Todos los modelos
soportan: MMX, SSE, SSE2, SSE3, SSE4a,
Enhanced
3DNow!, NX
bit, AMD64, Cool'n'Quiet, AMD-V.
Incluyen
soporte de memoria de DDR2 SDRAM

Figura 2 Micro arquitectura K10

a)

Caractersticas de la micro arquitectura.

Contiene hasta 12 ncleos por CPU.

Mejora de la prediccin de saltos y de ejecucin de


rdenes.

Mejora de controlador de memoria integrado que


puede estar configurado como controlador de
doble canal, o como dos controladores de canal
individuales.

Agena

Integra una cach de L3 de gran capacidad


compartida entre todos los ncleos para un ms
rpido acceso a los datos.

C. AMD PHENOM II
Es el nombre dado por AMD a una familia de
microprocesadores o CPUs multincleo (multicore) fabricados
en 45 nm, la cual sucede al Phenom original (basado en la
anterior tecnologa de proceso de 65 nm).
1) Caractersticas

Una de las ventajas del paso de los 65 nm a los


45 nm, es que permiti aumentar la cantidad
de cache L3. De hecho, sta se increment de una
manera generosa, pasando de los 2 MiB del Phenom
original a 6 MiB. Justamente la inmensa mayora de
los millones de transistores adicionales corresponde a
ese incremento, el cual -segn se ha informado- ha

Universidad Politcnica Salesiana-Sede Cuenca.

llegado a producir mejoras en el rendimiento de hasta


un 30%.

Tiene compatibilidad hacia atrs a nivel de pins y


ademas, el controlador de memoria AM3 soporta
tanto RAM del tipo DDR2 como DDR3 con un ancho
de banda de hasta 21 GB/s permitiendo a los
usuarios de la antiguas plataforma AM2+ actualizar
su CPU sin tener que necesariamente cambiar
tambin su placa madre y DIMMs de RAM.

Limitan el uso de la DDR3 a un DIMM por canal. Si


no, los DIMMs rebajan automticamente su
velocidad.

Usa tecnologa CoolnQuiet para la administracin


de energa mejorada que ajusta automticamente los
estados y las caractersticas de rendimiento basados
en los requisitos de rendimiento del procesador lo
que permite funcionamiento ms silencioso y los
requisitos de potencia muy reducida

Tecnologa HyperTransport 3.0

Gran ancho de banda y baja latencia en el controlador


de memoria. Ancho de banda de 17,1 GB/s para
DDR2 y 21 GB/s para DDR3

La fuente de poder puede ser encendida o apagada


mediante un solo ciclo del reloj.

3) Modelos
A partir de las versiones del Phenom II para el socket AM3,
hay cuatro diferentes series ofrecidas por AMD. La primera de
ellas, al no estar recortada de ninguna manera, es el buque
insignia de la familia y representa el mximo potencial del
producto. Las otras dos series estn formadas mediante lo que
se conoce como cosecha de ncleos, es decir, a partir de
chips a los que el fabricante les encontr algunos defectos (los
cuales no obstante no deberan afectar al usuario final, ya que
las porciones afectadas de estas CPUs corresponden al/a los
ncleo(s) deshabilitado(s). Estos chips estn identificados
como un producto de una calidad un poco inferior.1

Serie 1000: Estas son CPUs de 6 ncleos diseados


para satisfacer a los jugadores ms entusiastas y
exigentes, y, en menor medida, para ser empleados en
estaciones de trabajo de alto rendimiento de bajo coste.
stos tienen 3 MiB de cache L2 (512 KiB por ncleo) y
6 MiB de cache L3 compartidos.

Serie 900T (Segunda Generacin): Se trata de


CPUs de 4 ncleos, que nativamente son de 6 ncleos
(Serie 1000), pero a las que les son desactivados 2 para
as satisfacer la demanda comercial, o por algn defecto
en alguno o los 2 ncleos.

Serie 900: Se trata del buque insignia de la familia


Phenom II. Tanto los cuatro ncleos como el total de la
memoria cache L3 se encuentran plenamente habilitados.

Serie 800: Estas son CPUs de cuatro ncleos con


algn defecto (potencial o real) en parte del total de
su cache' L3', lo que no debera ser problema debido a
que slo 4 de los 6 MiB de estn habilitados.

Serie 700: Tienen 3 ncleos activos (al estar uno de


ellos deshabilitado). No obstante, su cache no est
reducida, siendo por lo tanto de 6 MiB (debido a su
ncleo faltante, son comercializados como X3 en vez
de X4). No obstante existen algunas versiones del
Phenom II X3 que no tienen ese defecto sino que
simplemente tienen ese ncleo desactivado debido a que
estn
orientados
al
segmento
del mercado inmediatamente inferior al del X4.

Serie 500: Versin de doble ncleo o dual core,


implicando que dos de los cuatro ncleos estn
deshabilitados (siendo X2 en lugar de X4). No
obstante, el total de 6 MiBde la memoria cache L3 es
accesible.

2) Arquitectura
Cuenta con una arquitectura de conexin directa, utilizando
esta para mejorar la eficiencia del sistema con los
procesadores, el controlador de memoria y la E/S a la CPU.
Est diseado para permitir 32 y 64 bits simultneamente.
Mediante esta arquitectura se asegura que los cuatro ncleos
tengan un ptimo acceso al controlador integrado de memoria,
logrando un ancho de banda de 16 Gb/s para
intercomunicacin de los ncleos del microprocesador y la
tecnologa HyperTransport, de manera que las escalas de
rendimiento mejoren con el nmero de ncleos.
a)

Controlador de memoria integrado

Aumenta el rendimiento de las aplicaciones


reduciendo drsticamente la latencia de
memoria

Escalas de ancho de banda de memoria y


rendimiento para satisfacer las necesidades
de cmputo

Tecnologa HyperTransport proporciona


un ancho de banda pico de 16.0GB/s

Hasta 37 ES/s de ancho de banda total de las


entregas del procesador al sistema.

4) Diseos

Universidad Politcnica Salesiana-Sede Cuenca.

Procesador Phenom II Diseo Deneb

a)

Controlador de memoria:

Deneb es un diseo nativo de cuatro ncleos, sin ncleos


deshabilitados.

Cache:

Cache L1 (por ncleo): 128 KB (64 KB + 64 KB


para instrucciones y datos respectivamente), 512 KB
en total.

Cache L2: 512 KB por ncleo, a la misma frecuencia


que la propia CPU.

Cache L3: 6 MB compartidos entre todos los


ncleos.
Controlador de memoria:

Socket AM2: memoria DDR2 de doble canal, de


hasta 266 MHz reales.
Socket AM3: DDR3 de doble canal de hasta 333
MHz reales

Consumo de energa: (TDP): 65, 95, 125 y 140 vatios.

Frecuencia del reloj: Entre 2.500 y 3.400 MHz.

Modelos: Phenom II X4 805 a 980.

Socket AM3: DDR3 de doble canal de hasta 333


MHz reales.

Consumo de energa (TDP): 65 y 95 vatios.

Velocidad del reloj: De 2.500 a 3.000 MHz.

Modelos: Phenom II X3 705 a 740

Procesador Phenom II Diseo Callisto.

c)

Callisto es un diseo de doble ncleo basado en el diseo


Deneb de cuatro ncleos con dos ncleos deshabilitados.
Cache

Cache L1 (por ncleo): 128 KB (64 KB + 64


KB), 256 KB en total.

Cache L2 cache: 512 KB por ncleo, a la


velocidad de la CPU.

Cache L3 cache: 6 MB compartidos entre todos


los ncleos.

Procesador Phenom II Diseo Heka

b)

Heka es un diseo de 3 ncleos basado en el diseo Deneb de


cuatro ncleos con un ncleo deshabilitado.

Socket AM2+: memoria DDR2 de doble canal,


de hasta 266 MHz reales.

Cache:

Cache L1 (por ncleo): 128 KB (64 KB + 64


KB), 384 KB en total.
Cache L2: 512 KB por cada ncleo, operando a
la frecuencia de ellos (1.536 KB o 1,5 MB en
total)
Cache L3: 6 MB compartidos entre todos los
ncleos.

Controlador de memoria:

Socket AM2+: RAM DDR2 de doble canal de


hasta 266 MHz reales.

Socket AM3: DDR3 de doble canal de hasta 333


MHz reales.

Consumo de energa (TDP): 80 vatios.

Frecuencia del reloj: Entre 3.000 y 3.100 MHz.

Modelos: Phenom II X2 545 a 560.

Universidad Politcnica Salesiana-Sede Cuenca.


d)

Procesador Phenom II Diseo Thuban

Thuban es un diseo nativo de seis ncleos, sin ncleos


deshabilitados.

Cache:

Cache L1 (por ncleo): 128 KB (64 KB +


64 KB para instrucciones y datos
respectivamente), 512 KB en total.

Cache L2: 512 KB por ncleo, a la misma


frecuencia que la propia CPU.

Cache L3: 6 MB compartidos entre todos


los ncleos.

Controlador de memoria:

Socket AM2+: memoria DDR2 de doble


canal, de hasta 266 MHz reales.

Socket AM3: DDR3 de doble canal de hasta


333 MHz reales.

1) Caractersticas Principales de los AMD


FUSION.
Las caractersticas principales de AMD Fusion nos hablan de
combos de CPU+GPU discreta. Inicialmente sern CPU de 2
ncleos en 40 nanmetros con GPU de DirectX 11. Sern
compatibles con memoria DDR3 (800 o 1.066 MHz.) y el
modelo de GPU pertenecer a las AMD 6000 Series para
porttiles o de escritorio. Ms concretamente, los primeros
modelos integrarn una AMD Radeon 6310.
Cmo se construye estos procesadores?
Cada vez se consigue reducir ms y ms el ancho de los
transistores. Estos son la unidad bsica que se utiliza para la
construccin de procesadores. Cada nueva generacin
consigue que su rea sea la mitad. En estas APU ya han
conseguido aadir la tarjeta grfica, el controlador de memoria
y los interfaces PCI-Express. Todos estos elementos estaban
antes en chips separados sobre la placa base. De esta manera
se consigue una reduccin de tamao, vers computadoras
ms pequeas en el mercado. Necesitaran menos energa
debido a que el consumo por transistor depende del rea.
Sern ms rpido ya que los diferentes componentes estn ms
juntos. Las distintas partes del procesador pueden trabajar a
distintas velocidades. Podremos acelerar aquellas que estemos
usando y dejar paradas las que no.
Mejoras que ofrece los microprocesadores AMD FUSION.
Se ha puesto gran nfasis en las mejoras en las instrucciones
vectoriales. Este tipo se caracteriza por realizar grandes
cantidades de operaciones a la vez. En un procesador anterior
si era necesario hacer clculos sobre una lista de datos se
hacan uno por uno. El cambio hace que en estos procesadores
podamos realizar esas operaciones en paralelo todas a la vez.

Tecnologas adicionales: Cool'n'Quiet, bit NX,


AMD-V y Turbo Core.

Consumo de energa: (TDP): 125 vatios.

Frecuencia del reloj: Entre 2.800 y 3.200 MHz.

Modelos: Phenom II X6 1055T y 1090T BE.


D. AMD FUSION

AMD Fusion es el nombre comercial usado por el fabricante


AMD para su familia de procesadores. Su caracterstica
principal y que los hace diferentes a los que existan en el
mercado es que cuentan con una tarjeta grfica integrada en el
mismo micro. Esta compaa fue la que empez a usar el
concepto de APU (Accelerated Processing Unit). AMD Fusion
se presenta como la revolucin en el mercado de los
procesadores. La idea bsica es unir CPU, GPU y northbridge
en el mismo chip, de forma que al juntarlo todo se mejoran los
circuitos de interconexin entre los diferentes componentes y,
con ello, se aumentan velocidades de transferencia de datos y
se reducen tiempos de espera.

2) Aplicaciones actuales que saldrn ms


favorecidas son:

Tratamiento de video.

Decodificacin y codificacin de video.

Tareas de procesado criptogrfico.

Reconocimiento y tratamiento de sonido.

Este cambio abre la posibilidad de crear nuevas


aplicaciones:

Que tu computadora sea capaz de reconocer tu rostro.

Computadoras muy pequeas y con capacidad de


reproducir videos en alta definicin.
3) Arquitecturas y modelos de los
microprocesadores AMD FUSION.
a)

Arquitectura Bobcat:

Esta arquitectura presenta las siguientes caractersticas.


ncleo de 64 bits

Avanzada predictor de saltos

Universidad Politcnica Salesiana-Sede Cuenca.

Un predictor de saltos es un circuito digital


utilizado en los procesadores que utilizan
segmentacin de la unidad de proceso para
reducir ciclos de parada en el pipeline.

decodificador de instrucciones x86 dual

Unidad de entero de 64 bits con dos ALU

canal nico controlador de memoria de 64 bits

+ 32 KB de datos L1 de instrucciones 32 KB de
cach

cach L2 de 1 MB - 512 KB

MMX, SSE , SSE2 , SSE3 , SSSE3 , SSE4A

10

MMX (Matriz Extensin matemtica),


Proporciona operaciones aritmticas y
lgicas sobre los nmeros enteros de 64 bits
(el software puede optar por realizar en su
lugar dos de 32 bits, cuatro operaciones de 8
bits 16 bits u ocho en una sola instruccin).
La extensin contiene 16 registros de datos
de 64-bits y ocho registros de control de 32bits.

b)

Socket AM3, ya sea con DDR2 o DDR3 para el de 45


nm de la serie Phenom II. todos los procesadores
Phenom K10 son compatibles con el zcalo AM2 + y
AM2, algunos Phenom II procesadores de 45 nm
solamente estn disponibles para Socket AM2 +.

Socket F con DDR2, DDR3 con Shanghai y ms


tarde

adiciones y extensiones del conjunto de instrucciones

Nuevos SSE instrucciones nombradas como SSE4a:


instrucciones combinado mscara del turno
(EXTRQ / INSERTQ) y almacenar instrucciones
escalares en streaming (MOVNTSD / MOVNTSS).
Estas instrucciones no se encuentran en Intel SSE4

AMD E Series, Zacate: APU dirigida a porttiles


bsicos, con TDP de 18 vatios y 1 y 2 ncleos. Dos
modelos: AMD E-350 (2 ncleos, 1.6 GHz.)
y AMD E-240 (1 ncleo, 1.5 GHz.)

AMD C Series, Ontario: APU para Ultraporttiles,


con TDP de 9 vatios. Tambin dos modelos: AMD C50 (2 ncleos, 1.0 GHz.) y AMD C-30 (1 ncleo, 1.2
GHz.).

Las instrucciones SSE son especialmente


adecuadas para decodificacin de MPEG2,
que es el cdec utilizado normalmente en los
DVD,
procesamiento
de
grficos
tridimensionales
y
software
de
reconocimiento de voz.

El apoyo a las instrucciones de operacin de carga no


alineados ESS (que anteriormente requiere la
alineacin de 16 bytes)

Mejoras en la pipeline de ejecucin

128 bits de ancho SSE unidades

Gran interfaz de memoria cach de datos L1 que


permite dos cargas de 128 bits por ciclo (en oposicin
a dos cargas 64 bits por ciclo con K8)

512-entrada indirecta predictor de saltos y una pila


grande de retorno (tamao se duplic de K8).

Side-Band Pila Optimizer, se dedica a realizar


incremento / decremento del puntero de pila de
registros

LLAMADA Fastpathed e instrucciones RET-Imm


(anteriormente microcodificado), as como MOVs de
SIMD registros a registros de propsito general

Figura 4. Cuadro de resumen de la arquitectura Bobcat.

Basados en esta arquitectura se crearon los primeros AMD


FUSION, los cuales tuvieron 2 modelos diferentes AMD E
Series y AMD C Series, las cuales se presentan a
continuacin:

Arquitectura k10:

Est Arquitectura presenta las siguientes caractersticas:


Socket AM2 + con DDR2 para el Phenom 65 nm y
Athlon 7000 Series

Las instrucciones SSE son especialmente


adecuadas para decodificacin de MPEG2,
que es el cdec utilizado normalmente en los
DVD,
procesamiento
de
grficos
tridimensionales
y
software
de
reconocimiento de voz.

GPU: TeraScale 2

Fecha de lanzamiento de los dos modelos : Enero


2011.

Universidad Politcnica Salesiana-Sede Cuenca.

11

Turbo Core 3.0

Controlador de memoria integrada(IMC)

Mejora de la prediccin de saltos y la obtencin


previa

Mejora de punto flotante y la programacin de


nmero entero

Soporte para extensiones vectoriales avanzadas


(AVX) 1.1, FMA3 , FMA4 , F16C , IMC1 y
TBM

AVX (Advanced Vector Extensions) introduce un


formato de instruccin SIMD de tres operandos,
donde el registro de destino es distinto de los dos
operandos de fuente. Por ejemplo, una
instruccin SSE usando el convencional de dos
operandos forma a = a + b ahora puede usar un
mtodo no destructivo forma de tres operando c
= a + b.

El conjunto de instrucciones FMA es una


extensin de los 128 y 256 bits instrucciones
SIMD Extensions en la instruccin del
microprocesador x86 establecido para realizar
operaciones de fusionados mltiple( FMA)

El F16C (antes / informalmente conocido como


CVT16 ) es un conjunto de instrucciones x86 de
la arquitectura que proporciona soporte para la
conversin de punto flotante entre la mitad de
precisin y de precisin simple.

TBM consiste en instrucciones complementarias


para el conjunto de instrucciones iniciada por
IMC1 ; su carcter complementario significa que
no necesariamente tienen que ser utilizados
directamente, sino que pueden ser generados por
un compilador de optimizacin que sean
soportadas

Figura 5.Cuadro de resumen de la arquitectura K10.

Basados en esta arquitectura se crearon los modelos AMD ASERIES Llano, los cuales presentan las siguientes
caractersticas.
AMD A-SERIES-Llano:

c)

Fecha de lanzamiento: Agosto 2011.

Fabricados en procesos tecnolgicos de 32


nanmetos.

Modelos hasta con 4 ncleos.

GPU y CPU bajo el mismo chip.

Disponen de memoria cach de hasta 4


Mbytes.

Ncleo grfico AMD Radeon serie 6000.

X86 en 64 bits con directX11.

Compatibles con estndares USB 3.0, SATA


6 Gbps, DisplayPort 1.1, HDMI 1.4.

Posibilidad
de
intercambiar
automticamente entre GPU integrada y
dedicada con el fin de ahorrar batera.

L1 grandes buffers lookaside traduccin (TLB) y


mejoras en la eficiencia L2 de cach.

Compatible con Socket FM1, FS1.

17 a 220 W de potencia de diseo trmico (TDP)

Memorias:
DDR3-1866,
DDR3-1600,
DDR3-1333 de doble canal hasta 1866
MHz.

Motor de codificacin de video.

Arquitectura Piledriver:

Est Arquitectura presenta las siguientes caractersticas:


Agrupado Multi-Hilo.

mayores tasas de reloj

Instrucciones por ciclo de reloj (IPC) mejoras

Menor consumo de energa y las temperaturas

Figura 6.Cuadro de resumen de la arquitectura Piledriver.

Universidad Politcnica Salesiana-Sede Cuenca.

12

Basados en esta arquitectura se crearon los modelos AMD ASeries Trinity y ADM A-Series Richland, los cuales presentan
las siguientes caractersticas.

AMD Trinity:

Dos o cuatro ncleos de procesamiento


Pildriver. Con frecuencias de hasta 3.2 GHz.

Tarjeta grfica integrada AMD Radeon de la


familia 7XXX.

Trinity dobla el rendimiento por vatio frente


a las APU originales.

Incluyen AMD HD Media Accelerator para


mejora de la calidad de reproduccin de
vdeo, acelerando codificacin y conversin
de archivos de vdeo.

Fecha de lanzamiento: Octubre 2012.

Aumento del rendimiento de la CPU de un


29 por ciento, con tecnologa Core AMD
Turbo para incrementar dinmicamente su
frecuencia cuando se necesite.

GPUs aumentando el rendimiento un 56 por


ciento frente a la anterior generacin.

Hasta 12 horas de batera en sistemas


porttiles.

Soporte APIs multimedia Direct X11

AMD Eyefinity. Por primera vez AMD


ofrece esta tecnologa multimonitor sin
necesidad de grficas dedicadas.

Compatible con Socket FM2, FS1+, FP2.

Soporte de memorias: DDR3-1866, DDR31600, DDR3-1333 hasta 1600 MHz.

AMD Richland:

Fecha de lanzamiento: Junio 2013.

Compatible con Socket FM2, FS1+, FP2.

Fabricacin bajo procesos tecnolgicos de


28 nanmetros.

Aumento de rendimiento de hasta el 40%


con respecto a las Trinity.

Dos y cuatros ncleos.

TDP de 65 o 100 W.

Tarjeta grfica integrada de la serie Radeon


8XXX

d)

Soporte de memorias: DDR3-2133, DDR31866, DDR3-1600, DDR3-1333 de hasta


2133 MHz.

Soporte para SATA 6Gbps, USB 3.0 y 2.0

Arquitectura Jaguar:

Esta arquitectura presenta las siguientes caractersticas:

32 KB de instrucciones + 32 KB de datos L1 cach


por ncleo, cach L1 incluye deteccin de errores de
paridad

16 vas, 1-2 MB unificadas cach L2 compartida por


dos o cuatro ncleos, cach L2 est protegida contra
los errores mediante el uso de cdigo de correccin
de errores

Fuera de la orden de ejecucin y la ejecucin


especulativa

Integrado controlador de memoria

ejecucin nmero entero de dos vas

Bidireccional,128 bits de ancho de punto flotante y


ejecucin de nmero entero lleno

divisor de hardware entero

Procesadores de servidor admiten 2 DDR3 DIMM en


un canal a frecuencias de hasta 1600 MHz con ECC

Como SoC (no slo una APU) que integra


concentrador de controladores de Fusin

Jaguar no no cuentan agrupado multihilo (CMT), lo


que significa que los recursos de ejecucin no se
comparten entre los ncleos

Mejoras que presenta la arquitectura Jaguar sobre la


arquitectura Bobcat:
Un aumento de ms del 10% en la frecuencia de reloj

Ms del 15% de mejora en las instrucciones por ciclo


de reloj (IPC)

Soporte para SSE4.1 , SSE4.2 , AES , CLMUL ,


MOVBE, AVX , F16C , y IMC1

Hasta 4 ncleos de CPU

Cach L2 es compartida entre los ncleos

FPU ancho camino de datos aument a 128 bits

Cach mejoradas.

El ancho de banda del doble de unidades de carga del


almacn

Ms pequeo, de 3,1 mm 2 de superficie al ncleo

Integrado Fusin concentrador de controladores


(FCH)

Universidad Politcnica Salesiana-Sede Cuenca.

Motor de vdeo Codificacin

Figura 7. Cuadro de resumen de la arquitectura Jaguar.

Basados en esta arquitectura se crearon los modelos AMD ASERIES Kabini y Temash, los cuales presentan las siguientes
caractersticas.
AMD kabini:

e)

13

Puma no disponen de Arquitectura del Sistema


Heterogneo o copia cero

32 KB de instrucciones + 32 KB de datos L1 cach


por ncleo

1-2 MB unificadas cach L2 compartida por dos o


cuatro ncleos

Canal nico, integrado y controlador de memoria


soporte de 64 bits DDR3L

3,1 mm 2 de superficie al ncleo.

Mejoras que presenta la arquitectura Puma sobre la


arquitectura Jaguar:
Ncleo de la CPU 19% de fuga de reduccin a 1,2 V

la reduccin de fugas GPU 38%

500 mW reduccin en el poder controlador de


memoria

Fecha de lanzamiento: mayo 2013.

200 mW reduccin en el poder de interfaz de pantalla

2 a 4 ncleos.

Impulsar selectiva de acuerdo con las necesidades de


aplicacin (impulso inteligente)

Procesos de fabricacin de 28 nanmetros.

Compatible con Socket AM1, FT3.

Soporte para ARM TrustZone travs integrado


Cortex-A5 procesador

Soporte de memorias: DDR3L-1866,


DDR3L-1600, DDR3L-1333, DDR3L-1066

Soporte para memorias DDR3L -1866.

AMD Temash:

Fecha de lanzamiento: mayo 2013.

2 o 4 ncleos.

TDP de 9 a 15 W.

GPU con tarjeta grfica integrada de la serie


Radeon HD 8000.

Compatible con Socket AM1, FT3.

Soporte de memorias: DDR3L-1866,


DDR3L-1600, DDR3L-1333, DDR3L-1066

Arquitectura Puma:

Esta arquitectura presenta las siguientes caractersticas:


Fuera de la orden de ejecucin y la ejecucin
especulativa, hasta 4 ncleos de CPU

ejecucin nmero entero de dos vas

Bidireccional de 128 bits de ancho de punto flotante


y ejecucin nmero entero lleno

divisor de hardware entero

Figura 8. Cuadro de resumen de la arquitectura Puma.

Basados en esta arquitectura se crearon los modelos AMD ASERIES Beema y Mullins, los cuales presentan las siguientes
caractersticas.
AMD Beema:

Fecha de lanzamiento: 2014.

2 a 4 ncleso con frecuencias de 1.35 a 2.4


GHz.

Memoria cach L2 de hasta 2 Mbytes.

Tarjeta grfica integrada de la serie AMD


Radeon RX.

Velocidad de la GPU de 350 a 800 MHz.

Universidad Politcnica Salesiana-Sede Cuenca.

TDP de 10 a 15 W.

Compatible con socket FT3b.

Soporte de memorias: DDR3L-1866,


DDR3L-1600, DDR3L-1333, DDR3L-1066

14

Procesador de la computadora porttil ms


rpida de esta serie: procesador de
ordenador porttil 35 W AMD FX-7600p

Procesador de escritorio ms rpida de esta


serie: 95 W AMD procesador de escritorio
A10-7850K (Radeon R7 GCN ) 3,7 GHz
Boost 4.0 GHz con DirectX12 de apoyo

Procesador de escritorio utiliza socket FM2


+

AMD Mullins.

Fecha de lanzamiento: 2014

2 a 4 ncleos con frecuencias de 1.4 a 2.2


GHz.

Memoria cach L2 de hasta 2 Mbytes.

Tarjeta grfica integrada de la serie AMD


Radeon RX.

Velocidad de la GPU de 300 a 500 MHz.

TDP de 2.8 W.

Compatible con socket FT3b.

Soporte de memorias: DDR3L-1866,


DDR3L-1600, DDR3L-1333, DDR3L-1066

f)

Arquitectura Puma+:

AMD Carrizo-L:

Fecha de lanzamiento: Mayo 2015.

2 a 4 ncleos.

Tarjeta grfica integrada de la familia AMD


Radeon RX

Proceso tecnolgico de fabricacin de 28


nanmetros.

Compatibles con libreras DirectX 12, API


mantle y a tecnologa de sincronizacin par
monitores FreeSync.

Compatible con Socket FP4.

Soporte de Memorias: DDR3L-1866


,DDR3L-1600, DDR3L-1333

g)

Arquitectura Steamroller:

Esta arquitectura presenta las siguientes caractersticas:


CPU basado en SteamRoller 2 a 4 ncleos

GPU basada en ncleo de grficos con 192512 procesadores de sombreado (marca


"Radeon R4 / 5/6/7 ")]
TDP 15-95 W

La tercera generacin de la plataforma, con nombre


Kaveri, fue puesto a la venta el 14 de enero de 2014.
Kaveri contiene hasta cuatro ncleos de CPU
SteamRoller a velocidad de reloj de 3,9 GHz con un
modo turbo de 4,1 GHz, hasta una GPU de 512ncleos, dos unidades de decodificacin por mdulo
en lugar de uno (que permite a cada ncleo para
decodificar cuatro instrucciones por ciclo en lugar de
dos), AMD TrueAudio, API Manto, una en el chip
ARM Cortex-A5 MPCore, y dar a conocer con un
nuevo socket, FM2 +.

El rendimiento de la APU Kaveri 45W A8-7600 se


encontr que era similar a la de la parte 100W
Richland, lo que lleva a la afirmacin de que AMD
hizo mejoras significativas en el rendimiento en el
chip de grficos por vatio; Sin embargo, se descubri
que el rendimiento de la CPU estando por detrs de
los procesadores de Intel, un retraso que era poco
probable que se resuelva en el APUs de la familia de
la APU SteamRoller.

Figura 9. Cuadro de resumen de la arquitectura SteamRoller.

Basados en esta arquitectura se crearon los modelos AMD ASERIES Kaveri, el cual presenta las siguientes caractersticas.
AMD Kaveri:

Fecha de lanzamiento: Enero 2014.

2 y 4 ncleos de procesamiento
frecuancias de 3.4 a 3.8 GHz.

Memoria cache L2 de hasta 4 Mbytes.

TDP de 95 W.

Tarjeta Grfica integrada de la serie Radeon


R7.

Ofrece 6 u 8 ncleos grficos.

Universidad Politcnica Salesiana-Sede Cuenca.

h)

15

Frecuencia de trabajo de 720 MHz

Hasta 832 procesadores stream.

AMD Bristol Ridge:

Fecha tentativa de lanzamiento: Junio 2016.

Compatible con Socket FM2+, FP3.

Chipset AMD A88X, AMD A78 y AMD


A55.

Tiene un rendimiento del 10% ms que


Carrizo y hasta 40% ms que Kaveri.

Controladora de memoria
DDR3-1866, DDR3-1600,
hasta 2.133 MHz

2 y 4 Ncleos con frecuencias de 2.3 a 3.7


GHz.

Soporte de las instrucciones DirectX 12.

Memoria cach L2 compartida de hasta 2


Mbytes.

GPU de 6 a 8 ncleos de 512 SPs.

GPU con frecuencias 686 a 900 MHz.

TDP de 12 a 35 W.

Compatible con Socket AM4, FP4.

Soporte de memorias: DDR4-2400, DDR42133, DDR4-1866, DDR4-1600

DDR3-2133,
DDR3-1333

Arquitectura Excavator:

Esta arquitectura presenta las siguientes caractersticas:


CPU basado en arquitectura Excavator con 4 ncleos
y grficos Radeon

Controlador de memoria es compatible con DDR4


SDRAM

Dual y variantes de cuatro ncleos

1 MB de cach L2 por mdulo

Arquitectura ZEN:
Esta arquitectura presenta las siguientes caractersticas:
Tiene un aumento de rendimiento por ncleo de hasta
un 40% de instrucciones por ciclo de reloj.
Figura 10.Cuadro de resumen de la arquitectura Excavator.

Basados en esta arquitectura se crearon los modelos AMD ASERIES Carrizo y Bristol Ridge, el cual presenta las
siguientes caractersticas.
AMD Carrizo:

Fecha de lanzamiento: Junio 2015.

Dos y cuatro ncleos de procesamiento con


frecuencias de 1.5 a 2.5 GHz.

Tarjeta de video integrada de la serie


Radeon RX.

Emplea 12 ncleos de clculo (4 CPU + 8


GPU)

Hasta 2 Mbytes de memoria Cach L2.

Compatibles con DirectX12

Compatible con Socket FP4, FM2+.

Soporte de memorias: DDR3-2133, DDR31866, DDR3-1600, DDR3-1333

23% menos espacio fsico con respeto a los


kaveri.

40% de reduccin de consumo energtico


frente a los modelos kaveri.

Compatible con memorias DDR4, CPU anteriores y


APU de AMD slo compatibles hasta memorias
DDR3.

Reduccin en el consumo de energa.

Compatibilidad con Zcalos AM1, FM2+ y AM3+

Incluye sistemas de enfriamiento.

CONCLUSIONES Y RECOMENDACIONES

Con los diferentes tipos de microprocesadores que revisamos,


el Athlon 64, el Phenom y el Fusion conocimos el cambio que
se realiz en stos dispositivos a los largo del tiempo; y
gracias a presentaciones anteriores se vio la evolucin
completa de AMD. En nuestro caso en especial el transcurso
de una arquitectura que operaba a 32 bits hacia una
arquitectura que opera a 64 bits sin perder compatibilidad con
sus antecesores de 32 y 16 bits. Con stos significativos
cambios se pudo mejorar la velocidad de transmisin
aumentando considerablemente la eficiencia de los
microprocesadores, tanto para AMD que fue el primero en
incursionar esta tecnologa; como en Intel que tambin la
utiliz (Intel 64). Adems el cambio no solo se basa a la
ampliacin en el bus sino en que en la utilizacin de

Universidad Politcnica Salesiana-Sede Cuenca.

tecnologas nuevas que aparecieron poco a poco con los aos


y as mismo se fueron mejorando con nuevas versiones.

16