Sei sulla pagina 1di 4

48 POWERUSR

ll por el ao 2000, AMD logr cruzar la barrera del


GHz y se posicion como el fabricante del procesador de
escritorio ms rpido. Intel se encontraba con los Pen-
tium III, que estaban basados en la arquitectura P6, vigente desde
los vetustos Pentium II de 233 MHz (que a su vez eran una deriva-
cin del Pentium Pro), y estaban muy cercanos a encontrar su fin,
ya que a duras penas lograron superar los 1000 MHz, cuando toda-
va faltaba mucho para explotar todo el potencial del Athlon.
Frente a esta situacin, Intel se vio obligada a lanzar una nueva
apuesta en el mundo de los procesadores tal vez, el cambio
ms significativo en la historia de la compaa: los Pentium 4,
basados en el ncleo Willamette.
La transicin, en los nmeros y caractersticas tcnicas, pareca
extraordinaria. Sin embargo, los resultados no eran convincen-
tes. Un Pentium 4 de cierta frecuencia era incluso ms lento que
un Pentium III, y todos verdaderamente nos sentamos estafados
por habernos ilusionado con una tecnologa que no era lo que
esperbamos en un principio.
De todos modos, Intel sigui adelante con la misma arquitectura,
pese a las grandes crticas de la prensa y de los usuarios, y de he-
cho, es la que utiliza actualmente, hacindole frente a los Athlon
64 de AMD (que fueron diseados con mucha posterioridad).
Vamos a analizar, por partes, cules son los componentes que ha-
cen a esta arquitectura tan durable respecto al tiempo.
PIPELINING
Resulta algo complicado entender esta caracterstica de los micro-
procesadores, aunque definiremos el pipelining de la manera ms
sencilla posible. Entre los datos de entrada que llegan hacia el
procesador y la informacin que sale de l, hay un proceso bas-
tante complejo, en el cual se realiza una secuencia de pasos, bien
al estilo Ford (con una lnea de montaje). Precisamente, el pipeli-
ning consiste en dividir este proceso en diferentes etapas, de ma-
nera tal que cuando una etapa termina su trabajo con
un dato, lo enva a la prxima y empieza a procesar
el siguiente dato. De esa forma, se crea un sistema de
etapas en armona, en la que cada una siempre tiene
cosas para hacer. Esto hace que se pueda dinamizar el
flujo de datos dentro del procesador, y as se mejore
el rendimiento.
Vale destacar que cuanto mayor sea la cantidad de
etapas, menos cantidad de trabajo realizar por ciclo
cada una de ellas. Gracias a esto, se le puede exigir
ms a cada etapa, y es posible aumentar la frecuencia
de trabajo, de manera que se puedan realizar ms ci-
clos en un segundo.
Los Pentium 4 tienen un sistema de pipelining deno-
minado Hyper Pipeline, el cual incluye una gran ca-
dena de produccin con 20 etapas, que es exactamen-
te el doble de lo que usan los Pentium III y Athlon/XP
(los Athlon 64 tienen 12 etapas).
Esto brinda posibilidades enormes en cuanto a la es-
calabilidad del procesador. El problema que presenta
es que cuando ocurre un atascamiento en cierta etapa
del proceso, se pierden ms ciclos que en un sistema
con menor cantidad de etapas. sta es una de las ra-
zones por la cual un Pentium 4 a 1,4 GHz tiene un
A
QUE SON LOS DATOS Y LAS INSTRUCCIONES?
A veces nos confundimos, y pensamos que un dato es lo mismo que una
instruccin, y en realidad no es as. Si bien ambos se guardan en registros
internos del procesador, podramos definir a cada uno de ellos diciendo que
los datos son los operandos, mientras que las instrucciones son las
operaciones propiamente dichas. Por ejemplo, si hacemos 1 + 2, estamos
utilizando dos datos (1 y 2), y una instruccin (suma), lo que nos dar un
resultado que luego podr ser usado como dato para otra operacin.
PENTIUM 4
LA ARQUITECTURA
.hrd
EN ESTE ARTICULO SUMAMENTE TEORICO, VEREMOS
CUALES SON LOS PUNTOS CLAVE DE ESTA LINEA
DE PROCESADORES, QUE DATA DESDE HACE MUCHO
TIEMPO Y SIGUE EN PIE. ANALIZAREMOS
OBJETIVAMENTE LAS CARACTERISTICAS TECNICAS
CON LAS QUE SE VALEN PARA PROMOCIONARLOS.
UNA TECNOLOGIA
QUE PERDURA

*
ARIEL GENTILE
FANATICO INCURABLE DE LOS FIERROS
genaris@tectimes.com
POR QUE EL RENDIMIENTO DE UN PENTIUM 4 ES INFERIOR
AL DE UN ATHLON CORRIENDO A LA MISMA FRECUENCIA?
POR QUE FUNCIONA TAN BIEN CON EDICION DE AUDIO
Y VIDEO Y NO TANTO EN JUEGOS? INCOGNITAS QUE
TRATAMOS DE DEVELAR EN ESTE ARTICULO.

Pentium4 5.qxd 2/2/04 4:22 PM Page 48


49 POWERUSR
rendimiento inferior al de un Athlon e incluso un
Pentium III, trabajando a la misma frecuencia. Pero
tambin debemos tener en cuenta que gracias a este
sistema, los Pentium 4 podran superar los 5 GHz,
cuando rara vez un Athlon supera los 2,5 GHz.
MOTOR DE EJECUCION
A lo largo de esta gran cadena de montaje que
existe dentro de un procesador, hay etapas en las
que se realiza una mayor cantidad de trabajo, por lo
tanto, es tarea de los diseadores de procesadores
buscar la forma de que todas ocupen el mismo
tiempo para lograr el mejor rendimiento posible y
no desperdiciar ciclos de reloj.
Precisamente, la etapa ms interesante es la de ejecu-
cin, donde se realizan todos los clculos con la in-
formacin ya ingresada, y all se recurre a un concep-
to que es la ejecucin superescalar. ste consiste en
ubicar varias unidades que trabajen en paralelo, de
manera tal que logren trabajar con ms datos al mis-
mo tiempo (aunque de un tamao menor). Esas uni-
dades son, bsicamente, unidades aritmtica lgica
(ALU) y de punto flotante (FPU). Las primeras se en-
cargan de realizar todas las operaciones con nmeros
enteros, y su trabajo se ve bastante simplificado res-
pecto a las segundas, que hacen todos los clculos
con valores flotantes. Por esa razn es que a estas l-
timas unidades se les hace tambin un pipelining.
Los Pentium 4 poseen cuatro ALUs y dos FPUs
(aunque tienen una dedicada al clculo de direccio-
SSE 2
Streaming SIMD Extensions 2 es una de
las caractersticas de los Pentium 4 ms
mencionadas, aunque en verdad poco se
sabe de la funcin que cumplen. SIMD
significa Single Instruction, Multiple
Data, y como podemos imaginarnos,
quiere decir que permite trabajar con
varios datos aplicando solamente una
instruccin.
Imaginmonos que tenemos que realizar
la misma operacin con una gran
cantidad de nmeros. Por ejemplo,
debemos multiplicarlos por cierto valor.
De una manera convencional, se debera
realizar la operacin uno por uno, y
enviarle la misma instruccin al
procesador en cada caso. Con una
instruccin SIMD, la orden que se le
entrega es una simple multiplicacin de
un vector (conjunto de nmeros) por un
escalar (nmero simple). De esta forma
se ahorra bastante tiempo, debido a que
simplemente se le enva una instruccin
al procesador.
En esto se basa el concepto de SIMD,
que empez con las clsicas MMX. Una
gran diferencia entre MMX y SSE es que
la primera solamente se dedicaba a
clculos con nmeros enteros, mientras
que la segunda incluye 50 instrucciones
nuevas dedicadas al clculo de flotantes
(adems de otras para enteros y
tambin para cach).
Estas tecnologas siempre se
promocionan para un determinado uso,
aunque en verdad podran ser usadas
para cualquier aplicacin que lo
requiera. La idea es que los
programadores puedan desarrollar su
software con un mayor grado de
simplicidad, adems de la mejora de
rendimiento que esto supone. No
obstante, en general son aplicaciones de
CAD y diseo 3D las que ms se
benefician con estas instrucciones, ya
que realizan numerosos clculos con
matrices y vectores (transposicin,
normalizacin, multiplicacin, etc.).
Las mejoras de SSE implementadas en el
Pentium 4 se refieren principalmente a la
utilizacin de registros de mayor tamao,
y la inclusin de mayor cantidad de
instrucciones para la cach de los datos.
Obviamente, todo software que no
utilice estas instrucciones no se ver
beneficiado en absoluto por esta
caracterstica, y aquel que s puede
notar mejoras bastante notables
(aunque no tanto como en la teora).
Por cierto, los procesadores de AMD
incluyen soporte completo a las
instrucciones SSE desde los Athlon XP,
y a SSE 2 desde los Athlon 64.
nes), todas funcionando en paralelo. Esto presenta una importante desven-
taja frente a los Athlon, ya que poseen un total de seis ALUs (tres para
datos y tres para generacin de direcciones) y tres FPUs. Esta gran canti-
dad de unidades que trabajan en paralelo hacen que los procesadores de
AMD estn mejor capacitados para aplicaciones que usen bastante clculos
flotantes (como los juegos y CAD), e Intel sea ms dependiente de las optimi-
zaciones del software para sus procesadores (si no, veamos el excelente ren-
dimiento que tienen los juegos basados en el motor del Quake III con pro-
ductos de esta compaa), as como el uso de instrucciones SSE.
CACHE
(INSTRUCCIONES
Y DATOS)
RETIRO
MOTOR DE EJECUCION
ALUs FPUs
Frente
RECEPCION
DECODIFICACION
1
2
3
1
2
3
1
2
3
AQUI VEMOS UN EJEMPLO DE PIPELINING. SE
SEPARAN LAS ETAPAS DE RECEPCION Y
DECOFICACION, Y TAMBIEN 3 DE CADA FPU.
ADEMAS, SE REALIZA EJECUCION SUPERESCALAR,
CON 3 ALUS Y 3 FPUS TRABAJANDO EN PARALELO.

Pentium4 5.qxd 2/2/04 4:22 PM Page 49


50 POWERUSR
CACHE
Hasta este momento, vimos algunos aspectos que pueden con-
siderarse como desventajas de los Pentium 4, ya que tanto la
intensa pipeline que poseen como la superescalabilidad del mo-
tor de ejecucin lo dejan atrs de AMD a la misma frecuencia
de clock en aplicaciones que hagan uso intensivo de las unida-
des de punto flotante. Sin embargo, hay una gran ventaja que
poseen los procesadores basados en Pentium 4 respecto a los de
AMD: la interfaz de la memoria cach.
Cuando un procesador trabaja, necesita almacenar los datos que
utiliza en el momento en algn lugar. Lo ms prximo que tiene
son los registros, pequeos cajones donde guarda valores (tanto
datos como instrucciones). Como los registros no alcanzan para
guardar todo, se debe recurrir a algn otro tipo de memoria don-
de alojarlos mientras se necesiten. Antiguamente, se recurra a la
memoria RAM, cuyo acceso es bastante lento; de esa forma, el
procesador retrasa sus operaciones, ya que no tiene tan a mano
la informacin. En la actualidad se sigue utilizando la memoria
RAM, aunque tambin se usa una pequea cantidad de memoria
auxiliar, integrada directamente en el procesador, llamada cach.
La mayora de los procesadores tienen dos tipos de cach. La pri-
mera es la de primer nivel (L1), y la segunda, de segundo nivel (L2,
un poco menos integrada al procesador). Intel divide la memoria
cach L1 en dos partes: 12 KB para Trace y 8 KB para datos. La
primera, ms prxima al motor de ejecucin, guarda las
instrucciones ms utilizadas en el proceso, para un acceso ms
cmodo. Pero en donde pone mayor nfasis es en la cach L2, que
tiene un bus de 256 bits (contra 64 de los Athlon) y permite un
mejor acceso a memoria, ya que puede transmitir una cantidad de
datos hasta cuatro veces mayor por ciclo. Aqu vemos la principal
razn por la que los Pentium 4 son tan efectivos en aplicaciones
que trabajan con grandes cantidades de datos y leen y escriben
continuamente en la memoria RAM, como es el caso de la edicin
de audio y video.
Tambin podemos notar que la penalidad que sufren los procesa-
dores Celeron (basados en Pentium 4, pero con 128 KB de cach
L2) es bastante grande, y ste es uno de los motivos por los que
su rendimiento es muy inferior respecto de su hermano mayor. Y
obviamente, vemos el porqu de la gran mejora de rendimiento
entre el ncleo Willamette (256 KB) y el Northwood (512 KB).
FSB
Ya estuvimos hablando del acceso a la memoria, y aqu es donde
tiene un rol fundamental el Front Side Bus, que es el camino por
el cual el procesador accede a la memoria RAM del sistema. Siem-
pre se busca que la comunicacin entre ambos componentes sea
lo ms rpida posible, de manera tal que no haya datos en el pro-
cesador que queden en espera. Por tal motivo, Intel present en el
HYPER-THREADING
Esta es una polmica caracterstica que agreg Intel a
fines de 2002 en sus procesadores Pentium 4 C (con
FSB de 800 MHz), y tambin en algunos con menor
velocidad de bus. Decimos polmica porque en su
momento solamente era soportada por chipsets de
Intel, incluyendo al ms antiguo (el i850), presentado
mucho antes de que se conociera esta tecnologa.
Por eso es que se dice que todos los Pentium 4
deberan soportar la tecnologa Hyper-Threading, pero
en realidad se encuentra deshabilitada.
En el punto anterior vimos que hay varias unidades
de distinto tipo funcionando en paralelo. Ahora
bien, hay programas que hacen ms uso de una que
de otra, por lo cual en este caso hay ciertas
unidades que quedan en desuso. Por ejemplo, los
programas de oficina trabajan ms con ALU, y
dejan ociosas a las FPUs. Para eso se dise el HT,
un sistema por el cual el procesador divide los datos
en dos hilos y, de esa manera, procesa informacin
de dos o ms programas en simultneo. Esto hace
que se aproveche mejor la capacidad total del
procesador y se mejore el rendimiento general,
siempre al utilizar ms de un programa. Cuando
decimos ms de un programa, debemos tener en
cuenta que si determinado software est diseado
para HT, la mejora de rendimiento puede
encontrarse aunque estemos utilizando uno solo.
Los sistemas operativos Windows 2000 y XP
reconocen esta tcnica y administran los recursos de
manera tal que ya desde las aplicaciones comunes
notemos diferencias de rendimiento al usar HT. En
la prctica, la mejora est entre un 20% y un 25%,
principalmente en la compresin de datos y
renderizacin de imgenes (no tanto en juegos).
NUCLEOS DE PENTIUM 4
NUCLEO WILLAMETTE NORTHWOOD NORTHWOOD-C PRESCOTT
PROCESO (MICRONES) 0,18 0,13 0,13 0,09
ZOCALO SOCKET 423/478 SOCKET 478 SOCKET 478 SOCKET 478 / LGA 775
CACHE L2 256 KB 512 KB 512 KB 1 MB
FSB (MHZ QDR) 400 400 - 533 800 800
FRECUENCIA (MHZ) 1300 - 2000 1600 - 2800 2400 - 3200 2800 - 4000
VIENDO LOS CONTENIDOS DE ESTA NOTA PODEMOS SACAR
CONCLUSIONES SOBRE EL DECLIVE DE LA LINEA CELERON
EN LOS ULTIMOS MODELOS, SUPERADA POR EL DURON DE
AMD. POR ESO ES QUE INTEL PLANEA MEJORARLA PRONTO.

Pentium4 5.qxd 2/2/04 4:22 PM Page 50


POWERUSR
Pentium 4 original un generoso FSB de 400 MHz, que era un nmero bastante
grande para la poca. En verdad, se trataba de un bus de 100 MHz, pero con la
posibilidad de transferir cuatro datos por cada ciclo, a diferencia de los Athlon,
que transfieren dos. Evidentemente, esto implica una ventaja interesante para los
Pentium 4, aunque, en realidad, lo mejor no es que se obtienen nmeros mejores
que AMD, sino que, una vez ms, Intel apost a la escalabilidad del sistema.
Mientras que la arquitectura Alpha EV6 de los Athlon XP alcanz su tope en los
200 MHz (en la prctica, 400 MHz) y debi ser reemplazada por nuevas tcnicas
en los Athlon 64, Intel an tiene un margen considerable para seguir utilizando la
suya. Por el momento, se emplean tambin 200 MHz (800 QDR), pero hemos visto
casos en los que se han utilizado procesadores con FSB de hasta 300 MHz, cuan-
do los Athlon XP mueren en los 230 MHz. Por supuesto que los Athlon 64 tie-
nen una arquitectura ms que interesante, en la cual integran un controlador
de memoria en el procesador (para disminuir las latencias), pero la antigua y
duradera alternativa de Intel ha demostrado ser muy efectiva frente a ella.
En este punto, podemos notar tambin otra de las grandes falencias de la lnea
Celeron, que an sigue con FSB de 400 MHz y se ve muy limitada, puesto que,
como vimos a lo largo de este informe, muchas de las ventajas de la tecnologa
de Intel estn en el acceso a memoria (cach y RAM).
CONCLUSIONES
Esperamos que esta nota haya servido para demostrar los puntos fuertes y
dbiles de la arquitectura de los Pentium 4, y sirva como base para futuros
artculos sobre microprocesadores. Hay que destacar que las comparaciones de
rendimiento que hicimos con respecto a los Athlon se refieren a "clock por
clock", o sea, cuando ambos procesadores corren a la misma frecuencia. Con la
nomenclatura de los procesadores AMD, se puede decir que se hacen bastante
parejos en rendimiento general (por ejemplo, un XP 2200+ contra un P4 2,2),
aunque con la diferencia de clocks, Intel gana levemente en los ltimos tiempos.
ESTE ES UN ESQUEMA BASICO DEL FUNCIONAMIENTO DE LOS PENTIUM 4.
NOTEMOS LA IMPORTANCIA QUE SE LE DA AL ORDENAMIENTO DE LAS
INSTRUCCIONES, A FIN DE EVITAR EL ATASCAMIENTO DE ETAPAS.
Bus de Sistema
UNIDAD DE BUS
CACHE L1
(DATOS)
CACHE L2
UNIDADES DE EJECUCION
ALUs y FPUs Subsistema de memoria
RECEPCION
DECODIFICACION
CACHE
L1 (TRACE)
LOGICA DE
ORDENAMIENTO
RETIRO
Actualizacin de
ramificaciones
Motor de ordenamiento
PREDICCION DE
RAMIFICACIONES
Frente
Hagan clic en
laquiero.tectimes.com
y van a poder comprar las
USERS que quieran, o suscribirse.
Dense el gusto de
estar al da con las ltimas
novedades para su PC...
>> users.tectimes.com
Pentium4 5.qxd 2/2/04 4:22 PM Page 51

Potrebbero piacerti anche