Intel Pentium 4 Prescott (Sockel 478)

Was anfangs nicht danach aussah, etablierte sich über die Zeit zu einem echten High-End-Prozessor: Der Intel Pentium 4. Wenn man von einem erfolgreichen Pentium 4 spricht, dann von den Modellen mit dem Northwood-Kern, welcher glücklicherweise relativ schnell den Willamette-Kern ablöste. Intel hat die Pentium 4-Prozessoren von 1800 bis 3400 Mhz mit dem Northwood-Kern bestückt und diesen bis an seine Leistungsgrenze gebracht. Selbst die so effektiv rechnenden Athlon XP- und Athlon 64-Prozessoren mussten sich den Pentium 4-Modellen oftmals geschlagen geben, was zu Zeiten der P3-Prozessoren noch nicht der Fall war.

Doch der Northwood-Kern ist an seine Grenzen gestoßen und höhere Taktraten waren einfach nicht mehr möglich. Daher entwickelte Intel intensiv an der feineren 0,09µm-Technologie. Herausgekommen ist dabei der Prescott, der den erfolgreichen Northwood ablösen und für deutlich höhere Taktraten sorgen soll. Die ersten Prescott-Modelle wurden mit dem Anhängsel "E" versehen, beispielsweise Intel Pentium 4 "E" 3,0 Ghz .

Mit großer Spannung wurden die neuen Modelle erwartet, so lief doch alles darauf hinaus, dass Intel den Pentium 5 auf den Markt bringen würde. Die vielen Erneuerungen in der Fertigung und der technischen Austattung ließen die Vermutungen aufkommen, dass Intel an der Pentium 4-Serie ablässt und nun eine neue Prozessor-Serie auf den Markt bringt. Doch von die Produktbezeichnung Pentium 5 wurde vorerst nicht benutz

Technische Details

Durch den Prescott-Kern erhält der Pentium 4 eine Fülle an Erneuerungen. Einer der wichtigsten ist das Shrinking von der 0,13 auf die 0,09µm-Technologie, denn das Verkleinern der Transistoren ermöglicht in der Regel deutlich höhere Taktraten und zieht eine geringe Verlustleistung mit sich. Intel ist mit der 90nm-Technologie Vorreiter, denn AMDs Topprozessoren Athlon64 und Opteron werden weiterhin mit 0,13µm großen Transistoren hergestellt und takten maximal mit 2400 Mhz. Doch eine Verringerung der Verlustleistung konnte nicht erreicht. Im Gegenteil: die Komplexität der neuen Prescott-Modelle lässt trotz feinerer Strukturen die Verlustleistung minimal ansteigen, was für ein Shrinking sehr ungewöhnlich ist.


Pentium 4 Prescott - Vorderseite

Den L2-Cache haben die Intel-Ingenieure großzügig auf 1 MB verdoppelt. Damit schließt der Pentium 4 Prescott zu den Athlon 64-Prozessoren auf. Der L2-Cache ist ein extrem schneller, dafür aber teurer Zwischenspeicher des Prozessors, und ist somit ein wichtiger Faktor für die Leistungsfähigkeit des Prozessors.


Pentium 4 Prescott - Rückseite

Neben L2-Cache hat man auch den L1-Cache erweitert. Die ersten beiden Pentium-4-Generationen mit Willamette und Northwood-Core mussten mit lediglich 8 KByte vierfach-assoziativem L1-Cache für die Daten auskommen. Die Prescott-Modelle erhalten nun die doppelte Menge und kann auf 16 KByte exklusiven achtfach-assoziativen Daten-Cache mit einer sehr niedrigen Latenzzeit zugreifen.

Des Weiteren kommen 13 neue Befehle hinzu, die den schlichten Namen "SSE3" tragen. SSE3 ist eine Befehlserweiterung, durch die der Prozessor stark beschleunigt werden kann, sofern die jeweilige Software für diese Befehle optimiert bzw. programmiert wurde. Insgesamt verfügt der Pentium 4 "E" über vier Befehlserweiterungen, nämliche MMX, SSE, SSE2 und SSE3.

SSE3-Befehle

  • fisttp = Optimierung Float- zu Ganzzahlen
  • addsubps, addsubpd, movsldup, movshdup, movddup = Komplexe Arithmetik
  • lddqu = Optimierung zur Video-Encodierung
  • haddps, hsubps, haddpd, hsubpd = Optimierung für Grafik (SIMD FP / AOS)
  • monitor, mwait = Thread-Synchronisation
 

Hohe Taktfrequenzen erfordern lange Pipelines, damit die einzelnen Pipeline-Stufen möglichst einfach ausfallen. Intel musste die Pipeline beim Prescott auf 31 Stufen verlängern und schlägt damit den bisherigen Spitzenreiter Willamette bzw. Northwood mit seinen 20 Stufen um einiges.

Die Komplexität des Pentium 4 "Prescott" spiegelt sich in der Anzahl der Transistoren wider. Bereits beim Vorgänger brachen einige in pures Staunen aus, als sie erfuhren, dass der Pentium 4 aus insgesamt 55 Millionen Transistoren besteht. Da konnte anfangs selbst der aufgrund seiner effektiven Architektur so beliebten Athlon XP nicht mithalten, denn dieser besitzt gerade einmal 37,5 Millionen. Doch die P4-Prescott-Modelle brechen mal wieder alle Rekorde, denn ein einzelner Prozessor besteht aus ca. 125 Millionen kleinster Schaltungen. Dabei nimmt der L2-Cache einen Großteil ein.

Modell

FSB

Multi CPU-Kern L2 L2 Speed Mikron Temp. Sockel V-Core Watt
Pentium 4 "HT" 2800 E 533Mhz 21,0 Prescott 1 MB 2800 Mhz 0,09 µm 69°C Sockel 478 1,05V 89,0
Pentium 4 "HT" 2800 E 800 Mhz 14,0 Prescott 1 MB 2800 Mhz 0,09 µm 70°C Sockel 478 1,35V 89,0
Pentium 4 "HT" 3000 E 800 Mhz 15,0 Prescott 1 MB 3000 Mhz 0,09 µm 70°C Sockel 478 1,3575V 89,0
Pentium 4 "HT" 3200 E 800 Mhz 16,0 Prescott 1 MB 3200 Mhz 0,09 µm 70°C Sockel 478 1,40V 103,0
Pentium 4 "HT" 3400 E 800 Mhz 17,0 Prescott 1 MB 3400 Mhz 0,09 µm 70°C Sockel 478 1,40V 103,0

Die ersten Pentium 4 Prescott-Prozessoren gab es als Sockel 478-Version. Die Nachfolgermodelle sind Sockel-775-Modelle. Vorteil der zusätzlichen Pins ist, dass der Prozessor mit mehr Strom versorgt werden kann und somit höhere Taktraten, dafür aber auch höhere Verlustleistungen entstehen. Bei den Modellen für den Sockel 775 setzt Intel nun auch das P-Rating ein, so dass man nicht mehr unmittelbar aus dem Produktnamen die reale Taktrate ermitteln kann.

Anfängliche Probleme beim Prescott

Die späteren Benchmarks zeigen, dass bei gleicher Taktrate der Prescott in vielen Benchmarks langsamer als sein Vorgänger ist. In diesem Fall zeigt sich, dass nicht nur die Taktrate, die Größe der L1- und L2-Caches oder die Menge der Befehlserweiterungen entscheidend für die Leistungsfähigkeit eines Prozessors ist. Es ist auch sehr wichtig für einen Prozessor, dass die einzelnen Einheiten bei der Bearbeitung eines Befehls optimal aufeinander abgestimmt sind, was die Athlon XP-Prozessoren hervorragend bewiesen haben. Klar, in vielen Fällen aus der Vergangenheit zeigte sich, dass die Erhöhung des L2-Caches einen Leistungsschub mit sich brachte, doch machte man dies bei einem bereits optimierten Prozessor. So verdoppelte beispielsweise Intel beim Pentium III den Cache auf 512 KB und verkaufte diesen dann unter dem Namen Pentium III-S. Hier hat man einem erprobten und erfolgreichen Prozessor mehr Cache-Speicher verpasst, was sich natürlich positiv auf dessen Leistungsfähigkeit auswirkte.

Beim Pentium 4-Prescott ist es nun aber anders, denn Intel plant mit diesem Prozessor für die Zukunft und musste den Chip intern teilweise umstrukturieren, um ihn für deutlich höhere Taktraten fit zu machen. Intel hat sich für den Prescott das Ziel gesetzt, ihn später einmal mit 5 Ghz betreiben zu können. Um hohe Taktfrequenzen zu erreichen, benötigt man lange Pipelines (hier werden die Befehle nacheinander abgearbeitet), damit diese möglichst einfach ausfallen. Aus diesem Grund besitzt der Pentium 4-Prescott Pipelines mit 31 anstatt der bisherigen 20 Stufen. Hört sich auf den Blick gut an, hat aber auch einige Nachteile:

Beim Abarbeiten von Befehlen und Instruktionen lebt ein Prozessor von Sprungvorhersagen. D.h. der Prozessor versucht möglichst genau die Daten in die entsprechenden Caches und Register zu laden, die am wahrscheinlichsten als nächstes benutzt werden. Das ist für die Leistungsfähigkeit eines Prozessors sehr wichtig, denn wenn zu oft die falschen Daten in den Caches und Registern, muss der Prozessor Pausen machen und ist sozusagen "arbeitslos". Das wirkt sich natürlich negativ auf die Performance aus.

Und genau hier tritt das Problem der langen Pipeline auf: Zwar hat Intel dadurch einen wichtigen Grundstein für höhere Taktraten gelegt, macht den Prescott jedoch auch anfälliger gegenüber Fehlvorhersagen. Sollte ein falscher Befehl in der Pipeline sein, so muss in der Regel die komplette Pipeline geleert und von neuem gefüllt werden. Aus diesem Grund haben die Intel-Ingenieure hart an besseren Methoden zur Sprungvorhersage geleistet, um solche Vorkommnisse zu vermeiden. Laut Intel Angaben kommen solche Fehlvorhersagen nur einmal 100 bis 1000 Instruktionen vor. Außerdem hat man den L2-Cache erhöht, um Daten und Instruktionen möglichst schnell nachzuladen. Alles in allem kann man dies auch als Schadenbegrenzung und nicht als Performance-Steigernde Maßnahmen betrachten.

Technischer Überblick

 
  • Modell: Intel Pentium 4 Prescott
  • Erschienen: Sommer 2004
  • Prozessorkern: Prescott
  • Herstellung: 0,09µm
  • Transistoren: 125 Millionen
  • L2-Cache: 1 MB
  • FSB: 800 Mhz QuadPumped
  • Sockel: 478 und 775
  • Befehle: MMX, SSE, SSE2, SSE3
 

Benchmarks

Wolfenstein 1024x786x32

Pentium 4 EE 3,4 Ghz  
 

 165

Athlon 64 FX-51  
 

 161

Pentium 4 3,4 Ghz  
 

 153

Pentium 4 3,2Ghz  
 

 149

Pentium 4 "E" 3,2 Ghz  
 

 146

Pentium 4 3,0 Ghz  
 

 142

Pentium 4 "E" 3,0 Ghz  
 

 139

Bei diesem 3D-Shooter wird deutlich, dass der Pentium 4 "E" (Prescott) langsamer als ein gleichgetakteter P4 mit Northwood-Kern ist. Absolute Spitze ist der P4 Extreme Edition mit 2 MB L3-Cache, der sich deutlich von seinen hauseigenen Prozessoren absetzt!

Main Concept 1.4.1 - 1,2 GB to MPEG-2

Pentium 4 EE 3,4 Ghz  
 

 154

Pentium 4 3,4 Ghz  
 

 156

Pentium 4 3,2Ghz  
 

 165

Pentium 4 "E" 3,2 Ghz  
 

 165

Pentium 4 3,0 Ghz  
 

 174

Pentium 4 "E" 3,0 Ghz  
 

 176

Athlon 64 FX-51  
 

 178

Main Concept nutzt teilweise schon die neuen SSE3-Befehle und somit kann der Prescott-Pentium 4 teilweise aufschließen. Trotzdem ist das Ergebnis enttäuschend, wenn man bedenkt, welch viele Erneuerungen der Prozessor erhalten hat!

Xmpeg 5.03 und DivX 5.1.1

Pentium 4 EE 3,4 Ghz  
 

 88

Pentium 4 3,4 Ghz  
 

 89

Pentium 4 "E" 3,2 Ghz  
 

 90

Pentium 4 3,2Ghz  
 

 95

Pentium 4 "E" 3,0 Ghz  
 

 96

Athlon 64 FX-51  
 

 97

Pentium 4 3,0 Ghz  
 

 100

Beim Video-Encoding zeigt sich das ganze Bild von einer anderen Seite, denn die Prescott-Modelle können ihre Northwood-Pendants deutlich in den Schatten stellen.