Nvidia Geforce GTX 680 (Kepler, GK104)

Viele Nvidia-Anhänger freuen sich, dass endlich die erste Kepler-GPU in Form der Geforce GTX 680 auf dem Markt gekommen ist. Lange hat Nvidia auf sich warten lassen und AMD die Möglichkeit gegeben, mit der Radeon HD 7970 im ersten Quartal des Jahres 2012 an der Leistungsspitze verweilen zu dürfen. In der schnelllebigen Grafikkarten-Szene können Monate einer gefühlten Ewigkeit entsprechen und daher ist die Vorfreude um so größer auf das neue Nvidia-Spitzenmodell.

Neuer 3D-Leistungskönig Geforce GTX 680 (GK104, Kepler)
Neuer 3D-Leistungskönig
Geforce GTX 680 (GK104, Kepler)

Die Geforce GTX 680 ist die zur Zeit schnellste Single-GPU-Grafikkarte aus dem Hause Nvidia. Nur die Geforce GTX 590, welche aus zwei Grafikchips besteht, ist schneller. Die Geforce GTX 680 tritt in den direkten Wettkampf mit der AMD Radeon HD 7970, ebenfalls die schnellste Single-GPU aus dem Lager der Konkurrenz, und somit treten die momentan schnellsten Grafikchips gegeneinander an. Mit einem ungefähren Preis von knapp 500 Euro liegen beide Konkurrenten auf demselben Niveau, so dass letztendlich die Leistung bei der Wahl entscheidet.

Geforce GTX 680 - Preise

Nvidia hat sich bei Geforce GTX 680 ordentlich ins Zeug gelegt, um den Abstand zum Erzrivalen aufzuholen. Positiv zu erwähnen ist, dass die Geforce GTX 680 nicht die schnellste Variante der Kepler-Generation sein wird und Nvidia in den nächsten Monaten mit einer schnelleren Variante plant. Die wichtigsten Änderungen und Erneuerungen sollen an dieser Stelle kurz vorweggenommen werden, bevor sie im weiteren Verlauf dieses Artikels genauer erläutert werden:

  • Verfeinertes Herstellungsverfahren: 28 statt 40nm
  • GPU-Boost-Technology: automatische Overclocking-Funktion
  • Chiptakt: neuer Taktrekord mit 1 GHz
  • Speichertakt: neuer Taktrekord mit 6 GHz
  • Bessere Shaderleistung: 3x mal so viele Streamprozessoren im Vergleich zum Vorgänger, optimierte Shaderarchitektur
  • Geringerer Stromverbrauch
  • Anschluss von bis zu vier Monitoren

Leistungstechnisch liegt die Geforce GTX 680 etwas über der Radeon HD 7970 und kann somit die Leistungskrone für sich gewinnen. Der Vorsprung ist knapp und die Unterschiede variieren zum Teil stark.

Technische Details zur Geforce GTX 680

Kommen wir zu den technischen Details und den Erneuerungen, welche die Nvidia Ingenieure bei der Geforce GTX 680 umgesetzt haben. Zu aller erst sei das Shrinking beim Herstellungsverfahren zu nennen. Der neue GK104-Kern wird nicht mehr wie der Vorgänger im 40, sondern im feineren 28nm Verfahren hergestellt. Dies ermöglicht generell höhere Taktraten oder einen geringeren Stromverbrauch bei gleicher Taktrate. Nvidia hat diese Erneuerung dazu genutzt, den Chip-/Shadertakt auf 1006 MHz anzuheben. Damit ist die Geforce GTX 680 an der Spitze. Keine andere Desktop-Grafikkarte wird in diesem Bereich höher getaktet.

Neu ist ebenfalls, dass Nvidia wieder zu einem einheitlichen Takt beim Chip und der Shaderarchitektur zurückgekehrt ist. In der Vergangenheit lag der Shadertakt deutlich höher als der Chiptakt. Dies ist bei der Geforce GTX 680 nicht mehr der Fall: sowohl Chip- als auch Shadertakt betragen 1006 MHz.

In Sachen Rasterendstufen ist Nvidia mittlerweile auch in der Realität angekommen und legt weniger Wert auf die Ausstattung der so genannten ROPs. Die Anzahl der Rasterendstufen (ROP) wurde auf 32 reduziert. Daraus ergeben sich folgende Leistungswerte bezüglich der (in der Praxis wenig relevanten) Pixelfüllrate:

Theoretische Pixelfüllrate

Nvidia Geforce GTX 680 (32): 32.192 MPixel/s
Nvidia Geforce GTX 580 (48): 37.056 MPixel/s
ATI Radeon HD 7970 (32): 29.600 MPixel/s
ATI Radeon HD 7950 (32): 25.600 MPixel/s
ATI Radeon HD 6970 (32): 28.160 MPixel/s
ATI Radeon HD 6950 (32): 25.600 MPixel/s
ATI Radeon HD 6870 (32): 28.800 MPixel/s
(In Klammern Anzahl der Rasterendstufen)

Deutlich wichtiger für die Leistungsfähigkeit ist die Texelfüllrate, welche sich aus dem Chiptakt und der Anzahl der Textureinheiten ergibt. Was Nvidia sinnvollerweise bei den Rasterendstufen eingespart hat, nimmt nun Platz bei den Textureinheiten (TMU) ein. Diese wurden auf 128 erhöht, was ein schlüssiges Konzept darstellt. 

Geforce GTX 680 ohne Kühlsystem
Geforce GTX 680 ohne Kühlsystem

Theoretische Texelfüllrate

Nvidia Geforce GTX 680 (128): 128.768 MTexel/s
Nvidia Geforce GTX 580 (64): 49.408 MTexel/s
ATI Radeon HD 7970 (128): 118.400 MTexel/s
ATI Radeon HD 7950 (112): 89.600 MTexel/s
ATI Radeon HD 6970 (96): 84.480 MTexel/s
ATI Radeon HD 6950 (88): 70.400 MTexel/s
ATI Radeon HD 6870 (56): 50.400 MTexel/s
(In Klammern Anzahl der Textureinheiten)

Moderne 3D-Spiele sind sehr shaderlastig und daher ist die Leistungsfähigkeit der Shaderarchitektur enorm wichtig. Nvidia hat dies begriffen und die Anzahl auf das dreifache erhöht. Waren es beim Vorgänger Geforce GTX 580 noch 512 Streamprozessoren, so sind es bei der Geforce GTX 680 insgesamt 1536. Diese Erhöhung ist auch dringend notwendig gewesen: zum einen liegt der Shadertakt deutlich niedriger (wie bereits erwähnt, liegen Chip- und Shadertakt nun gleich auf) und zum anderen hat die Konkurrenz die Messlatte sehr hoch gelegt. So greift die Radeon HD 7970 auf insgesamt 2048 Streamprozessoren zurück (wobei der Takt deutlich geringer ist).

Lassen wir die nackten Zahlen mal dahingestellt. Was zählt ist das Ergebnis und in Sachen Shaderleistung (gemessen in GFLops) hat sich die Geforce GTX 680 im Vergleich zum Vorgänger verdoppelt. Ein gutes Ergebnis, auch wenn eine Radeon HD 7970 dies um einiges übertreffen kann.

Theoretische Shaderleistung

Nvidia Geforce GTX 680 (1536): 3.090 GFlops
Nvidia Geforce GTX 590 (1024): 2.508 GFlops
Nvidia Geforce GTX 580 (512): 1.581 GFlops
ATI Radeon HD 7970 (2048): 3.790 GFlops
ATI Radeon HD 7950 (1792): 2.870 GFlops
ATI Radeon HD 6970 (1536): 2.703 GFlops
ATI Radeon HD 6950 (1408): 2.253 GFlops
ATI Radeon HD 6870 (1120): 2.000 GFlops
(In Klammern Anzahl der Streamprozessoren)

Genauso wichtig für die Leistungsfähigkeit einer Grafikkarte ist die Performance des Grafikspeichers. Damit ist nicht die Größe gemeint, sondern die Datenmenge, welche in den Grafikspeicher geschrieben und wieder gelesen werden kann. Die so genannte Speicherbandbreite berechnet sich aus dem Speicherinterface (Bit) und der Höhe des Speichertaktes.

Die Geforce GTX 680, welche auf insgesamt 2 GB DDR-5 Speicher zurückgreifen kann, bricht genauso wie beim Chiptakt alle Rekorde. Mit effektiven 6 GHz (realer Takt 3 GHz) wurde noch keine Grafikkarte zuvor getaktet. Dass dies letztendlich eher als Marketing-Aktion zu bewerten ist, zeigen letztendlich die Ergebnisse bezüglich der Speicherbandbreite. Da die Geforce GTX 680 nur über ein 256 Bit breites Speicherinterface verfügt, verpufft der Leistungsgewinn durch die extrem hohe Speichertaktrate.

Die Radeon HD 7970 beispielsweise wird deutlich niedriger getaktet, erreicht aber durch das 384 Bit breite Speicherinterface ein besseres Ergebnis.

Theoretische Speicherbandbreite

Nvidia Geforce GTX 680 (256 Bit): 192.256 MB/s
Nvidia Geforce GTX 590 (768 Bit): 328.320 MB/s
Nvidia Geforce GTX 580 (384 Bit): 192.384 MB/s
ATI Radeon HD 7970 (384 Bit): 264.000 MB/s
ATI Radeon HD 7950 (384 Bit): 240.000 MB/s
ATI Radeon HD 6970 (256 Bit): 176.000 MB/s
ATI Radeon HD 6950 (256 Bit): 160.000 MB/s
ATI Radeon HD 6870 (256 Bit): 134.400 MB/s
(In Klammern Speicherinterface)

Wie man anhand der theoretischen Leistungswerte sehen kann, sagen die technischen Daten nur die halbe Wahrheit. Anhand dieser Ergebnisse wird bereits deutlich, dass eine Geforce GTX 680 und eine Radeon HD 7970 nah beieinander liegen. Beide haben in unterschiedlichen Bereichen ihre Stärken und Schwächen, was zum Teil erklärt, warum beide Modelle in 3D-Spielen so unterschiedlich abschneiden.

Bis zu vier Monitor können bei der Geforce GTX 680 angeschlossen werden
Bis zu vier Monitor können bei der Geforce GTX 680 angeschlossen werden

GPU-Boost - Automatische Overclocking Funktion

Erstmals wird bei einer Grafikkarte eine Technik eingesetzt, welche dynamisch die Taktraten anhebt, wenn dies eine Anwendung erforderlich macht. Vereinfacht gesagt handelt es sich hierbei um eine integrierte Overclocking-Funktion. Dieses Prinzip kennt man bereits aus der Prozessor-Technik. Intel nennt diese Technik Turbo Boost, bei der einige Kerne zugunsten eines höheren Taktes abgeschaltet werden.

GPU boost von Nvidia

Anders als bei Prozessoren ist bei Grafikkarten nicht die fehlende Multi-Prozessoren-Unterstützung seitens der Sotware das Problem bzw. der Grund für den Einsatz einer integrierten Overclocking-Funktion. Es ist ein anderer Gedanke der dahintersteht.

Nvidia hat bei der Geforce GTX 680 die TDP auf 195 Watt festgelegt. D.h. Stromverbrauch und Hitzeentwicklung dürfen diese Werte nicht überschreiten. Was aber, wenn das 3D-Spiel mehr Leistung benötigt, aber die genannten Grenzen noch nicht erreicht sind? Die Grafikkarte lässt die restlichen Leistungsreserven brach liegen. Diese Leistungsreserven, welche seit Jahren von Overclockern mittels manueller Übertaktung herausgekitzelt wurden, werden nun mittels Nvidias GPU Boost automatisch ausgereizt. Benötigt eine Anwendung mehr Leistung und liegt der Stromverbrauch bzw. die Hitzeentwicklung im grünen Bereich, wird der Chip-/Shadertakt automatisch angehoben.

Nvidia schreibt folgendes zu der neuen Technik: "Bisher liefen Grafikprozessoren bei 3D games, mit einer festen Taktfrequenz, selbst wenn sie das Potenzial für höhere Taktungen hatten. GPU Boost überwacht ständig die Arbeitslast des Grafikprozessors und steigert nach Möglichkeit die Taktfrequenz. Der Grafikprozessor läuft immer mit optimaler Leistung und liefert maximale Frameraten"

HerstellerNvidiaNvidiaNvidiaAMDAMDAMDAMDAMD
GrafikchipGeforce GTX 680 Geforce GTX 590 Geforce GTX 580 Radeon HD 7970 Radeon HD 7950 Radeon HD 6970 Radeon HD 6950 Radeon HD 6870
Rang (Rangliste)69. Platz61. Platz89. Platz71. Platz83. Platz95. Platz111. Platz115. Platz
LeistungsklasseHigh-EndHigh-EndHigh-EndHigh-EndHigh-EndHigh-EndHigh-EndHigh-End
Veröffentlicht2Q 20121Q 20114Q 20104Q 20111Q 20124Q 20104Q 20104Q 2010
Anzahl Kerne12111111
CodenameGK104
(Kepler)
GF110GF110Tahiti XTTahiti XTCaymanCaymanBarts XT
Transistoren3540 Mio.2x 3060 Mio.3000 Mio.4312 Mio.4312 Mio.2640 Mio.2640 Mio.1700 Mio.
Herstellung28nm40nm40nm28nm28nm40nm40nm40nm
Chip
Chiptakt:1006 MHz607 MHz772 MHz925 MHz800 MHz880 MHz800 MHz900 MHz
Chiptakt (BOOST):nicht unterstütztnicht unterstütztnicht unterstütztnicht unterstütztnicht unterstütztnicht unterstütztnicht unterstütztnicht unterstützt
Shadertakt1006 MHz1215 MHz1544 MHz925 MHz800 MHz880 MHz800 MHz900 MHz
Pixelshadernicht unterstütztnicht unterstütztnicht unterstütztnicht unterstütztnicht unterstütztnicht unterstütztnicht unterstütztnicht unterstützt
Vertexshadernicht unterstütztnicht unterstütztnicht unterstütztnicht unterstütztnicht unterstütztnicht unterstütztnicht unterstütztnicht unterstützt
Streamprozessoren15362x 51251220481792153614081120
ROP322x 48483232323232
TMU1282x 6464128112968856
Speicher (RAM)
Speichertakt6010 MHz *3414 MHz *4008 MHz *5500 MHz *5000 MHz *5500 MHz *5000 MHz *4200 MHz *
Speichergröße2048 MB3072 MB1536 MB3072 MB3072 MB2048 MB2048 MB1024 MB
SpeichertypGDDR-5GDDR-5GDDR-5GDDR-5GDDR-5GDDR-5GDDR-5GDDR-5
Speicherinterface256 Bit2x 768 Bit384 Bit384 Bit384 Bit256 Bit256 Bit256 Bit
Herstellung
APIPCI-EPCI-EPCI-EPCI-EPCI-EPCI-EPCI-EPCI-E
DirectX11111111.111.1111111
OpenGL4.24.14.14.24.24.14.14.0
Multi-GPU fähig?SLISLISLICFCFCFCFCF
Hybrid Graphicsunbekanntunbekanntunbekanntunbekanntunbekanntunbekanntunbekanntunbekannt
Vulkanunbekanntunbekanntunbekanntunbekanntunbekanntunbekanntunbekanntunbekannt
Leistungswerte
PCE-Score
225.5
282.6
158.1
250.9
207.2
182.7
158.7
140.5
Pixelfüllrate32.192 MP/s58.272 MP/s37.056 MP/s29.600 MP/s25.600 MP/s28.160 MP/s25.600 MP/s28.800 MP/s
Texelfüllrate128.768 MT/s77.696 MT/s49.408 MT/s118.400 MT/s89.600 MT/s84.480 MT/s70.400 MT/s50.400 MT/s
Shaderleistung
(Single Precision)
3090 GFlops2508 GFlops1581 GFlops3790 GFlops2870 GFlops2703 GFlops2253 GFlops2000 GFlops
Shaderleistung
(Double Precision)
unbekanntunbekanntunbekanntunbekanntunbekanntunbekanntunbekanntunbekannt
Speicherbandbreite192.320 MB/s655.488 MB/s192.384 MB/s264.000 MB/s240.000 MB/s176.000 MB/s160.000 MB/s134.400 MB/s
Stromverbrauch
Maximal195 Watt365 Watt244 Watt250 Watt200 Watt248 Watt195 Watt151 Watt
Leerlauf (IDLE)14,0 Watt55,0 Watt31,0 Watt17,0 Watt22,0 Watt22,0 Watt20,0 Watt19,0 Watt
Weitere Informationen
Kaufangebote10 Angebote10 Angebote10 Angebote10 Angebote10 Angebote10 Angebote10 Angebote10 Angebote
ReviewZum ArtikelZum ArtikelZum ArtikelZum ArtikelZum ArtikelZum ArtikelZum Artikel
Tech. DetailsDetailsDetailsDetailsDetailsDetailsDetailsDetailsDetails

* Theoretische Taktrate. Abhängig von der RAM-Technologie.
  Bei DDR-Speicher ist dies nicht der Realtakt, sondern entspricht der theoretischen Leistungsfähigkeit

Energieaufnahme ("Stromverbrauch")

Ein wesentliches Problem der Geforce GTX 500 Serie war der vergleichsweise hohe Stromverbrauch. An dieser Problemstelle hat Nvidia gearbeitet und allein durch das Shrinking von 40 auf 28nm deutlich Fortschritte gemacht. Die TDP beträgt 195 Watt und im Leerlauf verbraucht die Geforce GTX 680 ungefähr 14 Watt. Sicherlich werden die Grünen-Politiker keine Luftsprünge machen, aber ein Fortschritt zum Vorgänger ist dies allemal.

Zu erwähnen ist auch die Boost-Technologie. Wird die Geforce GTX 680 nicht voll ausgelastet, kommen auch nicht die Overclocking-Mechanismen zum Einsatz. Dies wirkt sich zusätzlich positiv auf die Energiebilanz aus.

Technische Übersicht Geforce GTX 680

  • Hersteller: Nvidia
  • Grafikchip: Geforce GTX 680
  • Erschienen: 2Q 2012
  • GPU-Codename: GK104
  • Transistoren: 3540 Mio.
  • Herstellungsverfahren: 28 nm
  • Anzahl GPUs: 1
  • DirectX: 11
  • OpenGL: 4.2
  • OpenCL: unbekannt
  • Chiptakt: 1006 Mhz
  • Shadertakt: 1006 Mhz
  • Streamprozessoren: 1536
  • ROP / TMU: 32 / 128
  • Grafikbus: PCI-E
  • Speichergröße: 2048 MB GDDR-5
  • Speichertakt: 6010 Mhz (DDR)
  • Speicherschnittstelle: 256 Bit
  • Stromverbrauch: 195 Watt
  • Pixelfüllrate: 32.192 MPixel/Sek
  • Texelfüllrate: 128.768 MTixel/Sek
  • Shaderleistung: 3090 GFlops
  • Speicherbandbreite: 192.320 MB/s
  • Multi-VGA: SLI

Benchmarks zur Geforce GTX 680

Crysis 1600x1200 4xAA 16xAF

Crysis 1600x1200 4xAA 16xAF
Ego-Shooter basierend auf Direct3D 10, verwendet die CryEngine2, eine Weiterentwicklung der CryEngine von FarCry

Grafikchip Ergebnis
AMD Radeon HD 6990 Diagrammbalken44
AMD Radeon HD 7970 Diagrammbalken36
AMD Radeon HD 7950 Diagrammbalken31
Nvidia Geforce GTX 680 Diagrammbalken31
Nvidia Geforce GTX 580 Diagrammbalken26
Nvidia Geforce GTX 570 Diagrammbalken21

Testsystem: Intel Core i7 960, 4 GB DDR3-1600, 64GB SSD-HDD

Analyse: In Crysis scheint die Geforce GTX 680 nicht voll unterstützt zu werden und daher wird sie unter ihrem Wert verkauft. Sie ist etwas langsamer als AMDs Flaggschiff Radeon HD 7970. Die einzige Dual-GPU-Grafikkarte Radeon HD 6990 läuft außer Konkurrenz.

Unigine Heaven 2 1600x1200 4xAA 16xAF

Unigine Heaven 2 1600x1200 4xAA 16xAF
Der Unigine Heaven Benchmark war der erste DirectX 11 Benchmark, der mit verblüffenden 3D-Effekten (realistische Darstellung von Pflastersteine, Dachziegeln etc.) überzeugte. Grund hierfür war die neue Tesselation-Einheit, welche in moderne Grafikkarten Einzug erhielt.

Grafikchip Ergebnis
AMD Radeon HD 6990 Diagrammbalken75
Nvidia Geforce GTX 680 Diagrammbalken75
AMD Radeon HD 7970 Diagrammbalken63
AMD Radeon HD 7950 Diagrammbalken55
Nvidia Geforce GTX 580 Diagrammbalken50
Nvidia Geforce GTX 570 Diagrammbalken44

Testsystem: Intel Core i7 960, 4 GB DDR3-1600, 64GB SSD-HDD

Analyse: Anders sieht das Ergebnis im DirectX 11 Benchmark Unigine Heaven 2 aus: hier zeigt die Geforce GTX 680 ihre Stärke und lässt die AMD-Konkurrenz deutlich hinter sich. Dies zeigt zum einen, wie eng die Leistungskönige der beiden Lager beianander liegen. Zum anderen wird deutlich, dass die Grafikkarten unterschiedlich in den einzelnen Anwendungen/3D-Spielen abschneiden.

Technische Informationen zur Geforce GTX 680 von Nvidia.de

Nvidia-Webseite: Geforce GTX 680

Technische Daten der Grafikprozessor-Engine   

CUDA Recheneinheiten: 1536
Basis-Taktung: 1006
Boost-Taktung: 1058
Textur-Füllrate: 128.8

Technische Daten des Speichers   

Speichergeschwindigkeit ( Mhz ): 6010
Speichergröße: 2048MB
Speicherschnittstelle: 256-bit GDDR5
Max. Bandbreite: 192.2

Charakteristika der Karte   

SLI-Ready   
SLI-Typ    3 -way
Purevideo   
3D Vision   
PhysX   
CUDA
DirectX    11
OpenGL 4.2
Bus Type: PCI-E 3.0
3D Gaming   
Blu Ray 3D 

Technische Daten   

Max. DVI Auflösung: 2560x1600
Max. VGA Auflösung: 2048x1536
Medienverbindung: DisplayPort, Dual, Link, DVI-D, HDMI, Dual Link DVI
Supported Features: HDCP, HDMI, HDMI, Audio

Abmessungen   

Breite: 4.376 inches
Länge: 10.0 inches  Inches
Bedarf an Steckplätzen: Dual Slot
Energieverbrauch und Temperatur   
Höchsttemperatur: 98C
Leistungsaufnahme: 195W
Min. erforderliche Systemleistung: 550W
Netzanschlüsse: 6-pin x2