Energie-Effizienz auf dem Chip Was können die neuen Xeon-Prozessoren (besser)?

Autor / Redakteur: lic.rer.publ. Ariane Rüdiger / Ulrike Ostler

Gleich reihenweise kommen derzeit neue Server-Systeme mit Prozessoren aus Intels neuer Prozessorserie „Xeon E5 2600 v3“ auf den Markt. Was hat der Hersteller getan, um die Energie-Effizienz der Prozessoren zu erhöhen, und wo liegen die Spielräume der OEMs?

Firmen zum Thema

Aus der Nähe: Der neue Intel-Prozessor Xeon E5 2600 v3
Aus der Nähe: Der neue Intel-Prozessor Xeon E5 2600 v3
(Bild: Nick Knupffer)

Alle Jahre wieder beglückt Intel die Rechnerwelt mit einer neuen Prozessorvariante – diesmal war, dem üblichen Rhythmus folgend, eine Veränderung der Mikroarchitektur fällig. Intel wechselt jeweils zwischen veränderter Strukturbreite und veränderter Architektur ab. Ein dank steigender Strompreise immer wieder interessantes Thema ist, ob und wie sich energetische Effizienz, gemessen an Stromverbrauch pro Arbeitsschritt, verändert hat.

Für den Prozessor unter dem Codenamen „Haswell“ oder, formell korrekt, Xeon E5 2600 v.3, reklamiert Intel eine gegenüber der Vorversion v.2 um rund 24 Prozent erhöhte Leistung bei der Abarbeitung eines SpecPower-Benchmarks mit einem Intel-Serverboard. SpecPower simuliert übliche E-Business-Arbeitslasten, zum Beispiel einen Java-Webshop. Gegenüber einem rund dreieinhalb Jahre alten Serverboard mit einem Prozessor der Xeon-5600er-Serie liegt, so Intel, die Leistung sogar um 210 Prozent höher, hat sich also mehr als verdreifacht.

Doch die Leistungen sind nicht nur bei SpecPower gestiegen: AES-Verschlüsselung läuft auf den neuen Prozessoren gegenüber der Vorversion mit doppelter Geschwindigkeit, die AVX (Advanced Vector Extension)-Erweiterung für massiv paralleles Rechnen verarbeitet nun 256 Bit lange Operatoren statt 128 Bit langer. Beim reinen Compute-Benchmark SpecInt übertrifft das Spitzenmodell der aktuellen Prozessorserie das der Vorserie um immerhin 41 Prozent.

Kühlungsdesign der Server orientiert sich nicht an Spec-Werten

Hinsichtlich der Auslegung der Kühlung freilich sollen sich die Systemdesigner der Server-OEMs nicht an irgendwelchen Spec-Werten orientieren, sondern an der so genannten TDP (Thermal Design Power). Das ist der im schlechtesten Fall anfallende Stromverbrauch mit einer entsprechend hohen Abwärme-Erzeugung, für die die Kühlaggregate einer Box in jedem Fall ausgelegt sein müssen. Wie oft dieser Wert in der Praxis tatsächlich eintritt, darüber gibt es keine Angaben.

Bildergalerie
Bildergalerie mit 5 Bildern

Trotzdem ist der TDP-Wert interessant – schließlich müssen die Anwender ja auch das Kühlaggregat bezahlen, das je nach TDP-Wert leistungsfähiger oder weniger leistungsfähiger ausfallen muss und dementsprechend wohl auch mehr oder weniger kostet. Der TDP-Wert der Embedded-Prozessoren der E5-2600-V3-Serie liegt zwischen 75 bis 120 Watt, bei den reinen Server-Prozessoren reicht er von 65 W (Modell 2650 L, 1,8 GHz, 30 MByteCache) bis 160 W (Modell 2687 W, 3,1 GHz, 25 MByte Cache). Von den auf Intels Website aufgeführten 27 E5 2600 v3-Systemen liegen 17 bei einem TDP von 120 W oder höher.

Zum Vergleich: Bei den teilweise schon am Ende ihrer Produktlebensdauer stehenden Prozessoren der Xeon-5600er-Serie beginnen die TDP-Werte bei 40 W und reichen bis 140 W. Bei 19 von 24 Server-Prozessoren liegt der TDP-Wert unter 100 Watt.

Was interessiert?

Zumindest die nominellen Maximal-Stromverbrauchswerte für Designzwecke sind gestiegen – von einem Durchschnitts-TDP-Wert der 5600er Serie von 87,5 W auf einen TDP-Wert von 117 W durchschnittlich über 27 Server-Prozessor-Modelle der Serie E5 2600 v3 hinweg. Das ist rund ein Drittel mehr. Diesem Drittel stehen weit größere Gewinne an Rechenleistung gegenüber.

Markus Leberecht, Cloud Solution Architect bei Intel, betont: „Für die praktische Arbeit hat der TDP-Wert wirklich keine Bedeutung.“ Tatsächlich werden sich die Anwender, so lange die Anforderungen an die Rechenleistung weiter steigen, kaum von einem absolut leicht potentiellen Maximal-Stromverbrauch beeindrucken lassen – schließlich haben sie Aufgaben zu erledigen.

Dabei zählt derzeit in der Praxis zwar, dass möglichst wenig Strom in die Abwicklung bestimmter Tasks investiert wird. Absolutwerte, und noch dazu maximale, interessieren aber eher weniger.

DDR-4-Unterstützung sorgt für mehr Effizienz beim Speichern

Energetische Sparpotentiale erschließt Intel bei den v.3-Prozessoren nicht nur durch schlichte Leistungssteigerung. So werden jetzt DDR4-Speicherbänke unterstützt. Ihre Niederspannungsvariante (Low Voltage Register DIMMs, LVR-DIMMs) verbraucht trotz gestiegener Taktrate gegenüber dem Vorläufer DDR 3 rund ein Drittel weniger Energie beim Speichern, ist wahrscheinlich meist aber nur als teurere Option erhältlich. So bleibt es den Anwendern überlassen, ob sie sich dieses Sparpotential tatsächlich erschließen.

Neue Sparmöglichkeiten gibt es auch deshalb, weil der so genannte P-State, also die Taktrate, nun vom Power Controller des Prozessors für jeden einzelnen Kern separat reguliert wird.

Bisher wurde ein Durchschnitt über alle von einem Controller gesteuerten Kerne gebildet. Eine Absenkung der Taktrate, beispielsweise bei geringer Auslastung oder unwichtigen Aufgaben, übersetzt sich sofort in geringeren Stromverbrauch. Dafür musste selbstredend beispielsweise die Architektur der Verbindungen des Controllers zu den Kernen verändert werden – wie genau, das betrachtet Intel als sein Tafelsilber und gibt es daher nicht preis.

Optimiertes Management des Server-Systems

Schließlich wurde auch die Verwaltbarkeit des gesamten Server-Systems noch einmal verbessert. Vor allem geht es um genaueres Messen und Tunen. So lassen sich mit dem „Node Manager“ Schwellenwerte für den Stromverbrauch jeder Serverbox festlegen. Zusammen mit dem Power Controller wird dann die Rechenleistung jedes einzelnen Kerns im Zusammenspiel der Gesamtlösung optimiert.

Bildergalerie
Bildergalerie mit 5 Bildern

Außerdem können Anwender nun mehr Parameter messen. Ermitteln lässt sich jetzt etwa der Wert der Auslasstemperatur – selbst dann, wenn am Luftausgang physikalisch gar kein Sensor vorhanden ist. In diesem Fall wird der Wert aus Einlasstemperatur, Prozessortemperatur und der Temperatur des Restsystems algorithmisch kalkuliert.

Der Algorithmus lässt sich dabei mit bestimmten Parametern vom den Prozessor einbauenden OEM kalibrieren und eröffnet diesem damit gewisse Optimierungsspielräume. Auch der Volumenstrom wird kalkuliert, nämlich aus der Geschwindigkeit der Lüfter. Weiter ermittelt die Intel-Software in der aktuellen Version Auslastungsmetriken für Speicher, Zentraleinheit und Ein-/Ausgabesystem – bisher war das meist Sache des Betriebssystems.

Einige Prozent Effizienzsteigerung sind Sache des OEM

Besonders für Cloud-Lösungen ist wichtig, dass sich nun auch beobachten lässt, welche virtuellen Maschinen in einem virtualisierten Cloud-Server den Last Level Cache (LLC) besonders stark beanspruchen. „Bei entsprechenden Messergebnissen kann man die kritischen Systeme etwas weiter voneinander entfernt implementieren und jeden einzelnen physikalischen Server dadurch besser auslasten“, erkläutert Leberecht. Insgesamt, so der Manager, eröffne die neue Prozessorserie samt Managementsoftware weitaus mehr Steuerungs- und Optimierungsmöglichkeiten für das Gesamtsystem des Rechenzentrum oder der Cloud.

Zwar bringe, so Leberecht, der Prozessor einen gewichtigen, wahrscheinlich den größeren Teil der energetischen Optimierung darauf fußender Server-Systeme bereits mit, doch „haben die OEMs durchaus Spielräume, hier noch mehr zu tun“, ist der Manager überzeugt.

Stellschrauben seien beispielsweise die verwendeten Massenspeicher oder die Baugrößen. So sind bei einem System mit nur einer Höheneinheit die Ventilatoren klein, bei einem 4U-System naturgemäß groß. Das ergibt unterschiedliche aerodynamische Effekte und damit eine veränderte Gesamteffizienz der Lösung.

Man darf also durchaus gespannt sein, mit welchen Effizienzsteigerungswerten die unterschiedlichen Server-Modelle, die inzwischen Schritt für Schritt vorgestellt werden, prunken. Und vor allem darauf, welche Tricks die Hersteller jeweils verwendet haben, um im Gesamtsystem das Beste aus dem Haswell herauszuholen.

* Ariane Rüdiger ist freie Autorin aus München.

(ID:42953117)

Über den Autor

lic.rer.publ. Ariane Rüdiger

lic.rer.publ. Ariane Rüdiger

Freie Journalistin, Redaktionsbüro Rüdiger