Intel Vision 2024: Schnellerer KI-Beschleuniger und Xeon-6-Prozessoren Konkurrenz für Nvidia: Intel stellt KI-Chip Gaudi 3 vor

Von Klaus Länger 3 min Lesedauer

Anbieter zum Thema

Auf der Intel Vision 2024 dreht sich alles um das Thema KI: Der Chiphersteller stellt mit Gaudi 3 einen neuen KI-Beschleuniger vor, gibt einen Ausblick auf die Xeon-6-CPUs und einen Überblick über das gesamte KI-Portfolio für Client, Edge und Datacenter.

Der auf der Intel-Veranstaltung Vision 2024 vorgestellte KI-Beschleuniger Gaudi 3 soll bei Training und Inferencing schneller sein als Nvidias H100, dabei aber weniger kosten und energieeffizienter arbeiten.(Bild:  Intel)
Der auf der Intel-Veranstaltung Vision 2024 vorgestellte KI-Beschleuniger Gaudi 3 soll bei Training und Inferencing schneller sein als Nvidias H100, dabei aber weniger kosten und energieeffizienter arbeiten.
(Bild: Intel)

Die Vision-2024-Konferenz von Intel in Phoenix, Arizona steht unter dem Motto „Bringing AI Everywhere“. Damit ist auch der Rahmen für die Neuvorstellungen des Chipherstellers gesteckt: Intel-CEO Pat Gelsinger präsentiert dort offiziell den neuen KI-Beschleuniger Gaudi 3, der vor allem Nvidias Tensor-Core-GPUs H100 und H200 Konkurrenz machen soll. Zudem zeigt Intel die kommenden Xeon-6-CPUs für GenAI-Lösungen im eigenen Datacenter der Kunden sowie neue Prozessoren für Edge-Computing, die dort auch KI-Workloads übernehmen sollen.

Bildergalerie
Bildergalerie mit 7 Bildern

Intel Gaudi 3

Vor fünf Jahren hat Intel den israelischen Chiphersteller Habana Labs übernommen. Bisher hat sich die Akquise gelohnt: Zwar reichen die nach dem katalanischen Architekten Gaudi benannten KI-Beschleuniger in der Leistung nicht an die Spitzenmodelle von Nvidia heran, sind aber deutlich günstiger und erfreuen sich daher reger Nachfrage. Mit Gaudi 3 kommt nun eine neue Generation des für KI-Training und Inferencing bestimmten Beschleunigers, die in der Leistung gegenüber dem Vorgänger deutlich zugelegt haben soll. Der neue Chip besteht nun aus zwei Chiplets, die in einem 5-nm-Prozess hergestellt werden. Gaudi 2 ist noch ein 7-nm-Chip. Die Zahl der Tensor-Cores ist bei Gaudi 3 von 24 auf 64 gewachsen. Zudem verfügt der KI-Prozessor über acht statt zwei Matrix Multiplication Engines sowie 96 statt 48 MB SRAM auf dem Die. Mit auf dem Prozessor sitzen nun acht HBMe2-Stacks mit zusammen 128 GB Speichergröße und 3,7 TB/s Bandbreite. Bei Gaudi 2 sind es noch sechs Stacks mit insgesamt 96 GB.

Das Plus an Hardware sorgt laut Intel für die doppelte Leistung bei FP8 und die vierfache Performance die BF16 gegenüber dem Vorgänger. Im Vergleich zu Nvidias H100 verspricht Intel eine um bis zu 1,7-fache Leistung beim Training großer Sprachmodelle und die 1,6-fache Leistung beim Inferencing. Dabei soll Gaudi 3 auch noch effizienter arbeiten und so mit weniger Strom auskommen.

Ein weiterer Fortschritt bei Gaudi 3 ist die verbesserte Konnektivität durch die Verdoppelung der Bandbreite der 24 Ethernet-Ports auf dem Chip: Statt 100GbE- sind es nun 200GbE-Ports für eine bessere Skalierung im Cluster. Die Referenz-Architekturen von Intel reichen hin bis zu 1.024 Nodes mit 8.192 Gaudi-3-Beschleunigern und einem 800GbE-Netzwerk.

Die Nutzung von Ethernet für die Chip-zu-Chip-Verbindung soll ebenfalls die Kosten reduzieren und ein Vendor-Lock-in wie bei Nvidias NVLink und NVSwitch vermeiden. Intel beteiligt sich am Ultra Ethernet Consortium (UEC), das die Grundlagen für an KI und HPC angepasste Ethernet-Lösungen entwickelt.

Gaudi 3 kommt in verschiedenen Varianten auf den Markt: Als OAM-konforme Mezzzanine-Karte HL-325L, als Universal Baseboard HLB-325 mit acht Prozessormodulen sowie auch als Dual-Slot-PCI-Express-Karte mit 600 Watt TDP. Die OAM-Lösung und das Baseboard soll es zunächst mit Luft- und später auch mit Wasserkühlung geben. Derzeit liefert Intel Samples an ausgewählte Partner und Kunden. Für das zweite Halbjahr verspricht der Hersteller eine breite Verfügbarkeit aus der Massenfertigung. Als OEM-Partner für den Launch treten Dell, HPE, Lenovo und Supermicro an.

Eine weitere Stärke der Gaudi-Beschleuniger ist laut Intel der umfangreiche Software-Stack, der das PyTorch-Framework integriert und den Zugang zu einer großen Zahl optimierter Modelle gewährt.

Nach Gaudi 3 steht mit Falcon Shores eine neue Beschleuniger-Generation auf der Roadmap, die auf der Vision kurz erwähnt wird. Sie soll die Gaudi-Technologie und die der Xe-GPUs integrieren und über eine Programmierschnittstelle auf Basis der OneAPI-Spezifikation zugänglich machen.

Xeon 6 mit E- und P-Cores

Die kommenden Xeon-6-Prozessoren spaltet Intel in zwei unterschiedliche Produktlinien auf: Prozessoren auf Basis von E-Cores, bekannt als Sierra Forest, mit sehr vielen aber dafür sparsamen Kernen und CPUs mit weniger aber dafür sehr schnellen P-Cores für rechenintensive Workloads wie KI. Diese Xeon-6-Modelle werden unter dem Codenamen Granite Rapids entwickelt. Beide laufen auf der selben Plattform und teilen sich den Software-Stack. Die Xeon-6-E-Prozessoren sollen schon bald auf den Markt kommen und sollen vor allem durch die Reduktion von Platzbedarf und Leistungsaufnahme im Datacenter überzeugen. Granite Rapids startet im zweiten Halbjahr und unterstützt dann das MXFP4-Datenformat, das die Ausführung von großen Sprachmodellen beschleunigen soll.

KI für Edge Computing

Für den Embedded-Sektor bringt Intel den Mobile-Prozessor Core Ultra alias Meteor Lake in einer gesockelten PS-Version. Er soll gegenüber Raptor Lake beim Inferencing, etwa der Klassifizierung von Bildern, die bis zu fünffache Leistung liefern. Eine höhere KI-Leistung bringt laut dem Hersteller ebenfalls die neue Atom-Generation der Serie x7000C/x7000RE. Zudem halten die Arc-GPUs Einzug in den Embedded-Sektor. Diese neuen Prozessoren zeigt Intel ebenfalls auf der Embedded World in Nürnberg.

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

(ID:49991975)