Channel Fokus: Server & Edge Computing KI-Server-Boom im Channel?

Von Klaus Länger 7 min Lesedauer

Anbieter zum Thema

Von einem exponentiellen Wachstum im Server-Geschäft, getrieben von GenAI, spricht Gartner aktuell. Wir fragen in der Distribution nach, inwieweit der Channel von diesem Boom profitiert. Dem Edge-Business verschaffen lokale KI-Anwendungen ebenfalls Auftrieb.

Das Training von KI-Anwendungen erfordert den massiven Einsatz von GPU-Servern. In Unternehmen wird meist mit vortrainierten Modellen gearbeitet, die mit weniger und schwächerer Hardware auskommen.(Bild:  Gorodenkoff - stock.adobe.com)
Das Training von KI-Anwendungen erfordert den massiven Einsatz von GPU-Servern. In Unternehmen wird meist mit vortrainierten Modellen gearbeitet, die mit weniger und schwächerer Hardware auskommen.
(Bild: Gorodenkoff - stock.adobe.com)

Eine Steigerung von fast 35 Prozent für den weltweiten Umsatz mit Datacenter-Systemen prognostiziert Gartner für das laufende Jahr. Den größten Anteil daran haben die Server. John-David Lovelock, Distinguished VP Analyst bei Gartner, sagt hier nahezu eine Verdreifachung des Absatzes von 2023 bis 2028 voraus. IDC meldet für das zweite Quartal 2024 sogar ein Plus von 64,1 Prozent für den weltweiten Server-Markt. Allerdings wird ein erheblicher Anteil der Systeme wohl auf das Konto der großen GenAI-Anbieter gehen, die viele leistungsstarke GPU-Server für das Training der Modelle benötigen. Ein großer Teil der Kaufpreise und Leasingkosten für die Systeme wird in die Kasse von Nvidia fließen. Nicht ganz so enthusiastisch, aber durchaus positiv ist die Einschätzung der Distributoren bezüglich des Verkaufs von Servern über den Channel.

Starke Entwicklung bei Servern für die hybride Cloud

Rocco Frömberg, Leiter Vendor Development & Operations bei TIM(Bild:  Tim AG)
Rocco Frömberg, Leiter Vendor Development & Operations bei TIM
(Bild: Tim AG)

So sieht Rocco Frömberg, Leiter Vendor Development & Operations beim VAD TIM, eine starke Entwicklung bei Servern, „insbesondere On-Premises-Lösungen“. Er wertet das als „klares Statement für das Konzept eines sicheren, hybriden Data Centers“. Wachstumstreiber seien dabei „eine kritischere (Kosten-)Abwägung von Cloud Workloads zugunsten von On-Premises-Lösungen, der steigende Infrastrukturbedarf an KI-Implementationen, die Umsetzung von NIS2-Richtlinien (Stichwort Ausfallsicherheit und Resilience) sowie die Suche nach preiswerteren Alternativen von VMware-basierten HCI-Lösungen, die unter anderem im klassischen 3-Tier-Aufbau aus Server, Netzwerk und Storage liegen können“.

Stefan Blome, Chief Customer Officer bei Also Deutschland(Bild:  Also)
Stefan Blome, Chief Customer Officer bei Also Deutschland
(Bild: Also)

Stefan Blome, Chief Customer Officer bei Also Deutschland, sieht das ähnlich und sagt: „Der Server-Markt entwickelt sich in eine äußerst spannende Richtung. Wir verzeichnen weiterhin Wachstum in dieser Kategorie, insbesondere im Bereich der Hybrid Cloud und der As-a-Service-Modelle. Unsere Partner setzen verstärkt auf hybride Lösungen, um die Flexibilität und Skalierbarkeit der Cloud mit der Kontrolle und Sicherheit von On-Premises-Systemen zu kombinieren.“ Stefan Hohner, Supervisor, Dell EMC Presales & Consulting bei TD Synnex, macht sogar einen Trend in Unternehmen aus, Daten und Workloads aus der Public Cloud in die Private und Hybrid Cloud zu schieben und nennt vor allem Security als „treibende“ Kraft.

Stefan Hohner, Dell EMC Presales & Consulting bei TD Synnex(Bild:  TD Synnex)
Stefan Hohner, Dell EMC Presales & Consulting bei TD Synnex
(Bild: TD Synnex)

Bei den Prozessoren für Server legt AMD weiter zu. Im dritten Quartal 2024 ist der Umsatz im Datacenter-Segment mit Epyc-Prozessoren und Instinct-Beschleunigern um 122 Prozent gestiegen. Intel versucht, mit den Xeon-6-Prozessoren wieder Boden gut zu machen. Nach den auf der Computex angekündigten Sierra-Forest-Modellen mit bis zu 144 E-Cores sind nun auch die „großen“ Xeon-6-Modelle mit bis zu 128 P-Cores verfügbar. Allerdings könnte die Performance-Krone schon bald wieder an AMD fallen, da der Hersteller im Oktober die ersten Zen5-Epyc-Prozessoren angekündigt hat.

AMD Epyc 9005

In den 16 Zen-5-CCDs des AMD Epyc 9755 sind insgesamt 128 Cores versammelt.(Bild:  AMD)
In den 16 Zen-5-CCDs des AMD Epyc 9755 sind insgesamt 128 Cores versammelt.
(Bild: AMD)

Mit den Epyc-Prozessoren der Serie 9005 bringt AMD die leistungsstärkere Zen5-Architektur in Server-CPUs. Die zuvor als Epyc Turin bekannten CPUs kommen in zwei Varianten mit Zen-5- und mit Zen-5c-Cores. Ein Zen5-CCD mit bis zu acht Cores verfügt über bis zu 32 MB L2-Cache während sich in einem Zen-5c-CCD bis zu 16 Cores 32 MB L2-Cache teilen. Das Zen-5-Spitzenmodell Epyc 9755 bietet nun 128 Cores und 256 Threads. Er zieht damit mit Intels Xeon 6 gleich. Der Zen-4-Vorgänger Epyc war mit maximal 96 Cores lieferbar. Die Zen-5c-Prozessoren können sogar mit bis zu 192 Cores und 382 Threads aufwarten. Die Zen-5- und Zen-5c-Kerne sollen bei der Leistung um 17 Prozent zugelegt haben und liefern laut AMD eine deutlich höhere AVX-512-Performance durch einen auf 512 Bit verbreiterten Datenpfad, was sich vor allem bei HPC- und KI-Anwendungen auswirken soll. Der Hersteller verspricht hier ein Plus von 37 Prozent gegenüber der Zen-4-Generation. Die Sockel-SP5-Prozessoren mit bis zu 500 Watt TDP unterstützen nun zudem mit DDR5-6400 schnelleren Speicher.

Wachsende Nachfrage nach KI-Lösungen

Alexander Pohlmann, Consultant bei TIM(Bild:  Tim AG)
Alexander Pohlmann, Consultant bei TIM
(Bild: Tim AG)

Die Nachfrage nach KI-Lösungen sorgt auch bei Channel-Kunden bereits für eine höhere Nachfrage nach passenden Servern. Wie Alexander Pohlmann, Consultant bei TIM, betont, konzentrieren sich deutsche Unternehmen auf Anwendungsfälle wie RAG, Chatbots, Bild- und Spracherkennung sowie Klassifizierung. „Diese Use-Cases sind die Low-Hanging Fruits und können verhältnis­mäßig kostengünstig mit GPU-gestützten AI-Servern realisiert werden“, so Pohlmann. Ein steigendes Interesse an KI-Systemen registriert man auch bei Also, wo man laut Blome bereits mit den Partnern erste Projekte im Enterprise-Segment umsetzt. Mittelständische Kunden tun sich hier angesichts der wirtschaftlichen Lage schwerer. Wie sein Kollege Frömberg anmerkt, befinden sie sich meist noch in der Beratungsphase und Projektdefinition.

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Bei Beschleunigerkarten für KI-Anwendungen gibt es nun mehr Auswahl: Intels Gaudi 3 ist nun allgemein verfügbar und wird vom Hersteller vor allem in Kombination mit Xeon-6-Prozessoren empfohlen. AMD hat parallel zum Epyc Turin den Instinct MI325X vorgestellt, der Nvidias H200 schlagen soll. Der Beschleuniger basiert auf der CDNA-3-Architektur von AMD und wartet mit 304 Compute Units mit zusammen 19.456 Stream-Prozessoren und 1.216 Matrix Cores auf. Auf der CPU sitzen zudem acht HBM3E-Stapel mit insgesamt 256 GB Speicher. Systeme mit dem neuen AMD-Beschleuniger sollen im ersten Quartal 2025 auf den Markt kommen.

Platzhirsch im Markt für Datacenter-GPUs bleibt aber Nvidia. Die im Frühjahr angekündigte Blackwell-GPU als Top-Produkt für GenAI-Anwendungen ist nun endlich breit verfügbar. Ein Designfehler seitens Nvidia, der bisher dazu führte, dass die GPU nur in Kleinserie hergestellt werden konnte, wurde gemeinsam mit dem Auftragsfertiger TSMC behoben. Der Massenproduktion steht nun nichts mehr im Wege.

Supermicro wird auch die neuen Instinct-MI325X-Beschleuniger von AMD einsetzen. Sie verfügen über 304 GPU-Compute-Units und sind mit 256 GB HBM3E bestückt.(Bild:  AMD)
Supermicro wird auch die neuen Instinct-MI325X-Beschleuniger von AMD einsetzen. Sie verfügen über 304 GPU-Compute-Units und sind mit 256 GB HBM3E bestückt.
(Bild: AMD)

AMD und Intel gründen x86-Allianz gegen ARM

In der x86 Ecosystem Advisory Group habe sich eine ganze Reihe von Firmen zusammengetan, um die Zukunft der x86-Architektur zu sichern.(Bild:  Intel)
In der x86 Ecosystem Advisory Group habe sich eine ganze Reihe von Firmen zusammengetan, um die Zukunft der x86-Architektur zu sichern.
(Bild: Intel)

Auch Konkurrenten können sich verbünden, wenn es gegen gemeinsame Gegner geht. AMD und Intel haben gemeinsam eine x86 Ecosystem Advisory Group ins Leben gerufen, die das x86-Ökosystem weiter ausbauen und die Interoperabilität über Hard- und Softwareplattformen hinweg ausbauen soll. Gründungsmitglieder sind neben AMD und Intel noch Broadcom, Dell, Google, HPE, HP, Lenovo, Meta, Microsoft, Oracle und Red Hat. Zudem sind der Linux-Chefentwickler Linus Torvalds und Tim Sweeney, Gründer und CEO von Epic Games, als „Luminaries“ mit an Bord. Die inzwischen 46 Jahre alte x86-Architektur ist zwar bei PCs und Servern immer noch mit Abstand führend, sieht sich aber hier zunehmender Konkurrenz durch Prozessoren mit ARM-Architektur ausgesetzt. Im Server-Umfeld kommt diese einerseits durch Nvidia, die Kombi-Chips aus den eigenen GPUs und ARM-CPUs wie den Grace Hopper Superchip und den GB200 Grace Blackwell Superchip anbieten, andererseits durch Hyperscaler wie AWS und Google die eigene ARM-Prozessoren für ihre Rechenzentren entwickeln. In China hat Huawei mit Kunpeng 920 eine ARM-CPU entwickelt, die in den eigenen Storage-Systemen verwendet wird. Die frei verkäuflichen Ampere-Prozessoren spielen dagegen auf dem Markt eine nur untergeordnete Rolle.

Microsoft kooperiert zwar mit Qualcomm für Windows-Notebooks mit ARM-CPU und hat mit Azure Cobalt eine eigene ARM-Server-CPU auf Neoverse-Basis entwickelt, ist aber trotzdem Gründungsmitglied der x86-Allianz, da die Firma sich alle Optionen offen halten will. Broadcom entwickelt zwar ARM-SoCs für Embedded- und Netzwerk-Lösungen, ist aber als VMware-Eigner an der Zukunft der x86-Architektur sehr interessiert.

VMware bleibt ein wichtiges Thema

Ein Thema, das sowohl Kunden als auch Channel umtreibt, ist der weitere Umgang mit VMware. Hier stellen alle Distributoren fest, dass sich die Kunden für Alternativen interessieren. Darauf reagieren auch die Hersteller. Ronny Pilgram, Partner Account Manager Dell Technologies bei Siewert & Kau, verweist hier auf die gemeinsame Lösung von Dell und Nutanix für die hybride Multicloud in Form der neuen schlüsselfertigen und hyperkonvergenten XC-Plus-Appliance.

Ronny Pilgram, Partner Account Manager Dell Technologies bei Siewert & Kau.(Bild:   Siewert & Kau)
Ronny Pilgram, Partner Account Manager Dell Technologies bei Siewert & Kau.
(Bild: Siewert & Kau)

Für Fujitsu sagt Santosh Wadwa, Vice President – Head of Platform Business Deutschland, dass „die Nachfrage nach alternativen Virtualisierungslösungen wie Proxmox VE in vielen Unternehmen nach der Neuausrichtung von Broadcom und VMware spürbar gestiegen ist“ und sein Unternehmen eine entsprechende Lösung auf Basis der Primergy-Server RX2530 M7 und RX2540 M7 anbietet. Also-Consultant Pohlmann gibt allerdings zu bedenken, dass viele Kunden „stark in VMware-Produkte, Ausbildung und das Ökosystem investiert haben“ und deshalb zögern. In Greenfield-Umgebungen können alternative Lösungen aber überlegen sein. Laut Hohner sollten IT-Verantwortliche einen Wechsel nur nach reiflicher Überlegung in Betracht ziehen und vorher prüfen, ob alle Funktionen vorhanden sind, wie teuer eine Migration kommt, wie es mit dem Support aussieht und mit der Unterstützung durch Systemhäuser.

Edge Computing: KI als Wachstumsfaktor

Beim Markt für Edge-Computing-Lösungen geben die Distributoren ganz unterschied­liche Einschätzungen ab. So sieht Hohner bei TD Synnex derzeit „keine hohen Zuwächse“, aber einen noch stabilen Markt. Bei Also registriert man dagegen eine wachsende Nachfrage nach Edge-Lösungen. Blome nennt hier KI als einen Faktor. Laut dem Chief Customer Officer gibt es hier „keine pauschalen Standardlösungen“. Stattdessen entwickle man gemeinsam mit den Partnern „maßgeschneiderte Lösungen basierend auf den Anforderungen der Endkunden“.

Christian Eisner, Solution Architect – Modern Datacenter bei Siewert & Kau.(Bild:  Siewert & Kau)
Christian Eisner, Solution Architect – Modern Datacenter bei Siewert & Kau.
(Bild: Siewert & Kau)

Christian Eisner, Solution Architect – Modern Datacenter bei Siewert & Kau, sieht für den Edge-Computing-Markt als Grundlage der Industrie 4.0 ein steiles Wachstum. Er nennt „steigende Anforderungen an Latenz, Bandbreite, Datenschutz und Konnektivität sowie das Zusammenspiel mit KI“ als Gründe und verweist auf eine IDC-Studie im Auftrag von Dell. Danach würden 75 Prozent der Unternehmen beabsichtigen, ihre Investitionen in Edge-Lösungen binnen der kommenden zwei Jahre um durchschnittlich 37 Prozent zu steigern. Sein Kollege Pilgram ergänzt: „Edge Computing wird sich auf jede Branche auswirken, doch bevor dies der Fall ist, müssen Unternehmen einige universelle Herausforderungen bewältigen. Da die Zahl der intelligenten Geräte weiter zunimmt, müssen Unternehmen schnell und in großem Umfang handeln, um eine wertvolle Edge-Infrastruktur aufzubauen – und dabei die Sicherheit gewährleisten.“

AMD hat mit den Epyc-Prozessoren der Serie 8004 (Siena) bereits im September 2023 leistungsfähige CPUs mit bis zu 64 Zen-4c-Cores für robuste Edge-Server wie den Lenovo ThinkEdge SE455 V3 auf den Markt gebracht. Intel hat für die erste Hälfte 2025 den Xeon 6 SoC angekündigt. Granite Rapids-D, so der Codename der kommenden CPU für Edge-Server, wird deutlich mehr Kerne als die 22 Cores bietet, die derzeit die Ice-Lake-CPUs für Edge Computing bieten.

(ID:50143301)