Prozessortrends 2019 Die Prozessoren werden modular
Während das Jahr 2018 in der Prozessorwelt vor allem durch evolutionäre Entwicklungen und Schadensbegrenzung geprägt war, will man 2019 wieder große Sprünge machen. AMD kommt mit Zen 2 und 64 Prozessorkernen, Intel endlich mit einer neuen Prozessorarchitektur. Der Trend geht dabei zu modularen Prozessoren.
Anbieter zum Thema

Sowohl Intel als auch AMD brachten im Jahr 2018 vor allem Prozessoren auf den Markt, die auf der Basis bestehender Prozessorarchitekturen mehr Kerne und Verbesserungen im Detail brachten. Zusätzlich waren die Entwickler damit beschäftigt, Maßnahmen gegen mögliche Angriffe zu ergreifen, die durch die spekulative Ausführung von Befehlen möglich wurden. Für die diversen Spectre-Lücken waren praktisch alle modernen Prozessoren anfällig, Intel hatte zusätzlich noch mit der Meltdown-Attacke zu kämpfen. Komplett ausgestanden ist das zwar noch nicht, aber kommende Prozessoren werden wohl mit Hardware-Änderungen zum Schutz vor diesen Angriffen ausgestattet sein, die dann nicht soviel Leistung kosten, wie die aktuellen Soft- und Firmware-Fixes. Das Jahr 2019 soll der Computerwelt dagegen endlich wieder größere Sprünge bei der Prozessorarchitektur und der -herstellung bringen. Vor allem Intel hat viel aufzuholen. Aber auch AMD hat einiges in petto.
AMDs Wege führen nach Rom
Nach einer langen Durststrecke konnte AMD mit Zen gegenüber dem großen Konkurrenten wieder Boden gutmachen. Mit den diversen Ryzen-Modellen hat die Firma wieder konkurrenzfähige Prozessoren für PCs und Notebooks auf Lager. Mit den Epyc-CPUs gelingt die Rückkehr ins Datacenter und zu den Cloud-Anbietern. Auf dem Next-Horizon-Event gab der Hersteller einen Einblick in die Pläne für 2019 und darüber hinaus.
Unter dem Codenamen „Rome” läuft die nächste Generation des Server-Prozessors Epyc, der 2019 auf den Markt kommt. Er basiert auf der Zen-2-Microarchitektur und verdoppelt die Anzahl der Prozessorkerne gegenüber dem aktuellen Epyc von 32 auf 64 und die Anzahl der Threads auf 128. Der neue Prozessor besteht wieder aus mehreren Dies auf einem gemeinsamen Prozessorgehäuse. Allerdings verfolgt AMD bei Rome einen anderen Ansatz als bisher: Der 64-Core-Prozessor besteht aus acht CPU-Modulen, die AMD als „Chiplets” bezeichnet, und einem zentralen I/O-Modul mit acht Speicherkanälen. Diese Konstruktion soll unter anderem dafür sorgen, dass die Latenz bei Speicherzugriffen für alle Cores gleich ist. Die Verbindung zwischen den Chiplets und dem I/O-Die übernimmt AMDs Infinity Fabric, eine Weiterentwicklung von HyperTransport.
Die Chiplets werden von TSMC in einem 7-nm-Verfahren hergestellt. Für das I/O-Die kommt ein 14-Nanometer-Verfahren zum Einsatz. Hier soll Global Foundries der Hersteller sein. Zusätzlich zur größten Anzahl von Cores bei einer x86-CPU wird Rome zudem als erster Server-Prozessor PCI-Express 4.0 unterstützen. PCIe 4.0 soll die Geschwindigkeit von PCIe 3.0 verdoppeln. Der Prozessor bietet laut AMD insgesamt 128 Lanes, die wohl auf die acht Chiplets aufgeteilt sind. Hier hat der Hersteller noch keine Details genannt. In einer Dual-Prozessor-Konfiguration werden jeweils 64 Lanes für die Verbindung der CPUs über Infinity Fabric genutzt. Die einzelnen Cores sollen laut Mark Papermaster, CTO und Senior Vice President of Technology and Engineering bei AMD, zudem über eine verbesserte Execution Pipeline verfügen. Dazu kommen Verbesserungen bei der Sprungvorhersage, beim Prefetching von Instruktionen und ein vergrößerter Micro-Op-Cache. Gegenüber dem aktuellen Epyc verspricht Papermaster zudem eine Vervierfachung der Fließkomma-Leistung, da die Zen-2-Mikroarchitektur die Load-Store-Unit und die Ausführungseinheiten der FPU von 128 auf 256 Bit aufbohrt. Zudem sollen Änderungen in der Hardware die Zen-2-Prozessoren auch ohne Microcode-Updates gegen Spectre-Angriffe immun machen.
Die Trennung des Prozessors in einzelne CPU-Chiplets und einen I/O-Baustein bringt AMD mehr Flexibilität und geringere Herstellungskosten. Nur die relativ kleinen CPU-Dies werden im kostspieligen 7-nm-Verfahren hergestellt, das weniger performancekritische I/O-Die in einem bewährten und günstigen 14-nm-Prozess. CPUs mit weniger Kernen, etwa für Desktop-PCs, lassen sich leicht aus einer geringeren Zahl von Chiplets und einem kleineren I/O-Die zusammenstellen. Das wird bei der dritten Generation der Ryzen-Desktop-Prozessoren der Fall sein. Auf der CES in Las Vegas gab die AMD-Chefin Lisa Su eine ersten Ausblick auf den Sockel-AM4-Prozessor, der unter dem Codenamen „Matisse“ entwickelt und Mitte des Jahres offiziell vorgestellt werden soll. Er soll die erste Desktop-CPU mit PCI-Express-4.0-Unterstützung werden. Auf der Messe lieferte ein Vorserienprozessor mit acht Cores und nicht genannter Taktfrequenz im Raytracing-Benchmark Cinebench 15 eine ähnliche Leistung wie Intels Achtkerner Core i7-9900K, allerdings mit einer um 30 Prozent geringeren Leistungsaufnahme. Das spricht dafür, dass die Verbesserungen in der Mikroarchitektur das gewünschte Ergebnis bringen und auch der 7-Nanometer-Prozess bei TSMC gut funktioniert.
Picasso für Notebooks
Die auf der CES vorgestellte zweite Generation der Ryzen-Prozessoren für Notebooks, Codename „Picasso“ ist dagegen noch nicht modular aufgebaut, sondern ein im Detail verbesserter Die-Shrink der bisherigen mobilen Ryzen-2000-Prozessoren von 14 auf 12 Nanometer. Die neuen Ryzen-3000-Prozessoren mit zwei oder vier Zen+-Cores und integrierter Radeon-Vega-Grafikeinheit werden weiterhin als U-Variante mit 15 Watt TDP und neu als stärkere Ryzen-5- oder Ryzen-7-H-Version mit 35 Watt TDP angeboten. Sie wird, im Gespann mit einer dedizierten Grafikkarte, etwa in Gaming-Notebooks eingesetzt. Das Einstiegsmodell der Picasso-Familie ist der Athlon 300U, im Prinzip ein Ryzen 3 3200U mit reduzierter Taktfrequenz. Die für Chromebooks neu vorgestellten Prozessoren AMD A6-9220C und AMD A4-9120C sind noch APUs mit 28-nm-Excavator-Modulen aus der Ära vor den Zen-Cores, allerdings mit sechs Watt TDP. Erste Chromebooks mit AMD-Prozessoren sind das Acer Chromebook 315 und das HP Chromebook 14
Radeon Instinct für das Datacenter
Die Vega-GPUs auf den Datacenter-Beschleunigerkarten AMD Radeon Instinct MI60 und MI50 werden ebenso wie die Zen-2-Cores bei TSMC in einem 7-nm-Verfahren hergestellt. Mit ihnen will AMD den Vorsprung von Nvidia bei Beschleunigerkarten für HPC und KI wieder aufholen, den sich die Firma mit Tesla erarbeitet hat. Die AMD-Karten unterstützen aktuelle Deep-Learning-Frameworks wie TensorFlow und PyTorch. Die offene HPC-Software-Plattform ROCm kommt passend zu den Karten in einer erweiterten Version. Die Radeon-Instinct-Karten sollen mit ihrem PCIe-4.0-Interface zudem optimal mit dem neuen Epyc-Prozessoren zusammenarbeiten. Die Karten basieren auf der Vega-Architektur und sind mit HBM2 als Speicher ausgestattet. Die MI60 kommt mit 32 GB ECC-Speicher, die MI60 mit 16 GB. Laut AMD sind die Radeon-Instinct-Karten außerdem die einzigen GPUs mit Hardware-Virtualisierung.
Intel: Sonne und Eis
Auch wenn Intel von vielen Beobachtern auf dem absteigenden Ast gesehen wird: Die Firma verdient immer noch prächtig. Bei Prozessoren für Notebooks und Convertibles spielt AMD bloß eine Nebenrolle, und auch im Servermarkt nimmt Epyc nur langsam Fahrt auf. Trotzdem hat Intel ein Problem. Die Firma hat sich zu sehr daran gewöhnt, den Markt für x86-Prozessoren in der Tasche zu haben, und verlagerte ihr Interesse auf neue Geschäftsfelder wie Wearables oder Drohnen. Gleichzeitig verabschiedete sich der Hersteller vom Tick-Tock-Modell und lieferte immer neue Varianten seiner 14-Nanometer-Prozessoren mit mehr Kernen und ansonsten nur graduellen Verbesserungen.
Zuletzt stellte Intel auf der CES eine Reihe von Core-Prozessoren mit deaktivierter GPU vor, die als F- beziehungsweise KF-Modelle auf den Markt kommen und vor allem die Gamer-Gemeinde ansprechen sollen, für die eine integrierte Grafikeinheit sowieso überflüssig ist. Mit einer höheren Taktfrequenz warten die GPU-losen Prozessoren allerdings nicht auf, und wirklich neu ist nur der Core i3-9350KF als erster Core i3 mit Turbo-Boost. Eine stabile Fertigung von 10-nm-Prozessoren konnte Intel bislang nicht auf die Beine stellen. Es wurden wohl nur einige wenige Cannon-Lake-CPUs wie der Core i3-8121U hergestellt und das Projekt wohl beerdigt. Damit kommt die 10-Nanometer-Massenproduktion erst mit „Ice Lake“, den für Ende 2019 geplanten Core-U- und CoreY-Mobilprozessoren auf Basis der neuen Sunny-Cove-Mikroarchitektur. Dabei soll der 10-nm-Prozess Intel wohl ähnliche Strukturbreiten ermöglichen, wie der 7-nm-Prozess von TSMC. Später sollen Desktop- und 2020 auch Xeon-Prozessoren aus der Ice-Lake-Familie folgen.
Bei den Xeon-Prozessoren werden in diesem Jahr zunächst mit Cascade Lake und später mit Cooper Lake noch zwei 14-Nanometer-Zwischenschritte eingelegt. In ihnen will Intel speziell Funktionen für die Beschleunigung von AI-Workloads integrieren, die unter der Bezeichnung „DL Boost“ zusammengefasst werden. Cascade Lake kommt mit bis zu 48 Cores und 12 Speicherkanälen. Er wird zudem Intel Optane DC Persistent Memory unterstützen, also Optane-Speicher in Form von DDR4-Pin-kompatiblen DIMMs. Unter dem Namen „Snow Ridge“ arbeitet der Hersteller an einem 10-Nanometer-SoC, der für 5G-Basisstationen und Edge-Computing bestimmt ist
Den 10-Nanometer-Prozess bei CPUs mit Sunny-Cove-Architektur nutzt Intel, um mehr Transistoren auf dem Die unterzubringen. Sunny Cove bringt einen um 50 Prozent größeren Level-1-Daten-Cache, einen vergrößerten Leve-2-Cache und einen Micro-Op-Cache, der mehr als die bisherigen 2.048 Einträge fassen soll. Dazu kommen zehn statt bisher acht Execution-Ports, um so mehr Instruktionen pro Takt verarbeiten zu können. Der Chiphersteller stellte für Sunny Cove auf den Architecture Days im Dezember zudem Erweiterungen der Architektur in Aussicht. Neben DL Boost für AI nennt Intel auch Kryptografie-Funktionen. Der Memorycontroller unterstützt den schnelleren LPDDR4X-Arbeitsspeicher. Die im Ice-Lake-Prozessor integrierte Grafikeinheit soll im Vergleich zu den aktuellen Kaby-Lake und Coffee-Lake-Prozessoren deutlich schneller werden. Mit 64 statt wie bisher 24 Ausführungseinheiten soll sie eine Rechenleitung von mehr als einem Teraflop liefern. Dazu kommen Fähigkeiten wie Tile Based Rendering – Intel ist hier Nachzügler – oder die Unterstützung von Adaptive Sync und HDR. Auf der Chipsatzebene steht für Ice Lake die Integration von Tunderbolt 3 und 802.11ax auf der Tagesordnung.
Mit Foveros in die dritte Dimension
Erste Schritte in Richtung modularer Prozessoren aus mehreren Chiplets machte Intel bereits mit der Embedded Multi-Die Interconnect Bridge (EMIB). Sie wird für die Integration von FPGAs auf einem x86-Prozessor oder die Koppelung von Intel-Core-Prozessor und AMD-Radeon-GPU bei den Kaby-Lake-G-Prozessoren verwendet. Mit dem Projekt „Foveros“ folgt nun der Schritt in die dritte Dimension durch das Stacking von Chiplets. Dabei sollen für verschiedene Aufgaben des Prozessors unterschiedliche Arten von Chiplets mit unterschiedlichem Herstellungsprozess kombiniert werden. Beispiele sind High-Performance-CPUs, AI-Prozessoren, sehr sparsame CPUs, FPGAs, Speicher, Sensoren oder Funknetzwerk-Chiplets.
Erste Hardware auf Basis von Foveros zeigte Intel auf der CES mit der Client-Plattform „Lakefield“ mit einem Hybrid-Prozessor. Er kombiniert ein 10-nm-Sunny-Cove-Chiplet, einen Quadcore-Atom der kommenden Tremont-Generation und den Arbeitsspeicher in einem 3D-Package. Damit können die Entwickler ein sehr kleines Mainboard bauen, das auch bei kompakten 2-in-1-Mobilrechnern viel Platz für den Akku lässt.
Intel greift mit Lakefield das bei ARM-Prozessoren gängige big.LITTLE-Konzept auf, das langsame, aber sehr sparsame Cores für Routineaufgaben und Connected-Standby mit schnellen Cores für anspruchsvollere Anwendungen kombiniert. Ein LTE- oder später auch 5G-Model dürfte ebenfalls zur Ausstattung von Mobilrechnern mit dem neuen Hybrid-Prozessor gehören. Mit diesem Konzept reagiert Intel auf die gemeinsam von Qualcomm und Microsoft aus der Taufe gehobenen Always Connected PCs mit ARM-CPU.
Qualcomm und Windows on ARM
Da das Geschäft mit Smartphones nicht mehr nennenswert wächst, das mit ARM-Tablets sogar rückläufig ist und zudem die Konkurrenz chinesischer ARM-Hersteller immer stärker wird, bringt die US-Chipschmiede ihre ARM-SoCs nun in Windows-2-in-1-Notebooks unter. Sie sollen eine extrem lange Connected-Standby-Zeit bieten und auch im Betrieb länger abseits der Steckdose durchhalten, als vergleichbare Geräte mit x86-Prozessor. Zudem ist in den Snapdragon-SoCs ein LTE-Modem bereits integriert. Microsoft unterstützt Qualcomm durch eine eigene Windows-10-Version für ARM-Prozessoren. Das Betriebssystem und Universal-Apps laufen dabei nativ auf dem ARM-Prozessor. Für herkömmliche Windows-Programme ist eine x86-Emulationsschicht zuständig, auf der allerdings nur 32-Bit-Programme laufen. Erste Geräte mit Snapdragon 835 konnten nicht überzeugen, da die Performance der Emulation sehr zu wünschen übriglässt. Etwas besser, aber immer noch nicht optimal, ist die Leistung von Geräten mit dem stärkeren Snapdragon 850.
Ein deutliches Plus an Leistung bei trotzdem niedriger Leistungsaufnahme soll der Snapdragon 8cx liefern. Er wird der erste 7-nm-Notebook-Prozessor und soll den Snapdragon 850 nicht ersetzen, sondern als Top-Modell ergänzen. Auf dem SoC sitzt eine Kryo-495-CPU mit acht 64-Bit-Cores und big.LITTLE-Aufbau. Sie verfügt über größere Caches als der Kryo-385 mit Snapdagon 850. Die Adreno-680-GPU soll doppelte Performace liefern, wie die Grafikeinheit im Snapdragon 850. Zusätzlich soll der Snapdragon 8cx bis zu 16 GR RAM und NVMe-SSDs unterstützen. Das integrierte LTE-Modem soll Datenraten von zwei Gbps liefern, eine spätere Erweiterung auf 5G soll mit einen zusätzlichen Modem möglich sein.
(ID:45663162)