Computex 2024 Intel Lunar Lake: KI-Mobilprozessor der nächsten Generation

Von Klaus Länger 5 min Lesedauer

Anbieter zum Thema

Auf der Computex hat Intel den kommenden Low-Power-Mobilprozessor Lunar Lake mit starker NPU gezeigt. Mit ihm tritt Intel gegen Qualcomms Snapdragon X und AMDs ebenfalls in Taipeh vorgestellten Ryzen AI 300 im Rennen um die beste CPU für Copilot+-Notebooks an.

Bei Intels kommenden Mobilprozessor Lunar Lake haben die Entwickler vieles anders gemacht: Einen Arbeitsspeicher integriert, sehr schnelle E-Cores, flotte P-Cores ohne Hyperthreading, eine Xe2-Battlemage-GPU und eine neue NPU-Generation.(Bild:  Intel Corporation)
Bei Intels kommenden Mobilprozessor Lunar Lake haben die Entwickler vieles anders gemacht: Einen Arbeitsspeicher integriert, sehr schnelle E-Cores, flotte P-Cores ohne Hyperthreading, eine Xe2-Battlemage-GPU und eine neue NPU-Generation.
(Bild: Intel Corporation)

Bei den derzeit aktuellen Core-Ultra-Prozessoren der Meteor-Lake-Generation hat Intel ein Problem: Er verfügt zwar über eine eigene NPU, die für KI-Berechnungen optimiert ist, doch ist die Leistung relativ begrenzt. Sie genügt beispielsweise nicht den Ansprüchen von Microsoft an Prozessoren für das Copilot+-PC-Label. Die sind derzeit alle mit Snapdragon-X-Prozessoren von Qualcomm ausgestattet, da auch AMD noch keine passende Prozessoren im Portfolio hatte. Das wird sich mit der Ryzen-AI-300-Serie ändern, die von der AMD-Chefin Dr. Lisa Su auch gerade auf der Computex vorgestellt wurde.

Intel zieht nun mit Lunar Lake nach. Diese Mobilprozessoren mit starker NPU und integriertem Arbeitsspeicher werden gerade produziert. Mit ihnen bestückte Notebooks sollen im Herbst verfügbar sein.

Beim Intel-Lunar-Lake ist der Arbeitsspeicher in Form von zwei LPDDDR5x-Chips Teil des Prozessors. (Bild:  Intel Corporation)
Beim Intel-Lunar-Lake ist der Arbeitsspeicher in Form von zwei LPDDDR5x-Chips Teil des Prozessors.
(Bild: Intel Corporation)

Auf Effizienz und Performance getrimmt

Bei der Entwicklung von Lunar Lake hat Intel im Interesse der Effizienz das Gewicht noch stärker auf die sparsameren E-Cores gelegt als bei den bisherigen Hybrid-Prozessoren. Die sollen nun die Hauptarbeit verrichten, während die P-Cores nur bei hohen Anforderungen an die Rechenleistung zum Einsatz kommen. Dabei verspricht Intel eine intelligentere Klassifikation der Workloads durch den Thread Director. Mit den OS Containment Zones haben Software-Entwickler die Möglichkeit, festzulegen auf welchen Cores ihre Programme bevorzugt laufen sollen. Bei den P-Cores ist nun zudem eine feinere Taktregelung in 16,67-MHz-Schritten möglich. Bisher gab es nur 100-MHz-Schritte.

Die insgesamt vier Low-Power-E-Cores der neuen Skymont-Generation hat Intel gründlich aufgebohrt. Sie sollen durch tiefgreifende Verbesserungen in der Mikroarchitektur in Lunar Lake pro Kern die bis zu doppelte Leistung im Vergleich zu den Low-Power-E-Cores auf Meteor Lake liefern. Bei kommenden Prozessoren, Intel spielt dabei wohl auf Arrow Lake an, der für Desktop-PCs und leistungsstärkere Notebooks bestimmt ist, können die Skymont-E-Cores bei höherer Leistungsaufnahmen sogar die Performance der Raptor-Cove-P-Cores der Raptor-Lake-Generation erreichen, benötigen dafür aber weniger Energie.

Die neuen P-Cores der Lion-Cove-Generation, auf Lunar Lake sitzen ebenfalls vier davon, kommen ohne Hyperthreading, dafür aber ebenfalls mit einer optimierten Architektur, die mehr Instruktionen pro Taktzyklus verarbeitet. Gegenüber einem Redwood-Cove-Kern mit Hyperthreading kommt ein Lion-Cove-Core mit weniger Chipfläche aus und soll trotzdem eine um etwa 15 Prozent höhere Leistung pro Watt liefern. Eine der Neuerungen ist dabei eine zusätzliche Cache-Ebene. Den bisherigen L1-Cache mit 48 KB Größe hat Intel auf L0-Cache umgetauft, auch um auf die geringere Latenz von nur vier Taktzyklen hinzuweisen. Dazu kommt ein zusätzlicher 192-KB-Cache mit neun Ladezyklen, der nun als L1-Cache bezeichnet wird, und ein 2,5 MB großer L2-Cache.

Den P-Cores stehen zudem bis zu 12 MB gemeinsamer L3-Cache zur Verfügung. Die in einem Low-Power-Island angesiedelten E-Cores haben bei Lunar Lake keinen Zugriff auf den L3-Cache, sondern nutzen einen gemeinsamen, 4 MB großen L2-Cache.

Insgesamt verfügt Lunar Lake mit vier P- und vier Low-Power-E-Cores über weniger Kerne als die Core-Ultra-U-Prozessoren aus der Meteor-Lake-Familie. Dort gibt es zwar nur zwei P-Cores, allerdings mit Hyperthreading, aber gleich acht herkömmliche E-Cores und zwei Low-Power-E-Cores.

Bildergalerie
Bildergalerie mit 18 Bildern

NPU der vierten Generation

Die NPU der vierten Generation, Intel zählt hier offenbar auch die Movidus-Chips mit, liefert laut Hersteller eine KI-Leistung von bis zu 48 TOPS und übertrifft damit die Anforderungen von Microsoft für Copilot+-PCs deutlich. Sie ist damit mehr als vier mal so schnell wie die NPU 3 in Meteor Lake. Statt zwei Neural Compute Engines sitzen gleich sechs in der NPU4. In Ihnen haben die MAC Arrays für Matrix-Operationen ihren Platz. Dazu kommen noch jeweils zwei SHAVE DSPs (Streaming Hybrid Architecture Vector Engine) für Vektor-Operationen mit insgesamt 12-facher-Performance im Vergleich zur NPU 3.

Zudem arbeitet die neue NPU mit einer höheren Taktfrequenz und mit einer verdoppelten DMA-Bandbreite für größere Modelle. Schließlich soll sich die Leistung pro Watt deutlich verbessert haben.

Battlemage-GPU an Bord

Die integrierte GPU in Lunar-Lake verfügt über acht Xe-Cores der zweiten Generation, die Intel für die Arc-GPUs der kommenden Battlemage-Generation entwickelt hat. Der Hersteller verspricht dafür eine um 50 Prozent höhere Gaming-Performance im Vergleich zur Xe-GPU der ersten Arc-Generation in Meteor Lake und ein schnelleres Echtzeit-Raytracing. Eine neue Vektor-Engine mit Xe-Matrix-Extension-Engines (XMX) soll die KI-Leistung der GPU für Anwendungen wie Stable Diffusion um das mehr als fünffache der Meteor-Lake-GPU steigern – bis zu 67 INT8 TOPS sollen möglich sein.

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Insgesamt soll Lunar Lake damit bis zu 120 TOPS für unterschiedliche KI-Workloads schaffen: bis zu 48 mit der NPU, bis zu 67 mit der GPU und noch mal fünf mit den CPU-Cores (AVX-512 mit Vector Neural Network Instructions).

Die Display Engine in Lunar Lake unterstützt HDMI 2.1 und DisplayPort 2.1 für bis zu drei 4K60-HDR-Monitore, sowie den neuen Standard eDP 1.5 für das integrierte Display von Notebooks oder Tablets. Er soll ein verbessertes Panel Self Refresh ermöglichen und dadurch Energie sparen. Die Media Engine unterstützt effiziente VVC-Dekodierung (Versatile Video Coding) in Hardware.

Zwei Tiles und integrierter Arbeitsspeicher

Gesunken ist auch die Anzahl der Tiles, aus denen Lunar Lake aufgebaut ist. Waren es bei Meteor Lake noch vier, besteht Lunar Lake nur noch aus zwei aktiven Tiles: Dem Compute-Tile, das bei TSMC im N3B-Verfahren produziert wird, mit CPU-Cores, GPU und NPU als wesentlichen Komponenten und dem ebenfalls bei TSMC im N6-Verfahren produzierten Platform-Controller-Tile. Eine Lunar-Lake-Neuheit auf dem Compute-Tile ist ein 8 MB großer Memory-Side-Cache, der Zugriffe auf den Hauptspeicher reduzieren soll und so laut Intel die Performance steigert und die Leistungsaufnahme reduziert.

Aus Intel-Fertigung kommt bei Lunar Lake nur der Foveros-Interposer, der Compute- und Platform-Controller-Tile verbindet. Bei den folgenden Intel-Prozessoren Arrow Lake und vor allem Panther Lake sollen Kernkomponenten wieder aus Intels eigener Fertigung stammen.

Auf dem Platform-Controller-Tile sitzen der PCIe-Controller mit vier PCIe-Gen5- und vier PCIe-Gen4-Lanes, der Thunderbolt-4-Controller für drei Ports, der USB-Controller für USB 3.0 und USB 2.0, die LAN und WLAN-Controller sowie die Security-Engines. Der WLAN-Controller unterstützt Wi-Fi 7 und Bluetooth 5.4. Das zusätzlich nötige Companion Modul mit den Funk-Komponenten ist kleiner und schneller angebunden. Bei den Security Engines ist noch eine Partner-Security-Engine hinzugekommen.

Eine wesentliche Änderung bei Lunar Lake zu bisherigen Intel-Prozessoren ist der mit auf dem Base Tile integrierte Arbeitsspeicher im Form zweier LPDDR5X-Chips mit zusammen bis zu 32 GB Speicherkapazität. Diese Integration soll für einen schnelleren Zugriff auf den Speicher bei gleichzeitig geringerem Stromverbrauch sorgen. Zudem ermöglicht er Notebook-Herstellern den Bau kompakterer Mainboards. Insgesamt verspricht Intel für die Lunar-Lake-SoC eine um 60 Prozent höhere Akkulaufzeit in Real-Life-Szenarien.

(ID:50056053)