Agentic-AI-Software von Nutanix KI-Agenten von Nutanix im Produktivbetrieb

Von Klaus Länger 3 min Lesedauer

Anbieter zum Thema

Nutanix Agentic AI ist eine mit Nvidia AI Enterprise integrierte Full-Stack-Softwarelösung, die den Produktiveinsatz von KI-Agenten im großen Stil ermöglichen soll. Sie soll Komplexität und Token-Kosten reduzieren sowie die Sicherheit erhöhen.

Nutanix Agentic AI soll ein Cloud-Betriebsmodell für Enterprise-AI-Fabriken schaffen, mit dem Unternehmen ihre KI-Agenten einfacher verwalten und die darunterliegende Hardware effizienter nutzen können.(Bild: ©  sdecoret - stock.adobe.com / KI-generiert)
Nutanix Agentic AI soll ein Cloud-Betriebsmodell für Enterprise-AI-Fabriken schaffen, mit dem Unternehmen ihre KI-Agenten einfacher verwalten und die darunterliegende Hardware effizienter nutzen können.
(Bild: © sdecoret - stock.adobe.com / KI-generiert)

Der Einsatz von KI-Agenten im großen Maßstab stellt Unternehmen vor erhebliche Hürden. Schließlich geht es nicht nur um die Wahl des richtigen Modells und die Entwicklung einzelner Agenten, sondern um die Komplexität beim Managen einer Infrastruktur, in der Tausende KI-Agenten sicher betrieben und skaliert werden müssen. „KI-Infrastrukturen für das Trainieren von Modellen wurden dafür optimiert, eine einzelne große Aufgabe zu erledigen. Infrastrukturen für KI-Agenten im Produktivbetrieb hingegen müssen mit der Skalierung und hohen Änderungsrate von Tausenden von KI-Services und -Agenten, gleichzeitigen Nutzern und Entwicklern zurechtkommen“, gibt Thomas Cornely, Executive Vice President of Product Management bei Nutanix, zu bedenken. Die Full-Stack-Softwarelösung Nutanix Agentic AI soll diese Aufgaben erledigen, indem sie ein Cloud-Betriebsmodell für Enterprise-AI-Fabriken schafft. Sie ist auf dem Agent-Builder-Layer mit Nvidia AI Enterprise integriert und orchestriert das Nvidia-zertifizierte KI-Fabrik-Ökosystem für unterstützte Konfigurationen. Dabei besteht Nutanix Agentic AI aus einer ganzen Reihe von Software-Komponenten.

Die Agentic-AI-Software von Nutanix ist eng mit Nvidias AI Enterprise verknüpft und für Nvidia-Hardware ausgelegt.(Bild:  Nutanix)
Die Agentic-AI-Software von Nutanix ist eng mit Nvidias AI Enterprise verknüpft und für Nvidia-Hardware ausgelegt.
(Bild: Nutanix)

Automatische Optimierung der KI-Infrastruktur

Die erste Komponente der Lösung ist die Infrastruktur-Schicht mit dem Nutanix-AHV-Hypervisor im Zentrum. In einer Early-Access-Version, die Nvidia-Topologien erkennt, soll der AHV in der Lage sein, die Allokation physischer Ressourcen für virtuelle Maschinen auf Systemen mit hoher GPU-Dichte wie etwa Nvidia-HGX-Servern zu optimieren. Dabei soll sichergestellt werden, dass die virtualisierten Ressourcen wie vCPUs und Speicher im Einklang mit den GPUs und NICs arbeiten, derer sie sich bedienen. KI-optimierte VM-Profile sollen die Leistung durch ein automatisches, hardwarespezifisches Tuning erhöhen, ohne dass dafür komplexe manuelle Eingriffe notwendig sind. Dabei soll die Isolation der einzelnen VMs und damit deren Sicherheit gewahrt bleiben, verspricht der Hersteller. Für das massive LLM-Training oder Inferenz mit hohen Anforderungen an die Performance können alle acht GPUs in einem HGX-System einer einzelnen VM zugewiesen werden. Auf der Netzwerkebene spaltet Nutanix Flow den Datenverkehr für eine Maximierung des Durchsatzes auf: BlueField-3 DPUs erledigen die Datenaufnahme, damit mehr CPU- und Hauptspeicherressourcen für die Agentic-AI-Workloads zur Verfügung stehen.

Weiterentwickeltes Nutanix Unified Storage

Eine große AI Factory stellt ganz andere Anforderungen an die Datenplattform als eine Entwicklungsplattform. Gerade KI-Agenten benötigen durch längere Sessions größere und persistente Kontextfenster, die auch den Wechsel auf eine andere GPU überstehen. Für dieses Gedächtnis der KI-Agenten ist ein skalierbarer Storage mit niedriger Latenz notwendig. Daher integriert Nutanix mit LMCache einen Key-Value (KV) Cache-Manager in Unified Storage. Er soll nicht unmittelbar benötigte Daten aus den GPU-Nodes auf günstigeren Storage übertragen und wieder zurück, wenn das nötig ist.

Zudem greifen KI-Agenten permanent auf Unternehmensdaten zu, die dafür transformiert und in RAG-Pipelines übertragen werden. Laut Nutanix sollte das quasi in Echtzeit passieren, damit die Agenten akkurat arbeiten können. Daher sollten diese Pipelines möglichst im selben Storage Cluster angesiedelt sein, wie die Firmendaten.

Für eine hohe Performance unterstützt der Hersteller S3-over-RDMA- sowie NFS-over-RDMA. Nutanix Data Lens (NDL) soll in dem Konstrukt für Sicherheit und Governance sorgen, damit die Unternehmensdaten in dem ganzen Prozess geschützt bleiben. Der Hersteller ist zudem einer der Designpartner für Nvidia STX, die modulare Storage-Referenzplattform der nächsten Generation für Nvidias AI Factory mit Vera Rubin und BlueField 4.

Kubernetes-Plattform und Agentic-AI-Services

Die zweite Komponente ist die um einen mit umfangreichem KI-Katalog erweiterte Nutanix Kubernetes Platform. Der Hersteller stellt damit eine Sammlung vorgefertigter quelloffener KI-Entwickler-Tools wie AI-Notebooks, Vector-Datenbanken, MLOps-Workflow-Engines und Frameworks für KI-Agenten zur Verfügung. Zudem bietet die Kubernetes-Plattform einen AI Optimized Worker Pool, der auf der Kubernetes-Ebene automatisch die Provisionierung der korrekten VMs auf den GPU-Systemen übernimmt und damit die Komplexität für die Kubernetes-Administratoren reduziert.

Durch die Integration mit Nvidia AI Enterprise können Entwickler die NIM-Microservices von Nvidia einschließlich Nemotron schnell bereitstellen und damit die Entwicklung von KI-Agenten für den produktiven Einsatz beschleunigen. Eine Erweiterung der Model-as-a-Service-Funktionalitäten um weitere Modelle soll den Entwicklern mehr Flexibilität geben. Derzeit noch Tech-Previews sind die Unterstützung für Model Context Protocol (MCP)-Server und Fine Tuning sowie ein KI-Gateway-Service für eine einheitliche Regelkontrolle über private LLMs und solche in der Cloud. Der Gateway kann dabei die Verbindung zu mehreren Modellanbietern herstellen und für ein automatisches Fallback sorgen, wenn ein Anbieter ausfällt oder das für ihn vorgesehene Budget überschritten ist. Zudem soll der Dienst für Datenhoheit und durch granulare Token-Limits für die Kontrolle der Kosten sorgen.

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

(ID:50796641)