Auf Basis der Nvidia AI Data Platform Cloudian stellt S3‑kompatible KI‑Infrastruktur vor

Von Michael Matzer 4 min Lesedauer

Anbieter zum Thema

Eine KI‑fähige Lösung für den hausinternen Einsatz vereinfacht die Bereitstellung vollintegrierter Plattformen für beschleunigte Rechen- und Speichernetzwerke in S3‑kompatiblen Enterprise‑Umgebungen – besonders wichtig für MSP.

Eine Top-Level-Ansicht auf die Cloudian AIDP: Auf der Basis der DAIP kann KI Unternehmensdaten in KI-Erkenntnisse umwandeln.(Bild:  Cloudian)
Eine Top-Level-Ansicht auf die Cloudian AIDP: Auf der Basis der DAIP kann KI Unternehmensdaten in KI-Erkenntnisse umwandeln.
(Bild: Cloudian)

Cloudian, ein Anbieter softwaredefinierter Objektspeicherlösungen, hat seine „HyperScale AI Data Platform“ vorgestellt. Diese KI‑fähige Lösung basiert auf S3‑API‑Speicher, sei kompatibel mit bestehenden Datensätzen und Anwendungen und lasse sich nahtlos bis in den Exabyte‑Bereich skalieren. Die Plattform unterstützt das S3‑Speicherprotokoll über Remote Direct Memory Access (RDMA), das die CPU und den TCP/IP-Stack umgeht, und soll dadurch höhere Leistung und Effizienz für KI‑Workloads bieten. Die Plattform basiert nach Angaben des Herstellers auf der Nvidia-RTX-PRO-6000-Blackwell-Server-Edition-GPU und folgt dem Referenzdesign der Nvidia AI Data Platform.

Bildergalerie

Die Cloudian HyperScale AI Data Platform soll eine der zentralen Herausforderungen bei der Einführung von Agentic AI und GenAI lösen: Ihre umfangreichen Bestände an unstrukturierten Daten lassen sich sofort für KI‑Anwendungen erschließen und nutzbar machen. Damit könnten Organisationen auf die 90 Prozent ihrer Daten zuzugreifen, die unstrukturiert vorliegen, beispielsweise Berichte, Handbücher, Präsentationen und Multimediainhalte, die das interne Wissen ausmachen.

Komplexe Infrastrukturanforderungen eliminieren

Traditionelle KI‑Implementierungen erfordern in der Regel komplexe, dedizierte Dateisysteme und separate Vektordatenbanken, um die nötige Performance zu erreichen – ein kostenintensiver und zeitaufwändiger Prozess, der spezielles Know-how verlangt, das vielen IT-Teams fehlt. Sie müssten entweder in neue Talente investieren oder sich mit einer schlechteren KI-Leistung zufriedengeben.

Cloudian will diese Hürden beseitigen, indem Unternehmen KI‑Applikationen direkt auf den nativen S3‑kompatiblen Datenquellen betreiben können, also ohne zusätzliche Dateisystemebenen oder eine separate Vektordatenbank‑Infrastruktur. Dieser Ansatz reduziere die Komplexität drastisch, beschleunige Implementierungen und erlaube es, bestehendes IT‑Knowhow und vorhandene Infrastrukturinvestitionen optimal zu nutzen.

Unternehmensdaten in KI‑fähige Informationen verwandeln

Die Lösung bringe KI‑Rechenleistung direkt an die Datenspeicher und mache diese automatisch zur KI‑fähigen Infrastruktur. Dank einer in die Speicherebene integrierten Vektordatenbank würden multimodale, unstrukturierte Inhalte automatisch aufgenommen, eingebettet und indiziert. So ließen sich Daten sofort über Vektorsuchschnittstellen finden und für RAG-Workflows (Retrieval‑Augmented‑Generation) bereitstellen.

Dieser Ansatz soll sicherstellen, dass KI‑Agenten im gesamten Unternehmen Informationen nahezu in Echtzeit auffinden, durchsuchen und analysieren können. Datensilos würden aufgelöst, und Unternehmen könnten in der Agentic-AI-Ära, in der KI‑Systeme unmittelbaren Zugriff auf das gesamte interne Wissen benötigen, ihre Wettbewerbsfähigkeit sichern. Die oben erwähnte S3‑over‑RDMA‑Fähigkeit steigere die Leistung zusätzlich, indem sie höhere Lese‑ und Schreibdurchsätze liefere und den Zugriff auf KI‑Speicherressourcen optimiere.

Infrastruktur für KI‑Agenten

Durch die Kombination aus beschleunigtem Computing und integrierten Vektordatenbank‑Funktionen direkt auf der Speicherebene mache die HyperScale AI Data Platform den Aufbau und Betrieb komplexer, separater KI‑Infrastrukturen überflüssig. Dieser Ansatz beseitige technische Barrieren, die die KI‑Einführung bislang erschwert hätten, und ermögliche eine schnelle Bereitstellung auf Basis vorhandener IT‑Fähigkeiten und bestehender Infrastruktur.

Wesentliche Komponenten der Lösung sind Nvidia-RTX-PRO-6000-Blackwell-GPUs, Nvidia-BlueField-DPUs und Nvidia-AI-Enterprise-Software, darunter Nvidia NIM Microservices und Nvidia NeMo Retriever Microservices. Nvidia-Spectrum‑X-Ethernet‑Networking liefere mit RDMA und direkten Datenpfaden zwischen Storage, Systemspeicher und GPU‑Speicher eine hohe Performance von bis zu 35 GB/s pro Knoten (Lesegeschwindigkeit). Dies soll bis auf Terabytes pro Sekunde skalierbar sein.

Die Lösung ermöglicht es Unternehmen, KI‑Agenten bereitzustellen, die das gesamte Unternehmenswissen sofort verstehen, abfragen und auswerten können – und schafft damit die Basis, um KI‑Agenten zentral in Geschäftsprozesse zu integrieren. „Die HyperScale AI Data Platform markiert einen grundlegenden Wandel in der Art und Weise, wie Unternehmen ihre KI‑Readiness angehen“, sagt Neil Stobart, CTO bei Cloudian.

Bildergalerie

Cloudian-Objektspeicher wird in der HyperStore-Produktfamilie angeboten. Hierauf lässt sich mit S3 zugreifen, aber auch mit SMB und NFS. Die Hyperstore-Nodes können sowohl Festplatten als auch TLC-NVMe-SSDs enthalten.

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Als Sprachmodell verwendet die Hyperscale AI Data Platform das Llama-3.2-3B-Instruct-LLM von Meta. Die vier Nvidia-GPUs pro Knoten erledigen jeweils eine Aufgabe, nämlich LLM-Inferenz, Arbeiten der Vektordatenbank, Re-Ranking und Relevanz sowie eine gemeinsame Aufgabe für Vektor-Einbettungen und andere Aufgaben.

Der Nutzer bedient eine einfache grafische Benutzeroberfläche, in der er im Prompt Fragen stellen und sie dann verfeinern kann, ähnlich wie in ChatGPT oder einem anderen Chatbot. Die naheliegenden Use-Cases sind die Abfrage von Unternehmenswissen, die Abfrage geschützter Dokumente, die Auswertung von Video-Inhalten sowie der Aufbau von Datenableitungen und Audit-Trails im Hinblick auf Compliance und Governance.

Aktuelles eBook

Storage-Software als Effizienzbooster

eBook Storage-Software als Effizienzbooster
eBook „Storage-Software als Effizienzbooster“
(Bild: Storage-Insider)

Mit der geeigneten Storage-Software kann sich ein Unternehmen einen Effizienzbooster ins Haus holen oder in der Cloud abonnieren. Dieser Booster steigert nicht nur die Performance der geschäftskritischen Anwendungen, sondern optimiert auch die Kosten der bereits installierten Speichersysteme.

Die Themen im Überblick:

  • Herausforderungen eines modernen Speichersystems
  • Methoden und Technologien effizienter Speichersysteme
  • Effizienter Speicher mit Pure Storage, AWS, Cohesity und Dell

(ID:50644634)