KI-Modelle Amazon Nova in AWS-Region Frankfurt verfügbar

Von Alexander Siegert 2 min Lesedauer

Anbieter zum Thema

Die neue KI-Modellreihe Amazon Nova ist ab sofort in der EU über die Region Frankfurt verfügbar. Diese Erweiterung ermöglicht es, Cross-Region-Inferenzprofile zu nutzen. Damit sollen eine niedrige Latenz erreicht und Kosten gespart werden.

Anfragen an Amazon Nova landen nun auch in der Frankfurter AWS-Region.(Bild:  Midjourney/KI-generiert)
Anfragen an Amazon Nova landen nun auch in der Frankfurter AWS-Region.
(Bild: Midjourney/KI-generiert)

Amazon Web Services hat neue regionale Verarbeitungsoptionen für seine Foundation-Modelle der Amazon Nova-Reihe angekündigt. In der Europäischen Union werden die drei KI-Modelle – Nova Micro, Lite und Pro – künftig in Rechenzentren in Frankfurt, Paris, Stockholm und Irland gehostet. Im Asien-Pazifik-Raum stehen die Modelle in den AWS-Rechenzentren in Tokio, Seoul, Mumbai, Singapur und Sydney zur Verfügung.

Die drei Modelle

Amazon Nova Micro ist ein Textmodell mit niedriger Latenz und geringen Kosten. Es soll sich besonders für Sprachverständnis, Übersetzung, Argumentation, Codevervollständigung, Brainstorming und mathematische Problemlösungen eignen. Mit einer Geschwindigkeit von 200 Token pro Sekunde ist es für Anwendungen, die schnelle Reaktionen erfordern, gedacht.

Amazon Nova Lite ist ein multimodales Modell, das Bild-, Video- und Texteingaben schnell verarbeiten soll. Es bietet hohe Genauigkeit bei verschiedenen Aufgaben und eignet sich laut AWS besonders für interaktive Anwendungen, bei denen niedrige Kosten wichtig sind.

Amazon Nova Pro ist ein multimodales KI-Modell, das sich für Aufgaben wie Videozusammenfassungen, mathematisches Denken, Softwareentwicklung und agentenbasierte Workflows eignet. Das Modell zeichnet sich durch hohe Genauigkeit in Text- und Bildverarbeitung aus und kann komplexe Anweisungen befolgen. Insgesamt sei es ein vielseitiges und effizientes Tool für verschiedene Anwendungen. Pro und Lite haben eine maximale Token-Anzahl von 300.000.

Alle Modelle sind laut AWS nahtlos in dem GenAI-Service Amazon Bedrock integriert und können über 200 Sprachen verarbeiten. Größere AWS-Partner wie Ativion, Cognigy, Deloitte, Palantir und SAP nutzen die Modell-Familie bereits.

Regionsübergreifende Inferenz

Über die Region Frankfurt können nun Cross-Region Inferenzprofile angelegt werden. Durch die Erstellung eines Inferenzprofils, das mehrere Regionen umfasst, können Anfragen dynamisch an Nova weitergeleitet werden. Um die Latenz gering zu halten, wird die Quellregion priorisiert. Der Hyperscaler verspricht, dass die regionsübergreifende Inferenz den Durchsatz erhöhen und ungeplante Datenverkehrsspitzen besser bewältigen kann.

Laut AWS fallen keine zusätzlichen Routing-Kosten für die Nutzung der regionsübergreifende Inferenz an; die Preise basieren auf der Region, von der aus das Inferenzprofil aufgerufen wird.

(ID:50339100)

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung