Definition Was ist ein Sprachmodell?

Von Seelenschrift 2 min Lesedauer

Anbieter zum Thema

Künstliche Intelligenzen sind ein hochbrisantes Thema. Fast die ganze Welt spricht aktuell über ChatGPT und ähnliche Programme. Vielen von ihnen liegt ein sogenanntes Sprachmodell zugrunde. Doch wie genau funktioniert das und was kann es uns bieten?

Grundlagenwissen zum IT-Business(Bild:  © adiruch na chiangmai - Fotolia.com)
Grundlagenwissen zum IT-Business
(Bild: © adiruch na chiangmai - Fotolia.com)

Als Sprachmodell galt lange Zeit das Verständnis, das ein Computer von der menschlichen Sprache hat. Der Computer kann es nutzen, um die Wahrscheinlichkeiten einer Wortfolge zu berechnen. Als Basis dafür wird die Annahme genutzt, dass bestimmte Wörter in einer konkreten Wortumgebung wahrscheinlicher vorkommen als andere (so folgt auf "Ich komme" häufiger das Wort "heim" als das Wort "weg"). Diese Technik wird als statistisches Sprachmodell bezeichnet.

Mittlerweile wird als Sprachmodell auch ein Computerprogramm bezeichnet, das natürliche Sprache verstehen und erzeugen kann. Diese sogenannten neuronalen Sprachmodelle sind eine Form des Machine Learnings. Dabei handelt es sich um die Fähigkeit eines Computers, aus Erfahrung zu lernen, ohne dass eine explizite Programmierung zugrunde liegt. So kommen für das Training von Sprachmodellen große Mengen an Text zum Einsatz, beispielsweise Artikel aus Internetenzyklopädien oder sogar fiktive Erzählungen.

Mögliche Anwendungsbereiche für Sprachmodelle

Sprachmodelle werden heutzutage in den unterschiedlichsten Bereichen eingesetzt. Beispielhafte Möglichkeiten sind:

  • Textvorschläge auf der Smartphone-Tastatur,
  • die automatische Textübersetzung,
  • die Spracherkennung von Smartphones und Sprachassistenten,
  • die Textgenerierung sowie
  • Chatbots und andere Bereiche des Kundenservices.

Einige Sprachmodelle können Voraussagen darüber treffen, wie wahrscheinlich ein bestimmtes Wort auf einen Teilsatz folgen wird. Das allseits bekannte ChatGPT hingegen ist ein Beispiel für ein Generative Language Model. Dabei handelt es sich um Sprachmodelle, die auf Basis großer Textmengen selbst natürliche Sprache erzeugen kann. Es kann dementsprechend kontextbezogen handeln, Dialoge führen und Fragen beantworten.

Künftig weitere Anwendungsbereiche

Die Möglichkeiten für den Einsatz von Sprachmodellen wachsen stetig weiter. Im Jahr 2017 fand ein chinesisches Forscherteam eine Möglichkeit, mithilfe eines Sprachmodells Softwarefehler zu entdecken. Das Modell wurde hierfür mit Fehlerberichten trainiert und konnte im Anschluss weitere fehlerhafte Programme erkennen. Anzunehmen ist, dass sich für Sprachmodelle zukünftig noch weitere Anwendungsbereiche eröffnen werden.

(ID:49542719)

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung