Definition Was ist Dall-e?

Von SiLip 2 min Lesedauer

Anbieter zum Thema

Dall-e ist ein von OpenAI entwickeltes Computerprogramm, das Bilder aus Textbeschreibungen erstellen kann. Die Grundlage hierfür bildet maschinelles Lernen. Mittlerweile existieren mit Dall-e 2 und Dall-e 3 zwei Nachfolger.

Grundlagenwissen zum IT-Business(Bild:  © adiruch na chiangmai - Fotolia.com)
Grundlagenwissen zum IT-Business
(Bild: © adiruch na chiangmai - Fotolia.com)

Der Text-zu-Bild-Generator Dall-e ist eine generative künstliche Intelligenz (KI), die in der Lage ist, digitale Bilder auf Basis natürlichsprachiger Textanweisungen zu generieren. Die Bezeichnung ist ein Kofferwort, das sich aus den Namen des spanischen Surrealisten Salvador Dalí und der Hauptfigur des Animationsfilms “Wall-e - Der Letzte räumt die Erde auf“ zusammensetzt.

Grundlegende Fähigkeiten von Dall-e

Auf Grundlage sprachlicher Anweisungen erstellt Dall-e Bilder in unterschiedlichsten Stilrichtungen, angefangen von Zeichnungen und Gemälden über fotorealistische Bilder bis hin zu Abbildungen dreidimensionaler Modelle und Objekte. Zu den Fähigkeiten der KI zählen darüber hinaus:

- das Erweitern bestehender Bilder,

- das Entfernen und Hinzufügen von Elementen,

- das Verändern des Hintergrundes,

- das Berücksichtigen von Reflexionen, Schatten und Texturen,

- das Generieren von Bildvariationen sowie

- das Erstellen von Abbildungen aus unterschiedlichen Blickrichtungen.

Funktionsprinzip und zugrundeliegende Technologien

Vereinfacht dargestellt ist der Bildgenerator in der Lage, Texteingaben in ein Arrangement aus Pixeln umzuwandeln und auf diese Weise digitale Bilder zu erzeugen. Hierfür nutzt er verschiedene KI-Algorithmen und -Modelle.

Eine wichtige Funktionsgrundlage bildet der OpenAI-Textgenerator GPT-3, der Dall-e befähigt, Texteingaben zu verstehen. Das mit mehreren hundert Millionen Bild-Text-Paaren trainierte künstliche neuronale Netzwerk Clip hilft der KI dabei, passende Verbindungen zwischen der Textbeschreibung und Bildern herzustellen. Zum Generieren und Editieren von Bildern nutzt Dall-e das generative Diffusion-Modell Glide.

Anfangs haben die vom Bildgenerator erzeugten Bilder eine niedrige Auflösung. Aus ihnen entsteht anschließend über einen Up-Sampling-Mechanismus eine Bildversion mit höherer Auflösung.

Nutzungsmöglichkeiten für Dall-e

Voraussetzung für die Nutzung ist ein entsprechender Account bei OpenAI. Über diesen lässt sich Dall-e via Weboberfläche online ansprechen. User haben die Möglichkeit, über eine Befehlszeile eine Bildbeschreibung für ein zu erzeugendes Bild einzugeben oder über eine “Surprise me“-Option ein Bild ohne spezielle Anweisung erstellen zu lassen.

Bei der ersten Variante hängt das Ergebnis im Wesentlichen von der Exaktheit der textlichen Beschreibung ab. Dall-e generiert jeweils mehrere Bildversionen, die sich im Anschluss vergrößern und herunterladen lassen.

Rechtliche Fragestellungen bei der Nutzung

Derzeit (Stand: Oktober 2023) gibt noch es viele ungeklärte Fragen hinsichtlich des Urheberrechts und der Nutzungsrechte KI-generierter Bilder. Zudem existieren Rechtsunsicherheiten im Zusammenhang mit der Verwendung urheberrechtlich geschützter Bilder für das Training der Modelle. Hinzu kommt, dass KI-Bildgeneratoren trotz entwicklerseitiger Schutzmaßnahmen für Deepfakes und Desinformationskampagnen missbraucht werden können.

(ID:49748502)

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung