DALL-E 3 ist da und generiert exaktere KI-Bilder inkl. Text dank ChatGPT-Integration

// 13:37 Do, 21. Sep 2023von blip

OpenAI hat die neueste Version seines diffusionsbasierten KI-Bildgenerators DALL-E vorgestellt - er ist nun eng mit ChatGPT verzahnt, was gleich mehrere Vorteile bringt. So sollen Prompt-Vorgaben viel genauer befolgt werden als bisher und auch die Darstellung von Text in den generierten Bildern besser gelingen.

Tatsächlich heißt es, DALL-E 3 sei "built natively on ChatGPT", wobei es zur Modell-Architektur oder dem Training leider keine genauen technischen Deteils gibt. Durch den irgendwie multimodalen Ansatz entsteht ein anderes Verhältnis zwischen Sprache und Bild, was unter anderem in mehr Einfluss auf die Bildgeneration resultiert.

DALL-E 3 wird sogar direkt im Interface von ChatGPT laufen, sodass der Textgenerator gleich die genauen Prompts ausformulieren kann. Man müsse sich nur ein Bild wünschen und ChatGPT agiere dann als Vermittler zu DALL-E 3. Ein umständliches Prompt-Engineering gehöre damit der Vergangenheit an, so OpenAI. Wer möchte, kann natürlich auch selbst eine ausführliche Beschreibung seiner Bildidee eingeben.

Die von OpenAI ausgewählten Beispielsbilder - derzeit ist DALL-E 3 noch in einer geschlossenen Beta - zeigen in der Tat eine große Nähe zwischen Prompt und generiertem Bild:

Das folgende Bild wiederum basiert auf diesem Prompt - man beachte übrigens auch die tadellose Darstellung der Hände: "A middle-aged woman of Asian descent, her dark hair streaked with silver, appears fractured and splintered, intricately embedded within a sea of broken porcelain. The porcelain glistens with splatter paint patterns in a harmonious blend of glossy and matte blues, greens, oranges, and reds, capturing her dance in a surreal juxtaposition of movement and stillness. Her skin tone, a light hue like the porcelain, adds an almost mystical quality to her form."

DALL-E 3 ist da und generiert exaktere KI-Bilder inkl. Text dank ChatGPT-Integration

Auch Text wird korrekt eingefügt, hauptsächlich wenn er im Prompt wörtlich vorgegeben wird; dies hat zuvor nicht geklappt.

Grundsätzlich läßt sich auch in Bildern von DALL-E 3 noch Kauderwelsch finden. So enthielt der Prompt für das folgende Poster die Vorgabe "The bottom text reads, Explore Venus: Beauty Behind the Mist" - das wurde großteils, aber nicht ganz übernommen, während das Kleingedruckte wie zuvor frei fabuliert wurde.

Laut OpenAI sind mehrere Filter im neuen KI-Bildgenerator implementiert, nicht nur um die Darstellung von Gewalt u.ä. zu verhindern. Es soll demnach ebenso wenig möglich sein, Bilder von bekannten Persönlichkeiten zu erstellen, zumindest indem ihr Name im Prompt genannt wird. Auch sollen sich keine Bilder mehr im Stile von noch lebenden Künstlern generieren lassen. Darüberhinaus soll das Unternehmen an einer internen Kennung arbeiten, um künftig erkennen zu können, welche Bilder mit DALL-E 3 generiert wurden.

DALL-E 3 soll Anfang Oktober für ChatGPT Plus und Enterprise Kunden zugänglich werden (also kostenpflichtig).

mehr Infos bei
openai.com

Auf Socials teilen:

Leserkommentare // Neueste

markusG // 13:57 am 22.9.2023

Naja für Text gibt es zumindest Workarounds... https://www.youtube.com/wat...

Frank Glencairn // 10:17 am 22.9.2023

Ich glaub das liegt daran, daß das ganze nicht auf Text und Fonts basiert, sondern nur auf Bildern die es irgendwo gesehen hat. Eigentlich müßte da für Texte ne zweite "Ebene"...weiterlesen

MK // 09:01 am 22.9.2023

Komisch dass die alle so große Probleme mit Textwiedergabe haben... man sollte meinen dass das bei der ganzen Sache das Einfachste wäre.

Im Forum mitdiskutieren >>

Ähnliche News //

News

DALL-E 2: KI generiert und editiert Bilder nur anhand von Textbeschreibung

Vor etwas über einem Jahr hatte OpenAI die erste Version von DALL-E gestartet, einem neuronalen Netz, welches Bilder nur anhand einfacher Textbeschreibungen generieren kann. Jetzt ...

// 17:22 So, 10. Apr 2022von Thomas Richter

News

Stockphoto-Portal Shutterstock integriert KI-Bilder und gibt eine Antwort auf die ...

Seit kurzem steht die Frage im Raum, wie Künstler und Stock-Fotodienste überleben können, wenn bildgenerierende KIs wie DALL-E 2, Stable Diffusion oder Midjourney beliebige Bilder ...

// 09:41 Sa, 5. Nov 2022von Thomas Richter

News

Text-zu-Video auf neuem Niveau OpenAI Sora - das ist der KI-Video Gamechanger!

OpenAI präsentiert nach ChatGPT und Dall-E soeben sein erstes KI-Modell für die Videogenerierung - es nennt sich Sora und erstellt bewegte Bilder auf einem absolut sensationellen ....

// 23:07 Do, 15. Feb 2024von blip

News

Bing Image Creator - Microsoft bietet kostenlosen Zugang zu DALL-E 3

Ende September stellte OpenAI DALL-E 3 vor. Hierbei handelt es sich um einen generativen KI-Bildgenerator, der gegenüber Midjourney und Stable Diffusion einen vielleicht ...

// 14:02 Mi, 4. Okt 2023von Rudi Schmidts

News

Neue Audio KI generiert neben Musik auch beliebige Soundeffekte

Wie rasant die Entwicklung im Bereich KIs voranschreitet, zeigt sich u.a. gerade im Feld "Text-to-Music", also von KIs, welche per Textbeschreibung beliebige Musik generieren: ...

// 10:26 Do, 2. Feb 2023von Thomas Richter

zur Newsübersicht >

Generative Video-KI-Funktionen Adobe Firefly für Premiere Pro - Generative Extend, Object removal/addition

Zuletzt im Oktober hatte Adobe Firefly-Funktionen für Premiere Pro geteasert, darunter eine Generative Fill-Funktion - nun wird es konkret. Denn noch in diesem Jahr sollen über ...

// 15:08 Mo, 15. Apr 2024von blip

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

News

Günstiger und besser? Blackmagic stellt neues DaVinci Resolve Micro Color Panel für 495 Dollar vor

Blackmagic Design hat auf der NAB mit dem DaVinci Resolve Micro Color Panel ein weiteres, besonders erschwingliches Pult für die Farbkorrektur mit DaVinci Resolve angekündigt, ...

// 09:06 Sa, 13. Apr 2024von Rudi Schmidts

News

Blackmagic PYXIS 6K: Die Vollformat "Box"-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.

Am vielseitigsten riggbare Cam Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates ...

Von vielen seit langem ersehnt und jetzt da: Blackmagic stellt mit der Pyxis 6K gleich drei leistungsstärkere Vollformat-Versionen seiner Cinema Camera 6K vor, die in ein ...

// 03:40 Sa, 13. Apr 2024von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

Test

KI-Bilder mit Adobe Firefly - einfach, für jeden und besser als Midjourney oder Dall-E2?

Wir hatten bereits die Möglichkeit, Adobes neue KI-Tools namens Firefly auszuprobieren. Wie gut schlägt sich Adobes Einstieg in das Universum der KI-Bildgeneratoren?

// 14:23 Mi, 29. Mär 2023von Rudi Schmidts

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

Calman Ready und 98% DCI-P3 Neue Monitorserie AOC Graphic Pro U3 für Profis

AOC hat die neue Graphic Pro U3 Monitorserie vorgestellt, die ganz auf professionelle User aus den Bereichen Video- und Bildbearbeitung zielt. Die Pro-Features umfassen die ...

// 13:57 So, 28. Apr 2024von Thomas Richter

News

Syncen am Set Tentacle Sync Timebar: Timecode-Generator mit integriertem Display

Der deutsche Timecode-Synchronisations-Spezialist Tentacle Sync hatte bereits auf der letzten NAB seine Timecode-Anzeige Timebar gezeigt, nun soll das Gerät in Kürze verfügbar ...

// 11:11 So, 28. Apr 2024von Thomas Richter

zur Newsübersicht >