Schluss mit Kauderwelsch - neue Bild-KI DeepFloyd / IF kann auch schreiben

// 15:02 Di, 2. Mai 2023von Rudi Schmidts

Die Firma Stability AI (die unter anderem auch das quelloffene Stable-Diffusion maßgeblich fördert) hat mit DeepFloyd/IF einen weiteren Bildgenerator vorgestellt. Dieser soll sich besonders gut für Schrift und Grafik eignen.

Wer bereits eigene Erfahrungen mit diffusionsbasierten KI-Bildgeneratoren gesammelt hat, kennt das Problem: Korrekte Schrift - egal in welcher Sprache- ist praktisch nicht generierbar. Zu sehen bekommt man in der Regel - wenn überhaupt - einen sprachlichen Kauderwelsch aus halluzinierten Buchstaben.

Stable Diffusions Sprache scheint nicht von dieser Welt.

Doch mit diesem Problem soll nun Schluss sein, denn das neue DeepFloyd/IF-Modell soll fotorealistische Darstellungen mit Schriftzügen ermöglichen. Außerdem soll es sich besonders gut für grafische Aufgaben wie Logo-Design eignen.

In seinen Grundzügen basiert DeepFloyd auf Googles KI-Bildgenerator Imagen. Dieser arbeitet etwas anders als Stable Diffusion und verbindet ein Open Source Large-Language-Model (LLM) von Google ( T5-XXL-1.1) mit einem Pixel-Diffusions-Modell.

Letzteres arbeitet dreistufig und generiert primär nur 64 x 64 Pixel große Bilder, die dann zweimal per Superresolution über 256 x 256 Pixel auf die Ausgabe-Auflösung von 1024 x 1024 Pixel hochskaliert werden. Der Bildgenerator wurde dabei mit dem bewährten LAION-A-Datensatz mit 1,2 Milliarden Bildern trainiert.

DeepFloyd/IF kann lesbare Texte und Grafiken generieren

Einen offiziellen Web-Bildgenerator, um DeepFloyd/IF einmal online auszuprobieren, gibt es bislang nicht - weil die aktuelle Lizenz einzig den Einsatz für die Forschung und nicht für kommerzielle Zwecke erlaubt. Wer jedoch selbst "daran forschen" will, findet auf Github entsprechende Pakete zum Download.

Gleichzeitig läutet DeepFloyd/IF jedoch auch ein neues Zeitalter für den KI-Heimeinsatz ein. Denn während bisherige Stable Diffusion Modelle bereits mit Grafikkarten ab ca. 6 GB Speicher funktionieren, fordert DeepFloyd nun mindestens 16 GB GPU-Speicher. Für das qualitativ bessere (und damit größere Modell) sind sogar 24 GB obligatorisch. Derart stark steigende Anforderungen für GPU-Speicher bei den kommenden KI-Anwendungen hatten wir bei slashCAM bereits vor kurzem thematisiert.

mehr Infos bei
github.com

Auf Socials teilen:

Leserkommentare // Neueste

Kommentieren >>

Ähnliche News //

News

Kostenlose Bildgenerierung per KI: Stable Diffusion jetzt mit einfachem Installer

Vor kurzem wurde die Text-zu-Bild KI Stable Diffusion veröffentlicht, mit deren Hilfe man kostenlos auf dem eigenen Computer auch zuhause auf dem eigenen PC phantastische Bildern ....

// 11:00 Di, 13. Sep 2022von Thomas Richter

News

Stable Diffusion XL: KI-Bilder werden fotorealistischer

Stable Diffusion ist ein Open Source KI Bildgenerator, der sich gerade aufgrund seiner Offenheit großer Beliebtheit erfreut. So ist Stable Diffusion grundsätzlich frei verfügbar .....

// 14:48 Sa, 10. Jun 2023von Rudi Schmidts

News

Microsoft Olive: Neues kostenloses Tool verdoppelt Performance von Stable Diffusion

Microsoft hat ein neues, freies Tool namens Olive vorgestellt, welches vielen KI-Modellen wie zum Beispiel Stable Diffusion ermöglicht, automatisch die Hardwarebeschleunigung von ....

// 18:08 Mi, 24. Mai 2023von Thomas Richter

News

KI Bilder mit Stable Diffusion jetzt auch direkt in Photoshop und Gimp erzeugen

Die bildgenerierende KI Stable Diffusion kann seit kurzem einfach auf dem eigenen PC genutzt werden, doch gibt es jetzt einen noch einfacheren Weg. Der Programmierer und Künstler ....

// 10:51 So, 18. Sep 2022von Thomas Richter

News

Quelloffener KI-Bildgenerator Stable Diffusion 3 - erste Beta vorgestellt

Stability AI gab vor wenigen Stunden bekannt, dass nun eine erste Beta-Version von Stable Diffusion 3 zur Verfügung steht. Hierbei handelt es sich um ein leistungsstarkes Text-zu-....

// 19:02 Do, 22. Feb 2024von Rudi Schmidts

zur Newsübersicht >

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

News

IMAX Kamera von Blackmagic? Die URSA Cine 17K soll mit 50mm breitem Sensor kommen

Bei der Live-Vorstellung der neuen URSA Cine 12K mit Vollformatsensor agierte Grant Petty, CEO von Blackmagic Design unerwartet: So kündigte er gleich noch für Ende diesen Jahres ....

// 10:02 Sa, 13. Apr 2024von Rudi Schmidts

News

Mit eigenem Filmlook-Tool Neues Blackmagic DaVinci Resolve 19 bringt über 100 neue Funktionen

Wie erwartet hat Blackmagic Design neben zwei neuen Kameras - der URSA Cine 12K und der PYXIS 6K Vollformat "Box"-Kamera - und anderer Hardware auch eine neue Hauptversion seines ....

// 22:24 Fr, 12. Apr 2024von Thomas Richter

News

Latenzfreie Vorschau? Atomos Ninja Phone macht aus iPhone 15 Pro/Max einen HDMI-Kameramonitor/Rekorder

In Las Vegas präsentiert Atomos das neue Ninja Phone, einen 10-bit Video-Co-Prozessor, der das iPhone 15 Pro oder Pro Max in einen - laut Atomos quasi latenzfreien - OLED-...

// 18:25 Fr, 12. Apr 2024von blip

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Praxis

Stable Diffusion - Tipps und Tricks - Teil 1 - Einrichtung und Einstieg

Unter allen kostenlosen KI-Modellen sticht Stable Diffusion nicht nur durch seine großartige Bildqualität hervor. Es lässt sich sogar auf dem heimischen Rechner installieren...

// 11:52 Fr, 17. Mär 2023von Rudi Schmidts

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

Live von der NAB Videointerview: Adobe Premiere Pro - die neuen KI Funktionen erklärt

Beim Adobe Stand auf der NAB 2024 haben wir Francis Crossman getroffen und ihn nach den neuen KI-Funktionen in Adobe Premiere Pro gefragt. Entstanden ist hierbei ist ein sehr ...

// 15:41 Di, 16. Apr 2024von Rob

News

8K HDR-Display ASUS ProArt PA32KCX - 8K Mini-LED-Monitor mit DisplayPort 2.1

Mit dem ProArt PA32KCX kündigte ASUS auf der NAB 2024 einen professionellen 32-Zoll 8K-Studiomonitor mit beeindruckenden Rahmendaten an: Das Mini-LED-Panel besitzt eine native ...

// 15:32 Di, 16. Apr 2024von Rudi Schmidts

zur Newsübersicht >