Stable Diffusion 2.0 bietet nun eine Reihe wichtiger Verbesserungen und Funktionen im Vergleich zur ursprünglichen V1-Version:
Die neue Version enthält robustere Text zu Bild-Modelle, die mit einem brandneuen Text-Encoder (OpenCLIP) trainiert wurden, der die Qualität der generierten Bilder im Vergleich zu früheren V1-Versionen erheblich verbessern soll. Die Text-zu-Bild-Modelle in dieser Version können Bilder mit Standardauflösungen von 512x512 Pixeln und 768x768 Pixeln erzeugen. Stable Diffusion 2.0 enthält ein Upscaler-Diffusionsmodell, das die Auflösung von Bildern um den Faktor 4 erhöht. In Kombination mit den Text-zu-Bild-Modellen kann Stable Diffusion 2.0 somit Bilder mit einer Auflösung von 2048x2048 und höher erzeugen.
Richtig spannend klingt der Tiefengenerator Depth2img. Dieser schätzt die Tiefe (also den Z-Puffer eines Eingabebildes und generiert dann neue Bilder, die sowohl den Text als auch die Tiefeninformationen verwenden. Mit Depth-to-Image sollen sich alle möglichen neuen kreativen Anwendungen realisieren lassen, bei denen aber die Kohärenz und Tiefe des Bildes erhalten bleibt.
Es werden übrigens auch weiterhin nicht jugendfreie Inhalte mit dem NSFW-Filter vor der Ausgabe unterdrückt.
In den nächsten Tagen sollen die neuen Modelle in die Stability AI API Platform (platform.stability.ai) und DreamStudio eingebunden werden. Wir sind gespannt, was mit den neuen Tools auf uns zukommen wird...
mehr Informationen
Kommentare lesen/schreiben
Passende News:
- Nikon Z f Vollformat DSLM im Retro-Look (FM2) für 2.499,- Euro vorgestellt: 24MP Sensor, 4K 10 Bit 60p …
- SanDisk Professional G-DRIVE Project, G-RAID Mirror sowie PRO-CINEMA CFexpress Type B Speicherkarte vorgestellt
- Aus Text wird nun auch Audio: Stable Audio generiert Musik und Soundeffekte per KI
- Sennheiser MKH 8030 vorgestellt - HF-Kondensatormikrofon mit Achtercharakteristik
- Blackmagic Cinema Camera 6K mit Vollformat und L-Mount vorgestellt für 2.805 Euro
- Sieben Cine-Primes mit RF-Bajonett - neue Canon Objektiv-Serie vorgestellt
- Rode Wireless Pro 2-Kanal-Funkstrecke mit 32 Bit Float Recording, Timecode-Sync u.a. vorgestellt
- US-Gericht bestätigt: Kein Urheberrecht auf KI-generierte Kunst
- Magix Video deluxe 2024 vorgestellt mit neuer Oberfläche und Text-to-Speech
- Neue GPU-Benchmarks: AMD bei Stable Diffusion nun auf Augenhöhe mit Nvidia
- Zeiss CinCraft Scenario vorgestellt für Kamera-Tracking in Echtzeit
- DJI Osmo Action 4 vorgestellt - größerer Sensor und GPS-Bluetooth-Fernsteuerung