KI malt jetzt aufs Wort - Nvidia GauGAN2

// 11:52 Mo, 29. Nov 2021von

Es klingt wie ein weiterer Meilenstein in der aktuell rasanten Entwicklung der künstlichen Intelligenz. Nvidias neueste Online KI-App GauGAN2 kann fotorealistische Bilder nach einer textlichen Beschreibung einer Szenerie erstellen.


Man sagt dem Netz beispielsweise "Strand mit Sonnenuntergang vor blauen Sonnenschirmen" und bekommt nach einer kurzen Wartezeit vom Server ein Bild geliefert, dass selbige Situation mit großer Wahrscheinlichkeit plausibel darstellt.






Für unerfahrene Anwender dürfte dies fast schon magisch wirken, besonders wenn man diese Funktion noch mit einer Spracheingabe kombiniert. In unseren Augen ist es dennoch nur ein relativ kleiner Sprung gegenüber früheren Versionen der Software. Denn letztlich wurden hier "nur" Bereiche im Latent Space mit zusätzlichen verbal abgrenzbaren Begriffen verknüpft, was schon seit längerem in der KI-Forschung funktioniert.



Der Raum der möglichen Ergebnisse ist ebenfalls stark begrenzt durch Szenarien, die das Netz gelernt hat. Interessant bleibt dagegen, dass man in ein generiertes Bild anschließend mit den bekannten Werkzeugen eingreifen kann. So lässt sich ein Wald oder Berge mit den entsprechenden Pinseln sehr einfach erweitern oder "begrenzen".





Dass man für seinen eigenen Film auf diese Weise einfach virtuelle Szenarien per Befehl im Rechner entwirft ist mit GauGan2 noch nicht möglich. Doch das Programm zeigt bereits dass mit erweiterter Samplegröße und mehr Lernressourcen solche Ideen bald in den Bereich des möglichen kommen werden.



Richtig interessant wird es noch später in der Zukunft, wenn GANs komplette Romane visuell als Spielfilme umsetzen können. Und man als Regisseur vor allem Kleinigkeiten in der Adaption mit Korrekturpinseln ändert. Das dürfte allerdings noch ein paar Jahrzehnte dauern. Doch das Erstellen virtueller, photorealistischer Szenen per Sprache dürften wir noch in diesem Jahrzehnt zu sehen bekommen.



Wer nicht fantasieren, sondern jetzt und heute einfach mal mit den Möglichkeiten von GauGan2 herumspielen möchte, kann dies hier tun.


Ähnliche News //
Umfrage
  • Was hältst du von den neuen Bild/Video-KIs?





    Ergebnis ansehen
slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash