Ein neues Projekt namens DynVideo-E versucht, dieses Problem nun mit einem recht analytischen Ansatz für einen Spezialfall exemplarisch zu lösen: Das Input Video ist dabei immer ein sich bewegender Mensch, der von einer bewegten Handkamera verfolgt wird.
Durch die Nutzung von dynamischen NeRFs (Neural Radiance Fields) versucht man, die gesamte Aufnahme zuerst einmal als texturierten 3D-Raum zu begreifen, der aus den Blickwinkeln der bewegten Kamera gewonnen wird. Der im Originalvideo vorkommende Mensch wird dabei auf die Bewegung seiner Posen reduziert.
Dies erlaubt im Anschluss ein getrenntes Austauschen des Hintergrunds sowie ein Umgestalten der Person im Video. Dies kann beispielsweise durch einfaches Prompting passieren. Klingt natürlich wieder etwas holprig und schwer vorzustellen? Also hier mal wieder das Video zum Paper, welches viele anschaulichen Beispiele zu DynVideo-E präsentiert:
Auch wenn die Ergebnisse noch weit davon entfernt sind, fotorealistisch zu sein, zeigt das Projekt die prinzipielle Möglichkeit auf, einzelne Objekte in einem Video gezielt zu modifizieren. Nicht zuletzt ist es auch denkbar, DynVideo-E-Clips anschließend als Input für ein weiteres diffusionsbasiertes Modell zu nutzen, welches dann noch fotorealistischer "rendern" könnte.
Dass KI-Modelle beeindruckende Bilder schaffen können, dürfte mittlerweile unbestreitbar sein. DynVideo-E zeigt dagegen eine mögliche Idee, wie sich KI-Modelle im Allgemeinen auch zuverlässiger steuern lassen könnten. Denn im Bereich der exakten Kontrolle über das Bild dürfte in nächster Zeit besonders viel Forschung gefragt sein.
mehr Informationen
Kommentare lesen/schreiben
Passende News:
- AnimateAnyone - Foto und animierte Pose macht Video
- Stable Video Diffusion - Freies KI-Diffusionsmodell zur Videoerzeugung vorgestellt
- Und noch mehr Black Friday 2023 für Foto+Video – Teil 3 mit Canon, Panasonic, Tilta, Rotolight, Aputure etc.
- Meta Emu Video / Edit - verbessert Konsistenz in generativen KI Videos
- Noch mehr Black Friday-Deals 2023 für Foto+Video – Teil 2 mit Sony, Smallrig, MSI, WD, TopazAI u.a.
- Black Friday-Deals 2023 für Foto+Video – Teil 1 mit DJI, AVID, DZOfilm, Hollyland, Zhiyun..
- Topaz Labs optimiert Video-KI-Software für AMDs Ryzen AI
- Adobe teasert Generative Fill und Auto-Dubbing für Video
- Kann Chat GPT Bilder besser verlustfrei komprimieren als PNG?
- HeyGen Video Translate bietet einfaches Übersetzen und Dubben von Videoclips
- Blackmagic: Neue DeckLink 8K Pro Mini und Video Assist Update für Fujifilm GFX100 II
- YouTube: neue Editing-App verfügbar - und bald kommen die Video-KI-Tools