Aus Text wird nun auch Audio: Stable Audio generiert Musik und Soundeffekte per KI

// 13:08 Mo, 18. Sep 2023von blip

Mit Stable Diffusion hat Stability AI bereits einen guten Text-to-Image KI-Bildgenerator am Start. Seit kurzem ist nun auch Stable Audio online verfügbar, ein neues Diffusionsmodell mit dem sich - der Name sagt es schon - Audio und Musik aus Textprompts erstellen läßt.

Aus Text wird nun auch Audio: Stable Audio generiert Musik und Soundeffekte per KI

Das Stable Audio Modell wurde zu diesem Zweck anstelle von Bildern mit verschiedenen Audioinputs trainiert. Verwendet wurden über 800.000 - lizensierte - Dateien der Audiobibliothek AudioSparks inklusive der jeweiligen Metadaten. Durch dieses kontextreiche Training ist das Modell in der Lage, gepromptete Vorgaben bezüglich Inhalt und Form recht gut einzuhalten, und auch den Output auf die genaue Länge zu timen. Um das Modell auf eine Verbindung zwischen Text und Audio zu konditionieren, wurde beim Training eine Technik namens Contrastive Language Audio Pretraining (CLAP) eingesetzt - genaueres dazu in diesem Blog-Beitrag, in dem auch gute Audiobeispiele eingebettet sind.

Generieren lassen sich sowohl Musikstücke mit bis zu 90 Sekunden Länge, als auch einzelne Instrumentspuren oder auch Soundeffekte. Vorgeben lassen sich das Genre, der Stil, die Stimmung, die Instrumentierung, die Geschwindigkeit in BPM und mehr - im Grunde alles, was bei Audiobibliotheken üblicherweise über die Metadaten definiert wird. In einem User-Guide hat StabilityAI einige Prompt-Beispiele zusammengetragen, die von kurz und knackig bis mehrzeilig ausfallen.

Die resultierenden Musikstücke klingen wenig hitverdächtig, um nicht zu sagen teilweise recht erratisch "komponiert". Wobei es auch auf die Art Musik ankommt und auf die Länge; ruhige, ambient-artige Tracks lassen sich z.T. kaum von der typischen, GEMA-freien Hintergrundmusik unterscheiden. Eher brauchbar scheinen uns grundsätzlich die kürzeren Sound-Schnipsel, welche sich als Effektuntermalung generieren lassen, oder vielleicht minimalistisch gehaltene Instrumentausgaben.

Stable Audio ist in einer kostenlosen Version zugänglich, mit welcher sich pro Monat 20x bis zu 45 Sekunden lange Tracks generieren lassen. Das Pro-Abo für 12 Dollar im Monat erlaubt 500 Generierungen von bis zu 90 Sekunden Länge, welch auch in kommerziellen Projekten genutzt werden dürfen. Der Download erfolgt in 44.1 kHz Stereo.

Auch ein Open Source-Modell von Stable Audio soll demnächst veröffentlicht werden, allerdings wird dies mit einem anderen Datensatz trainiert worden sein, aus Lizenzgründen darf man annehmen.

mehr Infos bei
www.stableaudio.com

Auf Socials teilen:

Leserkommentare // Neueste

Drushba // 14:31 am 19.9.2023

Also die Ergebnisse für klassische Musik sind .... schräg erhellend.)) Sicher gut verwendbar für atmosphärisches Hintergundrauschen, das von atonalen Musikfetzen durchdrungen...weiterlesen

Cinemator // 13:17 am 19.9.2023

Eignet sich vielleicht ganz gut für Imagefilme von Fahrstuhlherstellern. Na ja, es ist immerhin ein Anfang...

macaw // 07:30 am 19.9.2023

ROFL. Ich bin ja ein Aphex Twin Fan und damit IDM Fan, was aber bei der Eingabe von IDM rauskam, klang wie eine totale Kakophonie...

Im Forum mitdiskutieren >>

Ähnliche News //

News

Erst Bilder, dann Sounds: Neue Google-KI generiert beliebige Musik nach ...

Forscher von Google haben eine neue KI vorgestellt, die nach einem ähnlichen Muster wie die gerade sehr populären Text-2-Image KIs wie DALL-E 2, Midjourney oder Stable Diffusion .....

// 10:57 Mo, 30. Jan 2023von Thomas Richter

News

Kostenlose Bildgenerierung per KI: Stable Diffusion jetzt mit einfachem Installer

Vor kurzem wurde die Text-zu-Bild KI Stable Diffusion veröffentlicht, mit deren Hilfe man kostenlos auf dem eigenen Computer auch zuhause auf dem eigenen PC phantastische Bildern ....

// 11:00 Di, 13. Sep 2022von Thomas Richter

News

Audio-KI von StabilityAI Stable Audio 2.0 produziert kostenlos Musik per KI

StabilityAI, vor allem bekannt durch seine Open-Source Bild-KI Stable Diffusion, hat die zweite Version seiner Audio-KI veröffentlicht. Sie ist jetzt in der Lage, ist bis zu drei ....

// 13:10 Di, 9. Apr 2024von Thomas Richter

News

Stable Diffusion XL: KI-Bilder werden fotorealistischer

Stable Diffusion ist ein Open Source KI Bildgenerator, der sich gerade aufgrund seiner Offenheit großer Beliebtheit erfreut. So ist Stable Diffusion grundsätzlich frei verfügbar .....

// 14:48 Sa, 10. Jun 2023von Rudi Schmidts

News

Stable Video Diffusion - Freies KI-Diffusionsmodell zur Videoerzeugung vorgestellt

Natürlich war es nur eine Frage der Zeit, bis auch das Stable Diffusion Team ein eigenes KI-Modell für Bewegtbilder ins Rennen schicken würde und dieser Tag ist nun gekommen. ...

// 09:07 Do, 23. Nov 2023von Rudi Schmidts

zur Newsübersicht >

Calman Ready und 98% DCI-P3 Neue Monitorserie AOC Graphic Pro U3 für Profis

AOC hat die neue Graphic Pro U3 Monitorserie vorgestellt, die ganz auf professionelle User aus den Bereichen Video- und Bildbearbeitung zielt. Die Pro-Features umfassen die ...

// 13:57 So, 28. Apr 2024von Thomas Richter

News

Update: Postproduktions-Suite DaVinci Resolve 19: Die neuen Funktionen ausführlich erklärt

Am Blackmagic-Stand auf der NAB 2024 gibt uns Simon von Blackmagic Design einen detaillierten Einblick in die neuen Funktionen von DaVinci Resolve 19. Wir schauen uns ColorSlice, ....

// 15:38 Di, 23. Apr 2024von Rob

News

Spezifikationen geleakt AMDs Notebook APU Strix Halo - besser als Apples M3 Pro Chip?

Wir hatten uns ja noch vor drei Monaten darüber beschwert, dass im PC-Bereich die CPU-Entwicklung langsamer als notwendig voranschreitet. Doch nun lichten sich endlich die ...

// 14:05 Mo, 22. Apr 2024von Rudi Schmidts

News

Profi-Kamera App kostenlos Blackmagic Camera App bald auch für Android Smartphones

Blackmagic hatte ja im Vorfeld der NAB 2024 seine beliebte Camera App für das iPhone in einer erneuerten Version 1.3 vorgestellt. Doch eine "Kleinigkeit" blieb dabei im News-...

// 14:31 Mo, 15. Apr 2024von Rudi Schmidts

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Praxis

Stable Diffusion - Tipps und Tricks - Teil 1 - Einrichtung und Einstieg

Unter allen kostenlosen KI-Modellen sticht Stable Diffusion nicht nur durch seine großartige Bildqualität hervor. Es lässt sich sogar auf dem heimischen Rechner installieren...

// 11:52 Fr, 17. Mär 2023von Rudi Schmidts

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

7.5. in München + Livestream Kooperation: Digitalschnittmesse und camgaroo film festival im ARRI-Kino

Zum ersten Mal seit fünf Jahren findet morgen - Dienstag den 7. Mai 2024 - in München wieder die Digitalschnittmesse statt, wo sich in leicht geschrumpftem Umfang (anderen Messen ....

// 13:51 Mo, 6. Mai 2024von blip

News

Canon Vollformat DSLM Canon USA startet Teaser Kampagne – EOS R5 Mark II kurz vor offizieller Vorstellung?

Canon USA scheint auf X (Twitter) eine Teaser-Kampagne gestartet zu haben, die ein Kind mit einer Canon DSLM zeigt und einem Verweis auf „exciting news“ (aufregende Neuigkeiten), ....

// 09:49 Mo, 6. Mai 2024von Rob

zur Newsübersicht >