YouTranscription - Youtube Videos in durchsuchbare PDFs transkribieren

// 12:00 Mo, 17. Okt 2022von

Der (momentan?) kostenlose Online Dienst YouTranscription transkribiert jeden YouTube-Videolink in ein durchsuchbares PDF. Der Service nutzt hierbei die gerade überall heiß gehandelte Whisper Engine von OpenAI.


Bei letzterer handelt es sich um ein mächtiges KI-Spracherkennungs- und Übersetzungssystem, das qualitativ aktuell den Stand der Technik widerspiegelt und gleichzeitig für eigene Projekte offen genutzt werden kann.



Was erst einmal banal klingt, ist in unseren Augen für viele Anwendungsfälle hilfreich. Besonders wenn man der immer weiter schrumpfenden Gruppe von Menschen angehört, die Informationen lieber schnell überfliegend (aka lesend) konsumieren, anstatt sich durch ein gesprochenes Video zu steppen, ohne zu Wissen ob der Sprecher jemals überhaupt auf einen relevanten Punkt kommen wird.



Auch Podcasts, Tutorials, Vorträge oder Interviews lassen sich auf diese Weise (jenseits von einem potentiell zusätzlichen audiovisuellen Unterhaltungswert) sogar an Orten lesen, wo man Video mit Ton ansonsten eher schwer konsumieren kann.



Kurz gesagt: YouTranscription scheint uns ein hilfreicher Youtube-Transkriptionsservice für viele denkbaren Einsatzszenarien zu sein. Um es kostenlos auszuprobieren, ist dennoch eine Registrierung notwendig.



YouTranscription - Youtube Videos in durchsuchbare PDFs transkribieren


Nach einer E-Mail Verifikation lassen sich anschließend Videolinks direkt eingeben. Nach maximal 10 Minuten bekamen wir in unserem Fall die Transkription an eine beliebige Email-Adresse geschickt, die nicht mit der registrierten Email Adresse übereinstimmen muss. Dies funktionierte somit praktischerweise sogar mit der Input-Adresse unseres E-Book Readers. Ziemlich cool - Dass so ein Workflow in dieser Qualität sogar kostenlos funktioniert, hätten wir uns vor einem Jahr noch nicht in unseren kühnsten Träumen vorstellen können.



Leider werden aktuell nur Videos bis zu einer Länge von 1 Stunde unterstützt, womit viele Podcasts leider außen vor bleiben. Im Gegenzug werden fast alle bekannten Sprachen erkannt (u.a. Deutsch).



Was grundsätzlich noch fehlt ist eine Erkennung verschiedener Sprecher (womit sich u.a. Dialoge aus Spielfilmen extrahieren ließen). Auch sollte man nicht vergessen, dass Whisper AI auch ziemlich potent übersetzen kann. Dies ließe sich in dieser Anwendung ebenfalls für weitere Anwendungsfälle nutzen. Aber ihr wisst ja, man sollte hier nicht meckern, geschenkter Gaul und so...



Ähnliche News //
Umfrage
  • Was hältst du von den neuen Bild/Video-KIs?





    Ergebnis ansehen
slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash