Blog > KI im Podcasten – benötigen wir mehr …

KI im Podcasten – benötigen wir mehr Transparenz?

Künstliche Intelligenz (KI) entwickelt sich nicht nur rasant, sondern auch auf komplexe und oft schwer überschaubare Weise – mit vielfältigen Auswirkungen. Wir haben dazu ein paar Experten und Expertinnen aus der Podcast Produktion, Redaktion und auch Unternehmen befragt. Wie sie mit Freude KI nutzen und welche Bedenken sie haben, erzählen sie in diesem Interview.

Interviewt werden Jan Linder, der Autor und Produzent des Podcasts Hörbücher zum Einschlafen, der KI nutzt, aber auch das alte Podcast-Handwerk zu schätzen weiß. Chris Guse von Bosepark, der sein Erstaunen über die KI-Möglichkeiten auf ganz besondere Art und Weise verarbeiten musste, jetzt aber nicht mehr ohne arbeiten will. Isabel Grünewald, die Moderatorin und Redakteurin des Podcasts “KI Update” ergänzt über die Produktion hinaus eine sehr spannende Sichtweise, die bei all der KI-Spielerei schnell vergessen werden kann. Hendrik Efert, einer der Geschäftsführer von Viertausendhertz und Produzent des KI-Podcasts “Historische Heldinnen”, ist ein routinierter KI-Nutzer, glaubt aber an eine emotionale Tiefe in Podcasts die nur Menschen ausgehen kann. Die Unternehmerinnen Nina Glaser und Marie Nolte von RetellHub haben zwar einen KI-Mitarbeiter des Jahres, möchten aber trotzdem nicht auf die menschliche Nahbarkeit im Podcasting verzichten. Lala, Data Analyst von Springer, sieht durch KI eine wesentliche Erleichterung und Effizient im Arbeitsprozess, hofft aber, dass es keinen Overload von KI generierten Podcasts geben wird.

Wo kannst du heute auf die KI nicht mehr verzichten?

Jan: Mir hilft es enorm in puncto Bildgestaltung: Meine YouTube-Thumbnails erstelle ich mit KI in einem Bruchteil der Zeit, die ich vorher benötigt habe und ich treffe mit den individuell erstellten Bildern zudem noch viel genauer die Aussage des jeweiligen Hörbuchs. Zudem übersetze ich englische Stories mit Hilfe von KI ins Deutsche, nutze ChatGPT als Recherche-Tool und erstelle mit KI Reels mit Untertiteln.

Nina & Marie: Bei unzähligen täglich anfallenden Aufgaben von dem RETELL Podcast Hub ist das Nutzen einer KI nicht mehr wegzudenken. Sei es das Übersetzen von Podcast Skripten oder von Speech-to-Speech Files oder als Support bei der Erstellung von Excel-Tabellen.

Hendrik: KI ist aus meinem Arbeitsalltag als Podcastproduzent nicht mehr wegzudenken. Ich benutze mittlerweile LLMs tatsächlich fast täglich. Am besten funktionieren sie für mich in einer Art Assistenzrolle: Also zum Vorschreiben kurzer Emails oder anderer Texte, zum Brainstormen zum Beispiel über Podcasttitel oder auch, um einen Projektmanagementplan aufzustellen. Aber auch bei der Entwicklung neuer Podcast-Ideen oder der Analyse von Hörertrends. Ich nutze die Ergebnisse aber niemals 1:1 und ungeprüft. Ansonsten nutze ich sehr häufig den KI-Klon meiner eigenen Stimme :)

Chris: In allen Bereichen der Produktion, vor allem aber beim Lernen und Absorbieren von neuem Wissen. Nie war es einfacher, Dinge zu erfahren und zu verstehen, Produktion, Coding, Naturwissenschaften, etc.

Isabel: Durch KI kann ich sehr viel Zeit sparen, weil sie für mich Interviews aus meinem Podcast verschriftlicht. Da ich zu jeder Folge vom "KI-Update" einen Begleitartikel auf heise online veröffentliche, ist es wunderbar, Zitate einfach aus einem fertigen Skript kopieren zu können. Allerdings klappt das nur so gut, weil ich selbst die Interviews führe und somit erkennen kann, wenn die KI Quatsch macht. Sei es, dass sie Sätze falsch wiedergibt, sich wiederholt, Worte einfügt oder missversteht. Die Zeit, die ich beim Verschriftlichen spare, investiere ich in die Qualitätskontrolle.

Lala: In Routineaufgaben wie dem Zusammenfassen von Dateien mit Perplexity AI, der Korrektur der Zeichensetzung mit DeepL und der Überprüfung des Codes auf Lücken.

Wie hast du dich gefühlt, als der Hype um KI vor zwei Jahren begann? Hat dich der Gedanke eher fasziniert oder besorgt, und warum?

Jan: Als ich das erste Mal mit Midjourney herumprobiert habe, war ich natürlich geflasht. Da war schon zu erahnen, welchen Mehrwert das für mich als Content Creator bieten kann. Parallel dazu war ich allerdings auch überrascht, wie weit inzwischen KI-Stimmen sind und in dem Zuge auch leicht besorgt, als ich sah, wie gut KI-Kanäle auf YouTube mit vergleichbaren Inhalten wie meinen vom Publikum aufgenommen werden. Durch die Flut an aufkommenden KI-basierten Hörbuch-Kanälen stelle ich ganz klar fest, dass das Wachstum von Kanälen wie meinem einen kleinen Dämpfer erfahren hat. Klar, es gibt wesentlich mehr Angebot bei vermutlich kaum gestiegener Anzahl an Hörerinnen und Hörern. Aber ich merke auch, dass viele Leute noch echte Handarbeit heraushören und zu schätzen wissen: Eine KI kann den emotionalen Aspekt einer Story, das dramaturgische Auf und Ab aktuell nicht wirklich erfassen, wodurch ich glaube, dass auch Kanäle wie meiner in Zukunft eine Daseinsberechtigung haben werden.

Nina & Marie: Aus der Perspektive eines Produzenten hat mich der Hype um KI fasziniert. Mir war früh klar, dass KI ein enormes Potenzial bietet, Produktionsprozesse effizienter zu gestalten. Insbesondere die Sichtung von Material – wie das Identifizieren von Highlights oder spezifischen Sequenzen – wurde durch KI erheblich vereinfacht. Mein Ziel war es, mithilfe von Keywords gezielt jene Momente (beispielsweise Social-Snippet-Potenziale aus Podcastaufnahmen) identifizieren zu können, die sich als Highlights eignen. Ähnlich verhielt es sich im Bereich Audio: Mit KI wollte ich gezielt nach Stichwörtern suchen, um etwa Markierungen für Werbeplatzierungen setzen zu können. Ich war überzeugt, dass die aufkommenden KI-Entwicklungen die Produktion von Podcasts deutlich unterstützen würden. Darüber hinaus war ich davon überzeugt, dass wir langfristig in der Lage sein würden, neue wirtschaftliche Ansätze im Bereich „Podcast AI“ zu erschließen. RETELL hat definitiv von diesem Hype profitiert. Die gesamte Branche war plötzlich begeistert von neuen Tools und führte Gespräche über automatische Übersetzungen. Auch wenn wir weiterhin auf menschliche Hosts und Muttersprachler:innen setzen, hat dieser Diskurs entscheidend dazu beigetragen, RETELL zu etablieren. Rückblickend sind meine Erinnerungen an diesen Hype überwiegend positiv.

Hendrik: Beides. Allerdings hat die Faszinination immer überwogen. All die neuen Möglichkeiten die sich da auftaten, die Arbeitserleichterungen, und die Möglichkeiten die eigenen Kompetenzen beim geschickten Einsatz von KI-Tools noch weiter zu bringen. Gleichzeitig hatte ich natürlich auch Respekt davor, wie schnell die Technologie sich entwickelt und welche ethischen Fragen das mit sich bringt.

Chris: Ich habe wieder angefangen zu rauchen, weil es mir wie Schuppen von den Augen fiel, was wir alles damit machen können. Danach habe ich aus gesundheitlichen Gründen wieder schnell mit dem Rauchen aufgehört und seitdem fasziniert es mich. Sorgen habe ich nicht, weil sich das für mich wie Skepsis vor der Dampfmaschine anfühlen würde. Wir sind mitten in einem Prozess, der für mich mehr mit Lernen, Verstehen und Umsetzen und weniger mit Angst oder Besorgnis zu tun hat. Sorgen sind im Geschäft wie in der Liebe keine guten Berater.

Isabel: Ich war - und bin - zwiegespalten. Zum einen ermöglicht die Technik faszinierende Fortschritte, vor allem im Bereich der Forschung. Aber KI ist eben auch sehr rechenintensiv und verbraucht dabei Unmengen an Energie. Somit passt sie nicht so ganz in eine Zeit, in der wir den Einsatz fossiler Brennstoffe radikal herunterfahren sollten. Gleichzeitig kann KI dafür sorgen, dass wir unseren Energiebedarf insgesamt effizienter regeln. Es wird sich zeigen, ob solche Anwendungen den Energiehunger der KI selbst ausgleichen können.

Lala: Ich würde sagen, ich war eher fasziniert als besorgt (letzteres hatte mehr mit ethischen Fragen im Zusammenhang mit dem Einsatz von KI zu tun). Die Faszination rührte vor allem daher, dass ich sofort daran dachte, wie viele Routineaufgaben man an KI delegieren könnte, um sich mehr auf strategische und kreative Dinge konzentrieren zu können.

Wie bewertest du die Tatsache, dass die rechtlichen Rahmenbedingungen den Entwicklungen im Bereich Künstlicher Intelligenz hinterherhinken? Bist du bei der Nutzung von KI-Tools bereits auf rechtliche oder ethische Herausforderungen gestoßen?


Jan: Ich finde, es sollte klarer formuliert sein, was man darf und was nicht. Inwieweit man etwa ein urheberrechtlich geschütztes Bild via KI bearbeiten darf und in welcher Form man den Urheber dann erwähnen sollte, damit es für alle Beteiligten zufriedenstellend ist. Dass das nicht ganz so leicht allgemeingültig festzusetzen ist, erschwert natürlich die Sache.
Aber ich fühle mich nicht berufen, dies zu besprechen oder Vorschläge dahingehend zu machen. Eine klare Linie, an die man sich halten kann, wäre halt einfach gut.

Nina & Marie: Da wir mit RETELL ein rechtlich fundiertes Lizenzkonstrukt für Storytelling-Podcasts schaffen, hat rechtliche Präzision für uns höchste Priorität. Wir arbeiten hierfür eng mit Kanzleien zusammen, die sich auf KI spezialisiert haben, um sicherzustellen, dass alle rechtlichen Anforderungen erfüllt werden. Hier geht es nicht nur darum, eine Datenschutzerklärung ins Englische zu übersetzen, sondern vor allem darum, deutschsprachige Kulturgüter wie Podcast-Skripte in andere Sprachen zu übertragen und dabei kulturell angepasste Adaptionen zu ermöglichen. Um dies rechtlich sauber umzusetzen, haben wir KI-gestützte Tools entwickelt, die individuelle Anforderungen abfragen und diese direkt in jeweils individuell generierte Lizenzverträge einfließen lassen. Dadurch gewährleisten wir eine klare rechtliche Grundlage für unsere Übersetzungs- und Adaptionstätigkeiten. Hinsichtlich ethischer Herausforderungen sind wir bisher auf keine größeren Probleme gestoßen. Unsere Prozesse und der Fokus auf kulturelle Sensibilität stellen sicher, dass wir sowohl rechtliche als auch ethische Standards einhalten.

Hendrik: Die rechtlichen Rahmenbedingungen sind definitiv nicht auf dem aktuellen Stand der Technik. Das macht die Nutzung von KI-Tools manchmal zu einem Balanceakt, besonders wenn es um urheberrechtlich geschützte Inhalte geht. Ich versuche, mich gut zu informieren und nur Tools einzusetzen, die Transparenz in Bezug auf ihre Datenquellen bieten. Gleichzeitig ist Ethik ein großes Thema: Ich achte darauf, dass ich KI unterstützend einsetze und nicht, um menschliche Kreativität komplett zu ersetzen. Ich kann nicht beurteilen, ob die rechtlichen Rahmenbedingungen hinterherhinken. Dazu muss ich noch verstehen, was die Rahmenbedingungen sind und die ändern sich aktuell ja recht häufig. Ethische Herausforderungen sind uns in der täglichen Arbeit keine neuen begegnet, als jene, die wir immer haben: Transparenz, Einverständnis, kein Herummogeln.

Isabel: Ich arbeite zum Glück in einem Unternehmen, das sehr aufmerksam auf die rechtlichen Rahmenbedingungen achtet, damit wir nur Tools im Redaktionsalltag einsetzen, die auch Gesetzeskonform sind. Aber natürlich bleibt der journalistische Anspruch erhalten, dass wir als Autor*innen unserer Artikel und Podcasts bei heise, selbst recherchieren und prüfen, ob die Schritte, bei denen wir uns von KI unterstützen lassen, auch korrekt ausgeführt wurden. Gerade wenn der Zeitdruck hoch ist, wäre es so einfach, sich zum Beispiel eine Pressemitteilung von einer KI zusammenfassen zu lassen. Aber das würde nicht unserem Anspruch genügen. Denn als Journalist*innen sind wir ja kein Presseportal, sondern müssen diese Informationen analysieren und in einen größeren Kontext einordnen.

Lala: Ich kann nicht sagen, dass ich damit einverstanden bin, dass der rechtliche Rahmen hinterherhinkt. Aber ich bin auch kein Jurist, um diesen Aspekt objektiv beurteilen zu können. Bisher bin ich nicht auf ethische oder andere rechtliche Probleme gestoßen, da ich KI hauptsächlich in Bereichen einsetze, die andere nicht betreffen.

Ist die Transparenz in der Podcast-Branche im Umgang mit KI-Tools aus deiner Sicht ausreichend? Wo siehst du mögliche Verbesserungen?


Jan:
In meinem konkreten Fall finde ich es unabdingbar, dass für Hörerinnen und Hörer klar sichtbar sein sollte, ob sie einen Podcast/Kanal mit KI-Stimme oder von Menschen gesprochener Stimme hören. Die Stimmung in den Kommentaren bei mir zeigt, dass man sich von KI-Kanälen Hops genommen fühlt – entweder man bedankt sich bei mir, dass ich noch echte Handarbeit anbiete oder man wirft mir fälschlicherweise vor, dass ich selbst eine KI-Stimme verwende. Ich finde, man sollte als Hörer*in das Recht haben, zu wissen, ob man hier echte oder artifizielle Emotionen konsumiert. Bei Amazon z.B. gibt es bei Hörbüchern neben Seitenanzahl, Verlag etc. ein Feld, das klar auf die KI-Stimme verweist. Das sollte sollte m.E. auch bei YouTube, Spotify und Co. klar signalisiert werden. Etwa mit einem KI-Logo im Podcast-Titelbild oder YouTube-Kanalbild. Dabei bin ich mir bewusst, dass ich hier mit zweierlei Maß messe. Ich selbst nutze ja KI, bspw. zur Thumbnailgestaltung. Aber in meinen Augen sind das alles Tools, um das eigentliche Produkt, also das Hörbuch oder die Podcastfolge, qualitativ aufzuhübschen oder marketingtechnisch voranzubringen.
Wenn das Hauptprodukt selbst aber zum Großteil auf KI basiert, dann finde ich es unabdingbar, Hörerin und Hörer darüber in Kenntnis zu setzen.

Nina & Marie: In internationalen Newslettern lesen wir viel über die aktuellen Trends in der Podcast-Branche im Umgang mit KI-Tools. Hörer:innen werden immer häufiger innerhalb des Podcasts darauf hingewiesen, wenn ein Podcast mit einer synthetischen Stimme oder mittels KI produziert wurde. Dies ist eine sehr gute Entwicklung. Hilfreich sind sehr anwendungsbezogene Events für Podcastschaffende wie z.B. die “So Many Voices” Konferenz in München, wo man sich zu neuesten Trends und Entwicklungen austauscht.

Hendrik: Die Transparenz ist noch ausbaufähig. Viele Produzent*innen nutzen KI-Tools, aber es wird selten offen kommuniziert, wie genau sie eingesetzt werden. Ich denke, es wäre hilfreich, wenn mehr über Best Practices gesprochen würde – auch um Vorurteile gegenüber der Technologie abzubauen. Gleichzeitig sollten Standards geschaffen werden, um den verantwortungsvollen Einsatz von KI in der Branche zu fördern. Transparenz ist wichtig, aber auch nicht neu und muss sich einpendeln. Wir schreiben nicht in die Shownotes, wenn wir das Audio mit RX neu berechnet haben oder Halbsätze aus einem Satz im Schnitt entfernen. Wohl aber weisen wir darauf hin, wenn wir Töne von anderen Quellen haben oder wer namentlich an einer Produktion beteiligt war. In die Richtung wird es gehen. In die Glaskugel KI Entwicklung möchte ich
nur zaghaft schauen, als dass alle Aspekte der Produktion, die wiederholbar sind, von AI profitieren werden. Profitieren heißt, sie werden kostengünstiger und das Ergebnis wird qualitativ besser für Zuhörerinnen und Zuhörer.

Lala: Ausgehend von den Diskussionen, die ich in der deutschen Podcast-Branche verfolge, denke ich, dass Fragen der Anwendung von KI-Tools recht transparent behandelt werden. Vielleicht würde ich mir noch mehr offene Diskussionen über die Erfahrungen mit diesen Tools wünschen. Das hat aber auch damit zu tun, dass viele noch zurückhaltend sind, wenn es um die Integration von KI in die Podcast-Produktion geht.

Wie glaubst du, wird sich fortgeschrittene KI (AGI) auf die Erstellung von Podcasts auswirken? Welche Aspekte der Produktion könnten sich dadurch verändern und wo siehst du Grenzen?

Jan: Um wirklich eine Prognose abzugeben, dafür bin ich, ehrlich gesagt, nicht tief genug im Thema AGI drin. (Musste gerade ChatGPT fragen, was das überhaupt ist 😃) Eine Grenze wäre: Ich bin überzeugt, dass bspw. "Laberpodcasts", in denen echte Menschen sich über Alltagshürden austauschen, nicht durch KI ersetzt werden wird. Womöglich wird es irgendwann sowas wie KI-basierte Promis geben, die auf Podcastebene in einen ähnlichen Schlagabtausch gehen. Ich denke, dass das dann aber immer nur
als unterhaltsames Zusatzangebot verstanden werden und echte Emotionen, Begebenheiten und Menschen nicht verdrängen wird.

Nina & Marie: Fortgeschrittene KI wird zweifellos einen erheblichen Einfluss auf die Produktion von Podcasts haben. Wir sehen AI-Dubbing im Bereich News-Podcasts als eine hervorragende Möglichkeit, journalistische Inhalte schnell auf allen Sprachen zu verbreiten, denn hier steht die Nachricht im Fokus und nicht der/die Journalist:in. Eine klare Grenzen sehen wir in Bezug auf Podcast Hosts. Wir sind überzeugt, dass KI niemals menschliche Persönlichkeiten ersetzen werden können. Daher glauben wir weder an KI-Influencer noch an KI-Hosts, weil Menschen Geschichten von Menschen hören möchten, mit denen sie eine persönliche Podcast-Beziehung aufbauen können. Hosts haben eine äußerst loyale und engagierte Community, was Podcasts zu einem der attraktivsten Werbemärkte weltweit macht. Host-Read-Ads, welche nicht weniger sind als authentische Empfehlungen der Hosts, die für ihre sogenannten "Love-Brands" – Werbung sprechen, sind ein Paradebeispiel für die Stärke von menschlichem Storytelling. Solche Verbindungen basieren auf echter Authentizität, die keine KI nachbilden kann. Unser Ansatz ist daher klar: KI soll und darf unterstützen, Prozesse effizienter gestalten und sogar neue Berufsbilder schaffen, aber sie soll niemals den menschlichen Kern der Branche ersetzen. Die Zukunft liegt in einer Symbiose aus menschlicher Kreativität und technologischem Fortschritt, nicht im vollständigen Ablösen menschlicher Kompetenzen.

Hendrik: Fortgeschrittene KI könnte die Podcast-Produktion noch stärker automatisieren, von der Ideenfindung bis zur kompletten Episode. Das würde die Erstellung von Inhalten effizienter und auch kostengünstiger machen. Aber die Grenzen sehe ich dort, wo es um Authentizität und emotionale Tiefe geht. Podcasts leben von der Persönlichkeit der Hosts und der Verbindung zum Publikum – und das wird eine KI, zumindest in absehbarer Zeit, nicht vollständig ersetzen können. Aber natürlich stehen wir vor der Gefahr, dass komplett automatisiert erstellte Podcasts die Plattformen überschwemmen. Da sind die Plattformen gefragt, um hier vorzubeugen.

Isabel: Es gibt bereits Tools wie NotebookLM, die zu einem pdf oder einem bestimmten Thema, einen Podcast auf Knopfdruck erstellen. Die Hosts lachen und scherzen miteinander und erklären dabei sehr natürlich den gewünschten Inhalt. Das ist faszinierend, aber ich frage mich, ob wir solche Funktionen brauchen. Wenn man bedenkt, wie viele Ressourcen darauf verwendet werden, um solche KI-Podcasts umzusetzen: LLMs, die mit großem Energieverbrauch das Paper analysieren und zusammenfassen und Stimmgeneratoren, die wiederum die Moderationen generieren. Ich weiß nicht, ob wir das brauchen. Der Charme eines Podcasts ist ja auch die gefühlte Nähe des Publikums zu den Hosts. Darum finde ich die Tatsache, dass Podcasts auf Knopfdruck möglich sind, faszinierend aber glaube nicht, dass sie den Menschen ersetzen. Viel eher kann KI zum Beispiel Interviews schneiden, Störgeräusche herausfiltern, Pegel optimieren, Musikbetten unterlegen, Titelgrafiken, Transkripte und Shownotes erstellen... All das geht ja schon und könnte in Zukunft noch besser und schneller über verschiedene Plattformen hinweg funktionieren. Dann brauche ich nicht mehr diverse verschiedene Dienste und Programme, sondern kippe meine Rohdateien in meinen KI-Assistenten und der produziert mir den Podcast nach meinen Vorgaben fertig. Ich müsste am Ende nur abnehmen, dass alles so umgesetzt wurde, wie ich mir das vorgestellt habe. Aber ich glaube, davon, dass KI ein Interview recherchiert, führt, nachbohrt, spontan auf den Gast eingeht und erläutert. Davon sind wir noch entfernt. Ich kann nicht sagen weit entfernt, aber ich will es hoffen.

Lala: Ich sehe Tools wie ElevenLabs als Game Changer für die Podcast-Produktion – sie werden die Prozesse deutlich vereinfachen und beschleunigen, was es einer viel breiteren Nutzerbasis ermöglicht, Content zu erstellen.
Gleichzeitig bin ich jedoch vorsichtig, was den potenziellen Overload an KI-generierten Podcasts betrifft, der den Markt überschwemmen könnte. Es wird entscheidend sein, wie sich die Qualität von Inhalten und die Authentizität in einer zunehmend automatisierten Umgebung entwickeln.

Welches KI Tool hat dich in diesem Interview unterstützt :)?

Jan: Chat GPT, zur Recherche, siehe oben. 😎

Nina & Marie: Anthropic haben wir zum Mitarbeiter des Jahres 2024 gekürt ;)

Hendrik: Natürlich ChatGPT :)

Chris: Keins.

Isabel: Keines ;)