KI und Emotionalität: Trends im Audio-Markt 2024

Medientage München #MTM24 (Bild: Medien.Bayern GmbH)
Medientage München #MTM24 (Bild: Medien.Bayern GmbH)

Bei den MEDIENTAGEN MÜNCHEN 2024 hoben Fachleute die besondere Bedeutung von Audio- und Radio-Formaten hervor, die durch Nähe und Glaubwürdigkeit Vertrauen schaffen können – selbst bei ganz jungen Zielgruppen. Die zunehmende Bedeutung von KI in der Produktion wurde durchaus kritisch beleuchtet: ChatGPT und Co. erleichtern zwar Prozesse, doch echte Kreativität und emotionales Engagement bleiben den Menschen vorbehalten, so der Tenor bei den #MTM24. Außerdem stufte die Branche die Gattung Audio als wachsendes Werbemedium ein, das durch regionale und zielgruppenspezifische Ansätze stark zur Markenbindung beitragen kann.

Ein Überblick von Petra Schwegler

Eine hohe Glaubwürdigkeit bei Inhalten, Gespräche auf Augenhöhe und Hörfunk- oder Podcast-Programme, die so „nah dran am Menschen“ sind wie „kein anderes Medium“: Bei verschiedenen Sessions im Rahmen der MEDIENTAGE MÜNCHEN 2024 machten Expert:innen aus der Branche deutlich, dass Audio über enorme Wirkmacht beim Publikum verfügt.

Ein Pfund, mit dem es zu wuchern gilt: Durch die starke Bindung der Hörer:innen ist es möglich, mit entsprechenden Inhalten das schwindende Vertrauen der Menschen in die Medien wieder zu erhöhen, wie beim Audio-Gipfel der #MTM24 deutlich wurde.

Senderchef Christian Berthold von Antenne Thüringen stellte beispielsweise vor, wie das Radioprogramm während der Landtagswahlen im September 2024 „Position bezog“, indem die Inhalte auf „Emotionalisierung, nah dran an den Hörern“ ausgerichtet waren: „Wir haben Formate kreiert, die nur aus Hörerfragen bestanden, die dann diskutiert wurden“, legte Berthold dar. Dadurch habe „sein Team die Leute bewegt, die Hörer gekitzelt“, indem es auf deren Probleme und Ängste eingegangen sei.

Für Diane Dotzauer, Programmbereichsleiterin beim Bayerischen Rundfunk, ist es wichtig, „Bindung aufzubauen, weg vom Oberlehrerhaften“ und zu fragen, was die Ängste der Hörer:innen seien. Mit der Frage „Wie können wir euch helfen?“ beschrieb Dotzauer beim Audio-Gipfel die Vorgehensweise bei der optimalen Ansprache der Hörer:innen, „damit die Menschen einen Nutzen haben“.

Marco Morocutti, Geschäftsführer von Radio NRW, sah die Herausforderung für die Audio-Branche darin, „Nachwuchs auf beiden Seiten, bei Hörer:innen und Moderator:innen“ aufzubauen. Damit das gelinge, müsse „die Anmutung der Branche Audio jünger und moderner“ werden. Und Katja Ostrowsky, Geschäftsführerin des Radio-Aggregators radio.de, hob die „Einfachheit“ der Rezeption als wichtigen Nutzen für User hervor. Sie appellierte an die Audio-Branche, „in den Zeiten von Multikrisen positiv zu bleiben“. Sie zeigte sich sicher: „Radio kann dazu beitragen.“

Der Audio-Gipfel der #MTM24 (Bild: Medien.Bayern GmbH)
Der Audio-Gipfel der #MTM24 (Bild: Medien.Bayern GmbH)

Von Nutzen, Chancen und Fragezeichen

Schnell kam die Diskussionsrunde auf den zunehmenden und unaufhaltsamen Einsatz von Künstlicher Intelligenz (KI) beim Erstellen und Verbreiten von Audio-Inhalten zu sprechen. Die Gefahr, die dort gesehen wurde: KI und vor allem generative KI wie ChatGPT könnte die positiven Eigenschaften von Audio einschränken. Deshalb sprachen die Expert:innen auf dem Podium auch darüber, wie die Medienschaffenden der Branche mit dieser Gefahr umgehen sollten.

Antenne-Thüringen-Chef Berthold etwa führte an, dass der Einsatz von KI „Ressourcen freisetze“, die dafür genutzt werden könnten, „Live-Entertainment“ zu erschaffen, um „nah am Hörer zu sein“ und „die Menschen zu erreichen“. BR-Managerin Dotzauer bezog sich auf den „Programmbestandteil Live-Entertainment“ und wies darauf hin, dass „KI bereits synthetische Bands kreiere“ und „Konzerte komplett in die Virtualität transformiere“. Sie überlege sich mit ihren Mitarbeitenden, wie für die Hörer:innen „das Erleben, das Echt-Sein“ in Folge dieser Möglichkeiten und Entwicklungen der KI weiterhin umgesetzt werden können.

In Bezug auf den Einsatz von KI werde „Voice-Cloning“ als eine Technologie, um die Stimme eines jeden Menschen mit hoher Genauigkeit nachzubilden, das „Nachwuchsproblem „nicht nachhaltig lösen“, prognostizierte Radio-NRW-Lenker Morocutti. Die hohe Qualität bei der Ausbildung von Moderator:innen bei seinem Sender ermögliche erst, „Glaubwürdigkeit herzustellen und identitätsbildend für NRW“ zu sein. Der Einsatz von KI sei dafür da, „die Effizienz zu steigern“, aber weniger für die Produktion von Inhalten geeignet.

Ins selbe Horn stieß York Strempel, Programmdirektor des privaten Hörfunksenders KISS FM Berlin. Der Einsatz von KI könne „nicht ersetzen, sondern nur unterstützen“, da „nur Menschen Menschen bewegen“, urteilte Strempel. Für Konstantin Seidenstücker (Foto: Medien.Bayern GmbH), Co-Founder & Managing Director des Podcast-Netzwerkes Studio Bummens, schafft der Einsatz von KI, beispielsweise in Form von „Tools“, um die „Audioqualität“ zu erhöhen, Entlastung in der Redaktion. „Weniger Nervkram, mehr Zeit für Inhalte“, sagte Seidenstücker.

Konstantin Seidenstücker von Studio Bummens (Foto: © Medien.Bayern GmbH),
Konstantin Seidenstücker von Studio Bummens (Foto: © Medien.Bayern GmbH)

Bei radio.de könnte KI die Nutzer:innen bei der Suche technisch darin unterstützen, Hörerwünsche“ zu erfüllen, wie Unternehmenschefin Ostrowsky ausführte.

Um KI kommt die Gattung nicht herum

Bei einer weiteren Diskussionsrunde im Rahmen des Audio-Tracks der 38. MEDIENTAGE MÜNCHEN standen die KI-Anwendungen selbst im Mittelpunkt. Dort waren sich die Expert:innen einig, dass Künstliche Intelligenz alle Prozesse im Bereich Audio nachhaltig verändern wird, indem Tools etwa den Rechercheprozess und die Herstellung von Audio-Inhalten erheblich unterstützen und beschleunigen können. Sie bilden darüber hinaus ein zusätzliches kreatives Potenzial. Doch der eigentliche schöpferische Prozess – beispielsweise bei der Podcast-Produktion – werde auch künftig maßgeblich durch die menschliche Intelligenz bestimmt, hieß es.

(Bild: © Medien.Bayern GmbH)
(Bild: © Medien.Bayern GmbH)

Maximilian Conrad, Co-Founder und Geschäftsführer des Corporate-Podcasting-Unternehmens Hype1000, stimmte dieser These uneingeschränkt zu. Eva Deinert, Journalistin und Innovationsmanagerin, und ihr Kollege Matthias Leitner, Digital Storyteller & Creative Producer beim BR verantworten dort die Produktion von Podcasts (Foto: Medien.Bayern GmbH).

Auch sie betonten die zentrale Bedeutung menschlicher Kreativität für die Herstellung von Audio-Inhalten. Das BR-Team stellte seinen sechsteiligen Krimi-Podcast vor, der kürzlich mit dem Grimme Online-Award ausgezeichnet wurde.

Ziel der Podcast-Produktion „In 5 Tagen Mord war, die KI dabei sowohl zum inhaltlichen Gegenstand der Erzählung zu machen als auch verschiedene Tools in den redaktionellen Entstehungs- bzw. den technischen Produktionsprozess einzubinden. Eine wesentliche Erfahrung aus diesem Projekt sei die Nutzung von KI-Tools als unterstützendes Element, berichtete Leitner.

Kreativität im engeren Sinne haben wir bei der KI jedoch nicht erkannt. Die bleibt wohl weiter dem menschlichen Redaktionsteam vorbehalten. (Matthias Leitner, BR)

Zudem seien schon bald ethische Fragen aufgekommen – etwa die, ob man die Stimme einer bereits verstorbenen Person klonen und in einer Audio-Produktion verwenden dürfe. „Hier setzt der BR eindeutige Regeln, die auch in Zukunft unsere Produktionen bestimmen werden. Dieses Klonen ist für uns tabu“, verdeutlichte der BR-Manager.

Erfahrungen, die Startup-Gründer Maximilian Conrad im Bereich Podcasts für die Unternehmenskommunikation gemacht hat, bezogen sich auf Sprachmodelle, das Klonen von Sprache, KI-gestützte Produktion und Audio-Transkription von Texten. Seine Firma Hype1000 hat dazu eine Software entwickelt, die beispielsweise Textinformationen in PDF-Form mit nur wenigen Klicks in einen sendefertigen Podcast umwandeln kann.

Noch werde dieser Umwandlungsprozess durch ein Team-Mitglied begleitet, schränkte Conrad ein. Die KI produziere noch zu viele Falschinformationen, als dass diese Prozesse vollautomatisiert ablaufen könnten. Doch, wie lange noch? Einig waren sich die Expert:innen, dass sich die Entwicklungszyklen bei KI-Anwendungen weiter dramatisch verkürzen und dem Feld der Audio-Produktion massive Veränderungen bescheren werden.

Was hören die Jungen?

Daneben standen bei den #MTM24 die Hörer:innen im Mittelpunkt – und ganz besonders die Jüngsten unter ihnen. Grundsätzlich sei es heute schwieriger, ein Programm auf junge Zielgruppen zuzuschneiden, sagte Schiwa Schlei. Die Programmchefin sowohl für das junge WDR-Angebot 1LIVE als auch das interkulturelle Radioprogramm Cosmo nahm neben Vertreter:innen der privatwirtschaftlichen Kanäle bigFM und Radio Teddy an einer MTM-Diskussion teil.

Einer erfolgreichen Positionierung als Angebot für junge Hörer:innen stünden die Fragmentierung der Hörfunklandschaft, die Konkurrenz durch immer neue Kanäle und die divergierenden Musikstile entgegen, betonte die Vertreterin aus dem öffentlich-rechtlichen Radio. Andererseits gebe es für ein stimmiges Konzept aber immer ein Publikum, zeigte sich Schlei überzeugt. Und das bedeute: „Auf das Live-Momentum setzen, Events kreieren, einen Mehrwert bieten und nicht nur eine Playlist abzuspielen.“

Zu diesem „Mehrwert“ zähle es beispielsweise, zuzuhören und auf die Anliegen und Sorgen der jungen Menschen einzugehen. Darauf wies Filiz Meryem de Campos Oliveira hin. Sie führt als Moderatorin beim Sender bigFM viele Live-Gespräche mit jungen Menschen. Manche seien auch zehn Minuten lang, räumte sie ein.

Von „Storylistening“ sprach Roland Lehmann. Der Programmchef des Kinder- und Familiensenders Radio Teddy schilderte, dass jeden Morgen on Air mit Eltern über die aktuellen Themen ihrer Kinder diskutiert werde. Hinzu kommen Umfragen unter Schulklassen und die Organisation von Fokusgruppen.

Von Gen Z-bis Gen Alpha-Diskussion (Bild: © Medien.Bayern GmbH / MEDIENTAGE MÜNCHEN)
Von Gen Z-bis Gen Alpha-Diskussion (Bild: © Medien.Bayern GmbH / MEDIENTAGE MÜNCHEN)

So wichtig wie die Themen sei auch die Auswahl der Kanäle, über die die jungen Zielgruppen angesprochen werden, hieß es in der Runde. Je nach Inhalt könne beispielsweise Social Media geeigneter sein als Live-Radio. Unterschiedliche Ausspielwege müssten jeweils andere Bedürfnisse befriedigen, so die die WDR-Programmchefin.

Neben Live-Radio, Podcasts und Social Media seien Veranstaltungen, auf denen sich Programmveranstalter und Hörer:innen begegnen, zunehmend ein wichtiger Kanal. Events seien fürs Community-Building unverzichtbar, bestätigte Lehmann.

Daneben empfahl Kommunikations- und Marketingexperte Axel Dammler, geschäftsführender Gesellschafter von Iconkids & Youth International Research, in einer weiteren MTM-Diskussion die chinesische Plattform TikTok, um die Zielgruppe anzusprechen: „Man muss die jungen Menschen über TikTok abholen“, denn die meisten klassischen Medien seien „zu erwachsen“ für die Generation Alpha, so der Medienforscher.

Mit der Audio-Werbung klappt es schon mal …

Optimismus versprühten bei den MEDIENTAGEN MÜNCHEN teils jene Expert:innen, die sich um Sales und Werbung im Umfeld Audio kümmern und sich zur Zukunft der Audio-Werbung im House of Communication austauschten. Angesichts der Tatsache, dass jede:r ständig Kopfhörer im Ohr habe, sah etwa RMS-Geschäftsführer Stefan Mölling seine Gattung im Aufwind: „Audio befindet sich in einer goldenen Gegenwart. Das gilt es zu monetarisieren.“ Wer seine Marke stärken und den Verkauf seiner Produkte ankurbeln möchte, sei in puncto Werbung mit der Mediengattung Audio besser beraten denn je: Audioformate würden nämlich heute stärker genutzt als noch vor fünf Jahren.

Isabell Santa Olalla (Bild: © Medien.Bayern GmbH / MEDIENTAGE MÜNCHEN)
Isabell Santa Olalla (Bild: © Medien.Bayern GmbH / MEDIENTAGE MÜNCHEN)

Mit steigender Reichweite steigt zugleich die Verantwortung, für qualitative Inhalte und für Brand Safety, also Markensicherheit, zu sorgen. Hier komme allen Seiten die Aufgabe zu, sich stärker zu professionalisieren, hieß es aus der Runde, an der auch Tina Jürgens, Co-CEO der Zebralution-Gruppe, und Isabell Santa Olalla, Senior Account Manager bei der Agentur 480Hz, teilnahmen.

Im Einsatz von künstlicher Intelligenz sah die Expert:innenrunde große Chancen für die Skalierbarkeit, etwa im Bereich der Regionalisierung. „Wir haben in Deutschland starke regionale Medien – daher kann hier etwa mit dem Einsatz regionaler Färbung natürlich auch eine Anwendung für Audio erfolgreich sein“, betonte Mölling, Chef des Hamburger Audiovermarkters RMS.

Mit technologischen Aspekten setzte sich die darauffolgende Expert:innenrunde zum Thema Media-Strategie auseinander. Mediaplus-Audiokenner Daniel Schmidt appellierte an die Audio-Anbieter: „Der Buchungsprozess muss leicht sein. Ich muss als Agentur wissen, was ich meinem Kunden anbieten kann. Am besten automatisiert.“ Aktuell würden häufig noch Excel-Tabellen verschickt, was kurzfristige Buchungen erschwere.

Maria Miersch, Senior Online Marketing Managerin beim Versandhändler Otto, ergänzte: „Für uns als Werbungtreibende ist wichtig zu wissen: Welche Plätze sind frei? Das bringt bessere Planbarkeit – gerade im Hinblick auf große Kampagnen zum Black Friday oder zu Weihnachten.“

Dass die Gattung hier auf einem guten Weg sei, versicherte Studio Gong-Geschäftsführer Andreas Lang: „Wir bauen derzeit Prozesse auf. Bei etwa 500 bis 600 Sendern in Deutschland gibt es immer mehr gebündelte Angebote.“ Der Kanal Audio sei im Mediaplan zahlreicher Werbekunden ein absolutes Muss. Aus Sicht von Maria Miersch etwa spielt die Gattung vor allem in Sachen Reichweiten-Aufbau eine große Rolle. Auch regional könne der Kanal Audio viel erreichen, etwa für Live-Events.

Audio ist für uns eine wichtige Ergänzung zur klassischen Bewegtbild-Kommunikation. Denn wir sprechen unsere Kunden hier nochmal in einer ganz anderen Nutzungssituationen an.(Maria Miersch, Otto)

„Wir haben als eines der letzten verbliebenen Massenmedien ein hohes Mobilisierungspotenzial“, urteilte Lang. Mit Targeting in der Region verknüpft sei die Gattung ein Pfund: „Hier lassen sich wichtige Akzente für den Abverkauf setzen.“ Dank Sound-Logo oder Sound-Identity ist die Gattung auch geeignet, wenn es darum geht, Marken tief zu verankern.

Maria Miersch (l.) mit Moderatorin Lena Herrmann (Bild: Medien.Bayern GmbH)
Maria Miersch (l.) mit Moderatorin Lena Herrmann (Bild: Medien.Bayern GmbH)

Gerade Otto hat aktuell an einem eigenen Sound getüftelt und will diesen künftig für mehrere Kanäle einsetzen. Der Versandhändler habe von anderen Werbungtreibenden gelernt, etwa von Ikea oder von Seitenbacher. Maria Miersch: „Der Erfolg wird sich natürlich nicht sofort einstellen, aber wir sind uns sicher: Für unsere Branding-Kampagnen ist das neue Audio-Format eine wichtige Ergänzung.“

Weiterführende Informationen