• Diese Kategorie ist für Diskussionen rund um die Programminhalte der Sender gedacht. Über Frequenzen und Empfang kann sich unter "DX / Radioempfang" ausgetauscht werden.

Künstliche Stimmen als Ersatz für reale Mitarbeiter

Ja. Sicherlich. Wenn es dann noch gelingt, die Betonungs-Einheitssoße zu variieren und den Text beim Vortrag lebendiger wirken zu lassen (Rubati, Wortraffungen und -dehnungen), dann braucht es wirklich (fast) keine Profis mehr.
Du kannst du im Prinzip schon heute alle Stimmen nach Belieben variieren, "Ausdruckskraft" und Emotionalität lassen sich mittels Schieberegler einstellen. Ich nahm faulerweise die langweiligen Durchschnittswerte der Preselection, aber an den Stimmen ließe sich noch lange feilen.
 
Die Stimmen von Artlist und Eleven Labs kann man kaum noch von echten unterscheiden. Ich habe manchmal das Gefühl dass uns auch im öffentlich-rechtlichen Fernsehen ab und an geklonte Sprecherstimmen untergejubelt werden, als Versuchsballons sozusagen. Ein paar mal hatte ich schon den Verdacht dass in kurzen Einspielern mit der neuen Technik experimentiert wird.



Diese Youtube-Reisereportage wurde mit einer KI-Stimme der Profi-Version von "Eleven Labs" vertont, da stockt einem doch fast der Atem:

 
Zuletzt bearbeitet:
Na und : Jeder Sprecher und Moderator hat sicherlich vorher eine rictige Ausbildung gemacht, dahin kann man zurückkehren (je nach IQ) .
Liebe Antonia!
Ich finde die Verknüpfung von IQ und Radiomachern schon ein starkes Stück (es impliziert "was muss man schon können, außer dumm daherreden und Knöpfe drücken"), um nicht zu sagen: das ist eine glatte Unverschämtheit! Um hier mal für uns "Sprecher und Moderatoren" (wir reden von einem journalistischen Beruf in den Redaktionen!) zu sprechen (von denen Sie nachweislich keine Ahnung haben): Der Großteil der Beschäftigten im privaten Hörfunk hat im Hörfunk gelernt und ein Volontariat gemacht. Das ist Grundvorraussetzung, wird aber nicht offiziell als Ausbildung anerkannt. Dann gibt es diejenigen (rund 1/3), die davor oder danach studiert haben und Quereinsteiger, die tatsächlich aus einem anderen Beruf kommen und ihr Hobby (Radio) danach zum Beruf gemacht haben (eine wirkliche Minderheit).
Im Namen Aller unseres Berufsstandes "ein herzliches Dankeschön" dafür, dass sie uns (Zitat: je nach IQ) für austauschbar halten. Die MENSCHEN (ja wir atmen und haben einen Pulsschlag), die hinter dem Mikrofon stehen, ihre Geschichten erzählen, andere durch den manchmal nicht ganz leichten Alltag begleiten, fühlen sich dadurch erst so richtig wertgeschätzt.
Ich hoffe in ihrem Beruf behandelt man sie nicht so... sondern mit Respekt (den sie definitiv vermissen lassen).
Übrigens: Ich bin in einigen Bereichen durchaus ein Befürworter der KI (auch im Radio). Man geht mit der Zeit, oder man geht mit der Zeit...
 
Zuletzt bearbeitet:
Warum soll es Radiomoderatoren anders als anderen Leuten gehen?
Übersetzer wurden schon durch KI ersetzt, demnächst schreibt sie Untertitel für die WDR-Lokalzeit. Die wenigen Sätze, die im Radio noch gesagt werden, können schon lange einfach durch Voicetracks ersetzt werden. Es wundert mich, dass sie dafür überhaupt noch Menschen für diese Ansagen bezahlen.
 
Eines Tages erwirtschaften KI, Roboter, autonom fahrende Transporter und automatisierte Fabriken 80 Prozent des Brutto-Inlandsprodukts, während 90 Prozent der Menschheit freiwillig oder erzwungenermaßen in der Hängematte liegen bzw. oder ihren vielfältigen Hobbys nachgehen. Statt Einkommensteuern einzuheben verteilt die Verwaltungs-KI des Staates nur noch um und das bedingungslose Grundeinkommen sichert die Existenz der abgeschafften Menschheit.
 
Warum soll es Radiomoderatoren anders als anderen Leuten gehen?
Im Film-Synchron-Geschäft wehrt man sich ebenfalls gegen KI. Das dortige Argument lautet dort: KI ist bis in nähere Zukunft nicht in der Lage, die schauspielerische Kunst der Synchron-Schauspieler zu ersetzen.

Beim Radio gäbe es für Moderatoren genau diese Chance, sich darüber unersetzlich zu machen. Tatsächlich ist das von Seiten der Radio-Veranstalter nun gerade nicht gewollt.
 
Ja, bekannt. Auch dagegen wehrt sich die Gilde. Besonders gegen Deepdub. Fürs Radio ist eine Moderatoren-Vereinigung selbst mit der Lupe nicht auffindbar.
 
Tatsächlich ist das von Seiten der Radio-Veranstalter nun gerade nicht gewollt.
Dann sollten die, von denen das nicht gewollt ist, eben keine Radioveranstalter mehr sein und das Feld denen überlassen, die noch wirkliches Interesse am Medium haben, wirtschaftlich, wie leidenschaftlich.
Es gibt so viele andere Möglichkeiten mit KI zu arbeiten, in Bereichen wo sich das viel mehr lohnt.
 
Klar wehrt man sich dagegen. Gerade in Deutschland, wo das Synchronisieren von Filmen und Serien jahrzehntelange Tradition ist. Das ist ein ganzes Business aus Dialogautoren, Dialogregisseuren, Synchronsprechern, Synchronstudios usw. Dass man hier das Feld nicht kampflos der KI überlässt ist ja logisch. Dennoch wird sich das in den nächsten Jahren radikal ändern. KI-Stimmen haben jetzt bereits eine hervorragende Qualität, Emotionen sind ebenso möglich. Es ist nur eine Frage der Zeit, bis sich Timothée Chalamet oder Scarlett Johansson, oder wer auch immer quasi "selbst synchronisieren" - und das in theoretisch jeder denkbaren Sprache. Natürlich werden Menschen dadurch weniger oder womöglich gar nichts mehr zu tun haben - allen voran die Synchronsprecher - aber es werden sich Berufe auch einfach verändern und es kommen neue, andere Geschäftsmodelle dazu. Für das Radio gilt das genauso. Die Branche ist ja bereits stark im Wandel, KI ist da nur ein Teil davon, und meiner Meinung nach ein sinnvoller Teil, wenn man KI intelligent und verantwortungsvoll nutzt.
 
Das Zauberwort heißt Wettbewerb. Man kann natürlich alles so lassen wie immer, dann geht man halt in Schönheit unter. Denn wenn der Markt um einen herum es anders macht und sieht und die Preise dadurch fallen, bekommen die halt die Aufträge. Moral hin oder her. Sieht man doch auch in allen anderen Branchen. Klar, wäre ein kleiner Laden um die Ecke schön. Fakt ist aber, dass die meisten zum Discounter rennen, kleine Läden dichtmachen und das ist es dann. Marktmacht auf wenige Konzerne verteilt, weil es sich so entwickelt. Auch wenn man es ursprünglich so nicht kommen sieht, kommt man trotzdem dorthin, weil jeder versucht, das meiste für 1 Euro rauszuholen und hier konkurrieren dann Supermarktketten gegen kleine Läden, die allzu oft unterliegen. Warum soll es beim Radio anders sein? Das ist das Risiko bei unserem Wirtschaftssystem, ob es einem passt oder nicht.
 
Hm, ein Aspekt, den ich dabei recht interessant finde, ist der der Akzeptanz. Wollen denn die Hörer KI-generierte Syncronstimmen oder Radiomoderatoren haben? Ich erlebe bei vielen eher eine gewisse Befremdung, was das angeht, selbst bei den vielen KI-interessierten und ihren Möglichkeiten gegenüber aufgeschlossenen Menschen in meinem Umfeld. Klar, das kann sich auch noch ändern, aber ich denke, einen Markt für echte Stimmen wird es immer irgendwie geben, und sei es als Nischenprodukt, das genau deshalb genutzt wird. Sowas haben wir ja schon in vielen anderen Bereichen, in denen Produkte offensiv als "handgemacht" vertrieben werden, eben weil es nicht (mehr) die Regel ist. Aktuell machen viele Sender ja noch recht großen Rummel um ihre KIs, einfach, weil das Thema im Trend liegt. Irgendwann wird das vermutlich abflauen, einfach, weil es nichts wirklich besonderes mehr ist. Und im Zweifelsfall setzt dann vielleicht eben eine Gegenbewegung ein.
So ein bisschen habe ich das selbst schon im Kleinen erlebt. Seit einigen Jahren produziere ich satirische Audios, in welchen ich, ähnlich wie einst Hermann Hoffmann, Aussagen bekannter Stimmen auseinanderschneide und anschließend in fiktiven Talkrunden wieder neu zusammensetze. Allerdings ist das bei mir eher im eigenen Mikrokosmos: Zu meiner Schulzeit nahm ich mir die Lehrerschaft dafür her, jetzt, an der Uni, sind es die Professoren. Und die Resonanz darauf war schon immer sehr gut, auch in einer Zeit, in der an KI-Voiceklons noch überhaupt nicht zu denken war. Irgendwann bin ich dann mal gefragt worden, ob ich eigentlich auch KI dafür einsetzen wolle, da ich meine Protagonisten ja so noch viel besser genau das sagen lassen könnte, was ich möchte. Ich dachte kurz nach und sagte dann entschieden: "Nein. Das wäre unsportlich". Der Witz an diesen Audiomontagen besteht ja genau darin, dass die Leute das, was sie hier sagen, wirklich selbst gesagt haben, nur eben in ganz anderen Zusammenhängen. Allerdings führte diese Überlegung zu etwas: Seitdem mache ich explizit darauf aufmerksam, dass hier keine KI, sondern ausschließlich echtes Material zum Einsatz kommt. Und was soll ich sagen? Es hat nochmal zur Steigerung der Popularität beigetragen, eben weil es mit KI ja so viel einfacher ginge und viele wohl diesen Weg des geringeren Aufwands gehen würden, wodurch aber eben dieser wichtige Teil der Komik verloren ginge.
Fazit: Es ist jetzt wichtig, die Stärken menschlichen Personals zu erkennen und offensiv zu vermarkten, eben zum Beispiel, wenn es darum geht, einen Moderator mit Ecken und Kanten am Mikrofon zu haben, der für die Hörer da ist, auch und gerade in Zeiten, in denen es nicht so viele sind, etwa in der Nacht. Das müsste dann damit einhergehen, auch die Radioprogramme wieder mehr als eine selbstbewusste Alternative zu nonlinearen Angeboten zu gestalten und zu vermarkten, was dem Medium, möchte es auch weiterhin eine Legitimation haben, auch nur zuträglich sein kann.
 
Keine Frage, KI wird immer mehr auch für Audio-Anwendungen genutzt werden. Gerade für kleine, schwach ausgestattete Produktionen oder als Vorle-Software hat das irgendwo auch gerne eine entsprechende Berechtigung.

Dennoch ist klar, dass z.B. ein Kinoerlebnis, in welches man bewusst Zeit und Geld investiert, am Ende auch eine gute Synchron-Performance enthalten sollte. Dieser Mehrwert muss da sein. Ansonsten entsteht eine Überproduktion nicht relevanter Inhalte.

Für mich ist auch entscheidend, ob wir uns die ganzen Medieninhalte noch reinziehen würden, wenn beispielsweise > 90 Prozent davon KI generiert wären. Vielleicht wird es einmal eine solche Generation geben?

Die Rückkehr von Stefan Raab ins Fernsehen, die ist vielleicht nicht einhundert Prozent gelungen, aber das macht sie so interessant. Sie polarisiert allgemein und hat auch im Zwist zwischen ProSieben und RTL einigen Staub aufgewirbelt. So entsteht Kreativität. Würde man sich so sehr an der Personalie Raab reiben, wenn eine KI die Show moderieren würde? ProSieben hatte jetzt eine Live-Ausgabe von TV Total mit Call Ins und einem Flohmarkt alter TV Total Requisiten. Man experimentiert aktuell mit dem Format. Wäre so eine Kreativität auch da, wenn da jeweils ein "KI Puffpaff" und ein "KI Raab" nach bestimmten Parametern programmiert wären?

Und vor allem: Würde man das schauen wollen, wenn alles von der KI käme? Witze, Moderation, klatschendes Studiopublikum? Vor allem bei der Schwemme möglicher KI-generierter Inhalte.

Auch beim Radio finde ich den Faktor Mensch entscheidend. Von KI vorgelesene Nachrichten und Meldungen haben trotz aller Fortschritte einen gewissen Zynismus beibehalten. Radio allgemein darf nicht noch beliebiger werden oder gar offen zynisch.
 
Zuletzt bearbeitet:
An der wirklich sehr fundierten Diskussion hier würde ich gerne teilnehmen, aber nachdem ich selbst schon einige Male auf KI-generierte Stimmen reingefallen bin (für mich noch vor zwei Jahren undenkbar!), strecke ich mal die Waffen. Allerdings hoffe ich, wie ja auch hier im Faden beschrieben, dass die Nischen (wirklich gut (!) gelesene Hörbücher, emotionale Textsorten wie Lyrik u.ä.) so schnell nicht über KI generiert werden können, jedenfalls nicht ohne aufwändigste Nachbearbeitung. Aber dann könnte man auch einen Sprecher hinsetzen, der es gleich richtig macht.
 
"...reingefallen bin...", "...ein Sprecher, der es gleich richtig macht..." - das zeigt schon, wie emotional dieses Thema ist - und das ist nicht wertend gemeint. Viele Medienschaffende haben Angst um ihren Job oder ihre Zukunft, und das ist völlig legitim. Trotzdem kann man das Thema "KI vs echte Menschen" auch ganz emotionslos betrachten. Jeder von uns konsumiert bereits täglich zig-fach KI-generierten Content. Sei es als Online-Texte, als Postings auf Social Media, als Antwort-Bots, als Werbetexte, als Moderatorentexte oder sogar als gesprochenes Wort, dass man nicht als KI erkennt. Problematisch wird es ja nur, wenn man merkt, dass es KI ist.
Realität ist meiner Meinung nach aber, dass man als Medienmensch die Entwicklungen akzeptieren muss, und sich mitentwickeln soll/kann/muss. KI ist eben nicht nur eine Gefahr, sondern auch eine Chance.
 
Aber dann könnte man auch einen Sprecher hinsetzen, der es gleich richtig macht.
Wer will denn noch Sprecher bezahlen, wenn den Text eine KI für lau "spricht"? Finde ich gruselig, ist aber voll im Trend!! KI wird vermehrt bei Warteschleifen genutzt, dessen einziges Ziel ist, Kosten zu sparen! Warum sollte das beim Radio anders sein?!:thumbsdown:
 
Zuletzt bearbeitet:
"...reingefallen bin...", "...ein Sprecher, der es gleich richtig macht..." - das zeigt schon, wie emotional dieses Thema ist - und das ist nicht wertend gemeint.
Zumindest das mit dem "richtig machen" ist aber glaube ich weniger der Emotionalität im Punkto KI geschuldet, sondern eher der Tatsache, dass man eben immer öfter Menschen vor Mikrofone setzt, die es eben nicht richtig im Sinne eines professionellen, eigens dafür ausgebildeten Sprechers machen. Erstere lassen sich schätzungsweise schneller durch KI ersetzen, jedenfalls, wenn es nur um das bloße Ablesen von Texten geht, während es, bis letztere durch KI adequat ersetzt werden können, wohl noch ein Weilchen dauern dürfte.
 
Wer will denn noch Sprecher bezahlen, wenn den Text eine KI für lau "spricht"? Finde ich gruselig, ist aber voll im Trend!! KI wird vermehrt bei Warteschleifen genutzt, dessen einziges Ziel ist, Kosten zu sparen! Warum sollte das beim Radio anders sein?!:thumbsdown:
Das ist ja der Punkt, den ich meine: Für wirklich höchstwertige Sprecherarbeit, die tatsächlich die verstecktesten Preziosen eines Textes zum Strahlen bringt, müsstet Du die KI "per Hand" intensivst nachsteuern. Und statt dieser Arbeit könntest Du auch gleich einen Sprecher buchen, der es sofort bringt. Einen Heidenreich, einen Klemm, einen Wittelsbürger, einen Langer, einen Bögel kann man mit diesem Textverständnis und dieser Präzision per KI nicht klonen.
Ergänzung:
Für Feld-, Wald- und Wiesentexte, auch für Dudelfunkmoderationen oder Sachinformationen reicht die KI aus. Aber sprecherische Ausdrucksgestaltung ist dann doch noch mal was anderes.
 
Zuletzt bearbeitet:
Ich befasse mich seit rd. 50 Jahren mit dem Thema "Synchronisation". Aus meiner Sicht ist die deutsche Synchronisation im Vergleich zu anderen Ländern immer noch gut. Aber- was hat sich in den letzten Jahren alles geändert. Standen früher 5 oder 6 Sprecher gleichzeitig im Studio und sprachen ihre Dialoge so wird heute nur noch "g-xt", d.h. ein Sprecher steht alleine im Studio und spricht den Text. Hinzu kommt, das oftmals die Person im Bildschirm (früher Leinwand) fast ganz verdeckt ist und nur die Mundbewegungen zu sehen sind, damit auch niemand etwas kopieren kann. Und jetzt kommt auch noch KI hinzu. Die polnische Serie ist in Israel "synchronisiert" worden. Angeblich waren daran 35 Techniker beteiligt, darunter eine deutschsprachige Dame, die wohl eine Art "Aufsicht" geführt hat (war aber vermutlich öfters in der Kantine...). Bei 35 Technikern frage ich mich natürlich, ob es nicht günstiger gewesen wäre, gleich Schauspieler zu engagieren.... Das Ergebnis ist jedenfalls in die Hose gegangen. Allerdings bin ich mir auch bewusst, das man die Entwicklung nicht aufhalten kann und irgendwann nur noch alles am Computer erstellt wird. Man wird in einigen Jahren wieder Clark Gable in neuen Filmen sehen können und dazu seine deutsche Stimme Siegfried Schürenberg hören. Hoffentlich drehen sich dabei die beiden Herren nicht im Grabe um...
 
KI wird vermehrt bei Warteschleifen genutzt
Und das leider oftmals ziemlich lustlos und uninspiriert, wodurch das Künstliche häufig schon im Begrüßungssatz hörbar ist. Dabei sind zumindest die grundlegenden Formulierungen einer Telefonwarteschleife, wenn es nicht gerade um täglich oder wöchentlich wechselnde Sonderangebote geht, meistens statisch und werden nur selten verändert. Da hätte sich z.B. ein großer Brief- und Paketzusteller mit Sitz in Bonn mehr Mühe geben dürfen.

Allerdings hoffe ich, wie ja auch hier im Faden beschrieben, dass die Nischen (wirklich gut (!) gelesene Hörbücher, emotionale Textsorten wie Lyrik u.ä.) so schnell nicht über KI generiert werden können, jedenfalls nicht ohne aufwändigste Nachbearbeitung. Aber dann könnte man auch einen Sprecher hinsetzen, der es gleich richtig macht.
Fiktionale Texte aller Art gehören ja auch im Radiogeschäft zur präsentationsästhetischen Königsdisziplin. Nur: An welchen Stellen wird diese Kunst im Hörfunk überhaupt eingefordert? In der MoShow jedes gewöhnlichen Hitradioverschnitts schon mal nicht. Und gerade dort könnte die KI mittelfristig das Hörerlebnis sogar verbessern:

Vielleicht bringt ein hochentwickelter KI-Newsanchor seine Nachrichten bald schon reifer, seriöser, glaubwürdiger und weniger fehlerbehaftet unter die Leute als jeder überarbeitete Brückentagslokalfunker, der neben seiner Haupttätigkeit auch noch Flitzerblitzer, Hörerservice und Social Media bedienen muss.

Rückblickend hätte ich in manch hektischer Nachrichtenschicht die Hilfe eines künstlichen Redaktionsassistenten durchaus gerne und wohlwollend in Anspruch genommen. Ob zwischen uns beiden Streit über die genaue Aufgabenverteilung entstanden wäre? Womöglich...
 
Zurück
Oben