Künstliche Stimmen als Ersatz für reale Mitarbeiter

Mir ist das völlig wurscht, ob mir eine KI oder eine fleischliche Moderationspuppe ins Ohr trötet, dass ich angeblich die meiste Musik mit der größten Abwechslung höre... Und für die 1"30 Infohäppchen auf Hitradio XY dürfte eine KI-Stimme sprecherisch sogar eine Verbesserung sein.
 
Traurig wie das hier gefeiert wird. Das nimmt dem Radio doch stark die Seele. Ich kann das so nicht befürworten. Geld sparen geht auch anders.
Naja, so, wie Radio heute aufgestellt ist, mit reinen Claim-Aufsagern, denen jede Spontanität und Individualität aberzogen wurden, und einem zu Tode optimierten Musikprogramm, wäre es nur konsequent, wenn man als letzten Schritt auch das gesprochene Wort, das eh belanglos ist, aus der Retorte produziert.
 
tztWo ist Dein Problem? Es wird in Kürze kommen, auch wenn ein genauer Tag noch nicht genannt ist.
Und darüber freust du dich so sehr. Bei besserer Recherche hättest du die Suchfunktion benutzt. wo auch du gesehen hättest, dass wir das Thema schon mal hatten. Aber du findest es besser, das Forum lieber zuzumüllen. Bin doch nicht doof & schreibe meinen Senf 2x zum gleichen Thema. Bin rbb-Wiederholungsgeschädigt.😵‍💫 Ich hoffe sehr, diese gequirlte (Zensiert) formulierst du nicht in paar Monaten wieder um & verkaufst es erneut als neuen Thread:cool:
 
Sind eigentlich die Foristen hier alle noch echt? Oder geistern hierlängst ein paar Chatbots herum?
Noch nicht, aber die kommen sicher auch... (spart ja auch Zeit)

Mal etwas ernthafter: Die KI Sprachen werden immer besser, z.B. die von Micmonster (https://micmonster.com/) haben inzwischen es weit gebracht. Und den typischen DJ Sound bekommt man einem solchen Modell bestimmt beigebracht.

Natürlich werden einige Zuhörer (mich eingeschlossen) verjagt, aber das ist dann so viel billiger, dass dieser Trend irgendwann doch nicht aufzuhalten ist.
 

Anhänge

  • de-DE-TanjaNeural.mp3
    180 KB
  • de-DE-ChristophNeural.mp3
    168,8 KB
  • de-DE-KlarissaNeural.mp3
    176,6 KB
Zuletzt bearbeitet:
Natürlich werden einige Zuhörer (mich eingeschlossen) verjagt,
Ich hoffe es wird jeder verjagt und man besinnt sich mal. Ein echter Mensch ist durch nichts zu ersetzen. Voicetracking toleriere ich noch und das muss auch reichen. Ein bisschen Arbeit sollte man erwarten können, sonst kann man es auch gleich komplett sein lassen. Radio entweder nur mit echten Menschen oder komplett einstellen.
 
In Randzeiten für kleine Stationen, um reale Gefahrendurchsagen von Feuerwehr und Polizei zwischen der Automation zu ermöglichen - Dafür könnte eine synthetische Stimme sinnvoll genutzt werden. "Fenster und Türen geschlpssen halten, Chemiewolke!"
Aber um Agenturmeldungen - am Besten noch 1:1 synsthetisch - vorzulesen in der Nacht, dafür sollte das nicht genutzt werden. Was machen dann dpa und andere Nachrichtenagenturen? Lassen die das dann auch künftig synthetisch schreiben? Es braucht im Gegenteil mehr kritischen Journalismus. Den gibt es aber weder gratis noch synthetisch.
 
Und darüber freust du dich so sehr. Bei besserer Recherche hättest du die Suchfunktion benutzt. wo auch du gesehen hättest, dass wir das Thema schon mal hatten. Aber du findest es besser, das Forum lieber zuzumüllen. Bin doch nicht doof & schreibe meinen Senf 2x zum gleichen Thema. Bin rbb-Wiederholungsgeschädigt.😵‍💫 Ich hoffe sehr, diese gequirlte (Zensiert) formulierst du nicht in paar Monaten wieder um & verkaufst es erneut als neuen Thread:cool:

Du hast aber einen aggressiven Tonfall. Nur zur Klarstellung: Ich habe mich mitnichten über den von RTL angekündigten Einsatz von synthetischen Stimmen gefreut.
 
Um im andauernden Podcast-Boom noch präsenter zu sein, kam man bei NTV auf die Idee, die Stimmen bestehender Sprecher zu synthetisieren und mit einer Text-to-Speech-Lösung aus Artikeln automatisch Audio-Episoden zu erzeugen.

Habe mir das mal auf https://www.n-tv.de/auto/Volvo-XC40-gute-Wahl-mit-verschiedenen-Antrieben-article23878906.html angehört.

Wie authentisch die Stimme klingt, kann ich nicht einschätzen. Von der Aussprachequalität (Betonungen usw.) ist alles aber weiterhin eher auf dem Niveau "Audiospur für Sehbehinderte".

Daher:

Der Einsatz bekannter Sprecherstimmen aus den Sendern, hatte für die Zuhörer nicht die entscheidende Bedeutung. „Deutlich wichtiger fanden die Nutzer die Klarheit der Sprache im produzierten Audio“, sagt die Innovationsmanagerin. Außerdem habe das System nach wie vor Probleme mit Fremdwörtern.


Quelle: https://www.meedia.de/technologie/w...-profitieren-1b123b88b2342b72f5ed7307dd60a2bd
 
Zuletzt bearbeitet:
In dem Zusammenhang fällt mir ein, dass man auch Radio Salü seit mindestens Dezember auf eine syntetische Stimme zum Lesen der Verkehrsnachrichten in den Randzeiten setzt.
Aber jetzt mal ne wirklich dumme Frage: Wer füttert denn die syntetischen Stimmen? Weil eigentlich müsste dann ja immer noch ein Redakteur da sein, der die Nachrichten die dann "vorgelesen" werden schreibt, bzw. die Verkehrsmeldungen bei Salü kuratiert. Und da beißt sich doch dann die Katze in den Schwanz. Wenn die Person eh da sitzt, dann kann die auch ins Studio nebenan rennen und Nachrichten und Verkehrsmeldungen selbst vorlesen.
Und zu der dummen Frage, ich bin in dem Fachgebiet beruflich bedingt nicht ganz unbedarft.
 
In dem Zusammenhang fällt mir ein, dass man auch Radio Salü seit mindestens Dezember auf eine syntetische Stimme zum Lesen der Verkehrsnachrichten in den Randzeiten setzt.
Aber jetzt mal ne wirklich dumme Frage: Wer füttert denn die syntetischen Stimmen? Weil eigentlich müsste dann ja immer noch ein Redakteur da sein, der die Nachrichten die dann "vorgelesen" werden schreibt, bzw. die Verkehrsmeldungen bei Salü kuratiert. Und da beißt sich doch dann die Katze in den Schwanz. Wenn die Person eh da sitzt, dann kann die auch ins Studio nebenan rennen und Nachrichten und Verkehrsmeldungen selbst vorlesen.
Und zu der dummen Frage, ich bin in dem Fachgebiet beruflich bedingt nicht ganz unbedarft.
Die Texte der Verkehrsmeldungen lassen sich sicher automatisch generieren. Immerhin ist das Wissen um die Bewegung der Autos bekannt. Die Nachrichten kann man von Agenturen übernehmen.

Ich hab gerade mal die Seiten 101 und 103 der ARD Videotext in ChatGTP gestellt, mit der Frage:
"Die Nachrichtenseite des Videotexts hat folgende Schlagzeilen: ...(hier Seite 101 & 103 cut & paste)...
Bitte generiere mit einen Text für einen Radiomoderator, der diese in einer Kurznachrichtensendung melden soll."

Und als Ergebnis kam:

"Guten Morgen und herzlich willkommen zu Ihrer Kurznachrichtensendung. Hier sind die Schlagzeilen des Tages: Das Bundesverfassungsgericht in Karlsruhe hält die Wiederholung der Berlin-Wahl am 12.2. für rechtens. Bayern verlängert die Frist zur Abgabe der Grundsteuererklärung als Alleingang. Die Zahl der Arbeitslosen steigt im Januar auf 5,7 Prozent, gemeldet von der Bundesagentur für Arbeit. Ex-Verfassungsschutzpräsident Maaßen weist Vorwürfe zurück. Papst besucht die Demokratische Republik Kongo auf seiner Afrikareise. Gewerkschaften in Frankreich rufen erneut zu Streiks gegen Rentenreform auf. Die Zahl der Toten nach einem Anschlag in Peshawar steigt auf 100. Scheidender RKI-Chef Wieler wird künftig Sprecher am Hasso-Plattner-Institut. Das war's für heute, bleiben Sie dran für weitere Nachrichten und Informationen."

Und auf meinen Einwand, das Radioprogramm wäre für junge Leute, kam dann dass:

"Yo, was geht ab? Willkommen bei eurer Kurznachrichtensendung für alle jungen Hörer da draußen. Hier die neuesten Schlagzeilen: Das Bundesverfassungsgericht hat grünes Licht für die Wiederholung der Berlin-Wahl am 12.2. gegeben. Bayern macht mal wieder sein eigenes Ding und verlängert die Frist für die Grundsteuererklärung. Die Zahl der Arbeitslosen ist im Januar gestiegen und liegt jetzt bei 5,7 Prozent. Ex-Verfassungsschutzpräsident Maaßen wehrt sich gegen Vorwürfe. Papst besucht gerade die Demokratische Republik Kongo. In Frankreich werden wieder Streiks gegen Rentenreform aufgerufen. In Pakistan ist die Zahl der Toten nach einem Anschlag gestiegen. Und zum Schluss: Der scheidende RKI-Chef wird künftig ein anderes Amt bekleiden. Das wars für heute, bleibt dran für weitere Nachrichten."

Warten wir noch ein paar Jahre und die Radionachrichten werden auf diese Weise Wirklichkeit, zumindest bei den Privatsendern...
 
Moderatoren können die gewinnmaximierenden Kommerzstationen bald einsparen. Im SPIEGEL stand ein Artikel, wie weit KI bereits ist. Die belanglosen Moderationsinselchen bei RTL Deutschland etwa können mit Leichtigkeit künstlich erzeugt werden.
 
Wenn dem so wäre und man diese Strategie verfolgt, wieso spricht nicht seit Ewigkeiten bei diesen Sendern nur noch eine Statiom Voice?
 
"Yo, was geht ab? Willkommen bei eurer Kurznachrichtensendung für alle jungen Hörer da draußen.
Habe die Nachrichten gesprochen & bin bei 57 Sekunden fertig. Solange bleibt die Jugend niemals dran, geschweige, schaltet erst gar nicht das Radio an. "Kurznachrichtensendung" ist zu lang & überfordert. Alle Präpositionen weglassen, dann wirds kürzer. Yalla. Lan! Bin ich Kino?! Ich geh Schwimmbad.
 
Zuletzt bearbeitet:
Yalla. Lan! Bin ich Kino?! Ich geh Schwimmbad.
Cringe!

Zurück zu künstlichen Stimmen: Mir fällt nun schon seit einigen Tagen die weibliche Sprecherstimme der Trailer im Dlf-Programm merkwürdig auf. Sowohl Aussprache als auch Betonung empfinde ich zum Teil extrem unorganisch und unnatürlich. Die Wörter wirken zusammengestückelt.

Ich werde einen Mitschnitt machen. Aber ist das vielleicht auch schon jemand anderem aufgefallen?
 
Zuletzt bearbeitet:
wieso spricht nicht seit Ewigkeiten bei diesen Sendern nur noch eine Statiom Voice?
Das hat man versucht bei einem landesweiten Sender in Dänemark (gehörte seinerzeit zu SBS / P7S1), nach kurzer Zeit wurde das gestoppt.
Die SV kostet für jeden neu eingesprochenen Take und für jeden neu in die Playlist aufgenommenen Titel der angesagt werden muss, Geld, Honorar wird pro gesprochene Zeile oder pro Stunde vergütet.
Für das KI-Programm zahlst du eine einmalige Anschaffungsgebühr und eine Jahreslizenz, egal wie viel texte dir das Programm Spricht.

In der Vergangenheit hatten viele Verkehrsbetriebe prominente Ansagestimmen,u.a Chris Lohner oder ich meine sogar mal kurzzeitig Dagmar Berghoff bei der HHA. Diese prominenten Stimmen wurden mittlerweile fast überall (zumindest vielerorts) durch automatisierte Ansagen / Computerstimmen / Sprachbausteine ersetzt. Es ist schlichtweg eine Kostenfrage! Außerdem ist das Computersystem sehr viel flexibler, Änderungen können innerhalb kürzester Zeit vorgenommen werden, die Aufnahmequalität und Lautstärke der Durchsagen ist immer gleich.

Bei einer SV müsste, z.B. im Falle eines mittlerweile verstorbenen Künstlers, erst die komplette Ansage erneuert und dafür eine neue Ansage eingesprochen/aufgenommen, rübergeschickt etc. werden. Und dann muss darauf geachtet werden, dass nachträgliche Änderungen, die z.b. im Home Studio eingesprochen wurden, exakt gleich ausgepegelt sind.

Es hat also gute Gründe, warum man automatisierte Titelansagen, die zuvor wörtlich durch die Station Voice eingesprochen wurden, mal probiert, aber das Vorhaben recht bald wieder aufgegeben und nicht mehr weitergeführt hat!
 
Zuletzt bearbeitet:
Die SV kostet für jeden neu eingesprochenen Take und für jeden neu in die Playlist aufgenommenen Titel der angesagt werden muss, Geld, Honorar wird pro gesprochene Zeile oder pro Stunde vergütet.
Die meisten Sender vereinbaren eine monatliche Fix-Bezahlung mit den Stimmen. Das Modell, welches du beschreibst ist äußerst selten und hauptsächlich in der Werbung zu finden.
 
Es nimmt wirklich kuriose Dimensionen an. Inzwischen springt jeder auf den Waggon auf!

Die Morgensendung Arno und die Morgencrew auf 104.6 RTL Berlins und Brandenburgs Hitradio lies [sic!] die Künstliche Intelligenz „ChatGPT“ Lyrics für einen englischsprachigen Popsong erstellen
 
Zuletzt bearbeitet:
Hatten wir das schon?

Per Knopfdruck kann man sich alle aktuellen Verkehrsmeldungen für die eigene, tägliche Strecke vorlesen lassen. Immer dann, wenn man die Infos braucht, um sich für den schnellsten Weg zu entscheiden. Möglich werden die personalisierten Meldungen durch eine synthetische KI-Stimme in der App.
 
Die Texte der Verkehrsmeldungen lassen sich sicher automatisch generieren. Immerhin ist das Wissen um die Bewegung der Autos bekannt. Die Nachrichten kann man von Agenturen übernehmen.
Durch KI wie ChatGPT oder dergleichen wird man in Zukunft bereits jetzt schon lieblos gemachtes Radio dann zumindest noch günstiger machen können. Wenn ich z.B. an die dauer-kichernden "Morning-Crews" diverser Sender denke, wo neben einem Moderatoren-Duo oder -Trio (?) es vielleicht noch eigene Sprecher für die 2-Minuten Weltnachrichten, für Wetter und für Verkehrsmeldungen gibt. Für diese Inhalte braucht es in Zukunft dann keine Mitarbeiter mehr, alles kann getrost von KI erstellt und gesprochen bzw. stündlich aktualisiert werden.
 
Zuletzt bearbeitet:
Durch KI wie ChatGPT oder dergleichen wird man in Zukunft bereits jetzt schon lieblos gemachtes Radio dann zumindest noch günstiger machen können.
Lieblos schafft die Regiocast jetzt schon. Auch ohne KI. Auf mich machen sie den Eindruck, ob es sich um Radio oder eine x-beliebige Dienstleistung handelt: Egal. Hauptsache Money-Money-Money. KI passt zu denen, wie Kopfhörer aufs Ohr. Gibt bald auch keine schlechten Mitarbeiter-Bewertungen mehr, mangels Mitarbeiter. KI ist ein weiterer Totengräber des Radios. Ich brauche diese KI nicht. So wie Musik von Hand gemacht wurde, brauche ich handgemachtes
Radio.:cool:
 
KI kann den Ablauf im Radio durchaus verbessern und unterstützen, ich denke da vor allem an die Musikplanung, die ja schon heute mit Tools wie MusicMaster weitestgehend automatisiert läuft. Bei der Verwaltung von Musikdatenbanken, belabeln von verschiedenen Versionen eines Songs, das Transkribieren von Interview und Sprachnachrichten sowie Moderationen. Aber man sollte niemals die Seele eines Radios durch KI ersetzen. Lieber rege ich mich zum 30x Mal auf wenn der Moderator im "Verkehrszentrum" wieder Neckars-Ulm statt Neckar-Sulm sagt, als wenn eine Roboterstimme mir das monoton vorliest.

Mit entsprechenden Tools kann man ja mittlerweile einfach Airchecks (ohne Bett) durch so ne KI jagen und dann gibt man seinen Wunschtext ein und plötzlich spricht der vermeintliche Moderator genau das. Spannende und gefährliche Zeiten.
 
Aber man sollte niemals die Seele eines Radios durch KI ersetzen.
Haste schön gesagt!:cool: Radio soll leben & von Menschen für Menschen gemacht sein. KI wird fürs Navi, Suchmaschinen & anderen technischen Systemen unersetzlich werden. Moment. Ein kleiner Radio-Sender auf Helgoland setzt auf Radio ohne Menschen;):
 
KI kann den Ablauf im Radio durchaus verbessern und unterstützen, ich denke da vor allem an die Musikplanung, die ja schon heute mit Tools wie MusicMaster weitestgehend automatisiert läuft. Bei der Verwaltung von Musikdatenbanken, belabeln von verschiedenen Versionen eines Songs, das Transkribieren von Interview und Sprachnachrichten sowie Moderationen. Aber man sollte niemals die Seele eines Radios durch KI ersetzen. Lieber rege ich mich zum 30x Mal auf wenn der Moderator im "Verkehrszentrum" wieder Neckars-Ulm statt Neckar-Sulm sagt, als wenn eine Roboterstimme mir das monoton vorliest.

Mit entsprechenden Tools kann man ja mittlerweile einfach Airchecks (ohne Bett) durch so ne KI jagen und dann gibt man seinen Wunschtext ein und plötzlich spricht der vermeintliche Moderator genau das. Spannende und gefährliche Zeiten.
Für deinen Text reicht ein Daumen nach oben nicht. Genauso ist es!
 
Zurück
Oben