Der Soundprocessing-Thread


wo einige Autoren meinten, ihr Sprechertext müsste unter allen Umständen immer lauter sein als die O-Töne.

Das ist auch so eine Geschichte, die ich schon öfter (vor allem von Cuttern) gehört habe, die sich mit Ton nicht wirklich beschäftigen. Meines Erachtens nach ein Missverständnis aus den Zeiten, in denen man versuchte Regleroffsets (Töne werden nicht verändert sondern nur mittels Regler unterschiedlich laut gemacht) für unterschiedliche Signale (Sprache, Klassik, Popmusik etc) vorzuschlagen. Wir sind zeitlich also wieder hier:

Man versuchte mit den jeweiligen technischen Gegebenheiten lediglich das Aufnahme- und Wiedergabemedium technisch gut auszusteuern, was bei der damaligen Technik automatisch zu annähernd gleichen Loudnesseindrücken führte.

Diese Versuche führten immer mehr in die Irre, je mehr das Audio manipuliert wurde. Die Idee, dass man den Sprecher lauter (Peaklevel) als die O Töne macht kam also ggf daher, dass O Töne auf der Straße aufgenommen evtl höhere Peaklevel durch Umgebungsgeräusche oder sehr stark gerichtete Mikrofone aufweisen.
Auch eine häufige Begründung ist die, man könne den O Ton leiser machen, weil man ja Denjenigen, der spricht im Bild sieht und somit das Gehirn den Ton dann wieder lauter erscheinen ließe. Mir konnte allerdings noch niemand erklären, was dann Menschen machen, die blind sind und wie das bei O Tönen ist, die im Off schon beginnen und der Sprechende erst später ins Bild kommt.

Aber wieder mehr zum Thema Sprachverständlichkeit, Loudness und Processing. Auch hier bin ich immer wieder der Meinung, dass viel zu häufig sprachliche und Verständnisprobleme ursächlich sind, wenn ggf zu viel und somit kontraproduktiv bearbeitet wird.
Meine These ist noch immer, dass gerade beim Radiohören mit dem Begriff laut oder leise häufig Sprache gemeint ist, weil hier die eigentliche Information steckt und man zum Volumeknopf greift um etwas zu verstehen. Neben des reinen Lautstärkeeindrucks wird die Sprachverständlichkeit /-verstehbarkeit aber auch häufig durch allzu starke Bearbeitung der Hüllkurve verändert. Das betrifft nicht nur Sprache, sondern alle Arten von Geräusch (Schlagzeug, Pferdehufe, Knistern einer Wunderkerze o.ä.), da jedes seine eigene Charakteristik in der Hüllkurve hat. Ich vergleiche das immer mit einer Art "Fingerabdruck" des Geräusches, den das Ohr benötigt, um dieses zu identifizieren.
Als Anhang findet Ihr mal zwei Grafiken, die ich von einer Internetseite habe, die es scheinbar nicht mehr gibt. Man erkennt daraus ganz gut, wie sich Sprache und die darin befindlichen Buchstabengeräusche über das Frequenzspektrum verteilen. Die zweite Grafik zeigt, wie sich das Gesendete evtl bis zum Empfänger durch Beeinflussungen verändert und somit Teile der Botschaft gar nicht ankommen oder von anderen verdeckt werden. Außerdem werden ein paar allgemeine Kritikpunkte zum Thema Sendeton angesprochen.

Beste Grüße, Björn
 

Anhänge

  • SV Info 1.doc
    53 KB · Aufrufe: 11
  • SV Info 2.doc
    257,5 KB · Aufrufe: 7

RainerK

Benutzer
Sehr störend für Verständlichkeit sind neben ungeeigneten dynamischen Frequenzverläufen auch zu langsam geteuerte Gates von Rauschreduzierungen, die den "Attack" der ersten Silben verschleifen oder sogar verschlucken.
Leider ist dieser Unfug z.B. bei TV-Studiosendungen immer häufiger festzustellen, wenn Tonpersonal dem Irrtum verfällt, dass die Unterdrückung selbst geringster Geräusche (z.B. Kamerakräne und Klimaanlagen) wichtiger ist, als die Verständlichkeit der Moderation.
Dass bei täglichen Sendungen die Stärke solcher Effekte oft in mehrtägigem Rythmus wechselt, also vermutlich mit den Diensten der jeweils verantwortlichen Tonis, ist auffällig und eine Bestätigung der menschlichen Fehlleistung.
 
Zuletzt bearbeitet:

Funkminister

Benutzer
Leider ist die Akustik in Fernsehstudios meistens eher auf Lagerraumniveau. Ganz schlimm bei virtuellen Sets mit 270° Hohlkehle. Teilweise funktionieren da (klanglich) keine Ansteckmikrofone mit Kugelcharakteristik mehr, weil der Hallradius unter 50cm schrumpft.
Was mir allerdings nicht ganz einleuchten will ist, wie man heutzutage noch Gates bzw. sinnvollerweise eher Expander so ungünstig eingestellt bekommt. Das ist doch alles längst Digitaltechnik und eine Ansprechzeit von quasi 0ms ist keine Hexerei. Stagetec bietet sogar die Möglichkeit das Nutzsignal gegenüber dem Detektorweg um wenige Samples zu verzögern, um garantiert keine Hüllkurve anzusägen.
Da sehr oft der Ton der Mikrofone generell verzögert werden muss, um dem Bild nicht vorzueilen (drahtlose Kameras und andere bildtechnische Geräte erzeugen schnell mal 60-120ms Verzögerung), hat man auf der Laufzeitebene praktischerweise Spielraum in beide Richtungen.

Ich verwende jedenfalls gern Expander, besonders bei Gesprächen mit Gästen bekomme ich damit Diffusschall und Kammfiltereffekte gut in den Griff. Echte Nebengeräusche gibt es zum Glück keine, wenn nicht gerade mal Kameramann oder Aufnahmeleiter welche erzeugen ;)
 
Zuletzt bearbeitet:
Echte Nebengeräusche gibt es zum Glück keine,

Bis auf diese pauschale Aussage unterschreibe ich Dir alles, denn leider befinden sich heutzutage zahlreich Gerätschaften mit Lüftern in den Studios. Deren Geräusch sammelt sich teilweise durch die von Dir beschriebene Bauweise an der Moderationsposition. Allerdings gibt es dafür heutzutage verlässliche Denoiser, so dass ich diese Beobachtung:

zu langsam geteuerte Gates von Rauschreduzierungen, die den "Attack" der ersten Silben verschleifen oder sogar verschlucken.

eher darauf schieben würde, dass bei Studio- und Schaltgesprächen teilweise mitgeregelt wird, um Akustik- oder Rückwirkung auf die n-1 zu minimieren. Aber gerade hierfür wäre der sinnvolle Einsatz von Automixern (mittlerweile funktionieren die auch) oder Expandern geeigneter.

Beste Grüße, Björn
 
Zuletzt bearbeitet:

Funkminister

Benutzer
Ich meinte tatsächlich konkret das Studio in unserem Haus, das ist recht still denn es läuft während der Sendungen keine Klimaanlage, dank LED-Scheinwerfer wird es auch kaum noch so heiss wie früher. Da wir ja nur ein kleines Landesfunkhaus sind, veranstalten wir in unserem Regionalmagazin auch keine Späße mit Kamerakranen oder so ;) (pun intended).

In der Tat regele ich das Moderationsmikrofon manchmal während Schaltgesprächen dezent mit, 3-6dB Absenkung reichen aber in der Regel damit Atem- und sonstige Geräusche des Moderators nicht stören, während der Gesprächspartner antwortet.
Meist reicht schon das was der Expander "aufräumt" (Thr. -34dB, 18dB Absenkung, Attack 0, Release 300ms).
Da die Moderatoren hier grundsätzlich ein In-Ear für Kommando tragen, gebe ich bei Schaltgesprächen den Ton des Schaltpartners auch mit aufs Ohr, dann kann ich die Lautstärke des Studioeinspiels reduzieren.
Das alles zusammen sorgt für einen doch recht sauberen Klang aus dem Studio.

Bei 2-3 Mikrofonen sehe ich noch keinen Bedarf an einem Automixer, das geht tatsächlich noch mit links ;) (die Mikrofonwege sind auf der linken Pulthälfte...)
 

RainerK

Benutzer
Ergänzung: Mit dem Rauschminderungs-Problem bezog ich mich auf die tägliche WDR-Sendung "Aktuelle Stunde" (18:45 - 19:30 Uhr).
Dort gibt es nur planare Wallscreens, keine Hohlkehle für virtuelle Effekte. Der Kamerakran ist recht munter im Einsatz. Es werden ausschließlich Lavalier-Mikros verwendet, auch bei Studiogästen.
Redaktion (Newsroom) und Studio sind Ende 2019 von Düsseldorf nach Köln umgezogen, seitdem hat sich das Rauschminderungs-Problem etwas verringert, ist aber immer noch deutlich vorhanden.
Reine Studio-Moderation oder Schaltgespräche machen dabei keinen Unterschied.
Bei Sendungen aus den Lokal-Studios habe ich den Mangel bisher nicht festgestellt.
Das gilt auch für Studiogäste die von dort in die "Aktuelle Stunde" geschaltet werden.

Zum Vergleich: Im Tagesschau-Studio sieht man z.B. Geräusche der Kamerakrane wesentlich entspannter und sie sind gelegentlich deutlich hörbar. Die oben bemängelten Effekte von Rauschminderungen habe ich dort (Tagesschau, Tagesschau 24 u. Tagesthemen) auch noch nie bemerkt.
 
Zuletzt bearbeitet:

Funkminister

Benutzer
Die Größe des Studios spielt da eine entscheidende Rolle, und das Studio der Tagesschau ist doch recht geräumig, und dadurch die geräuscherzeugenden Geräte relativ weit weg von den Mikrofonen - so dass das Problem nicht ganz so akut ist.
Und da die Bildhintergründe nicht virtuell eingestanzt sondern real projiziert sind, ist der Teil der Studiokulisse auch akustisch weniger wirksam als die berüchtigte grüne Hohlkehle.

Wenn ich die "Aktuelle Stunde" richtig vor Augen habe, saust der Kamerakran dort ja recht dicht an die Moderatoren heran, und das Studio sieht zumindest kleiner aus als das der Tagesschau.
 
Ja, das waren noch Zeiten als es im ARD-Hörfunk nicht möglich war, das Signal auf dem Zuspielweg von Platte und Band auch nur zu entzerren.

Naja, die Tatsache, dass heutige Sendepulte dazu in der Lage sind, bedeutet ja nicht, dass davon auch Gebrauch gemacht wird oder werden soll.
Bis auf den Wiedergabepegel werden fertig produzierte Zuspielungen so gesendet, wie sie sind. Schließlich ist ein Sendestudio kein Produktionsstudio, und im Selbstfahrerbetrieb erst recht nicht.

Beste Grüße, Björn
 

count down

Benutzer
Korrekt. Da ich auch zeitweise bei der Industrie Überspielfreigaben von Singles und LPs verantwortet habe und gesehen habe, dass anderswo solche Freigaben mit einem Consumer-DUAL-Plattenspieler ohne (!) AB-Vergleich zum Masterband gemacht wurden, war nicht verwunderlich, dass etliche z.B. Polydor-Singles mumpfig auf den Markt kamen. Keine Chance im Sender, die mumpfige Single oder LP ein wenig nachzuentzerren.

Von vielen Aufnahmen gab es damals halt nur Vinyl. K-Tel war ganz schlimm, mega leise und kaum Bässe bei 10 Tracks pro Seite.
 

Funkminister

Benutzer
Naja, die Tatsache, dass heutige Sendepulte dazu in der Lage sind, bedeutet ja nicht, dass davon auch Gebrauch gemacht wird oder werden soll.
Bis auf den Wiedergabepegel werden fertig produzierte Zuspielungen so gesendet, wie sie sind. Schließlich ist ein Sendestudio kein Produktionsstudio, und im Selbstfahrerbetrieb erst recht nicht.
Absolut. Das ist die Realität.
Um es noch ein Scheibchen zu eskalieren: es merkt ja auch keiner von den Selbstfahrern, dass eine Produktion technisch-klanglich Defizite aufweist. Der während der Sendung als Abhörpunkt genutzte low-latency Ausgang des Optimod macht alles halbwegs hübsch, und klingt dabei doch anders als der echte Sendeausgang.
Und selbst wenn es bemerkt wird, ist es in dem Augenblick schon über den Sender gegangen.
Bei uns sind bis auf laut-leise und Regler umbelegen alle anderen Funktionen, Filter und EQ eingeschlossen, eh für den normalen Benutzer gesperrt, mal schnell einen windigen O-Ton entrumpeln is' nicht.

Am wahrscheinlichsten wird ein vermeintlich zu leiser O-Ton in einem BmE noch daran erkannt, dass die Hüllkurve an diesen Stellen nicht balkenähnlich bei der grauen Linie (-9dBFS) im Startrack angenagelt erscheint.
Also durch Augenschein, und nicht durch Abhören.
 

lg74

Benutzer
Zumal der Selbstfahrer "nebenbei" noch den nächsten Titel vorhört, um einen Ausstiegspunkt für die Moderation zu finden, ggf. eine Absprache mit der Redaktion trifft, während der Titel läuft, einen nach dem laufenden Titel auf Sendung zu nehmenden Gesprächspartner am Telefon fürs Vorgespräch hat und dann "parkt", ... der hat anderes zu tun, als live herumzuregeln.
 
Zuletzt bearbeitet:

Südfunk 3

Benutzer
Dummes Zeug! Bis auf den letzten Punkt habe ich schon lange mehr keinen selbstfahrenen Moderator bei derlei Tätigkeiten beobachtet. (Und selbst da müßte ich nachdenken.)
 

Funkminister

Benutzer
Ich kann daran kein so dummes Zeug erkennen, das beschreibt ganz gut was unsere Selbstfahrer den lieben langen Sendetag so machen.
Dazu kommt noch hie und da eine Aufzeichnung im "Off Air"-Modus parallel zur laufenden Sendung, und auch der gelegentliche Gang auf Studio H bzw. D, also das keramische.
Andere Anstalten, andere Sitten ;)
/OT
 
Hallo zusammen,

nachdem hier ein wenig Ruhe eingekehrt ist erfülle ich zumindest mal meine Ankündigung, ein paar Sprachtöne unterschiedlicher Herkunft anzubieten, sie könnten so innerhalb einer Hörfunksendung aufeinander treffen. Die Besonderheit hier ist, ich habe sie zuvor alle nach Loudness normalisiert, unabhängig also von ihren jeweiligen Peakleveln. Der Versuch bezieht sich auf diese Bemerkung:

Es passiert mir oft, dass ich bei per Telefon zugeschalteten Wortbeiträgen lauter drehen muss. Das kriegt übrigens auch kein brachial eingestellter Optimod gut hin (er kann ja keine nicht vorhandenen Frequenzanteile anheben).

Nun würden mich Eure Einschätzungen und Beobachtungen dazu interessieren. Also so etwas wie : kann man gut durchhören, dieses oder jenes müsste man zwingend damit machen o.ä.

Beste Grüße, Björn
 

Anhänge

  • SPrachbeispiele.mp3
    4 MB · Aufrufe: 25

Funkminister

Benutzer
Wenn man eine der genannten Verrichtungen plant, hilft es ungemein, “Hotel California“ in der Ursprungslänge greifbar zu haben ;)
Als Not(durft)band.
 

lg74

Benutzer
Nun würden mich Eure Einschätzungen und Beobachtungen dazu interessieren. Also so etwas wie : kann man gut durchhören, dieses oder jenes müsste man zwingend damit machen o.ä.
Danke Björn!

Habe jetzt nur einmal - und flüchtig - via Kopfhörer gehört. Das Telefonat (vorletztes Beispiel) ist mir gefühlt zu leise. Warum auch immer - ist mir so. ;)
 

Ralle_Köln

Benutzer
Danke Björn!

Habe jetzt nur einmal - und flüchtig - via Kopfhörer gehört. Das Telefonat (vorletztes Beispiel) ist mir gefühlt zu leise. Warum auch immer - ist mir so. ;)
Auch großes Danke! Eher flüchtig bei „Zimmerlautstärke“ auf zwei schon als „vintage“ durchgehenden Abhören (Spendor BC1, also durchaus etwas, dass in Sendestudios stand) kommt mir das Telefonat auch gefühlt leiser vor.
Wenn ich Produktionen mit „ANG-Beiteiluging“ hatte war auf dem Kanal deswegen auch immer eine „Schweinekompression“ und eine Filterung drauf - Ziel: maximale Verständlichkeit. Schön ist G.711 ohnehin nicht.
 

lg74

Benutzer
kommt mir das Telefonat auch gefühlt leiser vor
Jetzt habe ich Björns File noch mal zerlegt und nachgemessen:

01 - hr3.mp3
-23.0 LUFS (-0.0 LU) / peak: -6.5 dBTP / range: 0.9 LU

02 - Bjoern.mp3
-23.1 LUFS (0.1 LU) / peak: -4.3 dBTP / range: 4.3 LU

03 - Werbung.mp3
-23.2 LUFS (0.2 LU) / peak: -15.4 dBTP / range: 1.0 LU

04 - Telefonat.mp3
-23.1 LUFS (0.1 LU) / peak: -3.5 dBTP / range: 4.3 LU

05 - Pro7.mp3
-23.2 LUFS (0.2 LU) / peak: -10.6 dBTP / range: 2.1 LU

Passt alles perfekt. Sehr schön zu sehen, wie brutal die Absenkung der beiden Werbe-Brüller ist.

Aber warum fühlt sich das Telefonat (auch noch mit dem höchsten peak-Level) zu leise an? Liegt es an seinem Frequenzspektrum? Das sollte doch eigentlich über die K-Bewertung auch berücksichtigt sein?

Wo hakt es hier? Sind es die langen Pause, die den psychologisch Eindruck erwecken, es wäre da etwas, wo man angestrengter zuhören müsse, um es verstehen zu können? Aber auch das müsste ja in der Lautheit berücksichtigt sein.
 
Zuletzt bearbeitet:

Funkminister

Benutzer
Wenn die Pausen unter das relative Gate absacken, gehen sie nicht in die Statistik ein. Das kann in Grenzfällen schon zu einem insgesamt leiseren Höreindruck führen - ist ja weniger Schallenergie pro Zeit.
Das schmale Spektrum hat daran sicher auch einen Anteil, zumal es vorn und hinten von „Hifi“-Klang flankiert ist.

Abgehört habe ich das gerade mal ganz suboptimal und realitätsnah
per iPad (keine Ahnung ob das das Audio noch verbiegt oder quetscht), einen Durchgang, und finde das Beispiel ziemlich unauffällig - gut durchhörbar, mit dem Qualitätsabstrich beim Telefon-Ton.

Naja, die Tatsache, dass heutige Sendepulte dazu in der Lage sind, bedeutet ja nicht, dass davon auch Gebrauch gemacht wird oder werden soll.
Meine analoge Sendeerfahrung beschränkt sich auf Radio Bremen, und da gab es tatsächlich nur in den Mikrofonwegen EQs (100, 1.000, 10.000 Hz...) , und ein frei steckbares Paar NTP Kompressoren und EQs, nannte sich „Gestaltungsregler“.
Zuspielwege hatten absolut nix im Kanal, um den Klang zu verändern.
War das allgemein üblich, oder eher dem traditionell knappen Budget in Bremen geschuldet?
Vom NDR kenne ich nur Produktionspulte, und da waren alle Kanäle gleich bestückt, wenn man vom Mikrofonvorverstärker absieht.

Und dann gab es ja auch noch die Zeiten, als der Gebrauch des Filters von der Gehaltsgruppe abhing... „Neee, Du darfst doch nicht filtern, Du bist doch keine VG4!“
(Erklärung: VG = Vergütungsgruppe; die 4 bekommt ein gehobener Ingenieur, der einfache bekam „nur“ die 5).
Und dann kamen die jungen Leute, die schon per Ausbildungsplan ProTools gepaukt bekamen, machten die Kiste mit den Plugins auf, und die Damen und Herren Ingenieure dicke Backen.
 
Zuletzt bearbeitet:

Habakukk

Benutzer
Vielen Dank für die Arbeit! Das ist eine spannende Zusammenstellung.

Interessant finde ich v.a. die Abfolge "Bjoern" und "Werbung". Das klingt für mich auf dem "Billig-Quäker" annährend gleich laut und gleich verständlich, aber in den Peaks sind das ja 10dB Unterschied!
Das Telefonat passt für mich von der Lautheit her auch gut zum Rest, ich empfinde es nicht unbedingt als leiser. Bin aber jetzt gerade auch in ruhiger Umgebung. Muss ich mir bei Gelegenheit mal im Auto anhören, dort habe ich mit Telefonaten im Radio immer die größten Probleme.

Nichtsdestotrotz würde ich sagen, für mich mit meinen Abhörbedingungen hat die Normalisierung nach Lautheit sehr gut geklappt, die Alogrithmen funktionieren gut, wie ich finde.
 

ADR

Benutzer
Aber warum fühlt sich das Telefonat (auch noch mit dem höchsten peak-Level) zu leise an? Liegt es an seinem Frequenzspektrum? Das sollte doch eigentlich über die K-Bewertung auch berücksichtigt sein?

Und jetzt schlagt mich wieder, deshalb bin ich der Meinung EBU R128 haut nicht ganz hin!
 
Oben