ARD-Arbeitsgruppe "Lautheit" will alle ARD-Radios gleich laut machen


Na, die Peaks im Refrain hätte man im Studio doch auch noch abrasieren können...;)
Für mich sieht das nur nach unterschiedlicher Spitzenbegrenzung aus, was ja mit Lautheit nichts zu tun hat. Der Sinn erschließt sich mir aber nicht. Wieso lässt man nicht den ganzen Song über die Peaks bis 0dB laufen?
Kennt sich da jemand aus? Mastert man heutzutage so?
 
@count down das ist ja im weiteren Sinne eine Geschmacksfrage, insofern kann man Deine Frage durchaus mit "ja" beantworten - aber wenn das vom Künstler so gewollt ist...
Solange die technischen Parameter eingehalten sind, kann man dagegen nur auf der Geschmacksebene motzen.

@icecube919 man mastert vernünftigerweise (um Inter-Sample-Peaks bei der D-A Wandlung auszuschließen) bis -0,3dBFS oder auch niedriger, je nach Zielformat.
Wenn auf das Mastering eine Codierung in datenreduzierte Formate erfolgen soll, muss ebenfalls für gegen Inter-Sample-Peaks und andere Codierungsartefakte Pegelreserve gelassen werden. Dazu gibt's in einem Thread um die Ecke eine ausführliche Abhandlung, ich habe nur gerade nicht parat von wem und wo genau. Vielleicht kann jemand helfen?
 
Zu spät zum ändern, daher Ergänzung:

Ohne tatsächliche Kenntnis des Songs - den Refrains noch mehr (elektrischen) Pegel zu geben, dürfte eine künstlerische Entscheidung sein, damit sie jeweils deutlich lauter sind als der Rest und herausgehoben sind.
Das kann man auch rein klanglich machen, per EQ oder breiterer Stereobasis, anderen Dynamikkompressionswerten usw. ohne den Pegel zu erhöhen.
 
Reine Sprachbeiträge mit +5 LU sind nach meiner Erfahrung ohne Dynamikkompression nicht durch den UKW-Kanal zu bringen. - Musik bringt das meist schon mit ihrer spektralen Dichte hin.
Und wie die R128 anzuwenden ist hat der @Funkminister im Post#127 gut erklärt. Trotzdem die Frage:
  • Muss denn in Informationssendungen die "Füllmusik" unbedingt mit der Sprache in der Loudness konkurrieren? Beides jeweils +5 LU?
Ich habe mir zum Vergleich mal wieder Programmmitschnitte aus den 70er- und 80er Jahren (also von vor dem "Sündenfall") angehört wo das noch anders war. Dort trägt die Musik erstens nicht so dick auf und mein Gehör ist für Loudness-Unterschiede toleranter. Also 0 bis +2 LU wäre für die Musik in diesem Fall m.E. eher angebracht.
Ich kann dir irgendwie nicht folgen. Wieso Sprachbeiträge mit +5 LU und Musik mit 0 bis +2 LU?
Egal was, alles soll auf 0 LU ausgesteuert werden, sonst bekomme ich am Ende ja kein Programm nach R128 und habe genau die Lautstärkesprünge, die du bemängeltst. Oder ich verstehe nicht, was du meinst...
Dass Musik aus den 70er/80er Jahren allgemein besser zu hören ist, liegt - wie schon geschrieben - daran, dass man damals noch mit mehr Dynamik produziert hat. Heute kommen halt fast ausschließlich Bretter aus dem Mastering. Und die werden dann natürlich mit deutlich geringerem Pegel ausgespielt, damit man auf 0 LU kommt.
 
Wieso Sprachbeiträge mit +5 LU und Musik mit 0 bis +2 LU?
Ich vermute, @Tonband meint: wenn er bei Sprachbeiträgen an der "Endkunden-Senke" (nennt man auch "Radio") +5 LU misst (also -18 LUFS, den "UKW-Zielwert"), dann müssen die vorher definitiv komprimiert worden sein. Ihr natürlicher Dynamikumfang erlaubt -18 LUFS nur, wenn ich komprimiere und/oder hart limitiere, sonst gehen mir die Peaks deutlich über 0 dBTP.

Und da sage ich mal ganz spontan: recht hat er. Das ist ja auch kein Geheimnis. Das kann er sich ja auch auf BR Klassik anschauen im Vergleich z.B. bei den Nachrichten. AC3 (nur Peak-Limiter) vs. MP2 (UKW-Preset mit deutlicher, aber nichts kaputtmachender Dynamikkompression davor). Oder ist da in den vergangenen Jahren was verändert worden? Ich habe da keinen aktuellen Einblick.

Die Kritik geht also offenbar in Richtung "generelle Dynamikbearbeitung bei Sprache" - und damit in eine Richtung, die für UKW eindeutig praxisfremd wäre, aber auf DVB machbar. Völlig unbearbeitete Sprache (ich gehe mal davon aus, dass @Tonband nichts gegen ein Begrenzerle hat, das im Notfall eingreift, wenn jemand gegen das Mikrofon schlägt oder hustet) dürfte aus meinem Bauchgefühl heraus irgendwo bei tatsächlich -23 LUFS ankommen, wenn die Peaks unter 0 dBTP bleiben sollen. Dann ist man wirklich 5 dB leiser, aber absolut sauber. Popmusik läuft dann halt bei -15 dBTP oder so, damit es passt. :D

Und von mir noch mal: nicht jedes Element muss , auf 0 LU gefahren, eine in sich stimmige Sendung ergeben. "Jingle-Allergiker" oder "Stinger-Allergiker" hätten diese Elemente sicher gerne paar LU niedriger. Für andere Hörer ists trotzdem ok oder generll wurscht.
 
Es ist im Zweifelsfall immer noch das Ohr das entscheidende "Messinstrument".
Wenn ein Audioelement im Zusammenhang als zu laut empfunden wird obwohl rein technisch alle Parameter einhält - ja dann halt leiser machen! Oder absichtlich so laut lassen.
Genau das ist die neue Freiheit die auch einhergeht mit R128, nicht nur dass man ein technisches Instrument hat um empfundene Lautheit zu messen.
Wenn es um Mischungsverhältnisse geht, hilft eh nur noch das Ohr. Da gibt R128 nur Empfehlungen wieviel Abstand Atmo oder eine Unterlegemusik zur Sprache haben sollen.

@lg74 ich meine auch Du interpretierst @Tonband richtig. Sprache kann durchaus einen Dynamikumfang erreichen der einen Zielwert von -18LUFS ohne Dynamikbearbeitung unmöglich macht. Allerdings ist das auch wieder stark inhaltsabhängig, ein professioneller Sprecher ist in der Lage seine Dynamik zu kontrollieren und dem Anwendungsfall anzupassen. Szenische Lesung oder Ansage im klassischen Nachtkonzert? Zwei komplett andere Baustellen.
Der Zielwert -23LUFS ist tatsächlich nicht theoretisch erarbeitet worden, sondern empirisch. Soweit ich das erinnere wurden über einen längeren Zeitraum die Sendungen der Tagesschau gemessen, und ist bei einem Mittelwert von etwa -23LUFS gelandet. Fernsehton durchläuft in den allermeisten Fällen kein fixes Processing.
Speziell die Tonregie der Tagesschau hatte damals ein analoges Lawo-Pult und allenfalls 4 einschleifbare Neumann U473a als einzige Dynamikbearbeitung. Sprecher und die Tonspuren der MAZen wurden also kaum bzw. garnicht komprimiert.
Ob es in der Summe einen Begrenzer bei -9dBFS gab weiss ich gerade nicht. Der Effektivwert von auf -23LUFS ausgesteuerter Sprache dümpelt aber eher bei -12 bis -15dBFS herum, eine harte Begrenzung bei -9dBFS hat dann nur geringen Einfluss auf die Lautheit des Signals - solange man es nicht mit Gewalt in den Begrenzer schiebt.
Da R128 einen elektrischen Pegel bis -1dBTP zulässt, kommt man ohne Rücksicht auf den Verbreitungsweg erstmal lange ohne Dynamikeinengung per Regelverstärker aus, die Hand am Regler genügt (und der Schutzbegrenzer der -1dBTP zuverlässig einhält).

Ob das praktikabel ist sei mal dahingestellt. Und ob das den klanglichen Vorstellungen nahekommt auch.
Ich persönlich komprimiere Sprache gern ein wenig, solo eher dezent und mit moderaten Zeitkonstanten, in einer Fernsehtonmischung etwas handfester aber weit entfernt vom Brikett. Die Fernsehzuschauer mit den Keinlautsprecherflachbildschirmen danken es einem.
 
Es ist im Zweifelsfall immer noch das Ohr das entscheidende "Messinstrument".
Wenn ein Audioelement im Zusammenhang als zu laut empfunden wird obwohl rein technisch alle Parameter einhält - ja dann halt leiser machen! Oder absichtlich so laut lassen.
Genau das ist die neue Freiheit die auch einhergeht mit R128, nicht nur dass man ein technisches Instrument hat um empfundene Lautheit zu messen.
Wenn es um Mischungsverhältnisse geht, hilft eh nur noch das Ohr. Da gibt R128 nur Empfehlungen wieviel Abstand Atmo oder eine Unterlegemusik zur Sprache haben sollen.
Es hängt ja auch sehr von der Abhörumgebung ab, wie man das empfindet, und auch davon, wie laut man etwas generell anhört. Da kann man es eh nicht für alle Situationen recht machen.
 
Wohl wahr, das kann man nur antizipieren indem man auf (qualitativ) unterschiedlichen Lautsprechern abhört und mit unterschiedlicher Abhörlautstärke.
Beispiel aus der Praxis: in den Mischstudios die ich kenne hängt ausser Geithain und Klein+Hummel auch ein hinreichend schäbiger Flachbildfernseher als Abhöre, um sich der Abhörsituation beim Zuschauer daheim einigermaßen anzunähern.
Das ist schon sehr nützlich - hat aber mit Lautheit und R128 nichts (mehr) zu tun.
 
Zuletzt bearbeitet:
Ich vermute, @Tonband meint: wenn er bei Sprachbeiträgen an der "Endkunden-Senke" (..) +5 LU misst (..), dann müssen die vorher definitiv komprimiert worden sein. ( ... ) Und von mir noch mal: nicht jedes Element muss, auf 0 LU gefahren, eine in sich stimmige Sendung ergeben.
Jou, danke @lg74 für die Erläuterungen. - Ich sehe gerade: Vor genau drei Jahren hatte ich das Problem schon mal benannt im Post #67.
... (ich gehe mal davon aus, dass @Tonband nichts gegen ein Begrenzerle hat, das im Notfall eingreift, ...)
keinesfalls, das hat früher nach meinem Empfinden gut funktioniert.
.. Völlig unbearbeitete Sprache (...) dürfte aus meinem Bauchgefühl heraus irgendwo bei tatsächlich -23 LUFS ankommen, wenn die Peaks unter 0 dBTP bleiben sollen. (..) Popmusik läuft dann halt bei -15 dBTP oder so, damit es passt.
Ich hatte unter Post#79 eine Grafik gepostet, welche die Limitierung der Amplituden eines UKW-Stereo-Kanals theoretisch darstellt. Ich versuche sie hier noch mal anders zu erläutern:
> Die rote Linie zeigt die für UKW zulässigen Amplituden reiner Sinusschwingungen in Abhängigkeit von der Tonfrequenz. Daraus ist zu erkennen, dass
  • zum einen die nach R128 digital produzierte Loudness von -23 LU für UKW um 5 LU angehoben wird,
    was alle Amplituden um 5 dB erhöht,
  • danach werden die Amplituden zusätzlich unter die 50us-Kurve gedeckelt um den zuslässigen FM-Hub 75 kHz einzuhalten.
Das Tonsignal wird so von unten und von oben, also doppelt schikaniert. Der digitale Amplitudengrenzwert -1 dBTP eines Tonsignals muss für UKW in jedem Fall unter -4,5 dBFS gedrückt werden (-4,5 bis -18 dBFS, freuquenzabhängig).

Ich habe S-Laute von Sprechern 'oszillografiert', die eine fast reine 10 kHz-Schwingung erzeugen. Deren Amplitude dürfte nach der Grafik -15 dBFS hoch sein, während Töne unterhalb 1kHz -5 dBFS erreichen dürfen. Tonsignale sind bekanntlich eine Mischung aus tiefen, mittleren und hohen Frequenzen, deren Amplituden sich überlagern zu einer Summenamplitude welche den FM-Hub bestimmt. Wenn nun ein Ton-/Sprachsignal hoch ausgesteuert wird, nehmen bereits tiefe Freqenzen im 'Kopfbereich' so viel Raum ein, dass der Amplitudenbereich für hohe Frequenzen zu eng wird. Eine adaptive Preemphasis begrenzt dann ein die Höhen temporär extra und nimmt im Extremfall (Preemphasis: 0 us) einer 10 kHz-Schwingung 10 dB weg. Wie dumpf sich ein Tonsignal über eine 50us-Deemphase anhört kann sich Jeder selbst ausmalen.

Fazit: Die frühere breitbandige Amplituden-Vorbegrenzung auf ca. 40 kHz Hub (= -9 dBFS) war m.E. sehr sinnvoll um zugunsten der Sprachverständlichkeit den Hochtönen mehr Raum (+4,5 dB ) zu geben. Die etwas niedriger ausgesteuerte (damalige) Musik profitierte im Klang vom "luftigen Kopfraum". Gewiss, die Einschränkung des Amplitudenbereichs für UKW von oben her war seit Beginn der digitalen Produktion notwendig. Aber diese zusätzliche 5-LU-Quetsche von unten halte ich für übertrieben. Meine Auswertungen früherer UKW-Mitschnitte kamen im Mittel immerhin auf einen ca. Loudnesswert von -23 LUFS.

Zum Anti-Argument "UKW-Rauschen": Dieses verewigte Argument stimmt nur bedingt und dient imer noch zur Rechtfertigung möglichst laut zu sein. Es kam doch erst im Loudness War mit den Privaten auf, die versuchten mit der Loudness ihre sog. "Reichweite", also Akzeptanz zu erhöhen. Das UKW-Sendernetz der ÖR's war schon so gut dimensioniert, dass das Rauschen beim Heimempfang im eigenen Senderbereich praktisch keine Rolle spielte. Und für den UKW-Empfang im geräuschvollen Auto kann ich das gar nicht anerkennen. Da stört dann eher die Dynamikkompression mit abgeflachten Transienten, spitzen- und pausen-befreiten Sprachbeiträgen. Ein ÖR-Toningenieur sagte mal folgenden einprägsamen Satz sinngemäss dazu:
"Wenn ich in einen Tunnel fahre muss ich jetzt den Lautstärkeregler aufdrehen um die Worte zu verstehen, dann ist es mir aber schon zu laut."

Die Grafik hier einzubinden hat nicht geklappt, ich lade sie nochmal nach:
UKWaussteuerung.gif
Grafik-Link
 
Dass Musik aus den 70er/80er Jahren allgemein besser zu hören ist, liegt - wie schon geschrieben - daran, dass man damals noch mit mehr Dynamik produziert hat. Heute kommen halt fast ausschließlich Bretter aus dem Mastering.

Hallo zusammen, ich empfehle in den Interpretationen und Überlegungen über loudnessbasiertes Aussteuern den Begriff Dynamik genauer zu definieren.
In der Musik bedeutet Dynamik die Varianz in der Lautstärke, also ob man ein Instrument leise/piano oder laut/forte spielt. Dabei klingt ein Instrument meist auch unterschiedlich, ebenso wie die menschliche Stimme einen anderen Klangcharakter entwickelt, wenn gefüstert oder geschrieen wird und produziert meist auch unterschiedliche Peaklevel.
In der Audiotechnik definierte man Dynamik gern mit Peaklevelunterschieden und deren Abständen zueinander. Allerdings liefern diese nicht immer eine zutreffende und verlässliche Aussage darüber, wie laut ein Klang wahrgenommen wird. So kann eine piano Stelle eines Orchesters durch einzelne Triangelschläge sehr hohe Peaks enthalten, wenn diese nah am Mikro gespielt sind. Hierbei lohnt sich übrigens mal der Blick auf ein Truepeakmeter (Integration mit mind 4facher Sample Frequenz) und ein DIN Meter (Integration mit 10ms), denn das letztere wird die Peaks evtl. gar nicht zeigen. Daher wäre:

Ob es in der Summe einen Begrenzer bei -9dBFS gab weiss ich gerade nicht. Der Effektivwert von auf -23LUFS ausgesteuerter Sprache dümpelt aber eher bei -12 bis -15dBFS herum, eine harte Begrenzung bei -9dBFS hat dann nur geringen Einfluss auf die Lautheit des Signals - solange man es nicht mit Gewalt in den Begrenzer schiebt.
...auch schade für den Klang und die Wahrnehmbarkeit des Triangels (durch dessen Transienten), übrigens gerade in "klanglich verseuchten" Abhörsituationen wie etwa im Auto oder anderswo, wo es natürliche Störsignale/Umweltgeräusche gibt.

Somit könnte man auf technischer Seite besser von der Differenz zwischen Loudness und Peakleveln reden, also "Peak to Loudness Ratio", diese betrüge also bei einem korrekt nach R128 produzierten Programms maximal 22 (-1dBFS - -23LUFS = 22PLR)

Die Dynamik eines Klangereignisses lässt sich viel besser mit der Loudnessrange beschreiben, die auch nicht nur einfach die Differenz zwischen dem Maximum und dem Minimum der gemessenen Loudness darstellt, sondern auch noch deren statistische Verteilung innerhalb der I Messung. Somit könnte also ein Klassikstück durchaus eine LRA von 15 - 20 LU aufweisen, was ziemlich viel ist. Oben beschriebener piano Satz hat aber in sich vielleicht nur eine LRA von 6 LU, denn zum piano wird er ja erst durch andere mezzoforte und forte Stellen in der Musik, unter Dynamikgesichtspunkten.

So gesehen hatte Pop- und Rockmusik inder seltensten Fällen eine wirklich hohe Dynamik, konnte jedoch eine sehr hohe PLR aufweisen, einfach weil damalige Limiter noch gar nicht in der Lage waren und sein mussten, sehr kurzzeitige Peaks zu verhindern. Und das ist übrigens nach meiner Meinung der wichtigste Grund, weshalb analog teilweise so viel besser klingt als digital!

Und zum Ende dieser Betrachtung ist Dynamik in der Stimme lediglich als dramaturgisches Stilmittel sinnvoll. In einer Nachrichtensendung oder auch bei Moderationen in einem gemischen Programm ist Dynamik geradezu sinnlos, störend und unverständlich. Ein guter Sprecher ist auch in der Lage nahezu gleichmäßig laut (hoffentlich nicht monoton) zu sprechen. Somit wird also kontinuierliche Sprache mit einer kleinen LRA von 3-5 LU daherkommen und das ist sehr gut durchgehend wahrnehmbar.
Je nach Aufnahmesituation und -mikrofonierung sind hierbei teils sehr unterschiedliche Peaklevel zu erwarten.

Beste Grüße, Björn
 
D'accord, @marillenfreund !
Um ganz kurz auf Deinen letzten Absatz einzugehen - säßen überall gute Sprecher, gäbe es keine Probleme ;) aber, ach...

Was (auch zum Verständnis des Messwertes Loudness Range (LRA) ) interessant und wichtig ist:
Es gibt ein relatives und ein absolutes Gate in der Messung. Das absolute Gate schliesst bei -70 LUFS, das relative Gate -10LU unterhalb des aktuellen Short Term Wertes (3s Integrationszeit).
Damit soll verhindert werden, dass u.a. kurze Modulationspausen die Messung rechnerisch verfälschen. Das menschliche Ohr integriert da anders.
 
Das absolute Gate schliesst bei -70 LUFS, das relative Gate -10LU unterhalb des aktuellen Short Term Wertes (3s Integrationszeit)
Soweit ich das relative Gate verstanden habe bezieht es sich auf die laufende I Messung. Anderenfalls würde es ja ständig wandern. Es stimmt natürlich, somit eine Verfälschung der Program Loudness verhindert wird. Gutes Beispiel hierfür wäre eine Naturdoku mit längeren Sprechpausen. Die Sprache ist auf 0LU gemischt und bestimmt die I Messung. Je länger die Messung dauert, desto weniger fällt die Program Loudness in den Sprechpausen ab. Liegt in diesen die Atmo unterhalb von -10LU dann würde sie also gar nicht gewertet.
Anfangs sollte das relative Gate bei -8LU liegen, das hätte engere, dichtere Mischungen ermöglicht. Allerdings bei ggf schlechterer Sprachverständlichkeit.
Beste Grüße, Björn
 
... dass man damals noch mit mehr Dynamik produziert hat. Heute kommen halt fast ausschließlich Bretter ....
Hallo zusammen, ich empfehle (..) den Begriff Dynamik genauer zu definieren. (...)
Die Dynamik eines Klangereignisses lässt sich viel besser mit der Loudnessrange beschreiben, ... LRA ....
... wobei über die Qualität des Klangereignisses die LRA kaum etwas aussagt. @DigiAndy verwendete hier "Dynamik" wohl als Qualitätsbegriff, für ungepresst und eher natürlich.

Dazu möchte ich nochmal einen SOS-Artikel von 2011 ins Gedächtnis rufen, in dem der Autor rein technisch nachweist, dass die "Dynamic Range" (Anm.: LRA?) neuer Produktionen gegenüber früheren nicht geringer geworden sei (siehe Anhang). Daraus lässt sich ableiten, wie eine "gute" LRA bei hohen LUFS mit teils furchtbaren Verzerrungen erkauft werden kann. Ein schönes Beispiel liefert ein Titel der Toten Hosen: "Tage wie diese": Das Lied beginnt in guter Qualität aber mit Amplituden bereits am Limit, die nachfolgend ansteigende Lautstärke kann dann nur noch mit entsprechender Verdichtung durch Verzerrungen erfolgen.
... ob man ein Instrument leise/piano oder laut/forte spielt. Dabei klingt ein Instrument meist auch unterschiedlich, ebenso wie die menschliche Stimme ...
Ein forte gespieltes Instrument (oder laute Stimme) klingt (soweit unbearbeitet) in meinen Ohren natürlich während ich die künstliche Loudness durch technische Verzerrungen als ziemlich brutal empfinde. Könnte das PLR denn ggf. als ein Qualitätsparameter verwendet werden?

 
Zuletzt bearbeitet:
dass die "Dynamic Range" (Anm.: LRA?)
Könnte das PLR denn ggf. als ein Qualitätsparameter verwendet werden?
Auch wenn wir jetzt fast schon wieder ein wenig vom Thema abweichen noch ein paar Anmerkungen zur Theorie in Messung und deren Interpretation für die Praxis.

Die Dynamic Range, wie sie auch im TT Meter

http://www.dynamicrange.de/sites/default/files/DR-Gebrauchsanweisung-V1_1-Deutsch.pdf

Anwendung findet entspricht in ihrer Aussage nahezu der PLR wie hier im Toneboosters Meter

https://www.toneboosters.com/tb_bustools_v3.html

Wie schon erwähnt beschreibt beides für mich nicht die Dynamik im musikalischen Sinne, sondern eher im technischen. Die musikalische Dynamik hingegen wird viel besser durch die LRA ausgedrückt. Hier zur Erläuterung mal konkrete Messwerte zum Titel "So far away" der Dire Straits aus der CD "Brothers in arms" von 1985 bzw 2005.

Integrated Loudness: -24,0 -10,0 LUFS
TruePeaks: -1,7 +2,2 dBFS
Loudness Range: 3,7 3,9 LU
Peak to Loudness Range: 22,3 12,2

Die Dynamic Range sollte der PLR ähneln, in der DR werden Peak und RMS Pegel ins Verhältnis gesetzt, in der PLR hingegen Peak und Loudness Pegel. Der Unterschied entsteht durch die k-Bewertung in der Loudnessmesssung und ist somit noch etwas näher an dem, was das Ohr vermittelt.

Man sieht also, während die PLR um den Wert 10 geschrumpft ist, war die LRA 1985 sogar minimal kleiner als in 2005. Der Titel ist auch von Anfang bis Ende nahezu gleich laut und hat somit also keine Dynamik im musikalischen Sinne.
Zur allgemeinen Beruhigung noch eine Bemerkung zu den True Peak Werten, das gemessene Maximum tritt in 2005 nur an einer Stelle auf und keinesfalls permanent ;)

Beste Grüße, Björn
 
Ich habe mir mal die Mühe gemacht und eine normale und eine HD-Produktion blind getestet. Optisch ein Riesenunterschied: die normale Produktion ein einziges Brikett (d.h. die Wellen oben und unten schön gekappt), in der HD-Version konnte man sehen, wie die Wellen schön nach oben und unten hin ausschwingen. Beim DR-Level auch ein Riesenunterschied! Gehört habe ich den Unterschied aber nicht, d.h. auch die HD-Produktion war im Prinzip gleichartig abgemischt und damit genauso ein Brei wie die normale Version, nur dass halt vermutlich weniger Verzerrungen da waren. War aber auch schon egal! Das hätte in LRA gemessen vermutlich auch keinen Unterschied ergeben.

Letztendlich muss man sich da auf sein Gehör verlassen. Und was weder LRA noch DR/PLR wiedergeben, sind die feinen Nuancen in der Dynamik, hier mal eine bewusst reduzierte Gitarre, dort mal ein bewusst betontes Schlagzeug, das ist es - wie ich finde - was modernen Musikproduktionen sehr viel mehr fehlt. Das was man gerne als "luftig" abgemischt bezeichnet.
 
Was hast Du denn da verglichen, @Andreas W ?

Wenn man ein paar Tools zum "Lautmachen" kennt, und weiß wie die arbeiten, nämlich neben extremer Spitzenwertbegrenzung ganz bewusst mit nichtlinearer Verzerrung (z.B. Waves L1/2/3 Ultramaximizer, Sony bzw. Sonnox Inflator Plugin), ist klar wie ein Beispiel wie das von @Tonband aufgeführte entstehen kann.
Klirrprodukte helfen der Nervigkeit Lautheit ordentlich auf die Sprünge...

Dagegen ist die Bandsättigung aus den besten Zeiten der Analogproduktion total harmlos.
 
@Funkminister: Der Blindtest war eines der neueren Alben von Depeche Mode, ich glaube die Delta Machine oder Playing The Angel, da bin ich mir nicht mehr ganz sicher. Müsste ich nochmal genauer nachsehen.
Dass der akustische Unterschied relativ oft gar nicht so groß ist, wie es anhand der Waveform-Anzeige oder den errechneten DR-Leveln zu erwarten wäre, ist mir schon öfter aufgefallen.
Wenn die grundsätzliche Abmischung in der HD-Version die gleiche ist (was mir bei HD-Tracks häufig auffällt), klingt es halt trotzdem allenfalls um Nuancen besser. Die Mastering-Tools scheinen die Brickwall ja tatsächlich verzerrungsfreier hinzubekommen als man es anhand der Wellenform erwarten würde.
 
Zuletzt bearbeitet:
Mal eine nebenbei gewonnene statistische Information:
Mein Tagewerk ist heute u.a. Retrodigitalisierung von Archivbändern, Fernsehen.
Dabei habe ich einfach mal die Lautheit gemessen, ein Sammelband mit Beiträgen aus 1994 landet bei etwa -19 LUFS / LRA von 8 LU / TPmax -2,5 dBTP.
 
Ich habe mir mal die Radio-Jazznacht auf Bayern 2 mit Peter Veit von vor ein paar Tagen hergenommen und zerlegt in die einzelnen Elemente. Leider lagen mit die Nachrichten vor der Jazznacht nur mit der letzten Meldung vor (der Mitschnitt hatte zu wenig Aufnahmevorlauf). Dann das Wetter mit Bett, der Opener, die Anmoderation und dann abfolgend Musik und Moderation. Drei Titel kamen sogar live von den beiden Plattenspielern, die bei Bayern 2 noch im Studio stehen (EMT 948). Ich habe nur die erste Stunde ausgewertet und an den Schluss die Nachrichten von 2 Stunden später gehängt, als die Übernahme des ARD-Nachtkonzertes erfolgte.

01 - Nachrichten.mp2: -21.0 LUFS / peak: -5.9 dBTP / range: -21.2 LU
02 - Wetter mit Bett.mp2: -19.7 LUFS / peak: -5.8 dBTP / range: 3.9 LU
03 - Opener Radio-Jazznacht.mp2: -15.8 LUFS / peak: -5.8 dBTP / range: -15.5 LU
04 - Moderation.mp2: -18.6 LUFS / peak: -5.7 dBTP / range: 3.8 LU
05 - Musik - Till Brönner - Nightfall - A 1000 kisses deep.mp2: -17,8 LUFS / peak: -5.7 dBTP / range: 4.5 LU
06 - Moderation.mp2: -18.1 LUFS / peak: -5.7 dBTP / range: 3.4 LU
07 - Miles Davis - So what (LP).mp2: -18.9 LUFS / peak: -5.7 dBTP / range: 6.2 LU
08 - Moderation.mp2: -18.3 LUFS / peak: -5.7 dBTP / range: 3.7 LU
09 - Musik (LP).mp2: -20.2 LUFS / peak: -5.7 dBTP / range: 12.0 LU
10 - Musik (LP).mp2: -17.7 LUFS / peak: -5.7 dBTP / range: 7.9 LU
11 - Moderation.mp2: -18.4 LUFS / peak: -5.7 dBTP / range: 3.3 LU
12 - Musik.mp2: -17.1 LUFS / peak: -5.7 dBTP / range: 4.3 LU
13 - Moderation.mp2: -18.1 LUFS / peak: -5.7 dBTP / range: 2.9 LU
14 - Musik.mp2: -17.1 LUFS / peak: -5.9 dBTP / range: 3.3 LU
15 - Moderation.mp2: -18.9 LUFS / peak: -5.8 dBTP / range: 4.3 LU
16 - Musik.mp2: -18.2 LUFS / peak: -5.8 dBTP / range: 4.3 LU
17 - Moderation auf Applaus.mp2: -18.9 LUFS / peak: -5.7 dBTP / range: 3.1 LU
18 - Musik.mp2: -18.4 LUFS / peak: -5.7 dBTP / range: 4.7 LU
19 - Moderation.mp2: -18.3 LUFS / peak: -5.7 dBTP / range: 3.0 LU
20 - Nachrichten ARD-Nachtkonzert.mp2: -20.8 LUFS / peak: -4.7 dBTP / range: 3.9 LU

Am lautesten ist tatsächlich der Opener gewesen - ca. 3 LU mehr als . Ist es das, was @Tonband stört?
 
Am lautesten ist tatsächlich der Opener gewesen - ca. 3 LU mehr als . Ist es das, was @Tonband stört?
Ich gehe davon aus, dass die Werte aus einem HF Mitschnitt stammen und nicht direkt am Studioausgang gemessen sind. Dafür sprechen die nahezu einheitlichen TruePeak Werte.
Der Opener wirkt in seinem Umfeld sicher störend. Ich gehe davon aus, dass auch im Opener gesprochen wird. Somit ist also Sprache in den Punkten 02-04 der Programmanteil, der jeweils die Loudnessmessung bestimmt. Somit ist der Opener im Vergleich zum Wetter 4 LU, und im Vergleich zur Moderation ungefähr 3 LU lauter, das wird mitunter schon als zu viel empfunden. Zudem spricht die hohe Range im Opener dafür, dass man sich laute Sprache durch eigentlich zu leises Sounddesign erkauft hat. Somit ist separat bewertet die Sprache (short term bewertet) wahrscheinlich sogar noch lauter.
An den verschiedenen Moderationen ist gut zu sehen, dass sie mit nahezu konstanten Werten daher kommt und vielleicht schon auf die später auf UKW erreichbaren -18 LUFS produziert sind.
Die Spanne der Range Werte der Musiken von 3,1 bis 12 LU spricht für mich dafür, dass hier offenbar wenig Processing zum Einsatz kommt, also keine flotte AGC oder starke Permanentkompression, sonst wären 12 LU Range schon eher ungewöhnlich.
Jedenfalls wird offenbar nicht nach Loudnessbewertung produziert, weshalb es natürlich zu mehr oder weniger starken Loudness Jumps und Schwankungen kommt.

Nun nochmal etwas näher ans eigentliche Thema und zum Beispiel die Frage:

Könnte das PLR denn ggf. als ein Qualitätsparameter verwendet werden?
Es könnte zumindest ein Anhaltspunkt dafür sein wie sehr versucht wurde, den Loudnesslevel nach oben zu schrauben, was als allererstes durch bekämpfen der bösen, bösen Peaks geschieht. Allerdings bleibt die LRA natürlich gleich, auch wenn ich bei ein und demselben Titel den Wiedergabepegel verändere. Insofern ist also gleiche LRA oder auch DR kein Kriterium, wie laut die Titel zueinander klingen.
Die Peaks in Aufnahmen kommen ja meistens von Signalen, die sehr perkussiv und transientenreich sind. Ein schönes Beispiel ist hier ein Kaminfeuer. Das Bollern ist eher gleichförmig und niederpegelig, aber ab und zu gibt sehr kurzfristiges Knistern oder Knacken, wofür viel Headroom bis Fullscale gehalten werden muss. Wenn man nun die Peaks zu stark limitiert, kommt irgendwann ein Punkt, an dem sich deren Klang verändert. Das Knacken klingt nicht mehr so direkt und frisch, fast als würde man sich vom Feuer entfernen. Man könnte also fast sagen, das Knacken wird leiser.
Und nun wird es interessant, wenn ja oft von lauter und leiser gesprochen wird. Meine Erfahrung beim Mischen von Signalen zeigt, dass sie sich leichter mischen lassen, wenn perkussive Elemente noch hohe Peaks erzeugen, somit setzen sie sich auch am Ohr noch gut gegen konstante Klänge durch. Dafür benötigt man aber ausreichend Headroom und erzeugt ein schön transparentes Klangbild oder eben,

Das was man gerne als "luftig" abgemischt bezeichnet.
Soll der Mix nun lauter werden muss ich die Peaks reduzieren, dadurch setzen sie sich nicht mehr so gut am Ohr durch. Jemand der keine Ahnung von Audiobearbeitung hat würde instinktiv sagen, dass die Klänge mit den peaks nun leiser sind, einfach weil man sie im Verhältnis zu den anderen Klängen weniger deutlich hört. Mache ich nun den gesamten Titel lauter, ist er schnell zu laut, und die eingestampften Peaks kommen auch nicht wieder.
Dies geschieht also beim Mischen von Klängen und wirkt sich auch auf die letzte Mischung aus. Der letzte Mix entsteht nämlich beim Endverbraucher, denn hier mischt sich der Musiktitel nochmal mit akustischen Nebengeräuschen am Ohr des Hörers. Und hier wirken sich fehlende Peaks und Transienten wieder negativ auf die Hörbarkeit der dazugehörigen Klänge aus, da diese nun durch andere Klänge überlagert werden.
In Workshops führe ich dies gern mit der Aufnahme des Fahrgeräusches im Cabrio vor. Das Ergebnis zeigt meist, dass zu viel Processing sich negativ auf die Hörbarkeit der Klänge auswirkt, der Laie würde ggf wieder von laut und leise sprechen. Und das, wo doch dieses ganze Processing gerade für die Autofahrer gemacht wird... Also, beim Versuch ein möglichst lautes Signal zu erzeugen, werden einige Signalanteile leiser, weil indirekter, und der Rest wirkt laut abgehört schnell unangenehm und störend.
Ein ähnliches Erlebnis hatte ich letztens auf einer Ü30 Party. Ihr wisst schon, die spielen dort die Hits aus den 70ern bis 90ern und das Beste von heute. Das Beschallungssystem war sehr gerichtet, so dass es nur auf der Tanzfläche deutlichen Klang gab, sobald man diese verlies hörte man nur noch weniger gerichtete Frequenzanteile (als fast nix mehr über 800 Hz) und Diffusschall. Auch hier könnte man sagen die Musik wurde leiser, weil indirekter und man den Gesang kaum mehr verstand.
Als ich nun so, natürlich abseits der Tanzfläche, umher stand war ein wunderbares Phänomen zu hören, nämlich das alte Aufnahmen auch abseits viel besser zu "verstehen" waren, während Produktionen neueren Datums nur eine breiige Klangwolke am Ohr erzeugten, konnte man in den alten Titeln noch viele Details hören. Würde man nun vielleicht auch wieder sagen, dass die neuen Titel zu leise waren? Der gefühlte Eindruck jedoch sprach für annähernd gleich laute Signale, sowohl abseits als auch auf der Tanzfläche. Der Unterschied betraf vornehmend die Wahrnehmbarkeit der verschiedenen Mischungsanteile.
Diese Situation lässt sich auch daheim gut nachstellen. Einfach mal Musik im Zimmer laufen lassen und heraus gehen. Dabei auf die jeweils hörbaren Klanganteile achten, die im Diffusschall wahrnehmbar sind.

Also, ob ein Radiosender lauter oder leiser erscheint, kann auch an der klanglichen Qualität der gesendeten Inhalte liegen. Diese kann auch heutzutage wieder steigen, wenn der Ehrgeiz zum lautesten Master der Welt dadurch begrenzt würde, dass man ihn ja ohnehin nicht 1:1 senden kann.

Viel Spaß beim Experimentieren und beste Grüße, Björn

Viel Spaß
 
Ich gehe davon aus, dass die Werte aus einem HF Mitschnitt stammen und nicht direkt am Studioausgang gemessen sind. Dafür sprechen die nahezu einheitlichen TruePeak Werte.
Korrekt: Astra-Transponder 93 war die Quelle.

Der Opener wirkt in seinem Umfeld sicher störend. Ich gehe davon aus, dass auch im Opener gesprochen wird.
Anbei der Beginn der Sendung, die Moderation ist gekürzt. Ich finde den Opener noch nicht störend, aber eben schon deutlich lauter als das Umfeld. Das dürften andere gewiss auch völlig anders sehen können. Vor allem, wenn es im Tagesprogramm häufiger solche Soundelemente als Trenner gibt. Hier gab es nur den einen in 2 Stunden.

Zudem spricht die hohe Range im Opener dafür, dass man sich laute Sprache durch eigentlich zu leises Sounddesign erkauft hat.
Das sehe ich jetzt erst, danke! Da steht sogar ein "-" davor, das kann doch nicht sein. Nochmal durchs Tool laufen lassen, wieder so. Da muss doch was nicht stimmen in R128gain? Habe den Opener nochmal in PCM gewandelt - wieder so. Wenn ich je 10 Sekunden Stille davor und dahinter setze (sollte doch gegated werden?), erhalte ich eine Range von 8,5 LU. Sieht schon besser aus... aber wie kann das passieren? Was sagt Dein Tool dazu?

Und danke für die Erläuterungen und die Anleitung zum Experiment!:)
 

Anhänge

03 - Opener Radio-Jazznacht.mp2: -15.8 LUFS / peak: -5.8 dBTP / range: -15.5 LU ....
Am lautesten ist tatsächlich der Opener gewesen - ca. 3 LU mehr als . Ist es das, was @Tonband stört?
Genau @lg74 . Auf mich als nahezu "Dauerhörer" des Programms wirkt der inzwischen jedesmal sehr störend und aggressiv.
Danke für Deine Fleissarbeit. Ich bin auch gerade dabei eine 'radiowelt'-Sendung von DVBS auszuwerten.
Da steht sogar ein "-" davor, das kann doch nicht sein. (...)
Doch, die Software hat dummerweise einen Vorzeichenfehler, auch das Nachfolge-Tool "BS1770gain" von Peter Belkner. Evtl. sollten wir den Mann mal darauf hinweisen. :rolleyes: Ich habe den Fehler bisher im Log "händisch" korrigiert.
(Nebenbei: Ich habe mir zur neuen Software einen GUI für die Stapelverarbeitung "gebastelt", an dem liegt's nicht.)
Bis später, TB.

add: es gibt zum Vergleich ein praktisches online-Tool für RME-Nutzer: DIGIChek 5.92
 
Zuletzt bearbeitet:
...also den mit 10 Sekunden wirklich sehr kurzen Jingle habe ich eben mal gemessen, mit einem RTW TM9. Dabei kommt dann eine ungefähre Range von 2,6 LU heraus, wobei sie direkt bei Ende des Audios noch bei 1,4 LU liegt.
Es ist etwas schwierig bei so kurzen Ereignissen, allein weil der Algorithmus erstmal 3 Sekunden sammelt und dann vermittelt. In jedem Fall macht R128gain da wohl etwas falsch, ebenso mit dem Vorzeichen bei der Range das es nicht geben kann, weil der Wert ja nicht kleiner als 0 werden kann.
Jedenfalls ist der Jingle sehr eng gemischt, Sprache und Sounddesign annähernd gleich laut, daher weist er eine kleine Range auf. Das wiederum erzeugt am Ohr natürlich einen nahezu permanenten Reiz. Wird dieser, wie oben dokumentiert, lauter als die umgebenden Moderationen, kann der Jingle schnell zu laut empfunden werden. Mit demselben Loudnesslevel jedoch nervt er weniger und bekommt trotzdem ausreichend Aufmerksamkeit, durch die sehr kleine Range in kurzer Zeit.

Beste Grüße, Björn
 
Gefällt mir: lg74
Oben