1. Diese Seite verwendet Cookies. Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies. Weitere Informationen

Ist Loudness eigentlich noch ein aktuelles Thema?

Dieses Thema im Forum "Studio- und Sendertechnik" wurde erstellt von SebVonHoldt, 02. April 2015.

  1. SebVonHoldt

    SebVonHoldt Benutzer

    Hallo ich bin neu hier und mich würde interessieren, ob Loudness noch ein aktuelles Thema für euch darstellt. Zumal es ja auch in diesem Forum vor einiger Zeit diskutiert wurde und es mit den Empfehlungen der EBU eindeutige Tendenzen gibt, die Dynamik der Programme und die Inter-Programm Lautheit zu verbessern.
     
  2. Tonband

    Tonband Benutzer

  3. codo

    codo Benutzer

    Hallo

    Die Radiostation in Deutschland haben das mit modernen Soundprozessoren ganz gut im Griff.

    Erwähnen könnte man vielleicht am Rande, das immer noch einige Musik-Label daran "glauben" Lautlautlaut ist alles
    und gerne komplett übersteuerte Bemusterungen an Sender promoten. Und das in den Zeiten von digitalen Zuspielungen.

    Sicherlich gibt es "tolle" Kompressions Plugins (s.u.) mit denen man überproduzieren kann.
    Das hört sich an einem guten Produktionsmischpult und analog mit +3 dB ausgespielt auch alles sehr schön fett an.
    Aber sobald es das dann auf einer digitalen broadcast Zuspielung als mp3 komprimiert landet clippt das wie irre.

    Die lernen das nie: "Bei null dB ist Schluss!"

    Wenn man dann die Promoter anruft und mitteilt das sie Datenschrott eingereicht haben,
    behaupten die immer das "müsse so sein" und " das ist "extra vom Künstler so dissonant gewollt", das sei "Stilmittel".
    Ich nehm' die Sachen dann immer wegen Qualitätsmängel aus der Rotation.

    Hier gibt es einen Film, der zeigt was da passiert wenn man mit Loudness Plugins bei der Produktion rumfuscht.
    Clipping und Limiting in der Praxis demonstriert:



    Gruß Codo
     
    Zuletzt bearbeitet: 09. April 2015
  4. marillenfreund

    marillenfreund Benutzer

    Ist Loudness eigentlich noch ein aktuelles Thema?

    Na selbstverständlich war, ist und bleibt Loudness immer ein aktuelles Thema, wenn Töne aufgenommen, bearbeitet und gesendet werden!

    Allerdings wird unter dem Stichwort Loudness gerne mal von vollkommen unterschiedlichen Ansätzen ausgegangen und argumentiert.
    Während es in der Vergangenheit immer nur um die Möglichkeiten zur Maximierung von Loudness (Loudnesswar) ging, weil stur behauptet wurde, dass lauter automatisch besser ist, wandelt sich die Diskussion inzwischen jedoch (zumindest bei dazu bereiten Tonschaffenden) hin zu einer neuartigen Bewertungsmöglichkeit von digitalen Audiosignalen, mit der Loudness gemessen und als neuer Aussteuerungsstandard (Loudnessnormalisierung) genutzt werden sollte.

    Der oben verlinkte Film zeigt ganz schön, was man alles so mit Audio anstellen kann, um Peaklevel zu reduzieren, damit die resultierende Audiowurst dann wieder ein paar dB nach oben gepresst werden kann, auch wenn immer mal darauf hingewiesen wird, dass dies alles auch Stilmittel sein können und nicht zwingend so im Mastering anzuwenden sind. Interessant finde ich das Zitat des Produzenten, dass er den unbearbeiteten Sound am besten findet! Dann könnte er ihn doch einfach so lassen!? Kann er eben in Zeiten des Loudnesswar nicht, weil der Track am Ende vielleicht leiser als der des Nachbarn wäre. In Zeiten der Loudnessnormalisierung allerdings müsste er sich über die ganzen Kniffe gar keine Gedanken machen und sich einfach an seinem guten Sound erfreuen. All die wunderbaren und für die Hörbarkeit von Signalen so wichtigen, Peaks könnten nämlich drin bleiben!

    Ich habe in den oben verlinkten Threads schon viele Erläuterungen zur EBU R128 geliefert, teilweise sicher zu wortreich. Sollten sich hier konkrete Fragen dazu entwickeln, dann gehe ich gern darauf ein. Denn es ist meines Erachtens nach unausweislich, dass sich auch der Hörfunk damit auseinander setzt, zumal es auch in der ARD schon entspechende Beschlüsse auf Hörfunkbetriebsleiterebene gibt.

    Unterschieden werden muss allerdings ganz klar zwischen Loudnessunterschieden innerhalb eines Programmes aufgrund unterschiedlicher Loudnesslevel der verschiedenen Programmanteile und der Loudness eines Senders bei der Ausstrahlung. Diesen Unterschied zugrunde gelegt kann ich zumindet obiges Statement

    ...nicht ganz nachvollziehen, denn gerade die Durchörbarkeit von Radioprogrammen ist heutzutage eigentlich kaum mehr Realität. Je nachdem was (Moderation, Popmusik, Telefon O Ton, Station ID, O Ton aus dem TV, Werbung) da gerade mit Reglernormstellung in den Sendeprozessor gejagt wird, muss der Konsument sein Abhörvolumen anpassen! Der Sendeprozessor schafft es allemal innerhalb der laufenden Minute die maximal zulässige MPX Leistung zu garantieren, womit wir wiederum bei einer weiteren Stufe der Maximierungsdebatte sind. Genau deshalb wird auch noch mal an dieser Stelle alles ausgepackt, was es an Bearbeitungsmöglichkeiten gibt. Die Loudnessunterschiede der eben erwähnten Audioereignisse, vor allem an den direkten Übergängen, werden dadurch jedoch nicht beseitigt, sondern allenfalls verringert! Ganz abgesehen davon, dass kein aufwendig gemasterter CD Track mit seinem Originalpegel gesendet werden kann.

    Ich merke gerade, dass ich schon wieder viel zu ausführlich bin...

    Beste Grüße, Björn
     
    Tonband gefällt das.
  5. Tonband

    Tonband Benutzer

    Genau, dort werden Tonsignale leider auf Pegel- oder Leistungsangaben reduziert. Die permanenten Regelvorgänge dieser Maschinen verändern auch permanent (oft sehr dilettantisch) den Klang und schütten den Hintergrund mit Regelverzerrungen zu, was die Transparenz verwäscht (sofern diese überhaupt noch enthalten ist). Vorreiter dieser Fehlentwicklung auch bei CD's war das UKW-Radio vor 25 Jahren.

    Vor allem im digitalen Radio ließe sich das "Transmit-as-it-is" doch technisch leicht realisieren. Und ich sehe auch keine Notwendigkeit die Produzenten von Musikstücken zu korrigieren.
    Dazu gab es Untersuchungen, sogar mit erfahrenen Toningenieuren, die folgendes ergab:
    Unser @ebs (Eberhard Sengpiel) hatte das Phänomen > dort < mit "Lemming"-Verhalten und Marktschreiern schön beschrieben. Da aber im Radio "nach oben schluss" ist wird dort "in die Breite" gegangen, mit den lästigen Folgen. Mehr kann eine Maschine halt nicht leisten.
    So ist das mit dem "Herzblut" :) @Björn. Es ist der Antrieb für den langen zähen, oft einsamen Kampf gegen Fehlentwicklungen. Die Physik lehrte uns, daß eingeschwungene Systeme schwer zu ändern sind. (Schneller ginge der Wechsel durch einen "Hype".)
     
    Zuletzt bearbeitet: 14. April 2015
  6. marillenfreund

    marillenfreund Benutzer

    Eben, irgendwann ist nach oben hin Schluss, vor allem im Digitalzeitalter!

    Die Versuche mit den teilweise minimal unterschiedlich lauten, unbearbeiteten Audioereignissen sind mir bekannt. Und natürlich wird das lautere als attraktiver empfunden, allerdings kann man eben nur begrenzt lauter machen, ohne die Signalform zu beeinflussen. Was darüber hinaus passiert erklärt obiger Film ganz schön. Dazu ist noch anzumerken, dass es sich in diesem Fall schon um synthetische Signale handelt, man stelle sich die hörbaren Verzerrungen auf Stimmen und Naturinstrumenten vor... Ach braucht man sich ja gar nicht vorzustellen, gibt es ja heute allenthalben zu hören.
    Wenn man das also nicht will, dann muss man zwangsläufig damit beginnen, die zu lauten Signale einfach mal leiser zu machen, damit sie in ihrem Loudnesseindruck den leisen entsprechen. Ist übrigens ganz einfach, deswegen sind die Pegelsteller an Mischpulten als praktische Schiebeelemente ausgeführt. Da diese aber, zumindest im modernen Hörrundfunk, kaum noch Ihrer Bestimmung entsprechend genutzt werden muss der Kunde/Hörer eben leiser und später wieder lauter machen. Das kann der übrigens auch mit einem ganz simplen Pegelsteller und benötigt dazu keine Multibandkompressoren und dynamischen Equalizer.

    Wohl gemerkt, ich spreche hier von simpelsten Art der Loudnessanpassung bereits sehr aufwendig bearbeiteter Audioereignisse, wobei man einfach mal leisere als Referenz nutzt.

    Ähnliches muss übrigens auch ein Kollege machen, der die Beschallung einer Fernsehshow betreut, in der die Moderation (bildtauglich) über Ansteckmikros realisiert wird. Diese lassen sich in der Regel nicht so laut übertragen, wie die abgespielten Playbacks oder Einspielfilme. Dieser Kollege ist gut beraten, diese Signale (unabhängig von ihren Peakleveln) sinnvoll an die Moderation anzupassen. Das macht er nach dem was er hört, also automatisch nach Loudness und bestimmt eine hoffentlich sinnvolle Dynamik (gehörter Unterschied zwischen laut und leise).
    Natürlich sollte auch hier das Übertragungssystem in sich so gepegelt sein, dass unschöne Störsignale wie Grundrauschen nicht auftreten. Das bedeutet jedoch keinesfalls, dass alles permanent an der Clippinggrenze gefahren werden muss, was ebenso auf CDs und die FM Übertragung zu Anwendung kommen könnte.

    Beste Grüße, Björn
     
  7. SebVonHoldt

    SebVonHoldt Benutzer

    Ich beschäftige mich gerade sehr intensiv mit dem Thema. Deshalb möchte ich einfach viele unterschiedlich Meinungen mit in Betracht ziehen und die Erfahrungen dieses Forum nutzen. Die spannendste Frage für mich momentan ist, welchem Standard die bekannten Streaming Services folgen werden. R128 (-23LUFS) ist ja zumindest für Europa schon eine recht eindeutige Empfehlung. YouTube und Apple liegen aber wieder darüber und sind demnach lauter, was für mobile Endgeräte meiner Ansicht nach auch gut ist. Nichtsdestotrotz klingt das schon fast wieder nach einem neuen Loudness War, wenn die einzelnen Content Provider anfangen sich wieder zu überbieten.
     
  8. marillenfreund

    marillenfreund Benutzer

    Genau das bleibt das Problem, wenn man sich nicht auf einen einheitlichen Loudness Wert einigen kann oder will.
    Und dieser einheitliche Wert muss sich eben zwangsläufig an der unteren Grenze der möglichen, vorkommenden Signale bewegen. Diese möglichen Signale sind zum Beispiel besonders bei Plattformen wie youtube auch gerne mal sehr laienhaft "produzierte" Beiträge. Diese können, nach ihren Spitzenpegeln normalisiert, in keinster Weise mit perfekt (und bewusst auf laut) gemasterten Studioprodukten in Sachen Loudness konkurrieren, werden also als leiser empfunden.
    Ebensolches gilt bei der unterschiedlichen, durchschnittlichen Loudness von klassischer und Rockmusik. Während klassische Musik in ihrer Dynamik (Unterschiede zwischen niedriger und hoher Loudness) größere Schwankungen aufweisen kann, so werden U Musik Produktionen in ihrer Dynamik eher gleichbleibend sein. Wenn man jedoch einen niedrigeren Wert zur Normalisierung ansetzt, so kann man beides mit gleicher Abhörlautstärke abhören und hoffentlich genießen.

    Die Argumentation mit den mobilen Endgeräten ist natürlich naheliegend, aber nur, wenn wir von "Lautsprecherwiedergabe" ausgehen, weil hier bauformbedingt einfach der mögliche Schalldruckpegel begrenzt ist. Allerdings ist natürlich auch der Frequenzbereich stark eingeschränkt, und zum Glück kommt noch niemand auf die Idee, nur diesen auszustrahlen. Das jedoch wäre mit ein und derselben Argumentation durchaus nachvollziehbar. Dann ginge es sogar noch lauter, weil man diese ganzen, dann überflüssigen, Tieffrequenzen nicht berücksichtigen müsste.
    In diesem Zusammenhang kommt mir jedenfalls die Hochzeit der Ghettoblaster ins Gedächtnis, die schließlich auch als mobile Endgeräte gelten müssen. Die konnten zeitweise gar nicht groß genug sein, warum wohl?
    Also, wer wirklich gut hören will, der greift ohnehin zum Kopfhörer oder verbessert die Wiedergabe wenigstens über größere Bluetooth Würfel. Dann sind auch mit -23LUFS ausgestrahlte Streams problemlos zu hören, was entsprechende Livestreams von TV Sendern belegen.

    Auch interessant in diesen Szenarien ist übrigens das Thema Monokompatibilität! Darüber machen sich wahrscheinlich die wenigsten, selbsternannten Soundspezialisten Gedanken.

    Beste Grüße, Björn
     
  9. Tonband

    Tonband Benutzer

    Da möcht' ich noch hinzufügen:

    Mobiles könn(t)en prinzipiell über "EarPhones" die gleiche Qualität liefern wie ein guter MP3-Player und brauchen deshalb genausowenig Dynamikkompression, soweit klar. Bei der Wiedergabe über einen (kleinen) Lautsprecher muss deshalb aber nicht die Empfangsqualität "versaut" sein. Die Elektronik zum adaptiven Audio-Plätten zugunsten einer "besseren" Lautsprecherwiedergabe kann genausogut im Mobile implementiert sein, technisch kein Problem.

    Damit widerspreche ich der Notwendigkeit zum "Audio-Plätten" bei Apple und Youtube.

    Das Hauptproblem bei der Lautsprecherwiedergabe liegt bei den Mobiles selbst.
    Sie sind, genauso wie viele MP3-Player, bei der Lautstärkewahl oft nach oben deutlich eingeschränkt bzw. angepasst auf die absolut lautesten Audioquellen. Es fehlen also lediglich die Reserven für die Abhöre ein -23LUFS-Signal ausreichend zu verstärken.

    Man kann nicht oft genug fragen:
    Warum soll eigentlich der Sender sich zwangsläufig an den unterschiedlichen Abhörmöglichkeiten orintieren??
     
    Zuletzt bearbeitet: 21. April 2015
  10. marillenfreund

    marillenfreund Benutzer

    Ich habe zwar keine vergleichenden Hörversuche mit Originalmaterial gemacht, aber ich denke, dass außer einer reinen Pegelanpassung, hier keine Audiobearbeitung stattfindet, sondern die Originalsignalform erhalten bleibt. Vielleicht gibt es ja diesbezüglich schon Erfahrungen hier Mitlesender?
    Das Problem der unterschiedlichen Loudness zu Audio gemäß der R128 liegt eben im anderen Zielwert bei der Anpassung.
    Dieser ist mit -23 LUFS sicherlich für manche erschreckend niedrig, bietet jedoch genügend Headroom, um beispielsweise Sprachaufnahmen in geräuschvoller Umgebung (klapperndes Geschirr am Tisch, oder knisterndes Kaminfeuer) selbst mit 16 Bit sauber zu digitalisieren. Der Versuch hierbei das Nutzsignal Sprache schon an Fullscale heran zu bringen würde unweigerlich zu Clipping oder wahlweise Pumpen vorgeschalteter Limiter durch die Störsignale führen.

    Und genau solch relativ leises Material kommt gerade bei youtube gar nicht so selten vor, wo gerne mal mit Kameramikros oder sogar denen in Handys aufgenommen wird und konkurriert mit Mastern, die so wenig von den 16 Bit nutzen, dass man sie problemlos auch mit 8 Bit auflösen könnte.

    Beste Grüße, Björn
     
    Tonband gefällt das.
  11. Radiowaves

    Radiowaves Benutzer

    Vor allem an Björn: 1000 Dank für soviel kompetenten Input! Ich lese mit, ich lerne dazu und ich bin beruhigt, daß meine Kritik am Sound von SWR Info offenbar nicht allzu weit weg ist von der Kritik eines Profis. Ich bin ja weder beruflicher Rundfunk- noch sonstiger Tonmensch.

    Jetzt bin ich neugierig geworden ... ich könnte doch mal spaßenshalber den Filmton (bis auf paar völlig kaputte und im Original übel geclippte O-Töne in einigen Bewegtszenen war es einst völlig stumm gewesen) eines von mir nachvertonten Videos mit R128 analysieren. Nur mal um zu schauen, wo man ohne Beachtung von R128 so loudnessmäßig rauskommt. Der Gründer der Kenianischen Biobauern-Initiative OTEPIC bat mich im Herbst 2013, doch mal sein Video zu vertonen, weil er mit dem Ton, den man für ihn in Portugal aufgenommen hatte, nicht glücklich war.

    Ich sperrte den jungen Mann also in die Abstellkammer des spirituellen Friedenszentrums in der Schweiz, in dem ich damals ehrenamtlich als Tellerwäscher und Mischpultbediener arbeitete, hängte Decken über die Stuhlstapel, baute das Laptop mit dem Stummfilm unter einem Stuhlstapel in eine Box aus Kissen (Schalldämmung und dennoch vorübergehend etwas Lüftung), holte einen externen Monitor fürs Video, ließ den Kenianer seine raschelnde Jacke ausziehen und nahm mit einem Chinaböller-Kleinmembranmikrofon für 50 EUR (Thomann SC140) aus etwa 30 cm Sprechabstand ab. Das Mikrofon bekam wegen extremer Ploppempfindlichkeit (Kleinmembran!) zusätzlich zum Schaumstoff noch einen "Ploppschutz" in Form eines an einem quergestellten Mikrofonstativ-Arm aufgehängten dünnen Tuches (Marke "Damenschal").

    Dann Tür zu und zwei komplette Durchgänge mitgeschnitten - so wie es am analogen Pult (Soundcraft GB4) ankam, ohne Dynamikbearbeitung. Danach in 2 oder 3 Nächten (der Kenianer war bereits abgereist und ließ mich mit dem Schnitt alleine) daraus eine passende Version gebastelt und mit den wenigen Film-O-Tönen verheiratet und wieder lippensynchron zur Bildspur dazugemuxt.

    Hier das Ergebnis:



    Der junge Mann spricht etwas dumpf, muß mit der Muttersprache zu tun haben. Das gleiche Mikrofon mal von mir probiert: sehr ausgeglichen, Brillanz sehr wohl vorhanden, gewisse deutlich hörbare Verzerrungen bei Transienten, aber hey, es kostet mit Spinne 50 EUR!

    Habe den Ton nun mal durch R128 geschoben. Das Ergebnis:

    True Peak: -0,8 TPFS
    Loudness über alles (20 Minuten): -22,4 LUFS
    Range: 8,0 LU

    Ich bin überrascht, wie präzise ich beim Richtwert von -23 LUFS lag. Ich hatte mich nicht um Loudness gekümmert, sondern am Ende die Spur einfach nur auf etwa -1 dBFS im Peak gebracht, damit noch etwas Luft fürs Recodieren bei Youtube bleibt - und zwischendurch versucht darauf zu achten, daß es anständig klingt und die Filmtonsequenzen passend laut sind zur jeweiligen Situation. Ein kleinwenig Peak Limiting (in Software) hatte ich der Stimme gegönnt, sonst wäre ich auf ein sehr ungünstiges Peak-RMS-Verhältnis gekommen. Und die O-Töne der Filmsequenzen sind teils deutlich gedimmt und nochmal so gut es geht "entclippt" worden.

    Die in Portugal aufgenommene Version kommt auf deutlich höhere Lautheit, übersteuert aber:



    True Peak: +1,2 TPFS
    Loudness über alles (20 Minuten): -15,9 LUFS
    Range: 8,2 LUFS


    Fazit 1: auch bei mir - man kommt bei "ruhiger" Sprache schon irgendwo um -23 LUFS raus.

    Fazit 2: meine Version ist deutlich leiser als die aus Portugal, aber Philip war begeistert über die "Power". Da war ihm wohl die Gesamtqualität ausschlaggebend.

    Fazit 3: Die Abstellkammer war beinahe besser als manche heutigen "Rundfunkstudios".

    Fazit 4: für Sprache doch trotz unsauberer Transienten lieber das 50-Euro-Dingsda von Thomann statt des 10 mal so teuren Elefantenpenis'. ;)
     
  12. Tonband

    Tonband Benutzer

    Chapeau! - Also zwischen dem portugiesischen "Original"(O) und Deiner Nachbearbeitung (N) liegen Welten. :thumpsup:

    O) Das Original dröhnt furchtbar (Hintergrund). Das Mikro selbst klingt (N) ähnlich, die Aufnahme wirkt hier IMHO aber durch den Hintergrund so dumpf. Es scheint ein Kompressor (incl. Phasenschmiererei) zu werkeln. Die reingeschnittenen O-Töne sind brutal laut und geklippt.

    N) Klare Aussprache vor rel. trockenem Hintergrund mit deutlich höherer Dynamik (im Editor erkennbar). Vokale wie "a" zeigen die charakteristische Spitzenstruktur im Signalverlauf. Das Hintergrundgeräusch liegt satte 30 dB(rms) unter dem von (O)!, bei ca. -60 dBFS(rms). O-Töne klingen gut loudness-angepasst.

    Mit reinen RMS-Messungen im Editor bin ich auch auf Deine Durchnittswerte gekommen.
    Bin mal auf die Bewertung vom @marillenfreund gespannt. :)
     
  13. marillenfreund

    marillenfreund Benutzer

    Also ich kann mich dem generellen Urteil nur anschließen, der Film ist in sich wesentlich besser gemischt und die Sprachaufnahme um Klassen besser. Sehr großes Lob, vor allem wenn wir ja wissen, wie das zustande kam. Das zeigt jedoch, dass Know How eben durch nichts zu ersetzen ist. Und wenn Du schreibst:

    dann hast Du zumindest einen Beleg geliefert, dass Du dazu offensichtlich durchaus Talent hast. Und ganz nebenbei liefern die beiden Filme zahlreiche Ansatzpunkte zum Vergleichen und Analysieren, vor allem auch bezüglich ihres Loudnessverlaufs, der Qualität der verwendeten Töne und die zu erwartenden Auswirkungen durch nachträgliches Summenprozessing.

    Ich werde dazu wahrscheinlich noch heute etwas detaillierter schreiben, muss aber jetzt erstmal einer eigentlichen Profession nachgehen.

    Beste Grüße, Björn
     
  14. Radiowaves

    Radiowaves Benutzer

    Besten Dank für die Einschätzungen! Daß meine Version besser ist, war mir klar, zum Lob abholen habe ich das nicht online gestellt, ich war überzeugt davon, daß es brauchbar gut ist (aber damals durchaus freudig überrascht und dann richtig "geflasht"). Es war auch sehr aufwendig, das ohne anwesenden "Ideeninhaber" zu schneiden. Ich hätte mir dazu gerne eine sichbare Bildspur gewünscht, die ich aber nicht hatte. Also war der VLC daneben offen, zeigte mir aber falsche Zeiten an.

    Mir blieb nur die Original-Tonspur - wegen der O-Töne, deren Position ich nicht verschieben durfte wegen der Lippensynchronizität. Alles außer den wenigen verbliebenen O-Tönen habe ich gemutet. Und für schnittbedingt stille Abschnitte in der neuen Aufnahme griff ich mir ein Stück echte, aufgenommene Pause, die ich geloopt habe, die kam dort immer rein, weil es ätzend klingt, wenn der Raum und das leise Hintergrundrauschen wie mit einem Gate ein- und ausschaltet.

    Das Original ist verzerrt in den O-Tönen, hat nen schlimmen Raum und rauscht. Dennoch ist es so, wie es hier vorliegt, durchaus gut sprachverständlich - behaupte ich zumindest. Vor allem wirkt es auf mich nicht dumpf. Niemand aus der Zielgruppe wird Anstoß daran nehmen, der Inhalt entscheidet. Notorische "HiFi-Hörer" werden freilich sofort monieren, was da alles nicht stimmt.

    Das, was mich am Original wohl am meisten gestört hätte, wäre nicht die Sprachverständlichkeit und der Raum gewesen, sondern die schrecklich lauten und dann noch verzerrten O-Töne. Das führt bei mir wesentlich eher zur Überschreitung der Frustrationstoleranz. Da sind wir wieder beim Thema Loudnessverlauf.

    Beide Versionen hätte ich nun gerne mal durch das Summenprocessing von SWR Info geschoben. Ich wäre zu gespannt, wie es danach mit der Sprachverständlichkeit aussieht. Die Portugal-Version könnte hübsch laut werden im (ehemals) Hintergrund. Und Hintergrundgeräusche hat man auch bei Korrespondenten, die für TV und nicht für Radio arbeiten. Dann wird es "very annoying". ;)

    Spannend finde ich, wie die Originalversion trotz nur 1-2 dB mehr Peak auf 6 dB mehr Loudness kommt. Da der gute Philip kaum seine Stimme auf biologischem Wege komprimiert haben dürfte, muß also im Signalweg Kompression gewesen sein. Ich weiß nicht, an welcher Stelle. Gerade bei reinen Amateuraufnahmen (und so wirkt es definitiv), sind vorhandene und bewußt genutzte Hardware-Dynamikbearbeitungen wohl faktisch ausgeschlossen und Software-Plugins wird man kaum einsetzen, weil man nicht weiß, daß es so etwas gibt und daß man "dichter" machen kann. Wo also ist das passiert? Oder rennt hier jemand fortlaufend in den Limiter eines Diktiergerätes / PCM-Recorders - oder eher in die AGC und Bandsättigung eines Kassetten-Diktiergerätes?
     
    Zuletzt bearbeitet: 30. April 2015
  15. marillenfreund

    marillenfreund Benutzer

    Hallo an alle Mitlesenden,

    Zunächst folgende Info, es geht hier weiterhin um die Problematik "Aussteuerung von Audio nach Loudness, konkret EBU R128", und kann man damit die katastrophalen Loudnessschwankungen derzeitiger Hörfunkprogramme, auch ohne Zwangsprozessing in der Summe, in den Griff bekommen?
    Die beiden von Radiowaves verlinkten youtube Videos bieten dazu interessantes Praxismaterial. Bei den folgenden Erläuterungen werde ich die Originalvariante mit O und die von Radiowaves erstellte mit N bezeichnen, wie von Tonband schon vorgelebt.

    Als erstes muss ich die Loudnessmessungen korrigieren, interessant wäre, wie sie zustande kamen.
    Also ich habe beide Filme nacheinander über denselben Hardwareweg, mit identischen Einstellungen (Achtung der youtube Player hat einen Volumenregler!) angehört und dabei mit einem R128 Messinstrument gemessen.
    Zur Pegelanpassung habe ich die Sprache der N Fassung auf durchschnittlich -23 LUFS also 0 LU gelegt. Dazu habe ich die ersten 3 Minuten gemessen und das Gaining entsprechend angepasst. Somit hat diese Quelle an meinem Sendepult also eine durchschnittliche Loudness von 0 LU, ist also nach R128 normalisiert. Da wir es hier mit einem in sich gleichmäßigen Signal (weil gleichmäßig gesprochen, also nicht zu dynamisch) zu tun haben, bildet dies eine gute Referenz, weil es im konkreten Fall auch die eigentliche Information liefert.
    Derart ausgespielt ergeben sich folgende Messwerte.
    Für N:
    I Messung über alles 0,4 LU
    Loudnessrange. 8.2 LU
    Truepeaks. -4,0 dBFS

    Für O:
    I Messung über alles 3,9 LU
    Loudnessrange. 8,1 LU
    Truepeaks. -3,0 dBFS

    Also der Originalfilm ist lediglich um 3,5 LU bzw dB lauter als die N Fassung und liegt insofern durchaus im sogenannten Toleranzbereich (in aufwendigen Versuchen unter anderem von Dolby ermittelt) der den Hörer noch nicht zum Nachregeln bewegt. Das entspricht auch meinem Eindruck, denn wenn ich zwischen den Anfängen der Videos wechsele, dann empfinde ich keinen übermäßigen Loudnesssprung in der Sprache. Die nahezu gleiche Loudnessrange lässt auch keine Dynamikbeeinflussung vermuten, ein Schutzbegrenzer bei der Sprachaufnahmen der O Fassung wurde sicher angefahren.

    Auffällig und erstaunlich ist umso mehr, dass für mich trotzdem N direkter, deutlicher (lauter???) wirkt als O, was der höheren Qualität der Sprachaufnahmen zu zu schreiben ist.

    Sprachaufnahme und deren Qualität:

    Wie N zustande kam wissen wir, bei O würde ich auf Handheldrecorder oder sogar Kameramikro (mit dem auch die Filmsequenzen entstanden) tippen, am Anfang hört man "verdächtige" Griffgeräusche.
    In jedem Fall sitzt der Sprecher einen halben bis knappen Meter entfernt und nicht in der Haupteinsprechrichtung des Mikrofons. Dadurch hören wir ziemlich viel Raumanteil und leider häufig störende Umgebungsgeräusche, die übrigens die höchsten Peaks liefern und deutlich limitiert werden.
    Die Stimme an sich klingt in beiden Fällen relativ ähnlich, insofern kann man den negativen Einfluss der Störsignale eigentlich gut einschätzen. Das jetzt bitte nicht zerpflücken, es geht nicht darum ob die Sprache wirklich genau gleich klingt, auf die Qualität der Aufnahme bin ich ja eingegangen, die ist wesentlich wichtiger.
    Man kann in beiden Aufnahmen das Gesagte durchgehend hören und verstehen. Die Sprache der N Fassung könnte man problemlos leicht komprimieren, um dieses Signal in sich kompakter zu bekommen (das ist die alte Autoradiodebatte), bei der O Fassung wäre das zwar ebenso wünschenswert jedoch schwieriger, weil durch die Verdichtung die Störgeräusche (Hall und Geräusche) mehr in den Vordergrund geraten würden.
    Man könnte jetzt sicher ewig darüber philosophieren, was man jetzt an EQ, Dynamics, Deessern, Denoisern, Transientendesignern..... auspacken könnte, mache ich aber nicht. Ich nehme die Sprache so wie sie ist, sie bietet für die folgenden Betrachtungen die Basis.

    Loudnessverlauf innerhalb der beiden Videos:

    Und damit kommen wir zum Loudnessverlauf und der Durchhörbarkeit der beiden Videos und entdecken ggf Parallelen zum Radio? Hierfür ist der Sprecher unsere Studiomoderation und die Film O Töne entsprechen Musiken, Werbung oder Jingles. Eine gute Stelle ist eine knappe Minute ungefähr ab 15:00, bitte beide Varianten ohne Anpassung der Abhörlautstärke durchhören.

    N Fassung:
    Welches Prozessing Radiowaves benutzt hat, das hat er uns ja freundlicherweise gesagt. Er hat versucht die schlechte technische Qualität zu verbessern, was bei den gnadenlos in den Limiter gefahrenen Signalen kaum möglich ist, und die O die Töne nach Gehör/Gefühl um einen konstanten Wert im Pegel abgesenkt, um sie gehörrichtig an sein Refernzsignal Sprache anzupassen. Das hauptsächliche Prozessing bestand also in einer simplen Pegelabsenkung!
    Und jetzt verrate ich mal, was die Loudnessmeter dazu sagen. Wir wissen ja, dass die Sprache auf durchschnittlich 0 LU ausgesteuert/normalisiert ist. Wenn ich nun die beiden Videoschnipsel messe (so wie sie jetzt gepegelt sind), dann haben auch sie eine durchschnittliche Loudness von ziemlich genau 0 LU, sind also auf denselben Loudnesslevel normalisiert.

    O Fassung
    Auf die technische Qualität der O Töne muss man nicht eingehen, die ist schlecht, Fakt. Viel wichtiger ist, dass der erste 8 und der zweite Schnipsel 6,5 LU lauter ist, als die sie umgebende Sprache. Sie sind also nicht gleich laut wie die Sprache und das hört man! Ebenso wie im Radio, wenn Töne unterschiedlicher Loudness aufeinander treffen.

    Unabhängig davon, ob man hier und da mittels gezieltem Prozessing an dem einen oder anderen Ton noch hätte etwas verfeinern können, haben wir es in der N Fassung also mit einem nach Loudness ausgesteuerten Signal zu tun, so wie es nach R128 Kriterien gedacht ist. Und das obwohl gar nicht gemessen, sondern lediglich gehört wurde. Ein Wunder!?

    Da ich schon wieder so viel geschrieben habe lasse ich es mal bei dieser Erkenntnis und danke Radiowaves für das Beispiel, weil es umfangreiche Basis für alle hier im Thread wichtigen Fragen und Thesen liefert, auch für die, was wohl durch das SWR Info Prozessing daraus gemacht würde.

    Beste Grüße, Björn
     
    Zuletzt bearbeitet: 01. Mai 2015
  16. Radiowaves

    Radiowaves Benutzer

    Hallo Björn, Du Nachtarbeiter! Besten Dank für all den Aufwand - es kommt wieder neues, spannendes hinzu.

    Ich habe beide Videos von Youtube runtergeladen als MP4, mit YAMB/MP4Box die AAC-Tonspur rausgestrippt und mit R128Gain analysiert in den Standardeinstellungen:

    upload_2015-5-1_7-46-16.png

    Mit komplettem FFmpeg geht das sogar ohne vorherige Umwandlung des AAC in PCM. Und dann kommen die Werte für Loudness, TruePeak und Range raus.

    Die ersten 3 Minuten ergeben auf meinem beschriebenen Weg, aber nochmal mit Umwandlung des AAC in WAV, bei N folgende Werte in R128Gain:

    Loudness: -19,1 LUFS (3,9 LU)
    Loudnessrange: 6,8 LU
    Truepeaks -0,8 TPFS

    Also alles nochmal 3,9 dB dimmen und dann N komplett messen:

    Loudness: -23,3 LUFS (-0,3 LU)
    Loudnessrange: 8,0 LU
    Truepeaks -4,7 TPFS

    Interessant, wie sich die Werte etwas unterscheiden. Deine 0,4 LU meinen auch wirklich 22,6 LUFS? R128Gain gibt den LU-Wert nämlich mit invertiertem Vorzeichen an (-22 LUFS sind dort -1 LU, offenbar soll das die Richtung der notwendigen Korrektur anzeigen), ich habe die Vorzeichen gedreht und zur Sicherheit sowohl LUFS als auch LU angegeben.

    Damit hätten wir 0,7 LU Unterschied zwischen beiden Meßmethoden - sowohl in Loudness als auch in den Truepeaks. Sieht schonmal "halb systematisch" aus, wer weiß, wie das zustandekam. Vielleicht bei unserem Einpegeln und dem daraus erkannten Gain (bei Dir sicher eher Gähn bei dieser späten Stunde...).

    Für das Original ergibt sich nach Deiner Methode mit meinen Mitteln (3,9 dB gedimmt wie im Film N):

    Loudness: -19,8 LUFS (3,2 LU)
    Loudnessrange: 8,2 LU
    Truepeaks -3,6 TPFS

    Ich komme nach dieser Methode auf 3,2 LU Unterschied. Irgendwo gibt es also kleine Unterschiede, wir müßten das vermutlich auf File-Ebene pingelig vergleichen. Ist aber von der Genauigkeit her völlig ausreichend.

    Die Bewertung der ersten 3 Minuten zur Einpegelung mittels N dürfte dazu führen, daß der Unterschied schrumpft. Nimmt man die ganzen Files so wie sie sind, kommt man auf die Werte in meinem älteren Posting mit 6,5 LU Unterschied.

    Eben, die ersten Minuten sind entsprechend ähnlich in der Loudness. Danach scheint sich ein größerer Abstand einzustellen. Entweder ich werde immer leiser (N) oder die Portugal-Version (O) immer lauter. Ich schaffe es jetzt zeitlich nicht, das genauer anzuschauen.

    Hier noch ein gestelltes Foto vom "Studio", noch mit raschelnder Jacke:

    [​IMG]

    Ich denk mal, Philip wird nichts dagegen haben, er taucht mit seinem Gesicht in einigen öffentlich zugänglichen Videos und auf Fotos auf. Links Holzwand mit Schiebetür zum Veranstaltungssaal (in dem hinten das Mischpult stand, das ich als Mic-Pre inkl. P48 benutzte, Aufnahme auf Olympus LS-11 in 48 kHz PCM), hinter Philip in etwa 80 cm Abstand ein nahezu raumhohes Holzregal, gefüllt mit zusammengefalteten Wolldecken und zusammengerollten Schaumgummi-Yogamatten, in der Ecke, in der ich mit Kamera stand, befindet sich der Warmwasserspeicher dieses Hauses (ein aufrecht stehender Zylinder mit etwa 160 Litern Inhalt) und ein Stapel Kissen, die Wand rechts ist kahl und verputzt, es gibt dort noch einen säulenartigen Wandvorsprung.

    Ich hätte zuallererst Lust auf ein saubereres Mikrofon bei N, aber für 50 EUR ists schonmal ordentlich. Das Zentrum ist auf Spenden und Einnahmen aus dem Veranstaltungsbetrieb angewiesen, ein Gönner hat jahrelang viel (sehr viel, das ist in der Schweiz) Geld da reingesteckt, vor allem in den Ton. Die beiden Thomann SC140 waren auf meiner Wunschliste - ich hätte mich nicht getraut, um KM184 zu bitten, zumal manches auch mal wegkommt, runterfällt, von echten Voll-Laien benutzt wird, nicht wertgeschätzt werden kann etc. Die SC140 sollten vor allem Raumathmo-Abnahme machen bei Aufzeichnungen von Veranstaltungen, bei denen Vorträge gehalten werden - und das tun sie super. Ich hatte sie auch schonmal am Flügel, spontan hingestellt, kein Soundcheck - und nach künstlichem Aufweiten der Aufnahme war ich auch recht angetan.

    Danke, wie schön! :D

    ...siehe jahrelang RBB Radio Eins auf den digitalen Wegen. Verpackung sinnlos laut, Rest deutlich leiser. Manche Hörer beschwerten sich. Die "Lösung" beim RBB: das (laut ARD-eigenen Messungen anerkannt derbe) UKW-Processing auf die digitalen Wege geben und das dann mit Zähnen und Klauen verteidigen. Sie haben mich damit als Hörer verloren. Ich bin heute nichtmal sauer darüber, es war der Sargnagel auf dem leidenschaftlich betriebenen Radiohobby. Und damit eine Befreiung von einer Sucht.

    Nö. Ein Beleg dafür, daß R128 praxistauglich definiert wurde, nämlich am Gehör ausgerichtet. Oder?

    Björn, nochmals lieben Dank für all den Aufwand!

    Nachtrag @Björn:

    Habt ihr eigentlich Software, die parellel zu einer Audiospur eine Art R128-Kurvenschar anzeigt mit Truepeak, momentaner Loudness (die Stufen, die es da gibt, short-term und so), ...? Sowas fände ich genial, um den Loudness-Verlauf einer längeren Produktion verfolgen zu können und zu vermeiden, daß man mit der Zeit z.B. "wegdriftet". Klar, Profis mit ordentlicher Abhöre passiert das vermutlich nicht, aber nicht jeder ist Vollprofi beim Ton.

    Schönes langes Wochenende!
    Christian
     
  17. marillenfreund

    marillenfreund Benutzer

    Guten Morgen Christian.

    Also in der Produktion wird ja das produzierte Signal permanent gemessen, nun eben mit einem Meter nach den Spezifikationen der EBU R128. Diese erfordern das Anzeigen von:
    Momentary Loudness
    Short Term Loudness
    Integrated Loudness
    True Peak Level aller Audiokanäle (Stereo oder ggf. 5.1)

    Möglich wären außerdem Anzeigen über den Loudnessverlauf, die Loudnessrange, M Max, S Max etc pp
    Das durchaus übliche TM9 von RTW ist da sehr flexibel.

    Klingt alles wahnsinnig kompliziert ist es aber gar nicht, und manche Anzeigen sind auch nicht für Jeden (Selbstfahrer) interessant und wichtig.

    Ich werde kommende Woche mal ein paar Fotos machen, wie so etwas aussehen kann.
    Außerdem nochmal dieser Link zu einer Plug In Schmiede, die ein sehr kostengünstiges und verlässliches Tool zum Messen anbieten. Damit kann man eigentlich alles sehen, was wichtig ist.

    http://www.toneboosters.com/tb-ebuloudness/

    In der Trial Version ist es sogar kostenlos.

    Es ergeben sich schon wieder zahlreiche Kommentare, allerdings Klinke ich mich bis Montag aus. Und vieles gehört nun wirklich eher in den Technikbereich.

    Ich hege ja auch die Hoffnung, dass hier "echte" Rundfunkmenschen mitlesen, die sich somit hoffentlich mit "offenen Köpfen" dem Thema Loudnessbasierte Produktion nähern können. Und ja, man muss sich damit erstmal eine Weile befassen, um es zu verstehen, ist aber kein Hexenwerk, und vor allem kein Voodoo wie dieses wahnsinnige Sendeprozessing heutiger Tage!

    Auch ich hätte vor ca 4 Jahren nicht gedacht, dass all diese vermeintlich unlösbaren Loudnessschwankungen durch eine neue Bewertungsmethode lösbar sind. Und gleich einschränkend, natürlich ist das ledigliche Messen und Normalisieren (durch statische Pegelanpassung) auf 0 LU nicht die Lösung für alles, allerdings eine wichtige Grundlage für sinnvolle, weitere Überlegungen.


    ...kleiner Nachtrag zu den Unterschieden in den Messungen und dann bin ich wirklich weg.

    Entscheidend ist, dass wir beide in der Programm Loudness einen Unterschied von ungefähr 3-4 LU zwischen den Beispielen erfassen, auch dass die LRA jeweils gleich ist ist wichtig.
    Das mit den Peaks lässt sich tausendfach begründen und wäre erst wichtig, wenn wir das Originalmaterial messen könnten und nicht die ganzen Unwägbarkeiten der Sende/Empfangsstecke dazwischen lägen.

    Ich musste zum Beispiel den Audioausgang des Büro PCs mittels Miniklinke aufs Pult zaubern. Wer weiß, ob nicht in der Soundkarte irgendein Limiting stattfindet?
    Aber das ist egal, denn so konsumiert es ja der Kunde ggf auch. Ich empfehle übrigens das wahlweise Konsumieren über Tablet "Lautsprecher" und gute Kopfhörern oder HiFi Anlage. Und dann mal darauf achten, ob man in beiden Fällen dieselben Dinge bemängeln würde, besonders was die technische Qualität betrifft.
    Entscheidend für den Kunden sind ja die Unterschiede zwischen beiden Filmen, die er ggf hintereinander schaut und sich wundert, vor allem über den Loudnessverlauf.

    Beste Grüße, Björn
     
  18. Guess who I am

    Guess who I am Moderator Mitarbeiter

    Björn/Christian: Ich habe Eure Beiträge wunschgemäß hierher verschoben.
     
  19. marillenfreund

    marillenfreund Benutzer

    Hallo Christian und alle interessierten Mitleser,

    ich hatte ja versprochen, anhand der beiden Filmchen und deren unterschiedlicher Loudnessverläufe die Messungen nach EBU R 128 zu verdeutlichen. Es hat ein wenig gedauert, weil ich dazu nicht kam, außerdem ist die Umsetzung jetzt doch spartanischer als vorgenommen. Ich habe nun also einfach mit meinem Handy ein RTW TM9 abgefilmt, dabei kann man die Messungen verfolgen, den Ton hört man allerdings lediglich über den Raum mittels internem Mikro aufgenommen. Allerdings finde ich auch diese Form der Aufnahme und das was sich damit vermittelt fast schon wieder interessant. Aber in diesem Fall geht es ja nicht mehr um die Audioqualität, sondern was das Messinstrument zeigt.

    Zunächst nochmal kurz mein "technischer Aufbau". Über die interne Soundkarte des PC bin ich aufs Pult gegangen und das Messinstrument zeigt den Pegel dieses Signals.
    Vor den beiden Messungen von Original und Nachbearbeitung habe ich den Pegel beider Fassungen korrigiert, so dass der durchschnittliche Loudnesslevel der Sprache beider Fassungen bei -23 LUFS also 0 LU liegt. So würde man die Sprache also während der Produktion gemäß R 128 aussteuern.
    Um nicht den kompletten Film messen zu müssen bin ich auf ca 13:45 gesprungen und zeige dann etwas über drei Minuten. In beiden Fällen wird die I Messung der Loudness zu Anfang neu gestartet.
    Zunächst messen wir eine Weile lang die Sprache, die ja die Referenz für Ohr und Messung bildet. Unterbrochen wird die Sprache von zwei Videoschnipseln mit Ton, die sich loudnessmäßig in den beiden Varianten O und N unterschiedlich zur Sprache verhalten.

    Folgendes zeigt das Messinstrument von links oben nach rechts oben

    Zweikanaliges Truepeak Levelmeter mit Farbumschlag bei -9dBFS
    Stereosichtgerät (für dieses Beispiel uninteressant)
    Loudnessmeter Radar von TC (zeigt den Loudnessverlauf, Loudnessrange und die I Messung/Program Loudness)

    Unten querliegend sieht man die Loudnessanzeigen M und S und rechts daneben als Zahlenwert nochmal die aktuelle I Messung.

    Unter folgendem Link findet Ihr einen Ordner in dem sich zwei Handyvideos der abgefilmten Messungen von O und N ab 13:45 befinden, im Hintergrund des TM 9 sieht man bruchstückhaft den Film.
    Ich will jetzt gar nicht zu viel dazu erläutern, werde aber gerne Fragen dazu beantworten.
    Nur eine kleine Erklärung zu den Loudnessmetern M und S, nach denen sozusagen aktuell ausgesteuert wird, weil man es vielleicht nicht genau erkennt. Der Targetlevel von -23 LUFS/0 LU liegt über dem T des RTW Schriftzuges, in der Mitte des grünen Bereiches der M und S Balken. Dieser grüne, sogenannte Toleranzbereich ist in beiden Fällen unterschiedliche groß, um den Farbumschlag auf rot entsprechend einzuschränken, standardmäßig erfolgt dieser nämlich schon bei jeweils +1 LU. Beim Aussteuern eines solchen Programmes könnte die "Aufgabe" also lauten: "Halte den Loudnesslevel im grünen Bereich!", sofern man eine möglichst konstante Loudness anstrebt, was natürlich sehr stark vom Programm abhängt, in diesem Fall aber gelten könnte.

    Und nun viel Spaß beim Anschauen und beste Grüße, Björn


    https://www.dropbox.com/sh/zwp39c6w3ljq4h9/AACLe_68uXgLjCk8ZfL_Roata?dl=0
     
  20. Radiowaves

    Radiowaves Benutzer

    Hallo Björn,

    besten Dank! Ich bin gerade an einem Ort, an dem ich mir beide Files wenigstens runterladen konnte. Nur zum Anschauen reicht es nicht... mein "großer" Rechner ist ein IBM Thinkpad T40, 11 Jahre alt, 1,5 GHz Single-Core. Da macht der VLC Standbild. ;) Muß damit mal in 2 oder 3 Wochen zu meinem Nachbarn gehen, wenn ich wieder zu Hause bin.

    LG Christian
     

Diese Seite empfehlen