Soundprocessing für den Hausgebrauch

Status
Für weitere Antworten geschlossen.
Manche Leute sagen: "Ich will Soundprocessing!" Meinen aber in Wirklichkeit: "Alle Lieder sollen sich gleich laut anhören!"

Insofern wäre eine Lautheit-Normalisierung des Ausgangsmaterials eine erste sinnvolle Maßnahme. Ob das Verfahren jetzt R-128, RMS oder ReplayGain heißt, im Grunde arbeiten die doch alle gleich.

Das stimmt im Detail nicht, R128 kommt dem physiologischen Empfinden des Ohr am nächsten, ist dementsprechend genauer als RMS oder RG.

frei nach George Orwell in "Die Farm der Tiere": Alle Tiere sind gleich, aber einige Tiere sind gleicher ;)

LG
Jean
 
Im Grunde abeiten aber alle doch sehr ähnlich:

Schritt 1: Lautheit bestimmen. Dazu wird das Signal erstmal so "gefiltert", wie es das menschliche Ohr wahrnehmen würde. Dann wird ein RMS-Wert (quadratisches Mittel) bestimmt. Am Ende erhält man einen Lautheitswert in irgendeiner Einheit, die für jedes Verfahren anders ist.

Schritt 2: Der ermittelte Lautheitswert wird mit einer festgelegten Soll-Lautheit verglichen. Daraus ergibt sich eine positive oder negative Verstärkung, mit der der Titel abgespielt werden muss, um die gewünschte Soll-Lautheit zu erreichen.

Schritt 3: Der Verstärkungswert wird irgendwo abgelegt und bei der Ausspielung berücksichtigt.

MP3Gain nutzt für Schritt 1 das ReplayGain-Verfahren, das eine Lautheit in der Einheit "dB" (einer willkürlichen Skala) zurückgibt. In Schritt 2 wird ein Referenzwert von 89 dB zugrunde gelegt. In Schritt 3 werden diese Daten dann im Header der MP3-Datei untergebracht - das ist wirklich der große Vorteil von MP3Gain, dass es die eigentlichen Audiodaten nicht anfassen muss, weil sehr viele Ausspielprogramme diese Header erkennen und auswerten.

Im Fall von R-128 heißt das Verfahren für Schritt 1 "BS.1770-1", heraus kommt ein Wert in der fiktiven Einheit "LUFS". Schritt 2 definiert einen Referenzwert von -23 LUFS, daraus ergibt sich die Verstärkung. In Schritt 3 könnte man die ermittelten Werte jetzt theoretisch in dieselben Header schreiben, die auch MP3Gain nutzt - wie die Verstärkung ermittelt wurde, sollte dem Ausspielprogramm egal sein. Mir ist aber keine Software bekannt die dies nutzt. Im Zweifel reicht es aber aus, wenn dem Ausspieler irgendwie mitgeteilt wird, mit welcher Verstärkung er den Titel jetzt zu fahren hat. So machen wir es auch in dem oben erwähnten Projekt, da wird einfach ein dB-Wert in der Datenbank hinterlegt.

Welches der beiden Verfahren jetzt die "besseren" Ergebnisse liefert sei dahingestellt. Ich empfinde es jedenfalls als Vorteil, dass es nun ein offiziell genormtes Verfahren gibt und nicht mehr nur - zwar erprobte aber letztlich doch - inoffizielle Standards aus dem Hobbybereich.
 
... das falsche Gainziel (ich bin zum Beispiel kein Freund der 89,0 dB) ... MP3Gain ....
Es kommt eben darauf an welche Produktionen der einzelne Hörer hauptsächlich hören will. Wer nur platte Titel hört kann auch 96 dB einstellen.

Ich möchte zum Beispiel meine Dire Straits in Originaldynamik ohne geklippte Spitzen hören. Dazu lege ich den Bezugspegel auf 89,5 dB mit der Folge, dass platte Musik zwar gleich laut raus kommt aber die oberen Bitkombinationen eben frei bleiben. Das hat meinen Hörgenuss nie geschmälert.

Ich möchte an meine Demo erinnern, dass "modern produzierte" Musik leicht mit 8 Bit Auflösung auskommt. Man könnte diese Titel um mindestens 25 dB absenken ohne einen signifikanten Unterschied im Klang zu hören. Es muss lediglich der Lautstärkeregler aufgedreht werden.


Was mir ganz barbarisch auf den Zeiger geht, ist, dass R-128 von einigen (Einzelpersonen) fanatisch bis militant als Allheilmittel gegen den Loudness-War in Feld geführt
Natürlich ist R-128 kein Allheilmittel, wäre aber eine Möglichkeit dagegen 'anzustinken'. Aber das wird sich im Radio nie durchsetzen solange UKW-FM besteht. Sonst wären ja die einflussreichen Sounddesign-Gurus arbeitslos. ;)

mfg. TB
 
Im Fall von R-128 heißt das Verfahren für Schritt 1 "BS.1770-1", heraus kommt ein Wert in der fiktiven Einheit "LUFS". Schritt 2 definiert einen Referenzwert von -23 LUFS, daraus ergibt sich die Verstärkung. In Schritt 3 könnte man die ermittelten Werte jetzt theoretisch in dieselben Header schreiben, die auch MP3Gain nutzt - wie die Verstärkung ermittelt wurde, sollte dem Ausspielprogramm egal sein. Mir ist aber keine Software bekannt die dies nutzt. Im Zweifel reicht es aber aus, wenn dem Ausspieler irgendwie mitgeteilt wird, mit welcher Verstärkung er den Titel jetzt zu fahren hat. So machen wir es auch in dem oben erwähnten Projekt, da wird einfach ein dB-Wert in der Datenbank hinterlegt.

Die freie Software R128GAIN nutzt die R128 Algorithmen und schreibt die ermittelten Daten Loudness, True Peak, Loudness Range, und weitere Daten in einem ReplayGain kompatiblen Format in den Header (z.B. bei FLAC),
womit diese non-destructive Loudness normalisierten Files in ReplayGain kompatiblen Playern abgespielt werden können, insbesondere mAirList.

LG
Jean
 
Die freie Software R128GAIN nutzt die R128 Algorithmen und schreibt die ermittelten Daten Loudness, True Peak, Loudness Range, und weitere Daten in einem ReplayGain kompatiblen Format in den Header (z.B. bei FLAC),
womit diese non-destructive Loudness normalisierten Files in ReplayGain kompatiblen Playern abgespielt werden können, insbesondere mAirList.

Cool, kannte ich noch gar nicht bzw. war mir nicht bewusst.
 
Es war ja zu erwarten, dass irgendwann jemand auftaucht, der wieder die Werbetrommel für eine europäische Zwangsverordnung zur Daten-, Dynamik- und Lautstärkeminimierung alias
rührt.quote]!

Natürlich war das zu erwarten, da die ganze Sache in erster Linie ein Loudnessproblem sein wird. Neben den reinen Klangunterschieden, die verschiedene Titel aus unterschiedlichen Zeiten und Musikrichtungen eben ggf. mit sich bringen. Einiges davon lässt sich sicherlich mittels EQing angleichen, und mit abartigem Permanentprozessing kann man vieles sogar in ähnliche Klangwürste verwandeln, was hoffentlich nicht gewollt ist. Festhalten kann man sicherlich, dass es für keines der verwendbaren Tools eine Einstellung geben kann, die für alle Titel gleichermaßen gut funktioniert.

@dea: Schade nur, dass, obwohl Du uns alle immer gern mit Deinem Wissen bloßstellen und berichtigen möchtest, Du offensichtlich die R-128 noch immer nicht ganz verstanden zu haben scheinst. Mal ganz abgesehen davon, dass sich das loudnessbasierte Normalisieren und Aussteuern gerade weltweit im Fernsehen durchsetzt und meist funktioniert, soll dadurch keineswegs die Dynamik minimiert werden. Ebenso wenig wird das digitale Medium missachtet, auch wenn Du das immer wieder behauptest, denn nach R-128 darf man Signalspitzen bis -1dBFS (True Peak bewertet) produzieren!
Und natürlich kann sie zum Ende des Loudnesswar führen, da sie ja die Loudness festlegt und definiert. Insofern man sich also daran hielte wäre der ganze Loudnesswar Geschichte, man muss es eben nur machen!
 
Und? Hast du darin gelesen?

Ich kurz, kam aber über
http://tech.ebu.ch/docs/r/r128_2011_DE.pdf schrieb:
Die EBU berücksichtigt,
a) dass die Normalisierung von Audiosignalen auf deren Spitzenpegel zu erheblichen Lautheitsunterschieden zwischen Programmen und Kanälen geführt hat;
nicht hinaus.
Eine derart irreführende Falschaussage gleich in die Einleitung zu schmieren, ... Da stehen einem nur noch die Tränen im A****. Kein Wunder, dass die (Nicht-)Argumentation der Trolle zu dem Thema hier (was ja gar nicht das Thema ist), die lauthals nach Mutti plärren, wenn man sie nicht füttert, genau so gipsig und schmalbandig ist.
 
Und? Hast du darin gelesen?

Ich kurz, kam aber über
nicht hinaus.
Eine derart irreführende Falschaussage gleich in die Einleitung zu schmieren,.

Zeigt sich mal wieder, dass lesen und verstehen (oder in diesem Falle vielleicht anerkennen) nicht dasselbe sind. Denn genau diese These (Spitzenpegelnormalisierung hat zu unterschiedlichen Lautheiten geführt) ist ja das grundlegende Kanonenfutter des Loudnesswar und wird an anderer Stelle ja von dea bestätigt:

Ein Limiter ist kein Maximizer! Er lässt sich nur leider prinzipbedingt viel zu gut dazu mißbrauchen, was auch redlich getan wird. Das Gesamtsignal möglichst laut zu bekommen und sich dazu exzessiven Limitings zu bedienen ist also lediglich die Intention des Anwenders.

Und andererseits hatte ja yps77 bereits sehr richtig festgestellt:

Ich denke, am Anfang sollte erstmal eine ordentliche Normalisierung stehen, und zwar nach Lautheit (!).

Ich arbeite gerade in einem Projekt, in dem es im weitesten Sinne auch um Hintergrundmusik geht. Wir verwenden als Grundlage ein relativ heterogenes Musikarchiv mit ca. 2000 Titeln aus diversen Genres. Die Titel haben wir nach R128 analysiert und normalisiert. Unter dem Strich lässt sich das Musikprogramm dann schon ohne jegliches Soundprocessing ganz gut durchhören. Es gibt kaum auffällige Lautheitsunterschiede zwischen den Titeln mehr.
.

Nur das löst natürlich ggf. noch nicht das Problem unterschiedlichen Klanges und genau der ist in der Regel das Aufgabenfeld von Tonleuten die sich verschiedener Bearbeitungsmöglichkeiten, verschieden bedienen.

Finalemente sei noch grob angemerkt, dass die hier erwähnten Tools natürlich auch Signal bekommen und wieder ausgeben müssen. Das dürfte bedeuten, dass entweder mehrere Audiointerfaces (jeweils mit digitalen Ein- und Ausgängen) am bzw. im Rechner vorhanden sein müssen.

...und solch eine Aussage ohne den Hinweis auf die ggf. notwendige Beachtung von Headroom an digitalen Schnittstellen von Fachleuten, die sonst keine Gelegenheit auslassen, auf die Gegebenheiten des Mediums zu achten, nenne ich mal wenigstens fragwürdig ;) ! Aber für Ungeschulte ist es dann natürlich "hervorragend", wenn man im wieder aufgezeichneten Audio plötzlich eine "blitzsaubere" Abrisskante der Wellenform sehen kann. Das ist dann wahrscheinlich digitales Mastering in Reinkultur :wall: und sooo schön laut, vor allem auf dem Smartphone über "Lautsprecher"...
 
Und? Hast du darin gelesen? Ich kurz, kam aber über
http://tech.ebu.ch/docs/r/r128_2011_DE.pdf: schrieb:
Die EBU berücksichtigt,
a) dass die Normalisierung von Audiosignalen auf deren Spitzenpegel zu erheblichen Lautheitsunterschieden zwischen Programmen und Kanälen geführt hat;
nicht hinaus.
Eine derart irreführende Falschaussage gleich in die Einleitung zu schmieren, ...
Er will es nicht verstehen :rolleyes:. Das nenn' ich Resistance ...

Ich hatte das früher schon dort versucht.
Die Antwort dort. "di-dah-di-dah-dit "
 
Fertig mit dem Bashing @marillenfreund?
Können wir zurück zum Thema kommen?

Sollte ich mich des Bashings schuldig gemacht haben, dann bitte ich dies natürlich zu entschuldigen!
Ich dachte halt ich mache mal darauf aufmerksam, dass die beschriebene Signalführung über mehrere Audio-Interfaces mit digitalen Schnittstellen durchaus dazu geeignet ist, Audio definitiv zu zerstören sofern man bestimmte Grundsätze der digitalen Audiotechnik nicht beachtet. Irgendwie hatte ich den Eindruck, dass das sehr wohl zum Thema "Soundprocessing" gehört, war aber dann sicher verkehrt von mir formuliert ;)
 
Dann freuen wir uns doch alle auf einen ausführlichen Beitrag von dir, in dem du uns <ironic="true">unwissensen Volldeppen</ironic> erläuterst, wie die fürchterlichen S/PDIF- und AES-Links dieser Welt, sowie Matrizen oder sonstige Pipes ähnl. VAC, gar Loopbacks, es anstellen, digitales
Audio definitiv zu zerstören

Selbstverständlich nur bei einem <ironic="true">unwissensen Volldeppen</ironic>, der
bestimmte Grundsätze der digitalen Audiotechnik nicht beachtet.
, die natürlich - Achtung! - <ironic="true">für jedwede Anwendung von EBU R-128, insbesondere die nachträgliche Normalisierung bereits existenter Daten, nicht gelten</ironic>

... Aber bitte erst morgen Abend, eher bin ich nicht mit meiner Chipstüte zurück. Herrlich. Endlich richtiges Kabarett hier. Da wird der Webradiobereich mal entlastet.
 
...ist es nicht möglich, intern auf Fließkommaebene in digitaler Audio Hard- und Software, höhere Audiopegel zu produzieren, als die digitalen Schnittstellen nach außen abgeben können? Oder anders gefragt: Was oder wie begrenzt zum Beispiel ein extern über AES angeschlossener Sample-Peak-Limiter, dessen Threshold auf sagen wir mal -0,1dBFS steht und der im Insert eines digitalen Summenbusses auf Fließkommaebene "arbeitet"?
Aber wie schon bemerkt ist das ja nicht das eigentliche Thema hier, abgesehen davon, dass durch wie auch immer geartetes Processing mit Sicherheit Pegel abgesenkt bzw. angehoben werden sollen. Und insofern sind natürlich die technischen Gegebenheiten ggf. zu berücksichtigen, vor allem wenn man Audio aus- und wieder einspielt.
Und im Übrigen ist die R-128 ja gar nicht primär nur zur Normalisierung existenten Audios gedacht, sondern als Produktionsstandard für erst entstehendes. Aber das weißt Du ja sicher auch. Es gibt eben nur derzeit leider viel zu viel plattgequetschtes Audio, für das durch R-128 Normalisierung ggf. Auflösung "verschenkt" wird, allerdings würden für vieles davon auch 8 Bit vollkommen ausreichen oder schon zu viel sein.
 
...ist es nicht möglich, intern auf Fließkommaebene in digitaler Audio Hard- und Software, höhere Audiopegel zu produzieren, als die digitalen Schnittstellen nach außen abgeben können?

mit welchem Sinn???!!?


aber ja.......das geht.
 
... Herrlich. endlich richtiges Kabarett hier ...
Jawoll! - Nicht ganz topic, aber weil es gerade so schön passt zum Kabarett: :D

Ein erneuter Blick auf die Sengpiel-Seite http://www.sengpielaudio.com/HeadroomUndAussteuerung.htm
Nachdem dort Christian Schubert korrekt beschrieben hat:
Dr. Christian Schubert schrieb:
Zielwert der digitalen Aussteuerung im Rundfunk ist demnach −9 dBFS. Nur Spitzenwerte dürfen diesen Wert überschreiten.
lässt es sich Meister Sengpiel nicht nehmen auf der selben Seite zu widersprechen:
Eberhard Sengpiel schrieb:
... ich wende mich gegen das allgemeine starre Aussteuern maximal auf die "digitale" −9 dBFS Marke, denn damit sind die "schönsten" Bits darüber bis zu 0 dBFS hin verboten und werden nutzlos freigelassen,
* :wow: :wow: :wow: *​
und noch einen Schenkelklopper drauf:​
Eberhard Sengpiel schrieb:
Es gibt keinen dBu- nach dBFS-Umrechner
Die digitale Spitzenwert-Skala passt nicht zur analogen Effektivwert-Skala.
Das sind zwei Welten.
:)
Der hat Humor, der "alte Saurier". ***Resistance Par Excellence
Freundliche Grüße an @ebs.

---
P.S.: nichts gegen seine wirklich informativen Seiten,
. aber er hat nun mal seine Prinzipien.
 
...stimmt doch aber alles soweit. Und in der zweiten Aussage gibt es auch keinen Widerspruch zur ersten. Man beachte die genaue Formulierung, die von starrem Aussteuern auf maximal digitale -9dBFS spricht und somit die oben angesprochenen Spitzen darüber ausschließen würde . Ein ähnlicher Fehler wäre der auf -9 eingestellte Digitallimiter, der die nach QPPM auf -9 ausgesteuerten und dabei nicht sichtbaren Spitzen zunichte macht. Aber genau wegen dieser ganzen Missverständnisse gibt es ja die Idee zur Abkehr von der Spitzenbewertung hin zu etwas, was dem Hören näher kommt.
 
Eben nicht!

Auf der dBu-Skala werden Pegelverhältnisse einer physikalischen Größe angezeigt. Diese heißt "Spannung". Per Definition seiner Funktion handelt es sich bei einem Pegelmesser mit dBu-Skala also zunächst um nichts anderes um ein Voltmeter, denn die Werteausgabe bezieht sich eindeutig auf einen festen Wert der Einheit V der physikalischen Größe U.
Dass dabei nicht wie einem Voltmeter eine lineare Anzeige in Volt erfolgt, hat mehrere Gründe. Einer davon ist, dass eine solche Anzeige durch eindeutige Festlegung auf einen definierten, eingeschränkten Wertebereich stets ungenau wäre. Kaum ein Gerät hält so extrem präzise den Wertebereich und der Zwang dazu würde unnötigen Entwicklungsaufwand bedeuten. Der zweite, noch viel wichtigere, um nicht zu sagen eigentliche Grund für die einführung der logarythmischen dB-Skala ist aber, dass auf einer linearen Skala die Ablesbarkeit kleinerer Meßwerte umso schwieriger wird, je kleiner sie gegenüber dem Endausschlag sind. Immerhin bedeuten -6 dB die halbe Spannung (bei Leistungsmessung sogar nur noch 25 %!) gegenüber dem Referenzwert; der Zeiger eines Instruments hätte also viel zuwenig Weg, um kleinere Signale übersichtlich anzuzeigen, aber immernoch den halben, für ganze 6 dB bis zu Vollausteuerung.

Hinzu kommt, dass ein analoges Messgerät stets mit der Zeit in Konflikt steht. Für eine sichere Erfassung der Messgröße muss diese mindestens so lange zu messen sein, wie ein Messgerät Zeit benötigt, um sie a) überhaupt zu erfassen und b) auch noch anzeigen zu können. Das sind bei Wechselspannung zum einen und Bursts zum zweiten gleich zwei verschiedene Disziplinen. Diese beiden Vorgänge zusammen werden unter dem Begriff Intergationszeit zusammengefasst. Der Pegel jedes Impulses, der kürzer als diese ist, entzieht einer exakten Messung und kann nur noch bei genauer Kenntnis des Integrationsverhaltens des Messgerätes mathematisch bestimmt werden. Auf Deutsch: Dem Messgerät geht einiges durch die Lappen.

Das war aber bei analoger Technik und den Wertebereichen, auf die man sich irgendwann festlegte, sowie mit der Vorgabe, wie ein Pegelmesser zu funktionieren hat (z.B. DIN) kein Problem, denn kein analoges Medium verzerrt derart schnell und vor allem stark, wie Digital Audio. Im Gegenteil: Die obere Aussterungsgrenze analoger Medien wird gar nicht primär durch dBu, also eine Spannung definiert, sondern durch einen mediumspezifischen maximal zulässigen Klirrfaktor. Mit welchen Spannungen die Elektronik arbeitet, ist völlig irrelevant.

Bei dBFS handelt es sich im Vergleich zu all dem um eine Skala zur vergleichenden Anzeige einer virtuellen Messgröße, denn angezeigt werden ausschließlich Daten, und Daten sind keine physikalische Größe. Was auf einer dBFS-Skala passiert, hat keinen direkten Bezug mehr auf das, was zu ihrer Anzeige führt, denn ein dBFS-Messinstrument ist so virtuell wie das, was es anzeigt. Es ist auch nicht eichbar, so dass man sich mit ihm "auf irgendwas einigen könnte".
Lediglich eins hat es mit einem dBu-Pegelmesser gemeinsam: Es zeigt vergleichend Pegelverhältnisse an. Und auch, bzw. besonders und erst Recht gilt bei dBFS: Mit welchen Spannungen die Elektronik arbeitet, ist völlig irrelevant.

Aufgrund der besonderen Notwendigkeit bei Digital Audio, Übersteuerungen zu vermeiden, weil es keine sanften Sättungsprozesse und somit keinen weichen Anstieg des Klirrfaktors gibt, darf ein Instrument mit dBFS-Skala nicht integrieren, also solange Informationen sammeln, bis es zur genauen Anzeige eines Messwertes reicht. Allerdings muss es das ja auch nicht, denn da nur Daten angezeigt werden, die ohnehin bereits vorliegen, können diese auch einfach benutzt werden. Leider gibt aber auch hier einen Pferdefuß, der sich aus den rein mathematischen Grundprinzipien der Messwerterfassung und -darstellung. Bestimmte Kombinationen von Verhältnissen aus Flankensteilheit des reproduzierten Signals (Frequenz), seiner Phasenlage zur Samplingfrequenz und dieser selbst können bei den meisten "einfachen" digitalen Peakmetern, wie sie üblicherweise in DAT-, MD-, Field- oder sonstigen Recordern sowie in PC-Software arbeiten, zu einer reduzierten Anzeige führen.
Die Wahrscheinlichkeit, dass das sampleweise passiert sowie die Größe dieses Fehlers lassen sich statistisch herunterbrechen und sind insgesamt so wahnsinnig gering, dass es für den Anwender reicht, die -2-dBFS-Marke als Maximum anzuvisieren. Damit ist praktisch ausgeschlossen, dass sich im Datenstrom mehr als die maximal 2 Oversamples ff. am Peakmeter hinterm Wandler vorbei zur Aufzeichnung schleichen. Das ist auch Grund, weshalb in Bedienungsanleitungen von Herstellern diese Angabe gemacht wird bzw. gemacht werden sollte.

Zusammenfassend sollte nun mehr klar sein, warum es keine Umrechnungsformeln für dBu, dBV, dBFS, dBVU und meinetwegen auch dBLUFS gibt. Sie haben alle nichts miteinander zu tun, weil ihre Anzeigeinstrumente grundverschiedene Funktionweisen haben und genau betrachtet nicht einmal alle genau das messen, was ihre Anzeige vorgibt. Wer solche Messgeräte benutzt, muss sich nicht nur genau darüber im Klaren sein, was er eigentlich messen will und wie die Geräte funktionieren, sondern natürlich auch, welche Rückschlüsse von den angezeigten Messwerten her zu ziehen sind. Diese Rückschlüsse sind selbstverständlich in aller erster Linie medienspezifisch zu ziehen. Nur sekundär, um nicht zu sagen zu allerletzt haben sie anwendungsspezifische Relevanz.

Abschließend sei noch angemerkt, dass diese unvollständigen, rein aufs Pegelmessen bezogenen Ausführungen (man kann immerhin ganze Bücher damit füllen) auch keinen Bezug zu anderen, hier immer wieder unverstanden ins Feld geführten Größen wie Dynamikbereich eines Mediums X, Dynamikumfang eines Signalverlaufs und erst Recht nicht sonstige, hörphysiologische oder -psychologische Dynamikbetrachtungen haben.
 
...Man beachte die genaue Formulierung, die von starrem Aussteuern auf maximal digitale -9dBFS spricht und somit die oben angesprochenen Spitzen darüber ausschließen würde .

@marillenfreund, der Witz ist doch, dass @ebs massiv gegen etwas 'anstinkt' was nirgendwo so empfohlen wird.

Das wurde ihm schon mehrfach von diversen Fachleuten erklärt. Da sehe gewisse Paralleln zu @dea. Aber @ebs ist eben Künsler, den die technischen Details gar nicht interessieren :). Christian Schubert hat es verstanden.

Wo er total daneben liegt (3. Absatz):
der Spitzenspannungsmesser ist kein Effektivwertmesser !​
auch nicht der DIN-Aussteuerungsmesser.​
Dass er der Clip-Grenze seines A/D-Wandlers kein analoges Spannungsäquivalent zugesteht finde ich nun wieder schrullig.​
Nichtsdestotrotz, ich mag den Menschen Sengpiel.​
Bei @dea ist es noch nicht soweit.​
------------------​
... Aber genau wegen dieser ganzen Missverständnisse gibt es ja die Idee zur Abkehr von der Spitzenbewertung hin zu etwas, was dem Hören näher kommt.
Jaja, zu bedenken ist jedoch, dass die DIN-Aussteuerungsmesser noch massenhaft vorhanden sind und sich leichter und schneller handhaben lassen als das neue Loudness Meter. Bei der Live-Aussteuerung sehe ich das Loudness Meter wegen seiner Trägheit immer noch skeptisch. Das DIN-Gerät liegt mit seiner Trägheit immerhin schon mal zwischen TruePeak und Loudness, also in der richtigen Richtung.​
Die neue R.128 ist doch vorerst nur eine Produktionsrichtlinie, die zwar beim Fernsehton auch auf Sendung gehen darf, aber beim Hörfunk sehen die Verhältnisse ganz anders aus.​
mfg. TB​
 
Auf der dBu-Skala werden Pegelverhältnisse einer physikalischen Größe angezeigt. Diese heißt "Spannung". Per Definition seiner Funktion handelt es sich bei einem Pegelmesser mit dBu-Skala also zunächst um nichts anderes um ein Voltmeter, denn die Werteausgabe bezieht sich eindeutig auf einen festen Wert der Einheit V der physikalischen Größe U.

Zusammenfassend sollte nun mehr klar sein, warum es keine Umrechnungsformeln für dBu, dBV, dBFS, dBVU und meinetwegen auch dBLUFS gibt. Sie haben alle nichts miteinander zu tun, weil ihre Anzeigeinstrumente grundverschiedene Funktionweisen haben und genau betrachtet nicht einmal alle genau das messen, was ihre Anzeige vorgibt. Wer solche Messgeräte benutzt, muss sich nicht nur genau darüber im Klaren sein, was er eigentlich messen will und wie die Geräte funktionieren, sondern natürlich auch, welche Rückschlüsse von den angezeigten Messwerten her zu ziehen sind. Diese Rückschlüsse sind selbstverständlich in aller erster Linie medienspezifisch zu ziehen. Nur sekundär, um nicht zu sagen zu allerletzt haben sie anwendungsspezifische Relevanz.

...danke für die wortreichen Erklärungen, die schön das ganze Dilemma mit der Pegelmessung erklären. Dazu von mir nur ein paar Erweiterungen bezüglich der Loudnesserfassung nach R-128:
  • die Einheit dBLUFS gibt es nicht! Das ist das größte Missverständnis, denn in der R-128 wird ganz klar zwischen der Erfassung des Loudnesslevels in LUFS bzw. LU, und des True Peak Levels in dBFS bzw. dBTP unterschieden
  • LUFS bedeutet: Loudness Units bezogen auf Full Scale, gemessen und empfohlen wird also in Loudness Units die innerhalb von Full Scale Digital Audio liegen, und das endet, wie richtig erklärt, definitiv bei 0. Somit haben wir hier also einen exakten Bezug auf das digitale Medium. Die Messung des Loudnesslevels erfolgt gleichzeitig mit drei verschiedenen Integrationszeiten.
  • als Messstandard für die R-128 wird die ITU 1770-2 genutzt, die die Einheit LKFS beschreibt. Das K verdeutlicht hierbei, dass die Messung der Signalspannung mit der K-Bewertung erfolgt, diese Frequenzbewertungskurve wurde eigens hierfür definiert. LKFS und LUFS entsprechen also einander und sind keine Phantasieeinheiten, sondern ganz klar beschrieben.
  • die Messung in LUFS mittels verschiedener Integrationszeiten zollt dem dynamischen Verhalten von Audio Respekt und ermöglicht die "Benennung" von laut und leise innerhalb einer Mischung. Reduziertes Beispiel: wenn 0LU (-23LUFS) "normal" sind, dann könnten +3LU laut und -3LU leise innerhalb der Mischung sein, hierfür sind die kürzer integrierten Messungen M und S relevant. Je nach statistischer Verteilung von laut und leise hätten wir in diesem Fall eine Loudness Range LRA von maximal 6LU. Ein weiterer Parameter der Loudnessmessung, der Aussage über die Gesamtdynamik auf Loudnesslevelbasis gibt. Anders als die Bestimmung der technischen Dynamik mittels Spannungspegel haben wir eine Aussage über das Gehörte, da sich der Höreindruck, wie an anderer Stelle schon erklärt, nicht mittels Spitzenpegelerfassung definieren oder vorhersagen lässt.
  • gleichzeitig zur Loudnesslevelerfassung mit der Empfehlung eines Zielwertes von -23LUFS (dieser bietet ausreichend Headroom für verschiedenste Klangereignisse) schreibt die R-128 die Messung des True Peak Levels vor und legt hierfür den Maximalwert von -1dBTP fest. Anders als in der normalen Sample Peak Messung erfolgt die True Peak Messung mit mindestens 4 facher Sample Frequenz des Audiosignals. Durch diese zweite/gleichzeitige Messung sollen also auch das digitale Medium beachtet, und die Übersteuerungen bei der DA Wandlung verhindert werden.
  • ergo: Loudnessmessung und Pegelmessung sind zweierlei, erfolgen aber beide in der R-128 und sind mit einer Empfehlung (-23LUFS) bzw. einem Maximalwert (-1dBTP) ganz klar definiert!
Bleibt also festzuhalten, dass die Messungen und Empfehlungen nach R-128 ein vollkommen neuer Ansatz sind, Audio zu erfassen und definieren. Dementsprechend kann man diesen auch nicht einfach mit anderen Messverfahren gleichzusetzen versuchen, sondern muss sie am Ergebnis bewerten. Ziel dabei ist die Orientierung am Hörverhalten des Menschen.
@Tonband: Richtig, somit ist die R-128 also eine Produktionsrichtlinie, die sich ganz konkret auf digitales Audio und dessen lineare Weitergabe bezieht. Beispielsweise müssen auch im Fernsehen, bei der Verbreitung über kodierte Strecken, andere True Peak Werte berücksichtigt werden, was in den sog. Distribution Guidelines zur R-128 erweitert beschrieben wird. Dadurch sollen Verzerrungen durch Codierprozesse verhindert werden. Ähnlich dazu könnte man also die R-128 durchaus auch im Hörfunk (in der Produktion) anwenden, um ein in sich homogen und gehörrichtig ausgesteuertes Signal zu erzeugen, welches dann gezielt für verschiedene Verbreitungswege (auch FM!!!) auf deren technische Gegebenheiten angepasst werden würde. Damit würden dann natürlich auch die Gegebenheiten der entsprechenden Medien/Verbreitungswege wie gefordert berücksichtigt. Somit wäre es dann endlich mal wieder möglich ein Programm (bestehend aus Nachrichten, Musik, Moderation, Jingles, Telefoninterviews, Werbung) ohne Anpassung der Abhörlautstärke durchzuhören, denn das sollte eigentlich Ziel einer guten Aussteuerung sein. Und da wären wir dann bei der Normalisierung von existentem Audio nach R-128, die es erstmals ermöglichen würde, eine Aussage über den zu erwartenden Höreindruck eines unbekannten Audioereignisses zu treffen. Auf der diesjährigen Tonmeistertagung war das übrigens großes Thema und es gibt auch entsprechende Arbeitsgruppen. Übrigens liegt die durchschnittliche Loudness bei UKW meines Wissens bei ungefähr -18LUFS mit großen Unterschieden.
Ich bitte diese umfangreichen Erklärungen zur R-128 in diesem Thread zu entschuldigen, aber es passt soweit zum Thema da meines Erachtens das ursprüngliche Problem eines der Loudness ist und eine NORMALISIERUNG verlangt. Und eine Normalisierung sollte sich auch einer Norm bedienen, die R-128 (bisher Empfehlung) versucht dies zu werden. Wenn ich hier andererseits lese, das für die Normalisierung mittels MP3 Gain (reine Pegelbewertung?) unterschiedliche Zielgains ins Feld geführt werden, dann kann ich darin keine Norm entdecken und mich nur wundern.
Viele Grüße an die angeschlossenen Funkhäuser!
 
Wenn ich hier andererseits lese, das für die Normalisierung mittels MP3 Gain (reine Pegelbewertung?) unterschiedliche Zielgains ins Feld geführt werden, dann kann ich darin keine Norm entdecken und mich nur wundern.

Ganz einfach:
Als Institution eine Norm zu proklamieren bzw. sich als Anwender an eine solche zu halten ist die eine Sache, die Sinnhaftigkeit der Norm an sich sowie der Sinn ihres Einsatzes eine andere. Auch auf die Gefahr hin, dass ich jetzt Äpfel mit Birnen vergleiche: Die festgenagelten Krümmungswinkel von Gurken, Bananen, WC-Trapsen und anderer Normierungswahnsinn haben doch deutlich gemacht, wieviel Unsinn man anrichten kann.

Das betrifft die Normalisierungsverfahren (schön, dass wir langsam wenigstens wieder dahin zurückkommen) in exakt der gleichen Weise. Wenn es gar keinen Grund gibt, sich überhaupt irgend eines der zu verfügung stehenden Verfahren zu bedienen, warum sollte man es anwenden? Nur weil es das gibt? sicher nicht.

Wenn die Aufgabe einer Normalisierung ansteht, dann gibt es noch immer keinen grundsätzlichen Zwang, sich eines bestimmten Verfahrens und bestimmter Parameter zu bedienen, denn bevor ich arbeite, betreibe ich naturgemäß Arbeitsplanung. Ich habe mich also zu fragen, mit welchen Werkzeugen ich welche Halbzeuge bearbeiten möchte, so dass ich nur minimalen Abfall generiere. Klingt verdammt nach Handwerk? Ist auch Handwerk!

Nun kommt die alte Leier, aber ich schreibs gern noch ein paar mal:

Wie eben schon bemerkt, mache ich mir Gedanken um meine Arbeitsmittel, die Halbzeuge sowie die nötigen Arbeitschritte, BEVOR ich anfange zu arbeiten. Das setzt schon mal voraus, dass ich auch weiß, was ich eigentlich herstellen möchte

Bleiben wir doch gleich bei der in diesem Thread ursprünglich gestellten Aufgabe, nämlich eine Lautheits- und Klangfarbennormalisierung für eine Radioautomation zu realisieren. Auch, wenn x Lesern das widerstreben mag: So stellte Anne sich das vor.
Dass die Aufgabe mit einem Mehrbandkompressor zu realisieren ist, ist schon abgehakt. Damit ist das Abeitsmittel klar. Also steht noch die Frage nach der Konsistenz der Halbzeuge, was im beschriebenen Fall wohl MP3-Dateien zu sein scheinen, die offensichtlich hinsichtlich ihrer Pegel noch keine Bearbeitungen erfahren haben. Wo die jeweils liegen, ist also unbekannt, egal ob wir nach Lautstärke oder Lautheit fragen.
Da ein (reiner) Kompressor ein Gerät ist, dessen Wirkergebnis zunächst leiser als der Input ausfällt (was am Ende i.d.R. gemakeupgaint, also wieder aufgeholt werden muss), könnte man fast schon auf die Idee kommen, sich zu fragen, wieso man vorher überhaupt irgendetwas leiser machen müsste. Das liegt ja nun bekanntlich daran, dass man einen Kompressor nur vernünftig in einem gewissen Toleranzband um einen selbst und frei gewählten Arbeitspunkt herum anfahren kann. Ansonsten handelt man sich mehr klangliche Schwierigkeiten ein, als man eigentlich ausbügeln möchte.
Hat man einen Mehrbandkompressor mit (Gated) AGC zur Hand, hat man ein deutlich größeres Toleranzband auf der Eingangsseite, als dies bei einem Kompressor der Fall wäre, wo der Input unmittelbar den VCAs und dem Regelsignalgenerator zugeführt wird.
Die Frage ist nun also: Wie groß muss mein Toleranzband denn insgesamt werden? Das wissen wir ebenfalls wieder nicht, denn wir haben keinen blassen Schimmer, was für Musik irgendwann durch den Kompressor rasseln wird. Wir wissen auch nicht, weit die Kompression getrieben werden soll.

Und genau hier sind wir an dem Punkt, an dem gar keinen Sinn macht, über irgendwelche Zahlen zu sprechen. Der Anweder steht vor einem individuellen Anwendungsfall, dem mit individuellen Parametern zu begegnen ist. Der Anwender ist auch keine Rundfunkanstalt, die über X Studios verfügt und sich somit mindestens eine eigene interne Norm auferlegen muss, damit es bei Schalten keine Differenzen gibt. Er darf sich also getrost bei seiner Parameterwahl ganz bequem an seinen Erfordernissen orientieren. Das selbstverständlich nur im Rahmen der Grenzen, die ihm das Medium auferlegt.
Konkret wäre es also sinnfrei, alle Titel des Archivs weiter nach unten zu normalisieren, als es nötig ist.

Hierbei spielt es keine Rolle, ob R-128 oder MP3Gain zum Einsatz kommen. Wie weiter oben erwähnt, wäre R-128 mit ReplayGain-Methode grundsätzlich die präzisere Alternative, aber eben nicht die flexibelste. Auch hier kann sich der Anwender getrost Gedanken darüber machen, ob der das, oder lieber mit MP3Gain arbeiten möchte. MP3Gain arbeitet weniger präzise, dafür ist sein Endergebnis problemlos anwendungsübergreifend portierbar.
Da es in diesem speziellen Fall aber ohnehin darum geht, dass lediglich ein Input für eine nachfolgende Dynamikregelung geschaffen werden soll, könnte man sich die Toleranzen, die MP3Gain hinterlässt, auch noch erlauben.

Was also bringt hier das Pochen auf eine Norm, deren Einhaltung keinerlei zusätzlichen Nutzen bringt? Im Gegenteil: In Abhängigkeit vom zu normalisierenden Programmmaterial kann sogar "Schaden" entstehen, nämlich dann, wenn der Gainprozess zu digitaler Untersteuerung führt. Diese ist genau dann erfüllt, wenn kein Signal mehr die -6-dBfs-Marke überschreitet. Das entspricht dem, was ich Datenreduktion nenne, denn dem Ausspielvorgang steht das MSB dann nicht mehr zur Verfügung. Dies entspricht wiederum einer Einschränkung des Dynamikumfangs des Mediums selbst, den man nur dann und insofern hinzunehmen hat, wenn es eine Anwendung konkret erfordert. Ansonsten hat man eben auszusteuern, nicht zu untersteuern.

Nun ist es aber nunmal so, dass die normgerechte Anwendung von R-128 sowie MP3Gain (mit dessen Default von 89,0 dB) auf Popmusik im Schnitt eine heftige Untersteuerung zur Folge hat. Anschließend soll ja in diesem hier diskutierten Fall noch der Kompressor nachgesetzt werden, der zusätzlich draufhaut, was schon 2 MSBs praktisch unbrauchbar macht. In der Folge hätten wir gut und gern 12 von 90 dB Dynamikumfang unwiderbringlich verrissen; statt 15 Bit arbeiten nur noch 13 effektiv (das LSB ist bekanntlich zwar schon an der Signalreproduktion beteiligt - irgendwo muss der Wertebereich ja auch anfangen -, ist aber selbst nicht in der Lage, ein Signal abzubilden und fällt daher raus).

Zum Schluss des Bearbeitungsprozesses steht die MakeupGain, die den ganzen Salat wieder herausreißen muss, da niemand diesen leisen Mist hören will. Warum auch sollte man am Ende einen schlechteren (analogen) Signal-Rauschabstand in Kauf nehmen, der sich zwangsläufig ergibt, wenn man den Lautstärkeregler am Verstärker wesentlich weiter aufreißen muss, als es notwndig wäre, käme aus dem Audiointerface das, was an Pegel machbar ist? Außerdem ist es immernoch so, dass die Wandlerpräzision dann am höchsten ist, wenn der Dynamikbereich des Mediums ausgenutzt wird - ein weiterer Grund, warum sich gezielte und konsequente Untersteuerung auf digitaler Ebene schlicht und einfach verbietet.

Die Frage, ob das Mehr an Quantisierungsrauschen durch den digitalen Gainvorgang, oder das Mehr an Stör und Rausch auf analoger Seite nun das größere Übel sein werden, kann man sich auch noch stellen. Die Frage kann man sich sogar erst Recht stellen, wenn man bedenkt, dass man es ja jetzt mit dynamikreduziertem Programmmaterial zu tun hat, das naturgemäß das physikalisch bestehende SNR gefühlsmäßig maskiert und damit relativiert. Auch die Antwort darauf ist vom Anwendungsfall abhängig.

Ist die Wiedergabeseite so hochwertig, dass Rauschen und Störeinflüsse völlig undiskutabel sind, bleibt nur der Gesichtspunkt "Wandlerpräzision". Im allgemeinen, besonders aber beim Heimanweder wird man aber die analogen Stufen sowohl des Audiointerfaces als auch des Leistungsverstärkers zusammen als "Schwachpunkt" ansehen können, so das am Ende die Entscheidung ziemlich eindeutig pro -2 dBfs ausfallen sollte.

Insgesamt kann und sollte man sich also verdammt viele Gedanken machen, will man denn
http://www.radioforen.de/index.php?threads/aussteuerung-von-audiosignalen.20073/ schrieb:
übertragungstechnisch und künstlerisch
so korrekt wie möglich aussteuern. Da hilft nicht irgendeine Norm XY, sondern umfassende Kenntnis von allem, was dazugehört. Es könnte ja sein, dass Norm XY ganz anderen, tieferliegenden Vorgaben im Wege steht, oder aber schlicht gar nicht weiterhilft.
 
Meine ganz persönliche Erfahrung sieht da etwas anders aus:

Annas Vorstellung hingegen lässt aber gar keinen Zweifel zu. Die Aufgabenstellung ist sonnenklar, nämlich

Sie möchte also die Wiedergabe ihrer
ganz radio-like so in einen Guß gebracht haben, dass der plärrige Rock-Oldie nicht zwischen einem basslastigen Dance-Klassiker und einer knackig-kickig-angejazzten Nummer für ein akustisches Loch in der Wohnumgebung sorgt. Und das passiert trotz Lautheitsnormalisierung!

Dea hat nicht ganz unrecht hier. Trotz Loudnessnormalisierung kann es natürlich akustische unebenheiten geben. (datt is ja auch normal.......)
(LEIDER) ganz Radio like = homogener, phasenverdrehter Rauschbrei (like SWR3).....
oder like 100.5 Das Hitradio. Auch ganz krass (im Sinne von grauenhaft) das Processing..... eindeutige Handschrift übrigends ;) genau wie Baden.Fm *fetttes räusper*
Letzteres wurde als edles Sounddesign angepriesen!!!! Hallo? Geht´s noch!? Man hört die Ahnungslosigkeit natürlich mehr als alles andere :p

Ich bin froh, dass ich mein Geld nicht in der Radiobranche verdienen muss.
"""So viele Köpfe stecken in so vielen Ärschen"""
 
Status
Für weitere Antworten geschlossen.
Zurück
Oben