Ausführlicher Mikrofonvergleich für Sprachaufnahmen

Status
Für weitere Antworten geschlossen.

Pianist_Berlin

Benutzer
Schönen guten Tag an alle Mitlesenden!

Wir haben hier ja schon oft darüber diskutiert, welche klanglichen Unterschiede zwischen Groß- und Kleinmembranmikrofonen bestehen und inwiefern sich bestimmte Mikrofone von einander unterscheiden. Ich habe nun noch mal eine ganze Reihe von Testaufnahmen durchgeführt, alle unter den gleichen technischen und räumlichen Bedingungen, alle mit dem gleichen Text. Sprechabstand etwa 30 Zentimeter. Wind- oder Poppschutze wurden nicht verwendet.

Am Test nahmen teil:

Neumann U87, TLM 103, TLM 193, KM 184, BCM 104 und das Bühnenmikrofon KMS 104
Microtech Gefell M 930
Sennheiser MKH 8040
Rode M3 (als Beispiel für ein sehr billiges Mikrofon)

In diesem ZIP-Ordner befinden sich von jedem der neun Mikrofone drei Dateien. Datei A ist die vollkommen unbearbeitete Aufnahme. Datei B ist mein übliches Bearbeitungs-Setup aus De-Esser, Kompressor und Limiter, außerdem EQ mit leichter Anhebung bei 1 KHz und leichter Absenkung bei 10 KHz. Das sind alles die ADT-Module. Und weil ich eine Filmproduktion betreibe und meine Sprachaufnahmen sich üblicherweise in eine komplette Filmtonmischung mit Atmo und Musik einfügen müssen, habe ich sowas dann als Variante C auch noch im Angebot.

Um einen ähnlichen Pegel zu erhalten, habe ich alle Aufnahmen normalisiert, was aber speziell bei den A-Varianten nicht funktioniert, da dort oftmals einzelne Transienten den Luftraum versperren.

Ich habe mir durchaus schon einige Meinungen gebildet, bin aber erst mal auf Eure gespannt.

Matthias
 
Ja, das schrieb ich ja: Vor allem die A-Versionen sind unterschiedlich laut, weil dort mangels Bearbeitungsstufen noch einzelne Transienten hervorstechen. Die B- und C-Varianten sind doch aber sehr ähnlich in der Lautheitswirkung, oder? Ich hätte auch einfach alles auf 0 dB auf dem RTW 1206 pegeln können, aber da würde ja das Risiko bestehen, mit einzelnen Transienten ins Clipping zu kommen, wenn alle signalbeeinflussenden Stufen abgeschaltet sind.

Matthias
 
Ich hätte auch einfach alles auf 0 dB auf dem RTW 1206 pegeln können, aber da würde ja das Risiko bestehen, mit einzelnen Transienten ins Clipping zu kommen, wenn alle signalbeeinflussenden Stufen abgeschaltet sind.
Oder generell entsprechend viel digitalen Headroom (für alle) zu reservieren, orientiert an der höchsten vorkommenden Spitze eines A-Signals. Also den Clipping Level des ADCs entsprechend hoch zu wählen.

Erfahrungsgemäß dürften aber bei einer RTW1206-Aussteuerung (DIN45406) auf 0 dB und 9 dB Headroom (= +6 dBu Aussteuerung und Clipping bei 15 dBu) nach EBU keine Übersteuerungen auftreten. Wirklich gleich laut würde man die Aufnahmen natürlich nur mit einem Lautstärkemesser bekommen.
 
RTW hat ja inzwischen mit der Auslieferung des TM 3 begonnen, aber meiner ist wohl erst im Juni dran. Dann kann ich auch Lautheit nach R-128... :)

Matthias
 
Eine Möglichkeit wäre die Lautheitsmessung mit dem kostenlosen Tool R128Gain und eine entsprechende Pegelanpassung, damit wären die Files lautheitsnormalisiert.

LG
Jean
 
Schön, dass nun plötzlich in ganz anderen Zusammenhängen die Vorteile der Lautheitsnormalisierung in den Vordergrund rücken! Denn offensichtlich und eigentlich altbekannt funktioniert die ganze Spitzenpegelbewertung und -normalisierung (egal ob SPPM oder QPPM) eben überhaupt nicht für das ausgelöste Empfinden am Ohr.
Übrigens Matthias, herzlichen Glückwunsch zur Kaufentscheidung! Das TM3 ist für die Preisklasse sicher ein echtes Sahnestück! Hatte vor ein paar Wochen schon bei RTW die Gelegenheit, es zu beurteilen und auch mit den Entwicklern darüber zu diskutieren, das Ding kann echt richtig viel. Ich hoffe, Du hast Dich gleich für die Mehrkanalvariante entschieden.

Grüße, Björn
 
Und vor allem wird dadurch auch deutlich, dass man Sprachaufnahmen zwingend sehr streng bearbeiten muss, damit sie überhaupt verwendbar sind. Also da geht es vor allem um die Herausnahme der einzelnen Spitzen, die durch ein simples "S" verursacht werden können und dann den ganzen Luftraum blockieren.

Möchte sich noch jemand zu den Aufnahmen äußern? :)

Matthias
 
Mache ich sehr gern, wenn ich wieder daheim bin, und in Ruhe hören kann. So etwas ist immer unglaublich spannend, wenngleich die Mikrofonauswahl ja leider nicht für Jeden erschwinglich ist ;)
Ich werde dann für mich auch mal testhalber eine Lautheitsbewertung der Files durchführen. Bin mal gespannt, aber relativ sicher, dass da nichts irgendwelche Räume blockiert. Man muss sich als Idee eben nur mal von den Spitzenwerten lösen und sie als Spitzen akzeptieren, schließlich gibt es sie ja in der Natur offensichtlich.

Björn
 
Erfahrungsgemäß dürften aber bei einer (..) Aussteuerung nach EBU keine Übersteuerungen auftreten.
Hallo Matthias, ich habe mal die dekodierten A-Files auf die schnelle analysiert:

Alle Original-Aufnahmen bringen auf meinem RTW(DIN) Anzeigen bis +5 ... +7 dBr (= -4 ...-2 dBFS, bei einer Spitzensample-Normierung auf -0,25 dBFS). Da wäre nach EBU-Headroom noch gut Reserve (~4 dB) gewesen.
Anders ausgedrückt: Bei exakter DIN-Aussteuerung auf 100% erreichen die höchsten Sample-Spitzen +4 dBr= -5dBFS. Das entspricht den Erfahrungswerten.
da geht es vor allem um die Herausnahme der einzelnen Spitzen, die durch ein simples "S" verursacht werden können und dann den ganzen Luftraum blockieren.
Die höchsten Spitzen traten aber nicht bei S-Lauten, sondern bei Vokalen nach Sprechpausen auf (> km184-a).
Vielen Dank für diese guten Beispiele in MP3-mono192kbps, Matthias. Damit lässt sich noch einiges analysieren.

Wir wollen uns zwar lösen von der DIN-Peak-Aussteuerung; praktisch ist diese aber immer noch für Aufnahmen die nachbearbeitet werden können. Vor allem, wenn man damit geschult ist, wie Matthias. Der Loudness-Normalizer wird's schon richten, gell Björn? ;)
 
Die höchsten Spitzen traten aber nicht bei S-Lauten, sondern bei Vokalen nach Sprechpausen auf (> km184-a).
Ja, genau deshalb liebe ich die ADT-Geräte, weil die bei richtiger Einstellung schnell genug sind, um sowas auszuregeln. Ich habe themenbedingt oft das Wort "U-Bahn" zu sprechen. Man ahnt ja wirklich nicht, was so ein "U" bei einem TLM 103 für einen Pegel verursacht. Ohne die ADT-Module habe ich das nie gebändigt bekommen. Da kommt man ansonsten tatsächlich ins digitale Over.

Wobei aber die Spitzen der Zisch- und Klicklaute auch praktisch sind. Ein solches Geräusch gebe ich meist nach einem Versprecher vor Beginn eines neuen Absatzes von mir, so dass mir das als Markierung zum Schneiden dient, wenn ich aus Spaß mal längere Wikipedia-Artikel einspreche. So kann man fast rein optisch schneiden, ohne sich das anzuhören... :)

Bin nun auf Kommentare zu den Mikrofon-Klangbildern gespannt. Meinen Senf gebe ich dann auch noch dazu, habe eine relativ klare Meinung.

Matthias
 
Wobei aber die Spitzen der Zisch- und Klicklaute auch praktisch sind. Ein solches Geräusch gebe ich meist nach einem Versprecher vor Beginn eines neuen Absatzes von mir, so dass mir das als Markierung zum Schneiden dient, wenn ich aus Spaß mal längere Wikipedia-Artikel einspreche. So kann man fast rein optisch schneiden, ohne sich das anzuhören... :)

*smile* Find ich gut!
 
Hallo Matthias,

habe mir Deine Aufnahmen angehört und gebe nun mal meine Kurzbeurteilung ab. Dazu zunächst zwei Anmerkungen.
- Offensichtlich wurde der Text mehrfach eingesprochen, was natürlich keine 100 %ige Vergleichbarkeit zulässt.
- Meine Anmerkungen beziehen sich ausschließlich auf die unbearbeiteten Aufnahmen, da die Bearbeitung mit identischem Prozessing trotz unterschiedlichem Ausgangsmaterial nach meiner Meinung wenig sinnvoll ist.

Wenn das Ziel ist, ein möglichst kompaktes Klangbild zu erhalten, an dem erstmal kein aufwendiges Prozessing nötig erscheint, dann fällt meine Wahl auf das bcm 104. Auch das tlm 193 liefert auf Anhieb einen schönen, noch wärmeren Klang. Diese Wärme im unteren Spektrum kann bei tieferen Stimmen ggf. zum Mulmen führen und ist im Gesamtprodukt vielleicht ohnehin nicht mehr wahrnehmbar. Das ist wie gesagt mein Urteil nach kurzem, einfachen Durchhören. Detaillietere Beurteilungen mache ich gern, sollte sich eine feurige Diskussion entwickeln.
Interessant finde ich die durchaus starken Unterschiede bezüglich des Rauschpegels. Sind die Mikros alle ladenfrisch, oder vergleichen wir bezüglich des Alters Äpfel mit Birnen?

Grüße, Björn
 
- Offensichtlich wurde der Text mehrfach eingesprochen, was natürlich keine 100 %ige Vergleichbarkeit zulässt.
- Meine Anmerkungen beziehen sich ausschließlich auf die unbearbeiteten Aufnahmen, da die Bearbeitung mit identischem Prozessing trotz unterschiedlichem Ausgangsmaterial nach meiner Meinung wenig sinnvoll ist. [...] Sind die Mikros alle ladenfrisch, oder vergleichen wir bezüglich des Alters Äpfel mit Birnen?
Ich habe tatsächlich alle Aufnahmen einzeln eingesprochen, da mir ja nur eine Vorverstärker-, eine Bearbeitungs- und eine Aufzeichnungsstufe zur Verfügung steht. Ansonsten hätte ich sowas wie einen Sound Devices 788 nehmen und mich von einem der neun Mikrofone trennen müssen, und vor allem hätten alle Mikrofone gleichzeitig verfügbar sein müssen. Und es stimmt, dass ich bei den B- und C-Varianten jeweils genau die Einstellungen übernommen habe, die ich standardmäßig mit meinem TLM 103 verwende. Wenn man sich dann für eines der Geräte entscheidet, ist da sicher noch mal einiges drin, wenn man die Einstellungen darauf optimiert.

Zum Alter der Mikrofone kann ich sagen: Frische Äpfel, etwas überlagerte Birnen und ein wenig Apfelmus.

Das U 87 ist etwa 30 Jahre alt, das TLM 103 etwa zehn Jahre, das KM 184 etwa fünf Jahre, das MKH 8040 und das KMS 104 etwa ein Jahr, das M 930 fast neu. Das BCM 104 und das TLM 193 stammen aus dem Messe-Demo-Park von Neumann, und wie lange die Teile dort schon genutzt werden, weiß ich nicht. Das Rode wurde mir privat zur Verfügung gestellt, so dass ich da ebenfalls nichts zum Alter sagen kann.

Um beim U 87 sicher zu gehen, dass es für sein Alter "normal" klingt, habe ich mir von jemandem ein etwa gleich altes ausgeliehen und kann daher sicher sagen, dass beide genau gleich klingen. Ich hätte daher nun auch keine Bedenken mehr, es jemandem zu verkaufen, der es unbedingt haben möchte, bevor es weiter bei mir im Schrank liegt.

Mit inhaltlichen Kommentaren warte ich immer noch ab.

Matthias
 
Dass ungefähr gleich alte U87 ungefähr gleich klingen, das erwarte ich eigentlich auch. Interessant wäre der Vergleich zu einem ladenfrischen Mikro gewesen... Unabhängig von den etwaigen Klangunterschieden durch Alterung müssen wir natürlich berücksichtigen, dass nicht alle Mikrofone für die Art und Weise der Aufnahme gedacht sind, wie Du sie durchgeführt hast. Das KMS 104 zum Beispiel ist nun wirklich ein Bühnenmikrofon und arbeitet somit sicher auch teilweise bewusst mit dem Nahbesprechungseffekt, der bei Deinem Sprechabstand nicht mehr wirkt, was man auch hört ;)
 
Klar, das KMS 104 ist für diesen Zweck nicht geeignet, aber es schadet ja nicht, genau das auch mal praktisch nachzuweisen. Denn oftmals wird ja Leuten empfohlen, doch einfach das Mikrofon zu nehmen, was gerade verfügbar ist. Und das klappt eben nicht. Ich habe das KMS 104 nur als Reserve, falls ich irgendwo mal ein drahtgebundenes Handmikrofon benötige und frequenztechnische Probleme mit meiner einzigen Funkstrecke kriege, die ich aber auch nur sehr selten mal einsetze. Mein Primärton wird überwiegend mit einem MKH 8060 geangelt.

Matthias
 
Hi Matthias,

jetzt habe ich mir auch mal Deine fertigen C Beispiele angehört und muss mich wundern. Irgendwie klingt es so, als hättest Du die jeweiligen Pegelverhältnisse nicht nach dem gewählt, was im Sinne einer guten Mischung jeweils notwendig gewesen wäre. Vielmehr habe ich den Eindruck, dass die "Mischungen" alle mit demselben Pegelverhältnis zwischen IT Mix und Sprachspur erfolgten. Das ist natürlich irgendwie unfair, da ja die unterschiedlichen Klangeigenschaften der Mikros ggf. unterschiedliche Mischungsverhältnisse, im Sinne der Verständlichkeit, erfordern. Mal abgesehen davon, dass ich den persönlichen Eindruck habe, dass der IT zur Sprache vielleicht so schon teils zu laut ist (vor allem, wenn man kein Bild dazu sieht), ist leider immer zu befürchten, dass der eine oder andere Fernseher mit "Raumklang"- oder "Musik"-Modus die Sprache noch weiter verschwinden lässt. Leider muss man das nämlich teils berücksichtigen, wenn man allzu dichte Mischungen herstellt.
Abgesehen davon wirken natürlich alle C-Beispiele unterschiedlich laut, da sie offensichtlich nach ihrem Spitzenpegel normalisiert sind.
Aber wir wollten ja das Mikrosignal bewerten, dazu habe ich ja schon meine Meinung geäußert ;)

Grüße, Björn
 
Vermutlich hätte ich tatsächlich alles auf etwa 0 dB auf dem RTW 1206 bringen und die Mischungen jeweils ein wenig an die Dichte des Mikrofonsignals anpassen sollen. Ist eben schwierig, sich zu überlegen, ob eine Vergleichbarkeit dadurch eher besser oder schlechter möglich ist. Tatsächlich hatte ich die erste Mischung mit der Aufnahme des TLM 103 gemacht und die anderen dann jeweils 1:1 ausgetauscht. Wenn das hier gewünscht wird, dann kann ich das ja noch mal machen. Obwohl ich vermute, dass die Unterschiede der verschiedenen Mikrofone doch ausreichend deutlich rausgekommen sind.

Übrigens: Das mit den Mischungsverhältnissen ist offensichtlich reine Geschmackssache. Neulich meinte jemand, dass er die Geräusche gerne noch lauter hätte. Das hängt sicher auch davon ab, wie laut jemand hört und wie gut seine Lautsprecher sind. Für mich steht die Sprachverständlichkeit an erster Stelle, so dass ich Musik und Atmo nicht zu laut machen werde. Vielleicht müsste ich mir echt mal noch ein paar ganz billige Lautsprecher kaufen. Ich höre meine Eigenproduktionen ausschließlich auf Geithain RL 940 (Schnittstudio) und RL 906 (Büro), und wenn ich selbst privat Radio und Fernsehen höre, dann auf Geithain MO 1 (Küche, Klo, Bad), MO 2 (Schlaf-Wohnzimmer) und RL 906 (Wohn-Wohnzimmer), so dass ich auch ganz gut beurteilen kann, wie die anderen das so machen.

Matthias
 
Hi Matthias,

Na da bin ich ja froh (und ein wenig stolz), dass meine Vermutungen (nur nach Anhören) bezüglich des Herstellungsprozesses auch der Realität entsprechen.

Sicherlich sind Mischungsverhältnisse auch immer Geschmackssache, allerdings handelt es sich beim Beispiel doch um einen Nachrichtenbeitrag und keine dramaturgische Spielfilmmischung. Daher liegt die eigentliche Information doch im Kommentar, und der sollte auch am Ende noch gut zu verstehen sein. Und spätestens am Ende spielt eben auch die Wiedergabesituation eine Rolle. Diese ist, bis auf THX-zertifizierte Kinos, leider nicht genormt! Also muss man sich automatisch damit befassen, anstatt sich darauf zu beschränken, dass im Studio (unter optimalen Bedingungen) alles toll geklungen hat.
Wenn wir mal vom Fernsehen ausgehen, dann kann ich nur empfehlen, mal die verschiedenen Audiomodi durchzugehen und sich anzuhören, was da aus verschiedenstem Material gemacht wird (besonders was das Verhältnis von Mono- und Stereoanteilen betrifft). Das sollte man dann ruhig mal mit verschiedenen Geräteherstellern machen, und leider sind die Werkseinstellungen häufig diesbezüglich nicht neutral und bei vielen Zuschauern aktiv :cry:. Also hier wird unser Ton definitiv verändert! Das soll gar keine Aufforderung dazu sein, dafür zu mischen (die Bandbreite ist ohnehin viel zu groß), allerdings kann man dies ja berücksichtigen ;) Und noch schlimmer wird das Ergebnis ggf., wenn vorher in der Sendeleitung evtl. noch Audioprozessing (ähnlich dem Hörfunk) stattgefunden hat. Vielleicht hat das dann nämlich Deine relativ dichte Mischung gänzlich vermurkst und zu Brei "gemastert" :mad:

Wie auch immer, all das (vor allem die Art der Herstellung) schreit förmlich danach, unter R128 Bedingungen erweitert zu werden, und zwar ganz puristisch vielleicht so:

1. die Sprachaufnahmen nur sauber schneiden, nicht klanglich bearbeiten, nur pegelmäßig nach R128 normalisieren (I-Messung des zu verwendenden Materials)
2. die hergestellte IT Mischung ebenfalls nach R128 normalisieren
3. eine Endmischung fertig stellen (mit dem bevorzugten Mikro), natürlich dann auch unter R128 Kriterien
4. nun, mit völlig identischen Pegeleinstellungen und -verläufen, zum Vergleich einfach nur die R128 normalisierten Sprachfiles austauschen

Nun würden wir wirklich hören, wie sich das pure Mikrosignal in der Mischung verhält. Da außerdem die Lautheitsbewertung, durch die k-Bewertung in der LUFS-Messung, evtl. Klangeigenschaften des Mikrosignals berücksichtigen würde, wäre das Ergebnis auch deshalb interessant.
Dann hätten wir gleich zwei Tests in einem, nämlich Mikrovergleich und R128 Praxistest. Vielleicht kommst Du ja dazu, wenn Dein TM3 geliefert wurde.

Viele Grüße, Björn
 
P.S.

Das soll übrigens nicht heißen, dass man künftig einfach alles nach R128 bewerten soll und zusammenklatschen und gut ist es. Mein Vorschlag adaptiert lediglich den Herstellungsprozess der bisherigen C-Files. Natürlich, Gott sei Dank und künftig vielleicht wieder viel mehr, spielen beim Mischen die Ohren die Hauptrolle! Denn gleiche Lautheit bedeutet lange noch nicht gleicher (guter) Klang, und Mischungsverhältnisse müssen natürlich hergestellt werden. Dafür ist es übrigens (unter R128 Kriterien) regelrecht befreiend, wenn man sich nicht schon die ganze Zeit an der Limiterschwelle bewegt, sondern Platz für (die ach so schlimmen) Spitzen hat. Somit hat dann nämlich eine zufallende Tür auch noch Platz und pumpt nicht alles andere herunter. Auch in der Musik haben dann Crescendi oder transientenreiche Signale die ihnen gebührende Berechtigung und müssen nicht plattgemacht und langweilig klingen! ;)
 
Genau alles das, was Du beschrieben hast, ist ja der Grund, warum die R 128 entwickelt und eingeführt wurde. Ich habe nur folgende Befürchtung: Im Internet werden sich nur die Sender daran halten und die Firmen, die auch für Sender produzieren. Die vielen anderen, die nur fürs Internet produzieren, gehen weiterhin bis an die technisch machbaren Grenzen, um so laut wie möglich zu sein. Ich sehe auch keine Möglichkeit, denen das zu verbieten, bzw. das irgendwie zu regulieren, weil es dafür keine rechtliche Grundlage gibt. Somit kann es passieren, dass einem dann irgendwann von Seiten der Auftraggeber aus der Nicht-Medienbranche vorgeworfen wird, dass der Ton zu leise sei...

Aber wir haben hier ja keinen R-128-Thread, sondern wollen klangliche Unterschiede von Mikrofonen diskutieren... :)

(falls dazu nichts mehr kommt, würde ich dann allmählich meine persönliche Meinung vom Stapel lassen)

Matthias
 
In Ordnung, mach mal ganz in Ruhe. Mir ist es lieber, die Leute sitzen zu Hause und hören auf guten Lautsprechern meine Stimme, anstatt in Kreuzberg Steine zu schmeißen... :)

(Das lässt in mir folgendes Bild reifen: Ich stelle mich morgen zwischen die Steineschmeißer und die Wasserwerfer und bitte darum, doch bitte erst mal ganz in Ruhe auf schönen Geithain-Lautsprechern die Sprachaufnahmen eines TLM 103, eines BCM 104 und eines M 930 zu vergleichen, bevor der Klassenkampf beginnt)

Matthias
 
Status
Für weitere Antworten geschlossen.
Zurück
Oben