Das Nyquist-Shannon-Abtasttheorem besagt, dass die Samplingfrequenz mehr als doppelt so groß sein muss, wie das zu übertragende Nutzsignal (um mathematisch eindeutig zu sein): Sample ich mit 48 kHz, kann ich knapp unter 24 kHz Nutzsignal übertragen.
Korrekt. Jeweils bei der halben Abtastrate bekommt man nicht mehr eindeutig einen Signalverlauf repräsentierende Samples. Oberhalb der halben Abtastrate bekommt man wieder "sinnvolle" Samples - nur ist das, was sie repräsentieren, an der halben Abtastrate gespiegelt. Im 48-kHz-System kommt ein Audiosignal von 25 kHz genauso raus wie eines von 23 kHz. Dass es umgekehrten "Drehsinn" hat, ist am Ende irrelevant und hilft nicht mehr bei der Verhinderung dieses Murkses.
Das kann man sich etwas wie den Stroboskop-Rand des Plattentellers eines Plattenspielers vorstellen. Die Blitzlampe ist die "Abtastung", sie "erhellt" (und macht für mich damit sichbar) den momentanen Stand der Punkte auf dem Tellerrand. Zum Abtast-Zeitpunkt beim Digitalisieren von Audio wird auch ein momentaner Stand "sichtbar" gemacht (gemessen): der des Amplitudenwertes zu diesem Zeitpunkt. Die vorbeilaufenden Punkte des Tellerrandes sind vergleichbar mit meinem Tonsignal, in diesem Fall mit einem Ton einer festen Frequenz (die Punkte haben ja auch immer gleiche Abstände und damit bei konstanter Drehzahl des Tellers gleiche "Erscheinungsfrequenz" am Ort der Blitzlampe). Dreht der Teller mit der korrekten Drehzahl, scheinen die Punkte an einem Ort fest zu stehen: es ist zum nächsten Blitz der Lampe halt immer der nächste oder immer der übernächste ... Punkt an der gleichen Stelle. Dreht der Teller etwas schneller, scheinen die Punkte vorwärts zu laufen, dreht der Teller etwas zu langsam, scheinen sie rückwärts zu laufen. Genau diesen Effekt (Umkehrung der Laufrichtung, aber gleiche "Laufgeschwindigkeit") hat man knapp unterhalb / knapp oberhalb der halben Abtastrate bei Digital Audio.
nach meinem Wissen - bei 15 kHz Nutzsignal gekappt
Ja, irgendwo da. In Mono könnte man weit höher gehen, bei Stereo kann man nicht so viel höher gehen, da bei 19 kHz der Pilotton kommt und das in AM übertragene Kanaldifferenzsignal (links minus rechts) ist auf einen Träger von 38 kHz aufmoduliert und macht damit Seitenbänder um 38 kHz mit der Breite der höchsten übertragenen Frequenz. Lässt man UKW NF-seitig bis 16 kHz gehen, kommt das untere Seitenband des Kanaldifferenzsignals von oben her schon bis zu 38 - 16 = 22 kHz runter. Damit hat man den 19-kHz-Pilotton noch mit 3 kHz Abstand nach unten (16 kHz) und nach oben (22 kHz). Das geht noch. Viel näher ran sollte man nicht, ob es klar definierte Grenzwerte gibt, weiß ich nicht.
Kritisch ist noch was anderes: die zur Rauschunterdrückung auf UKW von Anfang an genutzte Preemphasis (statische Höhenanhebung auf Senderseite) hat dank ihrer Zeitkonstante von 50 µs (außer Nordamerika, da ists mit 75 µs noch radikaler) schon bei 15 kHz
ca. 15 dB (!!!) Anhebung. Das mag in den 1950er Jahren noch halbwegs problemlos gewesen sein aufgrund der damaligen Produktionspraxis und Ästhetik (wars z.B. bei Sprache und Blechbläsern aber schon damals nicht, wie Literaturstellen zeigen), aber heutige Produktionen mit aggressivem Hochton-Energiegehalt fahren damit immer weiter in die Begrenzung. Da ist es sinnvoll, irgendwo zwischen 15 und 16 kHz dicht zu machen, statt vielleicht bis 17 oder gar 18 kHz zu gehen, sonst kommt man mit der Aussteuerung immer ungünstiger hin, weil die - am Ende kaum noch für irgendwen relevanten - obersten Höhen dank der Preemphasis für die Senderaussteuerung dominierend werden.
Angenommen, der weitere Übertragungskanal benötigt 48.000 Samples pro Sekunde
...was bei DAB+ normalerweise der Fall ist. Wenns nicht mit 48 kHz läuft, dann läufts mit 32 kHz (MDR Klassik beispielsweise), aber 44,1 kHz kenne ich nicht bei DAB+. Wage sogar zu behaupten, das steht nicht in der Spezifikation.
dann gibt es zwei Möglichkeiten: Entweder man spielt die Samples einfach schneller ab und verwirft damit im nachfolgenden Sampling Informationen (wenig zielführend) oder man rundet/glättet sinnvollerweise über die Zeit (bildet also über beachbarte Samples einen Mittelwert, so lange, bis die notwendige Anzahl an Samples zur Verfügung steht). Ansonsten kommt es irgendwann zu einem Pufferüberlauf, bei dem Samples entsorgt werden müssten, weil im Buffer einfach kein Platz mehr verfügbar ist. Auch dann dürfte das Ergebnis nicht gerade hörbar sein.
Deswegen haben "frei laufende" Digitalgeräte Abtastratenwandler an den Digitaleingängen. Die wandeln auch stur angelieferte 48 kHz in weiter zu verarbeitende 48 kHz um - halt einen minimalst um 48 kHz schwankenden Quelltakt in den geräteeigenen 48-kHz-Takt, der freilich auch wieder geringst schwankt (langzeitkonstant durch den verwendeten Quarz, dem ganzen dann noch der Taktjitter durch die verwendete Schaltung überlagert). Wirklich abweichende Quelltakte werden natürlich auch korrekt wie bei einem unendlich feinen "Automatikgetriebe" umgewandelt. Diese Abtastratenwandler sind in ihrer Arbeit normalerweise "unhörbar", auch bei zigfacher Kaskadierung. Dazu muss man aber ein wenig Headroom lassen, Aussteuerung bis 0 dBFS könnte zu Problemen führen. Auch deswegen gibt es ja seit Jahren die Spitzenpegelmessung nach TruePeak, die sagt einem dann recht verlässlich, wenns zuviel ist.
Abtastratenwandler kosten fast nichts mehr. Selbst die späteren MiniDics-Recorder von Sony hatten sowas hinter den Digitaleingängen - sie mussten ja zwangsweise auf 44,1 kHz wandeln.
Aber die Mathematik ist in diesem Bereich halt doch recht eindeutig.
Die ist - wie bei Mathematik üblich - absolut eindeutig. Und führt deshalb bei Missachtung des Shannon/Nyquist-Theorems eindeutig zu uneindeutigem Ausgabesignal.
Anbei noch bissl Fun mit Audiosignal vs. Abtastrate. Das File enthält links und rechts jeweils knapp 12 kHz (genau 11,9999 kHz) Sinus mit -6 dBFS Spitzenpegel bei 48 kHz Abtastrate. Für mehr Spaß habe ich beide Kanäle nur um 45° gegeneinander verschoben.
Wer das abspielt und eine analog arbeitende Pegelanzeige hat, sollte in beiden Kanälen konstant -6 dBFS angezeigt bekommen. Da kommt wirklich Festpegel raus. Wer das bitgenau via S/PDIF oder AES-3 auf eine Senke mit sample-based-Spitzenpegelanzeige (z.B. DAT-Recorder) abspielt, bekommt eine "Party-Anzeige". Das gleiche sollte in Audiosoftware passieren beim Abspielen, es sei denn, deren Pegelanzeige ist nicht sample-based. Trotzdem ists immer noch Festpegel. Die Schwankungen auf der Pegelanzeige sind ein Artefakt der Abtastung und ein Beweis dafür, dass sample-based-Anzeigen bei synthetischen Signalen nichts taugen.
Damit kann man Menschen in die Verzweiflung treiben, dabei ists nur bissl Spielerei mit digitalen Signalen. Der Quatsch sieht übrigens auch auf Stereosichtgeräten u.U. sehr schön aus.
Vorsicht! 12 kHz hören manche schon nicht mehr, das Signal nimmt darauf aber keine Rücksicht, es ist vorhanden und grillt / killt bei zu hoher Abhörlautstärke ("kommt doch nichts...") die Hochtöner. Ich übernehme keinerlei Haftung. Also: leise oder stumm abspielen - ist eh nur ein Pfeifen.