Beispiel:
Ich gebe ein: Künstler X, Künster Y, Band X, Titel XY, TITEL XYZ - Und bekomme eine Übersicht der Sender die diese Künstler und Titel in den letzten Tagen gespielt haben.
Stelle ich mir nicht so einfach vor. Die meisten Sender stellen auf ihrer Homepage vielleicht die letzten 3, 10 oder 20 gespielten Titel dar. Das müsste regelmäßig abgefragt / ausgelesen und gespeichert werden.
Rechenbeispiel: 100 Sender, 15 Einträge / Stunde, 3 Tage Speicherzeit.
Das sind 3 Tage * 24 Stunden = 72 Stunden * 15 Einträge pro Sender = 1.080 Einträge je Sender auf 3 Tage. Bei nur 100 beobachteten Sendern komme ich so auf 108.000 Datenbankeinträge, bestehend aus Sendername, Titel, Interpret, Timestamp.
Das Beispiel lässt sich beliebig erweitern: 7 Tage Speicherzeit machen bei 100 Sendern 252.000 Datenbankeinträge.
Gehen wir von 500 beobachteten Sendern aus, sind das in 3 Tagen 540.000 Einträge und in 7 Tagen 1,26 Mio. Datenbankeinträge. Hoppla!
Gehen wir gar von den von Dir ins Spiel gebrachten 15.001 Sendern aus - wo auch immer die Zahl herkommt - sind wir bei
5.400.360 Datenbankeinträgen pro Tag; bitte mit dem Faktor "gewünschte Speicherdauer" multiplizieren.
Dabei ist der Traffic, alle Sender regelmäßig abzufragen, noch gar nicht berücksichtigt.
Jetzt kommen die Fallen:
- Selbst innerhalb der Sender kommt es - je nach Moderator - zu fehlerhaften und unterschiedlichen Schreibweisen von Titel und Interpret. Auch die so genannten Auto-DJs sind nicht frei von fehlerhaften Tags.
Eine Gruppierung auf dieser Ebene kann zu erheblichen Abweichungen führen.
- Hinzu kommt, dass nicht alle Stationen eine einheitliche Kennung aussenden. Leider sind nicht alle sauber programmiert bzw. gestehen es ihren Moderatoren zu, je Format eine abweichende Stationskennung auszusenden. Gruppierst Du also Titel oder Interpret und Stationskennung / -name, findet sich der Sender im Häufigkeitsranking weiter unten.
- Bei der Zahl 15 Titel / Stunde bin ich jetzt von reiner Musik ausgegangen. Aber nicht jeder Sender beschränkt sich nur auf die Musikanzeige; da laufen Tags für Drops, Jingles, Trailer, Nachrichten und Werbung ungefiltert mit in die Playlist. Demzufolge ist die Zahl der zu sammelnden Datenbankeinträge vermutlich höher als 15 und ein Teil davon ist schlichtweg Müll.
Bei tunein hat man das wohl über "kaufbare Titel" gefiltert. Geht aber nur bei einwandfeien ID-Tags, siehe 1.
Führt bei verschiedenen getesteten Sendern zu sehr unterschiedlichen Ergebnissen (von 0 -100% ist alles dabei).
- Dann gibt es noch diejenigen, die sehr aktiv gegen Streamripper arbeiten. Da wird Dir zwar der Titel angezeigt, aber nach 2 Minuten erscheint automatisch die Stationskennung, auch wenn der Titel noch läuft. Oder, noch gemeiner (wenn auch gut für den Sender): Stationskennung und aktuell gespielter Titel werden minütlich ausgetauscht. Spätestens jetzt bin ich bei 59 Einträgen pro Stunde und die Gruppierung nach der Häufigkeit des gespielten Titels ist völlig für die Füße.
Technisch ist das sicher realisierbar. Aber ganz so einfach ist das nicht mal so nebenbei am Leben zu erhalten.