Unfassbar sympathischer Typ. Er kann sich richtig gut bedanken! Das ist ein Skill, der meiner Meinung nach zu selten ist. Vielen Dank für diesen wunderbar informativen und gleichzeitig unterhaltsamen Vortrag! ❤
Jan Kuhlmann war damals bei N-Joy mein Lieblingsmoderator, vorallem, weil er in seinen Shows echt breit gefächert war und es da ziemlich viele kleine Schätze zu hören gab…
Die Frage mit dem Radiowecker (43:35) fühle ich. Es kommt vielleicht nicht immer derselbe Song zur selben Zeit, aber es sind die selben 5 Songs die jeden Morgen laufen (zumindest auf 1Live). :D
In dem Monat vor Weihnachten (24.11.-24.12.) hättest Du um 06:45 tatsächlich fünf Mal Nina Chuba's "Fata Morganga" gehört und zweimal Bruno Mars/Rosé APT. Wenn Du mir Deine Weckerzeit nennst, kann ich Dir die Statistik personalisieren. ;)
Spannendes Video. Habe tatsächlich nachdem ich damals das DB Video von David Kriesel gesehen habe genau das selbe gemacht. Habe das mit allen Antenne Sendern gemacht und bin da auch zu spannenden Ergebnissen gekommen.
Danke, dass das auch jemanden auffällt. Habe den seit Ende 2022 und bin sehr zufrieden damit. Auch wenn ich zugeben muss, dass für mich zu Beginn das wichtigste Feature war, dass ich auf beiden Seiten des Laptops mit USB-C laden konnte.
MEGA spannendes Thema! Ich habe das Gefühl dass ich innerlich vorhersagen kann welcher Song als nächstes nach dem aktuellen kommen wird. Es wäre interessant das zu filtern ob gewisse Songs (auf einem Sender) immer nacheinander laufen...
Die meisten Sender achten darauf, nicht "vorhersagbar" zu sein, weil sie sich sonst wie eine zu oft gehörte Compiliation anhören. Da aber einige Lieder gerne gespielt werden UND gut nacheinander passen, gibt es einige Kombinationen häufiger als andere. Die Gesamtmenge habe ich als Liste präsentiert (und die Songliste auf meine Webseite gestellt).
Hallo @@StefanMagerstedt, danke für den tollen Vortrag. Du sprichst davon, dass du ähnliche Titel mit dem Hamming-Abstand erkannt hast. Meines Wissens sollte das die Levenshtein-Distanz sein, also die Anzahl an Operationen (Buchstaben ändern/hinzufügen/entfernen), sodass man den gleichen Text herausbekommt. Der Hamming-Abstand ist wiederum die Anzahl an unterschiedlichen Bits in zwei binären Codes. Also 000 und 101 hätten den Hamming-Abstand 2. Viele Grüße
Super Talk. Danke. Das mit dem Betriebsgeheimnis ist natürlich Quatsch. Es gibt sogar Anbieter die genau das was du gemacht hast an die Radiosender verkaufen für die Musikrecherche.
Bei den BPM wird allerdings vernachlässigt, dass moderne Musikproduktionen mit double-time arbeiten in der Produktion. Also ein Song, der gefühlt 80 BPM hat, wird in 160 BPM programmiert und das verzerrt die Statistik, falls der BPM counter es nicht versteht, dass es ein double-time beat ist.
was genau soll das bringen? doppelt so hohe Auflösung des Grids? Wenn ja, und man dann aber doch nur auf jede 8te Note ne Kick haut, dann ist es im Grunde ja wieder die halbe Geschwindigkeit und sollte auch so erkannt werden. Oder kannst du das irgendwie genauer ausführen?
Das hast Du tatsächlich sehr gut bemerkt. Die Songs mit potentiell zwei unterschiedliche valide BPMs habe ich auch testweise aus dem Datensatz mal entfernt, der gezeigte (grafische) Anstieg war aber ähnlich. Daher konnte ich einen einfachen Datenfehler ausschließen, die generelle Geschwindigkeit scheint sich banal erhöht zu haben - zumindest nach meinen Daten und meiner Interpretation. :)
Definitiv sehr interessant, und korreliert mit meinen eigenen Beobachtungen. Insbesondere bezüglich den Charts. Ich höre meist englische Radiosender aus aller Welt, sei es Australien, Malta oder USA. Da bekommt man die durchaus neusten Lieder mit. Und da ist es mir nämlich sehr oft aufgefallen: Wenn ich (eher selten) mal ein deutschen Radiosender höre(n muss), dann höre ich dort Lieder, die ich vor 2 Wochen oder teilweise einem Monat bereits in den ausländischen Radiosendern gehört habe. Teilweise liefen die auf und ab, und waren bereits fast wieder uninteressant. Bestes Beispiel: Blinding Lights von the Weeknd. Kannte ich bereits ca 3 Wochen, und dann zufällig mal in einem deutschen Radio gehört, dass es gerade so neu ist, frisch in den Charts etc. Warum die erwähnten Musikredaktionen so hinterherhinken, wäre mal interessant, bzw warum Musikredaktionen anderer Sender das nicht sind Nur mir war bisher nicht klar, wer denn nun am Ende zuerst da war, Henne ( Charts ) oder Ei ( Radiosender ) Also wieder was gelernt, es sind tatsächlich die Radiosender, die so langsam sind. Allgemein sehr interessant, damit kann ich einen Punkt auf meiner Liste streichen, was ich mal machen wollte. Für mich wäre dann noch interessant, allgemein (ohne Bezug aufs Radio) wie und OB die deutschen Charts im Vergleich zu weltweit oder anderen Ländern "verzögert sind, und auch wie schnell manche Lieder in die Charts einsteigen nach den Release... übrigens Daumen hoch für Firefox, und "vernünftiger Browser" im selben Moment. Stoppt den Chrome-Wahnsinn 😃
Musiklabel haben einen großen Einfluss darauf, indem sie den Radiostationen das schicken, was sie bewerben wollen. Landet in der Musikredaktion. War früher natürlich stärker ausgeprägt, könnte mir aber vorstellen, dass bestimmte Märkte eben erst später starten.
@@Deppenradar hm, valider Punkt. Ist natürlich schade, dass sich die Musikredaktionen so abhängig machen, und somit keinerlei nicht-Mainstream Musik "zum Zuge" kommt. Gibt so einiges, was auch für "Normalohren" hörbar ist, aber kaum oder gar nicht im Radio läuft. Und wenn, dann meist in kleineren Radios oder eben Internetradios.
Krass wieviel Arbeit da rein fällt bei den Sendern. Keine Wiederholung innerhalb der nächsten x Minuten Zumindest morgens rotations über Wochen Saisonale Rotations Bestimmte Songs werden nur angespielt ... Beeindruckend.
Ich habe keine Ahnung davon. Aber liebe jeden Vortrag zu Mining. Wäre noch interessant gewesen, welcher Radio-Moderator, welche Songs am liebsten spielt.
Ich habe auch mal bei meinem lokalen Radiosender angefragt ob sie noch die Playlisten der Musik meiner Kindheit haben weil ich damals viel Radio gehört habe... Aussage war nein das wären viel zu viel Datenmüll denn sie würden nur die letzten zwei Wochen speichern😢😮
Super Vortrag. Ich muss auf Arbeit jeden Tag 9h (8h wenn ich in der Pause die Halle verlasse) Radio hören hab aber dennoch freie Auswahl was an ist. Hatte ich es richtig Verstanden das ich Dir eine eMail schicken kann und Du eine Liste aus den Daten erstellen kannst mit einem Ranking aller Sender machen kannst mit: Spielt am wenigsten Doppelt bis Spielt am häufigsten doppelt Aktuell ist es so das ich ca. 6-7 Sender habe und die jeden Tag rotiere. Aber nicht die Perfekte Lösung.
Du kannst mir gerne eine Mail mit konkreten Fragen stellen, die ich mithilfe der Daten beantworten kann. Ich habe aber nicht *alle* Sender und die Werte sind Durchschnittswerte. Für die Wiederholungen musst Du Dir überlegen, ob Du eher "insgesamt" in der Woche mehr Abwechslung haben willst (aber trotzdem Wiederholungen enthalten sind) oder ob Du zwar weniger Abwechslung, dafür aber seltenere Wiederholungen willst.
Danke, das ist ja quasi ein Ritterschlag. :) Ich habe mit David nach dem BahnMining-Vortrag über dieses Thema gesprochen. Durch ihn hat das Thema Data Mining Interesse bei einer breiten Masse gewecket, wodurch es einfacher wurde, das zu platzieren. Da ich kein Data Scientist bin, kann ich mich aber nicht wirklich mit ihm konkurrieren. :)
@@StefanMagerstedtKann ich auch nur bestätigen. Bin aktuell zwar erst bei einem Viertel aber ich hab mich auch sehr an die super unterhaltsamen Vorträge von David erinnert gefühlt. Toll gemacht 👍🏼
Ich brauche im Flur eine Lampe die ziemlich exakt das momentane Außenlicht genau so wie Sonne oder Mond darstellen kann. Geht das? Das muss auch bei Sonnenuntergang und Aufgang exakt sein
mich hätte interessiert ob die daten dazu geeignet gewesen wären um den Einfluss der labels/produzenten zu veranschaulichen, bzw. ob songs gepusht wurden, obs bestimmte kickoff zeiten für songs gab ab denen es plötzlich in allen radios lief usw.
Radiosender sind zur Aufzeichnung ihres Programms verpflichtet. Auf irgend einem Server liegt bei jedem Sender der vollständige Mitschnitt des Programms über lange Zeiträume.
Könnte man nicht auch berechnen wie viel Musik zeitlich überhaupt gespielt wird. Die reine Anzahl an abgespielten Songs ist aufgrund der Songlänge ja nicht unbedingt repräsentativ? Es könnte ja sein, dass sich Songs seltener wiederholen weil generell weniger Musik gespielt wird und man stattdessen mit Werbung verköstigt wird.
Schwer. Ob Lieder vorzeitig abgewürgt oder voll ausgespielt werden geht aus den Daten ja i.d.R. nicht hervor. Manchmal ist noch nicht mal dokumentiert, welche Version eines Lieds gespielt wird (von manchen Liedern gibt's ja beispielsweise eine "Radio Edit"-Version)...
Es gibt nur wenige große Medienagenturen, die den Markt beherrschen und alle Sender gleich beraten. Dazu der Einfluss der großen Musikverlage, die Cashback geben, wenn ihre Lieder bevorzugt in die Rotation gehen...
ma 2024 Audio II (kann hier leider keinen Link posten, Du kannst aber danach suchen). Zitat: "Fast 53 Millionen der deutschsprachigen Bevölkerung ab 14 Jahren nutzen von Montag bis Freitag mindestens ein Audioangebot, unabhängig von seinem Empfangsweg." und "Die Tagesreichweite (Mo-Fr) liegt bei 73,9 Prozent". Die Aussage von statista ist übrigens 32 Millionen täglich, nicht Prozent. statista nutzt dieselbe Quelle, ich weiß allerdings nicht, woher sie diese Zahl genommen haben, in den Zusammenfassungen der Studie steht diese Zahl nicht und die werktägliche Nutzung ist mit 53 Millionen deutlich höher, immerhin weist auch statista korrekt die 73,9% aus.
Bei der Zahl 74% bin ich auch direkt hängen geblieben, das klingt sehr unrealistisch. Zunächst schon mal merkwürdig, dass von Deutschen Bundesbürgern die Rede ist. Also werden anscheinend die ca. 13 Mio. Menschen ohne deutsche Staatsangehörigkeit ignoriert, die in Deutschland leben. Dann frage ich mich, wie genau dieses Radio Hören definiert ist. Reicht es, wenn ich an einer Baustelle vorbeigehe und ein paar Fetzen mitbekomme? Reicht es, wenn ich während der Lohnarbeit damit beschallt werde, oder als Säugling/Kleinkind mithöre, oder als desorientierte Seniorin im Pflegeheim? Oder muss ich mich selbst auch dazu entschieden haben zu hören, was ich höre?
kann außerdem ByteFM sehr empfehlen. Keine Werbung, spendenfinanziert, keine Chartmusik, sondern aus allen möglichen (obskuren) Genres von Psychedelic Rock, über Techno und Jazz bis Drum n Bass alles dabei. Mit interessanten Hintergrundinfos zu den Interpreten und Labels sowie Release-Informationen (wann kommt der Song wo und auf welchem Medium raus)
SWR3 - Wir sind die Cantina-Band, wir spielen den selben Song nach ~120 Minuten nochmal! Was ein Schrott-Sender :D Ich hätte 3-4h getippt, aber 2h .... joaaah.
Wunderschöner Vortrag, aber irgendwie etwas... technisch lost? Warum sollte man sich die Mühe machen, das alles mit bash Tools zu parsen? Wenn man das in jeder Programmiersprache macht, ist es strukturierter und besser anzupassen.
Ist doch Wurst wie man es macht wenn am Ende das Ergebnis stimmt. Es kommt immer einer des Weges und sagt "aber das geht doch effektiver" (zumindest in Deutschland) 😂
Hallo, danke für das nette Feedback. Für das Scraping selbst kann man auch versuchen mit XPath und ähnlichen Vorgehensweisen an die Daten zu kommen. Aber dadurch muss man vergleichsweise lange dafür arbeiten, bis die Daten sauber herauskommen. Und kleinere Änderungen oder Fehler in den Webseiten (die häufig auftreten) führen dann zu ständigen Änderungen an den vergleichsweise komplexen Skripten. Daher habe ich diese alle eingestampft und habe die "iterative" Vorgehensweise mit grep, sed und ein paar weiteren Tools gewählt. Wenn JSON verfügbar war, hat mir übrigens jq am meisten geholfen. Für die Stabilität und Portierbarkeit der Skripte war übrigens bash entscheidend, ich habe zwar gegen Ende nur noch wenige Server genutzt, aber in der Hochphase unterschiedliche Architekturen/Plattformen. Da sind schon Unterschiede in z.B. Python-Versionen oder Libraries leider katastrophal für einen stabilen Datenbestand. Und nicht zuletzt galt für mich auch hier, dass für eine "einfache Aufgabe" auch bash-Skripte schon reichen können - warum also größere Geschützt auffahren, wenn es auch einfach geht? :)
@@StefanMagerstedt Hi, vielleicht gehe ich einfach etwas anders an die Sache an, ich hätte jegliche regex oder JSON parsen Logik lieber in Javascript/Python gemacht, das wäre meiner Meinung nach deutlich übersichtlicher und einfacher, die Daten zu säubern. Verschiedene Python-Versionen können natürlich ärgerlich sein, das passiert mit Node.js o. Ä. nicht so häufig, ich hätte vermutlich ein Docker Image gebaut, das ich überall draufschmeißen kann und es fängt sofort an zu sammeln, egal wo. Am Ende haben wohl die Kommentatoren recht, das beste Tool ist, dass das man beherrscht, ich finde bash tools werden schnell furchtbar fehleranfällig und unübersichtlich, aber wenn man damit umzugehen weiß, oder vielleicht damit besser umgehen kann, als mit anderen sprachen, ist es vermutlich besser bash zu benutzen.
Ich habe den Sender selbst nie gehört und daher "nur" die Playliste auf der Webseite abgegriffen. In meinen Daten habe ich die Einträge verkürzt nur mit "planet" abgespeichert. Da sehr viele Sender sich "Radio XXX" nennen (wie bei Radio FFH, denn radio planet gehört zur ffh-mediengruppe), kommt dieser Versprecher leider zustande. Also: Sorry für diese Ungenauigkeit.
Das BESTE an all den Daten: Ich kenne nur EINEN der Songs, die erwähnt wurden un dden hasse ich. Rick Astley, Never gonna give you up. Den Rest habe ich noch NIE gehört... man merkt: Ich streame seit gut 5 Jahren ausschließlich und nur noch, was ich wirklich hören will.
Wissenschaftlich sicherlich nicht das anspruchsvollste, ALLERDINGS ist es sehr unterhaltsam vorgetragen und man hat vor allem beim Q&A gemerkt, wie intensiv er sich mit den Daten bzgl. Deutung und Korrektheit auseinander gesetzt hat. Im Anfangsteil haben sicherlich viele nicht viel neues gelernt, aber es ist doch auch schön, wenn auch weniger fachkundige Menschen erfahren können, wie man so etwas eigentlich macht
„Haben wir noch Daten? Zwei noch?“ - hat mich gekillt :D Danke!
Wer hat die letzten genommen?
Nix mehr?
@@QemeH gar nichts mehr?
Danke - hast Du Dir auch die anderen Easter Egg Überschriften angeschaut? Habe während des Vortrags nicht mehr alle individuell angesagt.
@@StefanMagerstedt ich wollte nicht alle aufschreiben, aber ja :D da hattest du aber auch einen Lauf... :D
Finde diese Big Data Mining Vorträge echt mit das beste immer bei den Kongressen. 😂
Ja ich vermisse echt den David Kriesel, seine Vorträge waren legendär, hoffe er kommt irgendwann mal wieder.
@@TodayTestfbsfbsfbs safe!
Cool. Klare "Aufgabenstellung", gut erklärt wie er sich das gedacht hat. Viel Humor und authentisch rübergebracht
Ein wirklich amüsanter und interessanter Vortag! Und jetzt weiß ich endlich wann "Last Christmas" vermieden werden kann 🤣 Danke dir!
Mega sympathischer Typ und cooler Vortrag! Freu mich schon auf weitere Vorträge von ihm 👍
Unfassbar sympathischer Typ. Er kann sich richtig gut bedanken! Das ist ein Skill, der meiner Meinung nach zu selten ist.
Vielen Dank für diesen wunderbar informativen und gleichzeitig unterhaltsamen Vortrag! ❤
Einfach genialer Vortrag. Selten so eine Kombination aus Inhalt und Humor erlebt :)
Jan Kuhlmann war damals bei N-Joy mein Lieblingsmoderator, vorallem, weil er in seinen Shows echt breit gefächert war und es da ziemlich viele kleine Schätze zu hören gab…
Die Frage mit dem Radiowecker (43:35) fühle ich. Es kommt vielleicht nicht immer derselbe Song zur selben Zeit, aber es sind die selben 5 Songs die jeden Morgen laufen (zumindest auf 1Live). :D
In dem Monat vor Weihnachten (24.11.-24.12.) hättest Du um 06:45 tatsächlich fünf Mal Nina Chuba's "Fata Morganga" gehört und zweimal Bruno Mars/Rosé APT. Wenn Du mir Deine Weckerzeit nennst, kann ich Dir die Statistik personalisieren. ;)
Sehr cooler Vortrag und klasse Typ!
Klasse Vortrag, und räumt auch mit dem einen oder anderen Mythos auf. Sehr gut, Danke.
Das PULS so abwechslungsreich ist kann ich bestätigen. Ganz netter Sender!
dass
@ danke mein geliebter bruder!
@Tobeei aber gern brudi
Spannendes Video. Habe tatsächlich nachdem ich damals das DB Video von David Kriesel gesehen habe genau das selbe gemacht. Habe das mit allen Antenne Sendern gemacht und bin da auch zu spannenden Ergebnissen gekommen.
Super vorgetragen, für Profis interessant und wahrscheinlich auch für Laien verständlich!
Sehr schön bei einem Vortragenden mal ein Framework Laptop zu sehen.
+1 besitze selbst einen Framework 16 - tolles teil
+1 auch sehr zufrieden - schön, dass das Gerät seine Zielgruppe findet!
Danke, dass das auch jemanden auffällt. Habe den seit Ende 2022 und bin sehr zufrieden damit. Auch wenn ich zugeben muss, dass für mich zu Beginn das wichtigste Feature war, dass ich auf beiden Seiten des Laptops mit USB-C laden konnte.
Nice, wollte grad genau das kommentieren!
Aber auf dem Congress mit einem Windows drauf ... mega fail!
Sehr sympathischer Typ, das hat richtig Spaß gemacht
MEGA spannendes Thema! Ich habe das Gefühl dass ich innerlich vorhersagen kann welcher Song als nächstes nach dem aktuellen kommen wird. Es wäre interessant das zu filtern ob gewisse Songs (auf einem Sender) immer nacheinander laufen...
Die meisten Sender achten darauf, nicht "vorhersagbar" zu sein, weil sie sich sonst wie eine zu oft gehörte Compiliation anhören. Da aber einige Lieder gerne gespielt werden UND gut nacheinander passen, gibt es einige Kombinationen häufiger als andere. Die Gesamtmenge habe ich als Liste präsentiert (und die Songliste auf meine Webseite gestellt).
Klasse Vortrag, hat richtig Spaß gemacht. Danke!
Hallo @@StefanMagerstedt,
danke für den tollen Vortrag.
Du sprichst davon, dass du ähnliche Titel mit dem Hamming-Abstand erkannt hast. Meines Wissens sollte das die Levenshtein-Distanz sein, also die Anzahl an Operationen (Buchstaben ändern/hinzufügen/entfernen), sodass man den gleichen Text herausbekommt.
Der Hamming-Abstand ist wiederum die Anzahl an unterschiedlichen Bits in zwei binären Codes. Also 000 und 101 hätten den Hamming-Abstand 2.
Viele Grüße
Super Talk. Danke. Das mit dem Betriebsgeheimnis ist natürlich Quatsch. Es gibt sogar Anbieter die genau das was du gemacht hast an die Radiosender verkaufen für die Musikrecherche.
Bei den BPM wird allerdings vernachlässigt, dass moderne Musikproduktionen mit double-time arbeiten in der Produktion. Also ein Song, der gefühlt 80 BPM hat, wird in 160 BPM programmiert und das verzerrt die Statistik, falls der BPM counter es nicht versteht, dass es ein double-time beat ist.
was genau soll das bringen? doppelt so hohe Auflösung des Grids?
Wenn ja, und man dann aber doch nur auf jede 8te Note ne Kick haut, dann ist es im Grunde ja wieder die halbe Geschwindigkeit und sollte auch so erkannt werden.
Oder kannst du das irgendwie genauer ausführen?
Das hast Du tatsächlich sehr gut bemerkt. Die Songs mit potentiell zwei unterschiedliche valide BPMs habe ich auch testweise aus dem Datensatz mal entfernt, der gezeigte (grafische) Anstieg war aber ähnlich. Daher konnte ich einen einfachen Datenfehler ausschließen, die generelle Geschwindigkeit scheint sich banal erhöht zu haben - zumindest nach meinen Daten und meiner Interpretation. :)
Klasse Talk, danke dafür!
24:33 ICH HABE ES IMMER GEWUSST!!!
Definitiv sehr interessant, und korreliert mit meinen eigenen Beobachtungen. Insbesondere bezüglich den Charts.
Ich höre meist englische Radiosender aus aller Welt, sei es Australien, Malta oder USA. Da bekommt man die durchaus neusten Lieder mit.
Und da ist es mir nämlich sehr oft aufgefallen: Wenn ich (eher selten) mal ein deutschen Radiosender höre(n muss), dann höre ich dort Lieder, die ich vor 2 Wochen oder teilweise einem Monat bereits in den ausländischen Radiosendern gehört habe. Teilweise liefen die auf und ab, und waren bereits fast wieder uninteressant.
Bestes Beispiel: Blinding Lights von the Weeknd. Kannte ich bereits ca 3 Wochen, und dann zufällig mal in einem deutschen Radio gehört, dass es gerade so neu ist, frisch in den Charts etc.
Warum die erwähnten Musikredaktionen so hinterherhinken, wäre mal interessant, bzw warum Musikredaktionen anderer Sender das nicht sind
Nur mir war bisher nicht klar, wer denn nun am Ende zuerst da war, Henne ( Charts ) oder Ei ( Radiosender )
Also wieder was gelernt, es sind tatsächlich die Radiosender, die so langsam sind.
Allgemein sehr interessant, damit kann ich einen Punkt auf meiner Liste streichen, was ich mal machen wollte.
Für mich wäre dann noch interessant, allgemein (ohne Bezug aufs Radio) wie und OB die deutschen Charts im Vergleich zu weltweit oder anderen Ländern "verzögert sind, und auch wie schnell manche Lieder in die Charts einsteigen nach den Release...
übrigens Daumen hoch für Firefox, und "vernünftiger Browser" im selben Moment. Stoppt den Chrome-Wahnsinn 😃
Musiklabel haben einen großen Einfluss darauf, indem sie den Radiostationen das schicken, was sie bewerben wollen. Landet in der Musikredaktion. War früher natürlich stärker ausgeprägt, könnte mir aber vorstellen, dass bestimmte Märkte eben erst später starten.
@@Deppenradar hm, valider Punkt. Ist natürlich schade, dass sich die Musikredaktionen so abhängig machen, und somit keinerlei nicht-Mainstream Musik "zum Zuge" kommt.
Gibt so einiges, was auch für "Normalohren" hörbar ist, aber kaum oder gar nicht im Radio läuft. Und wenn, dann meist in kleineren Radios oder eben Internetradios.
Krass wieviel Arbeit da rein fällt bei den Sendern.
Keine Wiederholung innerhalb der nächsten x Minuten
Zumindest morgens rotations über Wochen
Saisonale Rotations
Bestimmte Songs werden nur angespielt
...
Beeindruckend.
Arbeit? Sowas programmiert man doch eigentlich nur einmal und dann stellt man sich als Sender nur noch die Parameter ein.
super spannend. Weils gleich am Anfang im Beispiel war: SNAP war mein meist gehörter Song 2024 bei mir.
Super Vortrag!
Auf die Frage zu Last Christmas: Bayern 3 hat das beispielsweise schon mal am 18.10. gespielt, habe ich ein Beweisfoto von :)
MDR Jump spielt den jedes Jahr am 24. Juni. Ja, genau 6 Monate vor und nach Weihnachten :D
Ich habe keine Ahnung davon. Aber liebe jeden Vortrag zu Mining. Wäre noch interessant gewesen, welcher Radio-Moderator, welche Songs am liebsten spielt.
Ich habe auch mal bei meinem lokalen Radiosender angefragt ob sie noch die Playlisten der Musik meiner Kindheit haben weil ich damals viel Radio gehört habe... Aussage war nein das wären viel zu viel Datenmüll denn sie würden nur die letzten zwei Wochen speichern😢😮
Super Vortrag.
Ich muss auf Arbeit jeden Tag 9h (8h wenn ich in der Pause die Halle verlasse) Radio hören hab aber dennoch freie Auswahl was an ist.
Hatte ich es richtig Verstanden das ich Dir eine eMail schicken kann und Du eine Liste aus den Daten erstellen kannst mit einem Ranking aller Sender machen kannst mit:
Spielt am wenigsten Doppelt bis Spielt am häufigsten doppelt
Aktuell ist es so das ich ca. 6-7 Sender habe und die jeden Tag rotiere. Aber nicht die Perfekte Lösung.
Du kannst mir gerne eine Mail mit konkreten Fragen stellen, die ich mithilfe der Daten beantworten kann. Ich habe aber nicht *alle* Sender und die Werte sind Durchschnittswerte. Für die Wiederholungen musst Du Dir überlegen, ob Du eher "insgesamt" in der Woche mehr Abwechslung haben willst (aber trotzdem Wiederholungen enthalten sind) oder ob Du zwar weniger Abwechslung, dafür aber seltenere Wiederholungen willst.
Wäre auch an ner Schule cool der Vortrag!
Sehr spannend, kann David Kriesel fast Konkurrenz machen ;)
Was macht der eigentlich inzwischen? Er war einer der besten Referenten, die ich je gesehen habe :)
Ich dachte beim Titel, hat David wieder mal zugeschlagen? :D
Danke, das ist ja quasi ein Ritterschlag. :) Ich habe mit David nach dem BahnMining-Vortrag über dieses Thema gesprochen. Durch ihn hat das Thema Data Mining Interesse bei einer breiten Masse gewecket, wodurch es einfacher wurde, das zu platzieren. Da ich kein Data Scientist bin, kann ich mich aber nicht wirklich mit ihm konkurrieren. :)
@@StefanMagerstedt aber trotzdem einen Super-Vortrag über ein spannendes Thema gestaltet, und das mit sehr gutem Humor :) gerne mehr!
@@StefanMagerstedtKann ich auch nur bestätigen. Bin aktuell zwar erst bei einem Viertel aber ich hab mich auch sehr an die super unterhaltsamen Vorträge von David erinnert gefühlt. Toll gemacht 👍🏼
Übelst gut :)
Ich brauche im Flur eine Lampe die ziemlich exakt das momentane Außenlicht genau so wie Sonne oder Mond darstellen kann. Geht das? Das muss auch bei Sonnenuntergang und Aufgang exakt sein
mich hätte interessiert ob die daten dazu geeignet gewesen wären um den Einfluss der labels/produzenten zu veranschaulichen, bzw. ob songs gepusht wurden, obs bestimmte kickoff zeiten für songs gab ab denen es plötzlich in allen radios lief usw.
Passend zum Thema Musik: Kann mir jmd. den Namen der Musik nennen die im Intro läuft, also ab 0:00. Danke (:
Die ist, wie auch alle Intros, eigens dafür produziert.
Radiosender sind zur Aufzeichnung ihres Programms verpflichtet. Auf irgend einem Server liegt bei jedem Sender der vollständige Mitschnitt des Programms über lange Zeiträume.
Geil. Dudelfunk ausgedribbelt. Gibt schon Gründe, eher byteFM oder DLF zu hören.
Geile Arbeit
Könnte man nicht auch berechnen wie viel Musik zeitlich überhaupt gespielt wird. Die reine Anzahl an abgespielten Songs ist aufgrund der Songlänge ja nicht unbedingt repräsentativ? Es könnte ja sein, dass sich Songs seltener wiederholen weil generell weniger Musik gespielt wird und man stattdessen mit Werbung verköstigt wird.
Schwer. Ob Lieder vorzeitig abgewürgt oder voll ausgespielt werden geht aus den Daten ja i.d.R. nicht hervor. Manchmal ist noch nicht mal dokumentiert, welche Version eines Lieds gespielt wird (von manchen Liedern gibt's ja beispielsweise eine "Radio Edit"-Version)...
Mein erster Gedanke: Wie zufrieden ist er mit dem Framework Laptop?
Ich liebe den Framework Laptop lol
genial ...danke
Einträge ab 1977 online verfügbar? Was?
Auch Radiosender haben Praktikanten/innen !!!
ich wundert ja fast, das Wham so gar nicht auftaucht..
Ich habe übrigens 2707 Stunden Musik. Und das Offline auf der Platte :)
Es gibt nur wenige große Medienagenturen, die den Markt beherrschen und alle Sender gleich beraten. Dazu der Einfluss der großen Musikverlage, die Cashback geben, wenn ihre Lieder bevorzugt in die Rotation gehen...
Für den Algorithmus!
Gibt es das Skript Open Source, um es auf seinen eigenen lokalsender anzupassen?
Wow....enorm gut. Danke Dir Stefan! Musik und Scraping ist bei mir auch Thema, allerdings eher im Kontext persönliche Plattensammlung und Discogs.
Statistika sagt 32 hören täglich Radio. Woher kommt die Diskrepanz?
edit: 32 Millionen, also 38%
ma 2024 Audio II (kann hier leider keinen Link posten, Du kannst aber danach suchen). Zitat: "Fast 53 Millionen der deutschsprachigen Bevölkerung ab 14 Jahren nutzen von Montag bis Freitag mindestens ein Audioangebot, unabhängig von seinem Empfangsweg." und "Die Tagesreichweite (Mo-Fr) liegt bei 73,9 Prozent". Die Aussage von statista ist übrigens 32 Millionen täglich, nicht Prozent. statista nutzt dieselbe Quelle, ich weiß allerdings nicht, woher sie diese Zahl genommen haben, in den Zusammenfassungen der Studie steht diese Zahl nicht und die werktägliche Nutzung ist mit 53 Millionen deutlich höher, immerhin weist auch statista korrekt die 73,9% aus.
Welche statistik hast du benutzt?
Bei der Zahl 74% bin ich auch direkt hängen geblieben, das klingt sehr unrealistisch. Zunächst schon mal merkwürdig, dass von Deutschen Bundesbürgern die Rede ist. Also werden anscheinend die ca. 13 Mio. Menschen ohne deutsche Staatsangehörigkeit ignoriert, die in Deutschland leben.
Dann frage ich mich, wie genau dieses Radio Hören definiert ist. Reicht es, wenn ich an einer Baustelle vorbeigehe und ein paar Fetzen mitbekomme? Reicht es, wenn ich während der Lohnarbeit damit beschallt werde, oder als Säugling/Kleinkind mithöre, oder als desorientierte Seniorin im Pflegeheim? Oder muss ich mich selbst auch dazu entschieden haben zu hören, was ich höre?
@@DerReaperZockt Warum verschwinden meine Comments ständig; ich hatte gestern schon geantwortet?!
Klassikradio hören, obwohl da sicher auch Sachen zu beobachten sind. Aber wenn mir nach Radio ist, dann das
kann außerdem ByteFM sehr empfehlen. Keine Werbung, spendenfinanziert, keine Chartmusik, sondern aus allen möglichen (obskuren) Genres von Psychedelic Rock, über Techno und Jazz bis Drum n Bass alles dabei. Mit interessanten Hintergrundinfos zu den Interpreten und Labels sowie Release-Informationen (wann kommt der Song wo und auf welchem Medium raus)
Und jetzt das Ganze nochmal mit Tracks, die in Reels, TikToks und Shorts gespielt wird…
SWR3 - Wir sind die Cantina-Band, wir spielen den selben Song nach ~120 Minuten nochmal!
Was ein Schrott-Sender :D
Ich hätte 3-4h getippt, aber 2h .... joaaah.
Wunderschöner Vortrag, aber irgendwie etwas... technisch lost?
Warum sollte man sich die Mühe machen, das alles mit bash Tools zu parsen?
Wenn man das in jeder Programmiersprache macht, ist es strukturierter und besser anzupassen.
Ist doch Wurst wie man es macht wenn am Ende das Ergebnis stimmt. Es kommt immer einer des Weges und sagt "aber das geht doch effektiver" (zumindest in Deutschland) 😂
Am besten ist das Tool das man selbst beherrscht
Hallo, danke für das nette Feedback. Für das Scraping selbst kann man auch versuchen mit XPath und ähnlichen Vorgehensweisen an die Daten zu kommen. Aber dadurch muss man vergleichsweise lange dafür arbeiten, bis die Daten sauber herauskommen. Und kleinere Änderungen oder Fehler in den Webseiten (die häufig auftreten) führen dann zu ständigen Änderungen an den vergleichsweise komplexen Skripten. Daher habe ich diese alle eingestampft und habe die "iterative" Vorgehensweise mit grep, sed und ein paar weiteren Tools gewählt. Wenn JSON verfügbar war, hat mir übrigens jq am meisten geholfen. Für die Stabilität und Portierbarkeit der Skripte war übrigens bash entscheidend, ich habe zwar gegen Ende nur noch wenige Server genutzt, aber in der Hochphase unterschiedliche Architekturen/Plattformen. Da sind schon Unterschiede in z.B. Python-Versionen oder Libraries leider katastrophal für einen stabilen Datenbestand. Und nicht zuletzt galt für mich auch hier, dass für eine "einfache Aufgabe" auch bash-Skripte schon reichen können - warum also größere Geschützt auffahren, wenn es auch einfach geht? :)
@@StefanMagerstedt Hi, vielleicht gehe ich einfach etwas anders an die Sache an, ich hätte jegliche regex oder JSON parsen Logik lieber in Javascript/Python gemacht, das wäre meiner Meinung nach deutlich übersichtlicher und einfacher, die Daten zu säubern. Verschiedene Python-Versionen können natürlich ärgerlich sein, das passiert mit Node.js o. Ä. nicht so häufig, ich hätte vermutlich ein Docker Image gebaut, das ich überall draufschmeißen kann und es fängt sofort an zu sammeln, egal wo.
Am Ende haben wohl die Kommentatoren recht, das beste Tool ist, dass das man beherrscht, ich finde bash tools werden schnell furchtbar fehleranfällig und unübersichtlich, aber wenn man damit umzugehen weiß, oder vielleicht damit besser umgehen kann, als mit anderen sprachen, ist es vermutlich besser bash zu benutzen.
Äh ich hoffe er rechnet besser als er spricht, denn 500 Minuten sind gut 8h und nicht 5!
Mag offensichtlich Daten lieber als Radio - das heißt Planet Radio und nicht Radio Planet... 😅
Ich habe den Sender selbst nie gehört und daher "nur" die Playliste auf der Webseite abgegriffen. In meinen Daten habe ich die Einträge verkürzt nur mit "planet" abgespeichert. Da sehr viele Sender sich "Radio XXX" nennen (wie bei Radio FFH, denn radio planet gehört zur ffh-mediengruppe), kommt dieser Versprecher leider zustande. Also: Sorry für diese Ungenauigkeit.
@@StefanMagerstedt Kein Ding, fällt nur auf, wenn man mit Planetradio aufwächst ... :D
Das BESTE an all den Daten: Ich kenne nur EINEN der Songs, die erwähnt wurden un dden hasse ich. Rick Astley, Never gonna give you up. Den Rest habe ich noch NIE gehört... man merkt: Ich streame seit gut 5 Jahren ausschließlich und nur noch, was ich wirklich hören will.
Glückwunsch. Dann weiterhin viel Spaß in deiner Blase
@@johndoe4314 Weil Radiomusik bekanntlich keine Blase ist, haben wir am Vortrag gemerkt
@chy4e431 wenn das dein Argument ist nicht über den Tellerrand zu schauen, dann soll es so sein
@@johndoe4314 Es geht hier immerhin um Musik, worin liegt also das Problem, bei der Musik zu bleiben, die man bereits mag? Its not that deep
die daten müssen falsch sein! der schlimmste song von allen ist nicht drin! stumblin in von cyril...
Hmm, Lückenfüller?
Meinst du die "Gespielt pro Woche und Sender" Datenpunkte?
>HTML unironisch zu Fuß parsen
Bruh
irgendwie ein bisschen nervig vorgetragen, das ist doch eine fachkonferenz
Absolut richtig, Hobby Projekt auf FH Student Level 🥱
Wissenschaftlich sicherlich nicht das anspruchsvollste, ALLERDINGS ist es sehr unterhaltsam vorgetragen und man hat vor allem beim Q&A gemerkt, wie intensiv er sich mit den Daten bzgl. Deutung und Korrektheit auseinander gesetzt hat. Im Anfangsteil haben sicherlich viele nicht viel neues gelernt, aber es ist doch auch schön, wenn auch weniger fachkundige Menschen erfahren können, wie man so etwas eigentlich macht
Super! Dann sehen wir dich auf dem 39c3! Bin gespannt, was du abliefern wirst.
@Deppenradar ich bin mir absolut sicher dass der speaker das anders hätte machen können und das war wirklich nicht böse gemeint
@@m222f87 Nicht jeder von uns hat Studiert.