38C3 - RadioMining - Playlist-Scraping und Analyse

Поделиться
HTML-код
  • Опубликовано: 7 янв 2025

Комментарии •

  • @tyberzann9713
    @tyberzann9713 3 дня назад +169

    „Haben wir noch Daten? Zwei noch?“ - hat mich gekillt :D Danke!

    • @kranko235
      @kranko235 3 дня назад +7

      Wer hat die letzten genommen?

    • @QemeH
      @QemeH 3 дня назад +8

      Nix mehr?

    • @kay0
      @kay0 2 дня назад +7

      @@QemeH gar nichts mehr?

    • @StefanMagerstedt
      @StefanMagerstedt 2 дня назад +15

      Danke - hast Du Dir auch die anderen Easter Egg Überschriften angeschaut? Habe während des Vortrags nicht mehr alle individuell angesagt.

    • @tyberzann9713
      @tyberzann9713 2 дня назад +4

      @@StefanMagerstedt ich wollte nicht alle aufschreiben, aber ja :D da hattest du aber auch einen Lauf... :D

  • @superman9693
    @superman9693 2 дня назад +58

    Finde diese Big Data Mining Vorträge echt mit das beste immer bei den Kongressen. 😂

    • @TodayTestfbsfbsfbs
      @TodayTestfbsfbsfbs День назад +14

      Ja ich vermisse echt den David Kriesel, seine Vorträge waren legendär, hoffe er kommt irgendwann mal wieder.

    • @superman9693
      @superman9693 17 часов назад

      @@TodayTestfbsfbsfbs safe!

  • @martinmusli3044
    @martinmusli3044 3 дня назад +82

    Cool. Klare "Aufgabenstellung", gut erklärt wie er sich das gedacht hat. Viel Humor und authentisch rübergebracht

  • @bigbasspic
    @bigbasspic Час назад

    Ein wirklich amüsanter und interessanter Vortag! Und jetzt weiß ich endlich wann "Last Christmas" vermieden werden kann 🤣 Danke dir!

  • @maddoggLP
    @maddoggLP 3 дня назад +53

    Mega sympathischer Typ und cooler Vortrag! Freu mich schon auf weitere Vorträge von ihm 👍

  • @RamonSmithMusic
    @RamonSmithMusic 2 дня назад +22

    Unfassbar sympathischer Typ. Er kann sich richtig gut bedanken! Das ist ein Skill, der meiner Meinung nach zu selten ist.
    Vielen Dank für diesen wunderbar informativen und gleichzeitig unterhaltsamen Vortrag! ❤

  • @m0llux
    @m0llux 2 дня назад +9

    Einfach genialer Vortrag. Selten so eine Kombination aus Inhalt und Humor erlebt :)

  • @Deppenradar
    @Deppenradar День назад +6

    Jan Kuhlmann war damals bei N-Joy mein Lieblingsmoderator, vorallem, weil er in seinen Shows echt breit gefächert war und es da ziemlich viele kleine Schätze zu hören gab…

  • @sorbische_sonne
    @sorbische_sonne День назад +8

    Die Frage mit dem Radiowecker (43:35) fühle ich. Es kommt vielleicht nicht immer derselbe Song zur selben Zeit, aber es sind die selben 5 Songs die jeden Morgen laufen (zumindest auf 1Live). :D

    • @StefanMagerstedt
      @StefanMagerstedt День назад +5

      In dem Monat vor Weihnachten (24.11.-24.12.) hättest Du um 06:45 tatsächlich fünf Mal Nina Chuba's "Fata Morganga" gehört und zweimal Bruno Mars/Rosé APT. Wenn Du mir Deine Weckerzeit nennst, kann ich Dir die Statistik personalisieren. ;)

  • @xzorey6062
    @xzorey6062 3 дня назад +11

    Sehr cooler Vortrag und klasse Typ!

  • @ulrichulrichulrich
    @ulrichulrichulrich 2 дня назад +3

    Klasse Vortrag, und räumt auch mit dem einen oder anderen Mythos auf. Sehr gut, Danke.

  • @Tobeei
    @Tobeei 2 дня назад +9

    Das PULS so abwechslungsreich ist kann ich bestätigen. Ganz netter Sender!

  • @RACOONLPs
    @RACOONLPs 4 часа назад

    Spannendes Video. Habe tatsächlich nachdem ich damals das DB Video von David Kriesel gesehen habe genau das selbe gemacht. Habe das mit allen Antenne Sendern gemacht und bin da auch zu spannenden Ergebnissen gekommen.

  • @Oafalda
    @Oafalda 6 часов назад

    Super vorgetragen, für Profis interessant und wahrscheinlich auch für Laien verständlich!

  • @loens2
    @loens2 3 дня назад +49

    Sehr schön bei einem Vortragenden mal ein Framework Laptop zu sehen.

    • @rainson12
      @rainson12 3 дня назад +2

      +1 besitze selbst einen Framework 16 - tolles teil

    • @g14d0s7
      @g14d0s7 2 дня назад +1

      +1 auch sehr zufrieden - schön, dass das Gerät seine Zielgruppe findet!

    • @StefanMagerstedt
      @StefanMagerstedt 2 дня назад +9

      Danke, dass das auch jemanden auffällt. Habe den seit Ende 2022 und bin sehr zufrieden damit. Auch wenn ich zugeben muss, dass für mich zu Beginn das wichtigste Feature war, dass ich auf beiden Seiten des Laptops mit USB-C laden konnte.

    • @martine.bruggemann98
      @martine.bruggemann98 День назад

      Nice, wollte grad genau das kommentieren!

    • @HanzFromHell
      @HanzFromHell День назад +3

      Aber auf dem Congress mit einem Windows drauf ... mega fail!

  • @Synonym_MS
    @Synonym_MS День назад +1

    Sehr sympathischer Typ, das hat richtig Spaß gemacht

  • @bernyBread377
    @bernyBread377 3 дня назад +7

    MEGA spannendes Thema! Ich habe das Gefühl dass ich innerlich vorhersagen kann welcher Song als nächstes nach dem aktuellen kommen wird. Es wäre interessant das zu filtern ob gewisse Songs (auf einem Sender) immer nacheinander laufen...

    • @StefanMagerstedt
      @StefanMagerstedt 2 дня назад +3

      Die meisten Sender achten darauf, nicht "vorhersagbar" zu sein, weil sie sich sonst wie eine zu oft gehörte Compiliation anhören. Da aber einige Lieder gerne gespielt werden UND gut nacheinander passen, gibt es einige Kombinationen häufiger als andere. Die Gesamtmenge habe ich als Liste präsentiert (und die Songliste auf meine Webseite gestellt).

  • @thommylicious
    @thommylicious 2 дня назад +1

    Klasse Vortrag, hat richtig Spaß gemacht. Danke!

  • @slartibartfasszwei5156
    @slartibartfasszwei5156 7 часов назад +1

    Hallo @@StefanMagerstedt,
    danke für den tollen Vortrag.
    Du sprichst davon, dass du ähnliche Titel mit dem Hamming-Abstand erkannt hast. Meines Wissens sollte das die Levenshtein-Distanz sein, also die Anzahl an Operationen (Buchstaben ändern/hinzufügen/entfernen), sodass man den gleichen Text herausbekommt.
    Der Hamming-Abstand ist wiederum die Anzahl an unterschiedlichen Bits in zwei binären Codes. Also 000 und 101 hätten den Hamming-Abstand 2.
    Viele Grüße

  • @ichsuper
    @ichsuper 23 часа назад +3

    Super Talk. Danke. Das mit dem Betriebsgeheimnis ist natürlich Quatsch. Es gibt sogar Anbieter die genau das was du gemacht hast an die Radiosender verkaufen für die Musikrecherche.

  • @stansteez
    @stansteez 3 дня назад +11

    Bei den BPM wird allerdings vernachlässigt, dass moderne Musikproduktionen mit double-time arbeiten in der Produktion. Also ein Song, der gefühlt 80 BPM hat, wird in 160 BPM programmiert und das verzerrt die Statistik, falls der BPM counter es nicht versteht, dass es ein double-time beat ist.

    • @fargoththemoonsugarmaniac
      @fargoththemoonsugarmaniac 2 дня назад

      was genau soll das bringen? doppelt so hohe Auflösung des Grids?
      Wenn ja, und man dann aber doch nur auf jede 8te Note ne Kick haut, dann ist es im Grunde ja wieder die halbe Geschwindigkeit und sollte auch so erkannt werden.
      Oder kannst du das irgendwie genauer ausführen?

    • @StefanMagerstedt
      @StefanMagerstedt 2 дня назад +5

      Das hast Du tatsächlich sehr gut bemerkt. Die Songs mit potentiell zwei unterschiedliche valide BPMs habe ich auch testweise aus dem Datensatz mal entfernt, der gezeigte (grafische) Anstieg war aber ähnlich. Daher konnte ich einen einfachen Datenfehler ausschließen, die generelle Geschwindigkeit scheint sich banal erhöht zu haben - zumindest nach meinen Daten und meiner Interpretation. :)

  • @D4RkViP3R
    @D4RkViP3R 3 дня назад +4

    Klasse Talk, danke dafür!

  • @DanielSmith-ze9lw
    @DanielSmith-ze9lw 3 дня назад +7

    24:33 ICH HABE ES IMMER GEWUSST!!!

  • @bernds6587
    @bernds6587 3 дня назад +7

    Definitiv sehr interessant, und korreliert mit meinen eigenen Beobachtungen. Insbesondere bezüglich den Charts.
    Ich höre meist englische Radiosender aus aller Welt, sei es Australien, Malta oder USA. Da bekommt man die durchaus neusten Lieder mit.
    Und da ist es mir nämlich sehr oft aufgefallen: Wenn ich (eher selten) mal ein deutschen Radiosender höre(n muss), dann höre ich dort Lieder, die ich vor 2 Wochen oder teilweise einem Monat bereits in den ausländischen Radiosendern gehört habe. Teilweise liefen die auf und ab, und waren bereits fast wieder uninteressant.
    Bestes Beispiel: Blinding Lights von the Weeknd. Kannte ich bereits ca 3 Wochen, und dann zufällig mal in einem deutschen Radio gehört, dass es gerade so neu ist, frisch in den Charts etc.
    Warum die erwähnten Musikredaktionen so hinterherhinken, wäre mal interessant, bzw warum Musikredaktionen anderer Sender das nicht sind
    Nur mir war bisher nicht klar, wer denn nun am Ende zuerst da war, Henne ( Charts ) oder Ei ( Radiosender )
    Also wieder was gelernt, es sind tatsächlich die Radiosender, die so langsam sind.
    Allgemein sehr interessant, damit kann ich einen Punkt auf meiner Liste streichen, was ich mal machen wollte.
    Für mich wäre dann noch interessant, allgemein (ohne Bezug aufs Radio) wie und OB die deutschen Charts im Vergleich zu weltweit oder anderen Ländern "verzögert sind, und auch wie schnell manche Lieder in die Charts einsteigen nach den Release...
    übrigens Daumen hoch für Firefox, und "vernünftiger Browser" im selben Moment. Stoppt den Chrome-Wahnsinn 😃

    • @Deppenradar
      @Deppenradar День назад +1

      Musiklabel haben einen großen Einfluss darauf, indem sie den Radiostationen das schicken, was sie bewerben wollen. Landet in der Musikredaktion. War früher natürlich stärker ausgeprägt, könnte mir aber vorstellen, dass bestimmte Märkte eben erst später starten.

    • @bernds6587
      @bernds6587 23 часа назад

      @@Deppenradar hm, valider Punkt. Ist natürlich schade, dass sich die Musikredaktionen so abhängig machen, und somit keinerlei nicht-Mainstream Musik "zum Zuge" kommt.
      Gibt so einiges, was auch für "Normalohren" hörbar ist, aber kaum oder gar nicht im Radio läuft. Und wenn, dann meist in kleineren Radios oder eben Internetradios.

  • @heldt952
    @heldt952 12 часов назад

    Krass wieviel Arbeit da rein fällt bei den Sendern.
    Keine Wiederholung innerhalb der nächsten x Minuten
    Zumindest morgens rotations über Wochen
    Saisonale Rotations
    Bestimmte Songs werden nur angespielt
    ...
    Beeindruckend.

    • @W00PIE
      @W00PIE 8 часов назад

      Arbeit? Sowas programmiert man doch eigentlich nur einmal und dann stellt man sich als Sender nur noch die Parameter ein.

  • @onlyNaizo
    @onlyNaizo День назад

    super spannend. Weils gleich am Anfang im Beispiel war: SNAP war mein meist gehörter Song 2024 bei mir.

  • @asador5637
    @asador5637 2 дня назад +1

    Super Vortrag!

  • @winkekeks
    @winkekeks 3 дня назад +7

    Auf die Frage zu Last Christmas: Bayern 3 hat das beispielsweise schon mal am 18.10. gespielt, habe ich ein Beweisfoto von :)

    • @m0llux
      @m0llux 2 дня назад +3

      MDR Jump spielt den jedes Jahr am 24. Juni. Ja, genau 6 Monate vor und nach Weihnachten :D

  • @Krausmar
    @Krausmar День назад +1

    Ich habe keine Ahnung davon. Aber liebe jeden Vortrag zu Mining. Wäre noch interessant gewesen, welcher Radio-Moderator, welche Songs am liebsten spielt.

  • @TecSanento
    @TecSanento 3 дня назад +8

    Ich habe auch mal bei meinem lokalen Radiosender angefragt ob sie noch die Playlisten der Musik meiner Kindheit haben weil ich damals viel Radio gehört habe... Aussage war nein das wären viel zu viel Datenmüll denn sie würden nur die letzten zwei Wochen speichern😢😮

  • @McGybrush
    @McGybrush 2 дня назад

    Super Vortrag.
    Ich muss auf Arbeit jeden Tag 9h (8h wenn ich in der Pause die Halle verlasse) Radio hören hab aber dennoch freie Auswahl was an ist.
    Hatte ich es richtig Verstanden das ich Dir eine eMail schicken kann und Du eine Liste aus den Daten erstellen kannst mit einem Ranking aller Sender machen kannst mit:
    Spielt am wenigsten Doppelt bis Spielt am häufigsten doppelt
    Aktuell ist es so das ich ca. 6-7 Sender habe und die jeden Tag rotiere. Aber nicht die Perfekte Lösung.

    • @StefanMagerstedt
      @StefanMagerstedt День назад +1

      Du kannst mir gerne eine Mail mit konkreten Fragen stellen, die ich mithilfe der Daten beantworten kann. Ich habe aber nicht *alle* Sender und die Werte sind Durchschnittswerte. Für die Wiederholungen musst Du Dir überlegen, ob Du eher "insgesamt" in der Woche mehr Abwechslung haben willst (aber trotzdem Wiederholungen enthalten sind) oder ob Du zwar weniger Abwechslung, dafür aber seltenere Wiederholungen willst.

  • @towb0at
    @towb0at 3 дня назад +2

    Wäre auch an ner Schule cool der Vortrag!

  • @retohummer2570
    @retohummer2570 3 дня назад +60

    Sehr spannend, kann David Kriesel fast Konkurrenz machen ;)

    • @anbu.ishtar
      @anbu.ishtar 3 дня назад +31

      Was macht der eigentlich inzwischen? Er war einer der besten Referenten, die ich je gesehen habe :)

    • @rGunti
      @rGunti 2 дня назад +11

      Ich dachte beim Titel, hat David wieder mal zugeschlagen? :D

    • @StefanMagerstedt
      @StefanMagerstedt 2 дня назад +16

      Danke, das ist ja quasi ein Ritterschlag. :) Ich habe mit David nach dem BahnMining-Vortrag über dieses Thema gesprochen. Durch ihn hat das Thema Data Mining Interesse bei einer breiten Masse gewecket, wodurch es einfacher wurde, das zu platzieren. Da ich kein Data Scientist bin, kann ich mich aber nicht wirklich mit ihm konkurrieren. :)

    • @anbu.ishtar
      @anbu.ishtar 2 дня назад

      @@StefanMagerstedt aber trotzdem einen Super-Vortrag über ein spannendes Thema gestaltet, und das mit sehr gutem Humor :) gerne mehr!

    • @Volvo_EG
      @Volvo_EG 2 дня назад

      @@StefanMagerstedtKann ich auch nur bestätigen. Bin aktuell zwar erst bei einem Viertel aber ich hab mich auch sehr an die super unterhaltsamen Vorträge von David erinnert gefühlt. Toll gemacht 👍🏼

  • @andtrixr3284
    @andtrixr3284 11 часов назад

    Übelst gut :)

  • @paradonym
    @paradonym 14 часов назад

    Ich brauche im Flur eine Lampe die ziemlich exakt das momentane Außenlicht genau so wie Sonne oder Mond darstellen kann. Geht das? Das muss auch bei Sonnenuntergang und Aufgang exakt sein

  • @notofinterest
    @notofinterest 2 дня назад +1

    mich hätte interessiert ob die daten dazu geeignet gewesen wären um den Einfluss der labels/produzenten zu veranschaulichen, bzw. ob songs gepusht wurden, obs bestimmte kickoff zeiten für songs gab ab denen es plötzlich in allen radios lief usw.

  • @GameDeLaGame
    @GameDeLaGame 2 дня назад +1

    Passend zum Thema Musik: Kann mir jmd. den Namen der Musik nennen die im Intro läuft, also ab 0:00. Danke (:

    • @Deppenradar
      @Deppenradar День назад +1

      Die ist, wie auch alle Intros, eigens dafür produziert.

  • @julianreverse
    @julianreverse 2 дня назад +1

    Radiosender sind zur Aufzeichnung ihres Programms verpflichtet. Auf irgend einem Server liegt bei jedem Sender der vollständige Mitschnitt des Programms über lange Zeiträume.

  • @subjektobjektpradikat7902
    @subjektobjektpradikat7902 2 дня назад +3

    Geil. Dudelfunk ausgedribbelt. Gibt schon Gründe, eher byteFM oder DLF zu hören.

  • @blueark1
    @blueark1 2 дня назад +1

    Geile Arbeit

  • @rainson12
    @rainson12 3 дня назад +5

    Könnte man nicht auch berechnen wie viel Musik zeitlich überhaupt gespielt wird. Die reine Anzahl an abgespielten Songs ist aufgrund der Songlänge ja nicht unbedingt repräsentativ? Es könnte ja sein, dass sich Songs seltener wiederholen weil generell weniger Musik gespielt wird und man stattdessen mit Werbung verköstigt wird.

    • @LX.M
      @LX.M 3 дня назад +3

      Schwer. Ob Lieder vorzeitig abgewürgt oder voll ausgespielt werden geht aus den Daten ja i.d.R. nicht hervor. Manchmal ist noch nicht mal dokumentiert, welche Version eines Lieds gespielt wird (von manchen Liedern gibt's ja beispielsweise eine "Radio Edit"-Version)...

  • @Alex-lu4po
    @Alex-lu4po 10 часов назад

    Mein erster Gedanke: Wie zufrieden ist er mit dem Framework Laptop?

  • @Ratsacker0269
    @Ratsacker0269 2 дня назад +1

    Ich liebe den Framework Laptop lol

  • @funkyvogelfutter3147
    @funkyvogelfutter3147 День назад

    genial ...danke

  • @kai990
    @kai990 3 дня назад +3

    Einträge ab 1977 online verfügbar? Was?

  • @uelzen20
    @uelzen20 День назад +1

    ich wundert ja fast, das Wham so gar nicht auftaucht..
    Ich habe übrigens 2707 Stunden Musik. Und das Offline auf der Platte :)

  • @redaquarius3661
    @redaquarius3661 3 дня назад +9

    Es gibt nur wenige große Medienagenturen, die den Markt beherrschen und alle Sender gleich beraten. Dazu der Einfluss der großen Musikverlage, die Cashback geben, wenn ihre Lieder bevorzugt in die Rotation gehen...

  • @2XS
    @2XS День назад

    Für den Algorithmus!

  • @willidriver
    @willidriver 2 дня назад

    Gibt es das Skript Open Source, um es auf seinen eigenen lokalsender anzupassen?

  • @void-fc2dd
    @void-fc2dd 3 дня назад +3

    Wow....enorm gut. Danke Dir Stefan! Musik und Scraping ist bei mir auch Thema, allerdings eher im Kontext persönliche Plattensammlung und Discogs.

  • @fst534
    @fst534 2 дня назад +3

    Statistika sagt 32 hören täglich Radio. Woher kommt die Diskrepanz?
    edit: 32 Millionen, also 38%

    • @StefanMagerstedt
      @StefanMagerstedt День назад

      ma 2024 Audio II (kann hier leider keinen Link posten, Du kannst aber danach suchen). Zitat: "Fast 53 Millionen der deutschsprachigen Bevölkerung ab 14 Jahren nutzen von Montag bis Freitag mindestens ein Audioangebot, unabhängig von seinem Empfangsweg." und "Die Tagesreichweite (Mo-Fr) liegt bei 73,9 Prozent". Die Aussage von statista ist übrigens 32 Millionen täglich, nicht Prozent. statista nutzt dieselbe Quelle, ich weiß allerdings nicht, woher sie diese Zahl genommen haben, in den Zusammenfassungen der Studie steht diese Zahl nicht und die werktägliche Nutzung ist mit 53 Millionen deutlich höher, immerhin weist auch statista korrekt die 73,9% aus.

    • @DerReaperZockt
      @DerReaperZockt День назад

      Welche statistik hast du benutzt?

    • @argh1989
      @argh1989 8 часов назад

      Bei der Zahl 74% bin ich auch direkt hängen geblieben, das klingt sehr unrealistisch. Zunächst schon mal merkwürdig, dass von Deutschen Bundesbürgern die Rede ist. Also werden anscheinend die ca. 13 Mio. Menschen ohne deutsche Staatsangehörigkeit ignoriert, die in Deutschland leben.
      Dann frage ich mich, wie genau dieses Radio Hören definiert ist. Reicht es, wenn ich an einer Baustelle vorbeigehe und ein paar Fetzen mitbekomme? Reicht es, wenn ich während der Lohnarbeit damit beschallt werde, oder als Säugling/Kleinkind mithöre, oder als desorientierte Seniorin im Pflegeheim? Oder muss ich mich selbst auch dazu entschieden haben zu hören, was ich höre?

    • @fst534
      @fst534 2 часа назад

      ​@@DerReaperZockt Warum verschwinden meine Comments ständig; ich hatte gestern schon geantwortet?!

  • @habichmeyer
    @habichmeyer 3 дня назад +1

    Klassikradio hören, obwohl da sicher auch Sachen zu beobachten sind. Aber wenn mir nach Radio ist, dann das

    • @fargoththemoonsugarmaniac
      @fargoththemoonsugarmaniac 2 дня назад +1

      kann außerdem ByteFM sehr empfehlen. Keine Werbung, spendenfinanziert, keine Chartmusik, sondern aus allen möglichen (obskuren) Genres von Psychedelic Rock, über Techno und Jazz bis Drum n Bass alles dabei. Mit interessanten Hintergrundinfos zu den Interpreten und Labels sowie Release-Informationen (wann kommt der Song wo und auf welchem Medium raus)

  • @Deppenradar
    @Deppenradar День назад

    Und jetzt das Ganze nochmal mit Tracks, die in Reels, TikToks und Shorts gespielt wird…

  • @Hoerli
    @Hoerli 3 дня назад +7

    SWR3 - Wir sind die Cantina-Band, wir spielen den selben Song nach ~120 Minuten nochmal!
    Was ein Schrott-Sender :D
    Ich hätte 3-4h getippt, aber 2h .... joaaah.

  • @chy4e431
    @chy4e431 3 дня назад +7

    Wunderschöner Vortrag, aber irgendwie etwas... technisch lost?
    Warum sollte man sich die Mühe machen, das alles mit bash Tools zu parsen?
    Wenn man das in jeder Programmiersprache macht, ist es strukturierter und besser anzupassen.

    • @peterl0815
      @peterl0815 3 дня назад +12

      Ist doch Wurst wie man es macht wenn am Ende das Ergebnis stimmt. Es kommt immer einer des Weges und sagt "aber das geht doch effektiver" (zumindest in Deutschland) 😂

    • @schnitzelsemmel
      @schnitzelsemmel 3 дня назад +14

      Am besten ist das Tool das man selbst beherrscht

    • @StefanMagerstedt
      @StefanMagerstedt 2 дня назад +8

      Hallo, danke für das nette Feedback. Für das Scraping selbst kann man auch versuchen mit XPath und ähnlichen Vorgehensweisen an die Daten zu kommen. Aber dadurch muss man vergleichsweise lange dafür arbeiten, bis die Daten sauber herauskommen. Und kleinere Änderungen oder Fehler in den Webseiten (die häufig auftreten) führen dann zu ständigen Änderungen an den vergleichsweise komplexen Skripten. Daher habe ich diese alle eingestampft und habe die "iterative" Vorgehensweise mit grep, sed und ein paar weiteren Tools gewählt. Wenn JSON verfügbar war, hat mir übrigens jq am meisten geholfen. Für die Stabilität und Portierbarkeit der Skripte war übrigens bash entscheidend, ich habe zwar gegen Ende nur noch wenige Server genutzt, aber in der Hochphase unterschiedliche Architekturen/Plattformen. Da sind schon Unterschiede in z.B. Python-Versionen oder Libraries leider katastrophal für einen stabilen Datenbestand. Und nicht zuletzt galt für mich auch hier, dass für eine "einfache Aufgabe" auch bash-Skripte schon reichen können - warum also größere Geschützt auffahren, wenn es auch einfach geht? :)

    • @chy4e431
      @chy4e431 2 дня назад +1

      @@StefanMagerstedt Hi, vielleicht gehe ich einfach etwas anders an die Sache an, ich hätte jegliche regex oder JSON parsen Logik lieber in Javascript/Python gemacht, das wäre meiner Meinung nach deutlich übersichtlicher und einfacher, die Daten zu säubern. Verschiedene Python-Versionen können natürlich ärgerlich sein, das passiert mit Node.js o. Ä. nicht so häufig, ich hätte vermutlich ein Docker Image gebaut, das ich überall draufschmeißen kann und es fängt sofort an zu sammeln, egal wo.
      Am Ende haben wohl die Kommentatoren recht, das beste Tool ist, dass das man beherrscht, ich finde bash tools werden schnell furchtbar fehleranfällig und unübersichtlich, aber wenn man damit umzugehen weiß, oder vielleicht damit besser umgehen kann, als mit anderen sprachen, ist es vermutlich besser bash zu benutzen.

  • @Markusobi0
    @Markusobi0 18 часов назад

    Äh ich hoffe er rechnet besser als er spricht, denn 500 Minuten sind gut 8h und nicht 5!

  • @armin0815
    @armin0815 День назад

    Mag offensichtlich Daten lieber als Radio - das heißt Planet Radio und nicht Radio Planet... 😅

    • @StefanMagerstedt
      @StefanMagerstedt День назад +4

      Ich habe den Sender selbst nie gehört und daher "nur" die Playliste auf der Webseite abgegriffen. In meinen Daten habe ich die Einträge verkürzt nur mit "planet" abgespeichert. Da sehr viele Sender sich "Radio XXX" nennen (wie bei Radio FFH, denn radio planet gehört zur ffh-mediengruppe), kommt dieser Versprecher leider zustande. Also: Sorry für diese Ungenauigkeit.

    • @armin0815
      @armin0815 День назад +2

      @@StefanMagerstedt Kein Ding, fällt nur auf, wenn man mit Planetradio aufwächst ... :D

  • @hippotek1
    @hippotek1 3 дня назад +4

    Das BESTE an all den Daten: Ich kenne nur EINEN der Songs, die erwähnt wurden un dden hasse ich. Rick Astley, Never gonna give you up. Den Rest habe ich noch NIE gehört... man merkt: Ich streame seit gut 5 Jahren ausschließlich und nur noch, was ich wirklich hören will.

    • @johndoe4314
      @johndoe4314 2 дня назад +7

      Glückwunsch. Dann weiterhin viel Spaß in deiner Blase

    • @chy4e431
      @chy4e431 2 дня назад

      @@johndoe4314 Weil Radiomusik bekanntlich keine Blase ist, haben wir am Vortrag gemerkt

    • @johndoe4314
      @johndoe4314 2 дня назад

      @chy4e431 wenn das dein Argument ist nicht über den Tellerrand zu schauen, dann soll es so sein

    • @chy4e431
      @chy4e431 2 дня назад

      @@johndoe4314 Es geht hier immerhin um Musik, worin liegt also das Problem, bei der Musik zu bleiben, die man bereits mag? Its not that deep

  • @ThePapanoob
    @ThePapanoob 23 часа назад

    die daten müssen falsch sein! der schlimmste song von allen ist nicht drin! stumblin in von cyril...

  • @m222f87
    @m222f87 2 дня назад +5

    Hmm, Lückenfüller?

    • @theod0r
      @theod0r День назад

      Meinst du die "Gespielt pro Woche und Sender" Datenpunkte?

  • @localhorst6822
    @localhorst6822 День назад

    >HTML unironisch zu Fuß parsen
    Bruh

  • @3nt3_
    @3nt3_ 3 дня назад +4

    irgendwie ein bisschen nervig vorgetragen, das ist doch eine fachkonferenz

    • @m222f87
      @m222f87 2 дня назад +1

      Absolut richtig, Hobby Projekt auf FH Student Level 🥱

    • @Silas_229
      @Silas_229 День назад +10

      Wissenschaftlich sicherlich nicht das anspruchsvollste, ALLERDINGS ist es sehr unterhaltsam vorgetragen und man hat vor allem beim Q&A gemerkt, wie intensiv er sich mit den Daten bzgl. Deutung und Korrektheit auseinander gesetzt hat. Im Anfangsteil haben sicherlich viele nicht viel neues gelernt, aber es ist doch auch schön, wenn auch weniger fachkundige Menschen erfahren können, wie man so etwas eigentlich macht

    • @Deppenradar
      @Deppenradar День назад +7

      Super! Dann sehen wir dich auf dem 39c3! Bin gespannt, was du abliefern wirst.

    • @3nt3_
      @3nt3_ День назад

      @Deppenradar ich bin mir absolut sicher dass der speaker das anders hätte machen können und das war wirklich nicht böse gemeint

    • @theod0r
      @theod0r День назад +2

      @@m222f87 Nicht jeder von uns hat Studiert.