PySpark Tutorial für Anfänger! DataFrames, Funktionen & SQL

Поделиться
HTML-код
  • Опубликовано: 16 сен 2024
  • In diesem Video geben wir dir eine Einführung in Pyspark und zeigen auf wie du Daten und Abfragen mit Apache Spark verarbeiten kannst.
    Zu Beginn erklären wir kurz en Hintergrund Apache Spark. Dabei gehen wir näher auf den Aufbau der Plattform ein, sowie mit welchen APIs man in diesem System interagieren kann.
    Außerdem beschreiben wir kurz, welche Rolle Machine Learning in Apache Spark hat.
    Weitergehend wird beispielhaft eine Demo vorgeführt, um dir an praktischen Beispielen wie du mit der Python API in Apache Spark deine Daten und einfache Abfragen verarbeiten kannst und somit über Python mit Spark kommunizieren kannst.
    Dieses Video veranschaulicht dir eine simple Einführung in Apache Spark und Pyspark und zeigt dir beispielhaft auf, wie du einfach ETL-Prozesse, sowie Machine Learning Prozesse selber schreiben kannst.
    Notebook: Was ist Apache Spark?:
    github.com/dat...
    Internetpräsenz:
    Mehr zum Thema Apache Spark findest du in unserem Blog unter:
    datasolut.com/...
    datasolut.com/...
    Unsere Website: datasolut.com
    LinkedIn: / datasolut

Комментарии • 5