Это видео недоступно.
Сожалеем об этом.

Web Scraping con Python (ft. BeautifulSoup4)

Поделиться
HTML-код
  • Опубликовано: 16 авг 2024
  • In questo video introduco la tecnica del web scraping facendo vedere come utilizzare la libreria beautifulsoup (python).
    -----------------------------------------------------------------------------------------
    TIMESTAMPS
    00:00 Introduzione
    00:40 Web scraping
    01:57 Il Document Object Model (DOM)
    09:51 Beautiful Soup
    18:08 Esempio #1: caso banale
    26:00 Esempio #2: caso reale
    29:30 Scaricare il file .html
    32:35 Salvare e caricare il file .html
    39:05 Analisi struttura file .html
    44:00 Estrarre i dati dal file .html
    58:50 Conclusione
    -----------------------------------------------------------------------------------------
    RIFERIMENTI
    - github.com/Leo...
    -----------------------------------------------------------------------------------------
    CONTATTI
    - Technical blog: blog.leonardot...
    - Github: github.com/Leo...
    - Support my work: www.paypal.com...

Комментарии • 50

  • @massimostramaglia5748
    @massimostramaglia5748 Месяц назад

    fantastica spiegazione che usero' per i miei scopi nella vita reale, grazie!

  • @raffaelegirodo3246
    @raffaelegirodo3246 2 года назад +2

    Complimenti Leonardo, spiegazione chiara 👏️👏️👏️👏️, grazie 1000 !

  • @rammrras9683
    @rammrras9683 2 года назад +2

    Contenuti di estrema qualità! Montato bene per giunta.

  • @hodma5274
    @hodma5274 3 года назад +1

    OTTIMO! Spiegazione chiara anche per un neofita come me, grazie!

  • @ladyvanity
    @ladyvanity 2 года назад +1

    Complimenti Leondardo, sei bravissimo a spiegare

    • @esadecimale
      @esadecimale  2 года назад +1

      Grazie mille 🥺🙇🏻‍♂️

  • @marcofari532
    @marcofari532 7 месяцев назад

    Grandissimo come sempre! Ti consiglio se puoi di fare un video più approfondito per scovare direttamente l api (se ci fossero) usando l'inspector di mozilla e network, senza passare per bs4, così da avere i dati già in json e più facilmente manipolabili. Inoltre aspetto sempre una video guida in tuo stile per arch linux in particolare come configurare una bella rice come la tua! Buona giornata

    • @esadecimale
      @esadecimale  7 месяцев назад +1

      no in questo sito le API non ci sono, però si è tendenzialmente un modo migliore quello di attaccarsi alle API dirette

  • @vincenzocicchino5342
    @vincenzocicchino5342 2 года назад +1

    super chiaro

  • @LucaCanali
    @LucaCanali 3 года назад +1

    Molto interessante ... grazie :D

  • @nicolarighetto796
    @nicolarighetto796 3 года назад +1

    Bravissimo e chiarissimo come sempre è un piacere ascoltarti complimenti

  • @tiaspectosium411
    @tiaspectosium411 3 года назад +1

    Ciao! Mi piacciono molto i tuoi video, sono fatti molto bene, volevo inoltre farti una domanda, che SO utilizzi?

    • @esadecimale
      @esadecimale  3 года назад +1

      Hey, grazie mille!
      Attualmente utilizzo arch linux come distro, sopra cui ho messo i3 come windows tiling manager.

  • @annamariaperuz5635
    @annamariaperuz5635 3 года назад +1

    Ciao bel video una domanda : nei video di Jack The box nomini sempre imax e i file org mi potresti spiegare cos'é imax?

    • @esadecimale
      @esadecimale  3 года назад

      Hey, grazie mille per il feedback!
      Allora penso che tu ti stia riferendo a Emacs (pronunciato simile a “imax”). Emacs praticamente è un “text editor molto potente” (non è proprio così ma questa descrizione è la più sintetica possibile). È il software principale che uso in ogni video. Se guardi sul canale c’è un video chiamato “Introduzione ad Emacs”, in cui entro proprio nei dettagli. Poi se ti interessa ancora di più c’è una playlist dedicata sempre chiamata Emacs in cui entro ancora più in dettaglio su vari aspetti di Emacs.
      Spero sia staro chiaro, in caso fammi sapere!

  • @axel9546
    @axel9546 Год назад

    Hi! Nice video!
    Is it possible to do web scraping for real estate auctions, only tailored to very specific location on a map, making a dashboard with some interesting graphs, to understand if it is worth, prices, etc etc?

    • @esadecimale
      @esadecimale  Год назад

      Yes, it only depends on how the site is implemented, but it is usually always possible. Sometimes its harder than others.
      If you want more info send me an email at leo95.yt@gmail.com with the details, and I shall answer you

  • @emanuelebarese7445
    @emanuelebarese7445 2 года назад +1

    Ciao @LeonardoTamiano grazie per il bel video, ti volevo chiedere un informazione, o meglio vorrei il tuo aiuto se mi è possibile. Vorrei farti vedere un mio progetto che ho fatto tempo a dietro con google sheet ( per praticità ) adesso sono passato con python in quanto mi hai dato la possibilità di poterlo fare.
    Attendo tue notizie per fati vedere il mio progetto 🙂 grazie mille per il tuo tempo che ci hai donato

    • @esadecimale
      @esadecimale  2 года назад

      Guarda in questo periodo sono super impegnato, ma scrivimi per email in ogni caso!
      E grazie mille.
      L.T.

  • @mectronik8907
    @mectronik8907 2 года назад +1

    Bravo bel video. Potresti farne uno dove spieghi come scrappare un sito con pagine dinamiche?

    • @esadecimale
      @esadecimale  2 года назад

      Sicuramente è nei piani di argomenti da trattare, se riesco a prepararmi una demo semplice ma chiara lo farò sicuramente!

  • @TikTok.Video41
    @TikTok.Video41 3 года назад +1

    ciao, bel video volevo chiederti se potresti postare il tuo codice di configurazione di emacs

    • @esadecimale
      @esadecimale  3 года назад

      Guarda attualmente non lo pubblico perché lo vorrei sistemare e documentare meglio (e anche perché è pieno di cose abbastanza inutili e che non utilizzo).
      Detto questo, se lo vuoi, scrivi per email e te lo invio (poi tra un po' di tempo farò un video al riguardo)

    • @TikTok.Video41
      @TikTok.Video41 3 года назад +1

      @@esadecimale grazie dove trovo la tua mail? Se per te non é un problema ovvio

    • @esadecimale
      @esadecimale  3 года назад

      @@TikTok.Video41 la trovi verso la fine della descrizione del video, o anche sul mio sito (il cui link è sempre in descrizione) :D

    • @TikTok.Video41
      @TikTok.Video41 3 года назад

      Grazie mille

  • @danielebianchi2644
    @danielebianchi2644 3 года назад +1

    Per favore aiutami perchè sto impazzendo. Ho provato a fare scraping con questa pagina e mi dà questo errore: Si è verificata un'eccezione: OSError
    [Errno 22] Invalid argument: 'ruclips.net/video/5fqdMlzR-Uc/видео.html'
    File "C:\Users\danie\web scraping.py", line 10, in
    f = open(FILE, "w+")

    • @esadecimale
      @esadecimale  3 года назад

      Hmm, se non vedo il codice non credo di poterti aiutare.
      Che valore ha la variabile FILE? Considerando che è un errore a livello di sistema operativo, probabilmente stai cercando di aprire un file che non esiste o cose del genere.

    • @danielebianchi2644
      @danielebianchi2644 3 года назад

      @@esadecimale ho copiato il codice nel tuo video. Il file è quello di questa pagina

    • @danielebianchi2644
      @danielebianchi2644 3 года назад

      @@esadecimale ho copiato solo la parte che serve a scaricare i dati

    • @esadecimale
      @esadecimale  3 года назад

      @@danielebianchi2644 intendi dire che la variabile file ha come valore l’url di questa pagina web? “youtube…” etc?
      Perché se così fosse allora l’errore sta nel fatto che stai aprendo con una open un URL che indica una risorsa remota su un server.
      Se vuoi scaricare una pagine remota (specificata da un URL), devi utilizzare la libreria requests come ho fatto verso la fine del video. In particolare devi fare
      r = requests.get(URL)
      E poi puoi accedere al valore testuale con
      print(r.text)
      Nel tuo caso prova a rinominare FILE in URL e poi ad eseguire il codice di prima.

    • @danielebianchi2644
      @danielebianchi2644 3 года назад

      @@esadecimale infatti ho proprio utilizzato la libreria requests, per questo non capisco quale sia il problema

  • @andreamattei5991
    @andreamattei5991 2 года назад

    si dovrebbe dire: "restituisce" non "ritorna" :)