Web scraping Python - Annonces immobilières (400 d'un coup!)

Поделиться
HTML-код
  • Опубликовано: 6 ноя 2024
  • НаукаНаука

Комментарии • 39

  • @VincentTassier
    @VincentTassier 3 года назад +2

    Grand fan de ton travail, vraiment très inspirant. Ça donne envie de regarder les autres vidéos que tu as réalisé

    • @Joycode_
      @Joycode_  3 года назад

      Merci beaucoup !
      N'hésite pas, si tu débutes la série python pour débutant devrait t'intéresser :)

    • @VincentTassier
      @VincentTassier 3 года назад

      @@Joycode_ Alors justement non j'ai un bon niveau avec ce langage, c'est pour ça que je suis tombé sur cette vidéo. Tu devrais reconduire ce format "projet tutoriel" avec d'autres librairies

    • @Joycode_
      @Joycode_  3 года назад +1

      C'est noté !
      Maintenant que j'ai fini la série pour débutants je travaille sur des concepts plus avancés qui demandent un peu plus de préparation comme les bonnes pratiques de l'orienté objet et les techniques pour contourner les blocages lors du scraping.
      Ça arrive bientôt !

    • @VincentTassier
      @VincentTassier 3 года назад

      @@Joycode_ Excellent. J'attends avec impatience ces vidéos alors ! Je vais tester de mon côté de mettre en place un script de webscrapping. Les possibilités sont endless ! Si jamais j'ai des questions tu as un twitter sur lequel je peux te contacter ?

    • @Joycode_
      @Joycode_  3 года назад

      Twitter non pour l'instant mais n'hésite pas à m'envoyer un email : amaury.joycode@gmail.com

  • @emelybrown7539
    @emelybrown7539 3 года назад +1

    Super ta vidéo. Ce serai cool une vidéo sur la manière à déjouer le Geetest.
    J'ai un script mais il fonctionne une fois sur 3

    • @Joycode_
      @Joycode_  3 года назад

      Honnêtement il vaut mieux réessayer avec une IP différente (en utilisant un proxy) que de tenter de résoudre le capcha.
      La prochaine vidéo parle justement de ça (comment éviter la détection).

  • @thomasmathieux1979
    @thomasmathieux1979 3 года назад +1

    Superbe vidéo, très intéressant et bien expliqué. Serait il possible d'avoir la vidéo pour le contournement des blocages ?
    Merci et bonne continuation

    • @Joycode_
      @Joycode_  3 года назад +1

      Merci beaucoup !
      Bien sûr, je travaille dessus en ce moment même !
      J'ai pris un peu de retard en septembre avec mes congés ^^

    • @thomasmathieux1979
      @thomasmathieux1979 3 года назад

      @@Joycode_ c'est génial, je te remercie et hâte de voir ta vidéo ! 👌🏻

  • @magnuss64
    @magnuss64 2 года назад +1

    très bonne vidéo comment on fait pour cacher le navigateur quand il s'ouvre

    • @Joycode_
      @Joycode_  2 года назад +1

      Tu peux soit utiliser l'option "headless" (mais ça peut être détecté par certains sites) soit déplacer la fenêtre à un endroit où elle n'est pas visible.
      Exemple :
      stackoverflow.com/questions/42829480/how-to-hide-firefox-window-selenium-webdriver-in-python-test

  • @OmarMhissen
    @OmarMhissen 2 месяца назад

    svp comment faire pour avoir les numéros de téléphone des propriétaire ?

  • @jacquesbaudson8767
    @jacquesbaudson8767 2 года назад

    Bonjour, je vous félicite pour votre vidéo par contre j'emploie chrome et pas firefox et j'aurais aimé récupérer le squelette du code , j'utilise pycharm et j'aurais aimé scraper deux sites et ensuite créer un petit logiciel de statistiques encore bravo

    • @Joycode_
      @Joycode_  2 года назад

      Merci beaucoup !
      Vous pouvez télécharger le driver de chrome au lien suivant, qui contient également les informations nécessaires pour adapter le code.
      www.selenium.dev/documentation/webdriver/getting_started/install_drivers/

    • @jacquesbaudson8767
      @jacquesbaudson8767 2 года назад

      @@Joycode_ merçi beaucoup

  • @emericg6659
    @emericg6659 Год назад

    super cool merci

  • @noobils
    @noobils Год назад

    Salut merci beaucoup pour ton tuto, j'essaye de le faire sur Google colab pour un projet d'école, en revanche ça me retourne la page du captcha quand je connecte le driver à la page, tu as une idée de comment je pourrais le bypass avec Colab? :)

    • @Joycode_
      @Joycode_  Год назад +1

      Avec Colab c'est compliqué parce que tu ne peux pas ouvrir une fenêtre. Il y a des outils qui peuvent résoudre automatiquement certains anciens capchas, mais pas forcément les nouveaux. Mon conseil est de faire le scraping en local (tu peux mettre le code dans Colab pour l'expliquer ensuite) et de tout enregistrer dans un fichier CSV, puis de faire toute la partie retraitement, graphes, etc. dans Colab.

  • @tcgvsocg1458
    @tcgvsocg1458 2 года назад

    super merci à toi

    • @Joycode_
      @Joycode_  2 года назад

      Merci pour ton commentaire !

  • @nadinemarcelin8841
    @nadinemarcelin8841 2 года назад

    c'est très bien expliqué. moi, je suis bloquée, pourtant j'applique votre méthode. Pouvez-vous m'aider?

    • @Joycode_
      @Joycode_  2 года назад

      Bien sûr !
      À quelle étape est-tu bloquée ?
      Sur quel site ?

  • @hassan_web3924
    @hassan_web3924 2 года назад

    est ce que tu peux écrire ton code avec une liste compréhension?

    • @Joycode_
      @Joycode_  2 года назад

      On peut remplacer quasiment toutes les boucles de append par des list comprenhension.
      En revanche mon conseil est de ne le faire que lorsque l'opération est très simple et claire, sinon ça rend le code illisible.
      Dans certains cas également, utiliser numpy ou pandas directement sera plus efficace.

  • @frenchwomeninthevineyard
    @frenchwomeninthevineyard Год назад

    Bonjour, nous sommes à la recherche d'un freelance qui puisse nous aider dans notre projet d'extraction de données immobilières à partir de certains sites web immobiliers. Êtes-vous intéressé à travailler avec nous ?

    • @Joycode_
      @Joycode_  Год назад

      J'ai un travail à plein temps et cette chaîne est un hobby, donc malheureusement je n'ai pas le temps pour des missions en freelance.

  • @huguytughffcvfdxv
    @huguytughffcvfdxv 3 года назад +1

    4:30 ça m'interesse

    • @Joycode_
      @Joycode_  3 года назад

      C'est en cours 😉

  • @julienpierrel6399
    @julienpierrel6399 Год назад

    Salut ! Merci beaucoup pour tes vidéos ! je débute l'apprentissage de python et c'est vraiment top :)
    J'ai cependant un petit problème avec ce tutoriel scraping, j'ai scrupuleusement recopier les lignes et étapes, mais lorsque tu tapes dans ton terminal : cd 'etc puis python .\etc je n'ai plus la même chose...
    en effet, tout d'abord sur visual studio code, dans le terminal, je n'ai pas les flèches de couleurs (gris,bleu,vert,violet) puis il m'est ecrit : python .\scraper.py
    C:\Users\Julien Pierrel\AppData\Local\Programs\Python\Python311\python.exe: can't open file 'C:\\Users\\Julien Pierrel\\Desktop\\Immobilier\\scraper.py': [Errno 2] No such file or directory
    je n'ai hélas pas la connaissance pour débloquer le problème...
    si tu pouvais m'aiguiller ! d'avance merci !

    • @Joycode_
      @Joycode_  Год назад +1

      Dans VSCode, pour savoir dans quel dossier tu es regarde le début de la ligne (invite de commande) là où tu tapes "python scraper.py". Tu peux aussi taper "pwd" puis entrée ça t'affichera le chemin. Ensuite utilise cd "dossier" ou cd .. (revient en arrière) pour te déplacer de dossier en dossier. Tu peux aussi fermer et réouvrir VSCode directement dans le bon dossier. Dernier truc : vérifie que ton fichier est bien sauvé (Ctrl+S).

    • @Joycode_
      @Joycode_  Год назад +1

      Si tu débutes commence peut-être par le cours pour débutants :)

    • @julienpierrel6399
      @julienpierrel6399 Год назад

      @@Joycode_ Super merci beaucoup pour ta réponse !