Scraper instagram: Exemple de scraping avec Python

Ninja Scripter

Просмотров 35 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 5 окт 2024
Salut à toutes et à tous, aujourd’hui une vidéo un peu plus longue pour vous montrer un exemple un peu plus concret de scraping avec Python. On scrape Instagram, ou plutôt un profil Instagram.
CONTACT: contact@ninjascripter.com

Комментарии • 67

@AlexandreMalfreyt 3 года назад ⁺¹⁰
Pour voir plus clairement l'arborescence dans un json, tu peux le copier-coller dans un json verifier: ça te le trie avec des menus déroulants, indentés pour chaque niveau de l'arborescence
@rimerodecoco1098 2 года назад ⁺¹
j’ai été choqué quand tu as parler en français mdrrr enfin un programmeur fr je te soutiens merci pour ta vidéo
@bernardfronsacq9765 3 года назад ⁺²
C'est très clair, même pour un débutant, merci!
@julienfink7410 4 года назад ⁺²
Merci beaucoup pour ces très bonnes explications, c'est super clair.
@sofianerebib1925 4 года назад ⁺¹
Bonjour
Super tuto et superbe chaîne je vous encourage
Si vous pouvez faire une vidéo sur comment scrapper le site leboncoin ça serait top
Merci
@multimedia1442 4 года назад
super merci jai suivi toute la série c super
@angelopinto5511 4 года назад ⁺³
Hey j'adore t'es vidéos et j'aurais kiffé que tu scrape un site internet et que tu le mette sur une app mobile avec React-Native donc en gros que ton scraping genere un ficher JSON ça aurait été démon si tu fais ça :D
@AngeloLeFou 2 года назад
@Sae x . mais what comment tu sais ? C’est mon autre compte excuse 😌
@kondabalo8772 3 года назад ⁺¹
Bonjour, Merci beaucoup pour ces vidéos c'est très clair. Je voulais savoir si c'était possible un scraping des profils linkedin car actuellement je suis dessus et j'ai quelques blocage (Une petite vidéo sur le scrapping de profils linkedin ou si l'on a deja un certains nombre de url linkedin) Merci d'avance
@catherine5444 2 года назад ⁺¹
Merci pour cette vidéo, j'ai essayé de suivre le tuto mais le site n'est plus identique j'ai l'impression. Si c'est le cas, est-ce que tu pourrais remetre à jour ta vidéo ? Un grand merci :)
@nabilait-hellal2678 4 года назад ⁺¹
merci pour cette video... une video sur un exemple de scraping de donnees avec une action derriere serait magnifique... je pensais par exemple à scraper les liens des abonnements ou abonnes sur une page et les follw derriere avec des conditions (tags, nb abonnes, bio ou date du dernier commentaire)
@ninjascripter5214 4 года назад ⁺¹
Bonne idée, je prend note
@ulrichatin1349 2 месяца назад
tu peux scrapper linkedin et recuillir des information comme le nombre de like et commentaire ainsi que quelques information du post
@ibrahimabarry8839 4 года назад
tres top merci
@kalik6499 4 года назад ⁺⁵
Comment scraper une vidéo sur un site de streaming (youtube, netflix, ou autres sites de streaming)
Sinon super vidéo
@user-jm3ix9kg3w 3 года назад
Pour une vidéo tu as la commande ytdownload qui marche très bien
@issabarack8590 3 года назад
@@user-jm3ix9kg3w Dans ÿthon?
@ValerianRamazotti 4 года назад ⁺²
Bonjour, super boulot ! Une question néanmoins, si on rajoute " .text" à la fin du " 'script', {'type': 'text/javascript'})[3] " le résultat dans le cmd ne retourne rien. Savez-vous pourquoi?
@bigben001 4 года назад
faut verifer les balise à identifier
@ValerianRamazotti 4 года назад
@@bigben001 Merci pour l'indice, en vérifiant les balises ont pourtant l'air correctes ...
@remesz 2 года назад
@@bigben001 .findAll('script' ,{'type' : 'text/javascript'})[3].text erorr
@samim7792 3 года назад
Bonjour, superbe vidéo ! Mais que faire si en passant par python, la page instagram renvoie 'page not found' alors que sur un navigateur classique ça marche ? Merci !
@lehoax6498 4 года назад ⁺¹
Salut un tuto sur comment, si je créer un logiciel et que je veut une fonction qui cherche sur Wikipedia ou autre à ma place juste en mettant des mot clef. Sans avoir à trouver les id de chaque page car vu que c'est un site communautaire les balise ne sont peut-être pas les même ?
Peut être un peu d'ia 😂
Merci continue comme ça 💪
@ninjascripter5214 4 года назад ⁺⁴
Merci très bonne idée, pas besoin d'IA pour ça. Il y a un tas de méthodes, ça pourrait faire un bon sujet pour les explorer ! :)
@plutio__ 8 месяцев назад
Salut je suis un peu bloquer... J'essaye de scraper un site donc, cependant chaque balise que j'essaye il me met None...
Pour tu m'aider ?
@kunc3929 Год назад
Bonjour, je me demandais pourquoi instagram ne bloque pas ces requêtes, aurais-tu une idée ?
@najy8320 2 года назад
Salut tu pourrais faire une vidéo ou tu fais un site avec l’outil d’analyse pareil que le site que tu montres dans la video stp ?
@salimaissani5564 3 года назад
Bonjour,
Une question , lorsque je rajoute .text
à la fin du script = soup.findAll('script',{'type':'text/javascript'})[3].text le résultat ne retourne rien.
Savez-vous pourquoi?
@mouhiteadebo8559 3 года назад
Salut comment tu vas, j'aimerais savoir si tu peux scrapé le site du leboncoin.Merci
@sebastienverslype 4 года назад
Bon boulot, vidéos claires et de bonne qualité ! Je m'abonne !
Je me lance dans le scrapping, saurais tu me dire si ça se monnetise bien ?
@ninjascripter5214 4 года назад ⁺¹
Il y a plein de manières de monétiser le scraping. C'est une compétences comme une autre, création de SAAS, freelancing, prestations de service, etc... Le scraping peut aussi servir à récolter des données pour du ML ou encore à réaliser des automations pour driver du traffic.
@rx3443 3 года назад
Pour copier une page entière fais control+a
@konflashnamikaze4750 Год назад
Stp tu pourrais en faire pour les canaux telegram ?
@SportsLJ6 3 года назад ⁺¹
scrapper une sortie de chaussure sur nike snkrs :)
@swinight8273 3 года назад
Et aussi tu pourais me donnais l'url pour le logiciel terminator ?
@joepia9309 3 года назад
Comment récupérer les statuts WhatsApp avec le scrapping python
@swinight8273 3 года назад
Salut
Je pourais savoir comment tu fais pour ouvrire la console ?
@wargone540 3 года назад
Sur sublime text je sais pas mais sur VS Code c'est Ctrl + F5
@XLatiozz 4 года назад
Salut tu aurais quelquechose ou je peux te contacter ?
@willypaisley7475 4 года назад
Bjr,
Cool tes videos, Pourrais tu faire une video de scraping sur leboncoin stp, et rentrer les résultats directement dans une base de données ?
Merci encore.
@emelybrown7539 4 года назад
Ce n'est plus possible. Du moins c'est devenu très compliqué. Ils ont mis un catcha
@nabilbenhamed7798 4 года назад
salut
j'ai besoin de scraper une page facebook
quels sont les étapes à suivre
@ninjascripter5214 4 года назад ⁺¹
Salut, la méthodologie de la série de vidéos sur le web-scraping devrait t'aider reprend les étapes et adapte les à la page que tu veux scraper
@hugofragassi 3 года назад
Salut, peux tu apprendre à scrap sur télégram car ça aiderais énormément de monde
@issabarack8590 3 года назад
Salut et merci pour tes vidéos fort intéressantes! J'ai un souci avec instagram: quand je fais un request sur le site instagram j'ai systématiquement une réponse 429 (Too Many Requests). comment faire pour régler ce problème systématique... Merci d'avance
@ninjascripter5214 3 года назад
tu peux utiliser un user agent différent, ceux de google marchent souvent pas mal. Tu peux retarder tes requêtes avec time.sleep(n). Ou encore utiliser des proxies
@ninjascripter5214 3 года назад
Pour utiliser time.sleep il faut importer time (import time) et passer une valeur n dans sleep pour la durée en secondes
@issabarack8590 3 года назад
@@ninjascripter5214
Où trouver cette liste de user_agent Google et comment coder ça dans Python? Désolé je suis novice. A moins que tu aies tu déjà fait un tuto sur le sujet? Je serai preneur
@floriancasagrande3095 4 года назад
bonjour, comment pourrait on changer le nombre de posts a analyser ? merci
@ninjascripter5214 4 года назад ⁺¹
Il me semble qu'il y à 12 posts dans le json, alors quand tu fais référence à la variable "posts" définie dans le tuto, tu peux commencer à partir du deuxième post avec la syntaxe posts[1:] et ainsi avoir 11 posts. tu peux augmenter le nombre exemple: posts[5:] qui te fera commencer à partir du 6eme tu aura donc 7 posts sauf erreur. Tu peux aussi commencer à partir de la fin et effectuer la même opération. la variable "posts" n'est jamais qu'une liste, pour en apprendre plus sur les liste tu peux jeter un coup d'oeil ici -> docs.python.org/fr/3/tutorial/datastructures.html
En revanche si tu veux avoir plus de posts dans ta liste ça devient un peu plus complexe car il faut multiplier le nombre de requêtes et jouer sur les paramètres mais on verra tout ça dans la série de tuto avancés sur le scraping !
@floriancasagrande3095 4 года назад
@@ninjascripter5214 oui je pensais plus a augmenter le nombre de posts. Merci, je suis impatient de voir la suite !
@ninjascripter5214 4 года назад ⁺¹
Pour répondre à ta question initiale, je t'invite à consulter la dernière vidéo de la chaîne ruclips.net/video/pQL-Bflq_pw/видео.html
@Allouetti 4 года назад ⁺¹
Très bonne série de vidéos ! :)
Je rencontre néanmoins un problème sur la définition de la variable script.
script = soup.findAll('script', {'type': 'text/javascript'})[3].text
Il m'est impossible de rajouter ".text". Le print devient nul et ne m'affiche alors plus rien. En enlevant ".text" j'ai bien le 4ème script qui s'affiche mais donc avec les balises.
@ninjascripter5214 4 года назад
Tu peux me donner plus de détails ?
@fatimahabib1431 4 года назад
J’ai le même problème! Quand j’ecris .text , j’ai aucune résultat
@Allouetti 4 года назад
@@fatimahabib1431 Au lieu de mettre ().text essaye str()
Cela va convertir en string (=texte) le contenu de la parenthèse
@fatimahabib1431 4 года назад
@@Allouetti merci , jai fait comme ca : script =
str(
soup.findAll
('script', {'type':'text/javascript'})[3])
raw_data = script.replace(';' ,',').replace('window._sharedData =','').replace(' ','').replace('','')
-----------------------
mais quand utiliser json.loads(raw_data),j'ai erreure "json.decoder.JSONDecodeError: Extra data: line 1 column 50281 (char 50280)
"
@cyrilbazin2649 4 года назад
@@fatimahabib1431 Toujours pas de solution ? car j'ai le même problème
@edits4kk 2 года назад
Je voulais juste les codes de ma meuf tu m'as sorti un truc j'ai rien compris 🤣🤣🤣
@JP-xe6gn 3 года назад
Merci pour cette vidéo ! Je n'arrive pas à scraper Instagram, requests me renvoie un code 429 -> Too many requests ...
@elliotprybil3408 3 года назад
Salut JP, j'ai le meme problème. As tu pus le résoudre depuis ?
@JP-xe6gn 3 года назад ⁺¹
@@elliotprybil3408 Salut, oui, en mettant ça comme paramètre Headers de la méthode .get -> r = requests.get(url,headers= {"User-Agent": "Mozilla/5.0"})
@peterkim9696 3 года назад
It's called JSON not jayzon 🙄
@nedjmachihabe4796 2 года назад
Dommage pas assez de pédagogie, trop de perte de temps et trop de blabla...

Следующие

Автовоспроизведение