Saia do zero em Webscraping no Python com Scrapy

Поделиться
HTML-код
  • Опубликовано: 12 дек 2024

Комментарии • 227

  • @HashtagProgramacao
    @HashtagProgramacao  3 года назад +21

    Fala galera!
    Gostou do vídeo? Deixa a sua curtida e se inscreve no canal!
    ► Para baixar o Minicurso de Python, acesse: pages.hashtagtreinamentos.com/inscricao-minicurso-python-automacao-org?origemurl=hashtag_yt_org_minipython_QdLgNr1mKQU
    ► Para baixar os arquivos da aula, acesse: pages.hashtagtreinamentos.com/arquivo-python-12dFWOx9eH1dJH7iEV7vE7AIF1w1Up9FN?origemurl=hashtag_yt_org_planilhapyt_QdLgNr1mKQU
    ► Para instalar o Jupyter, acesse: ruclips.net/video/_eK0z5QbpKA/видео.html
    ► Blog: bit.ly/2MRUZs0
    ► RUclips: bit.ly/3c0LJQi
    ► Instagram: bit.ly/3o6dw42
    ► Facebook: bit.ly/3qGtaF2

    • @Dinis_666
      @Dinis_666 2 года назад

      o comando pip nao eh reconhecido no ambiente virtual, o que pode ser feito?

  • @fernandocoelho1334
    @fernandocoelho1334 27 дней назад +1

    Videos de WebScrapping, sempre fazem abrir a mente, dando-nos uma noção de informações que desejamos, mais que para obte-las, é complicado ou exigia uma certa esperteza.
    Ainda temos a possibilidade de adquirirmos informações a partir de uma planilha e gravarmos em um banco de dados.
    Ajuda bastante e em algumas vezes é necessário, principalmente quando há um legado.
    Eu tenho uma necessidade.
    Estou precisando de pegar todos os bairros de todos os municípios de uma UF.
    A partir de cada município, que há necessidade de ser escolhido, preciso ler pelo menos o CEP, pois diante deste, existe um pacote Python que mostra o Bairro e no teste utilizado, ele trouxe essa informação a partir de um campo, chamado Distrit.

  • @LuisLima-rc2ls
    @LuisLima-rc2ls 2 года назад +33

    Ótimo vídeo, gostei muito. Só tenho uma pequena correção no código, quando for armazenar a avalição os valores se repetem. com isso é coloquei uma variável para contar e ir de índice em índice "'nota': response.css('strong::text')[cont].get()". Coloque "cont = 0" antes do "for" e fiz a incrementarão logo após o final da chave do "yield", que ficou assim "cont += 1".

  • @raulfaria07
    @raulfaria07 Год назад +4

    Que aula SENSACIONAL! 1 hora de puro conteudo, isso é maravilhoso.

  • @guilhermealves-qw4te
    @guilhermealves-qw4te Год назад +1

    deem mais espaço para este cara lira, o cara é bom e a didática é excelente !!!!!!!!!

  • @srkenny404
    @srkenny404 Год назад +2

    Estou integrando numa empresa e o teste técnico é justamente usar o Scrapy e Docker para varrer um site específico. Obrigado pela aula! Me ajudou muito!

  • @mafer.sa86
    @mafer.sa86 10 месяцев назад

    Gentee, que massa essa sequencia de videos de webscrapping
    arrasaram

  • @CeramicasJG
    @CeramicasJG Год назад

    Muito obrigado por esta abordagem à biblioteca Scrapy !!! Excelenteeee e PARABÊNS

  • @freedoom4090
    @freedoom4090 2 года назад

    melhor video sobre o tema. Assisti vários e já quebrei muito a cabeça. Vlw! Salvou rs

  • @JuniorSilva-dl2ex
    @JuniorSilva-dl2ex 2 года назад +1

    Obrigado pelo material, muito bom ver na prática e realmente, é muito simples, minha experiência de desenvolvimento web de 6 anos facilita bastante, mas realmente é incrivel a praticidade do python para esses processos, vou continuar estudando, mas o seu vídeo já me deu fundamentos mais que suficiente para trabalhar processos interessantes.
    Mais uma vez obrigado e parabéns, inscrição em gratidão.

  • @andrevercosa3050
    @andrevercosa3050 2 года назад

    Excelente vídeo! Ajudou muito! Estamos ralando no trabalho com uma planilha que deve ser preenchida todos os dias com informações de um dos sites que atendemos. Vou puxar essas informações de de forma direta agora.

  • @apbluis
    @apbluis 3 года назад +2

    Top...muito obrigado pela ótima explicação...vai me ajudar muito em um projetos que estou desenvolvendo...estou engatinhando no python mas esse canal tem me ajudado bastante a progredir

  • @teamwgss
    @teamwgss 3 года назад

    Cara estou abismado show de bola, curti muito. Estou ingressando agora nesse mundo e de cara ja vi esse vídeo que só me deixou mais animado ainda.

  • @felipelandim4619
    @felipelandim4619 3 года назад

    Animal essa aula. Já tinha noção de WebScraping e não esperava.

  • @gustavoco
    @gustavoco 2 года назад +2

    MUITO FODA! Obrigado por ir super no detalhe, faz muita diferença para quem está começando!!!

  • @gabrielsozinho
    @gabrielsozinho 3 года назад +17

    Vocês lêem mentes é? Tava pesquisando sobre isso desde ontem. Vocês são muito bons!

    • @manobro358
      @manobro358 2 года назад

      Enfim o algoritmo.

    • @wilsonpalma4458
      @wilsonpalma4458 2 года назад

      Eles não, mas o algoritmo do yt kskskskks

  • @LennWeltmeister
    @LennWeltmeister 3 года назад +2

    Webscraping mudou minhavida

  • @windsorramospsicologo2622
    @windsorramospsicologo2622 2 года назад

    Gostei muito da sua didática. Impossível não compreender.

  • @sergiolcrezende
    @sergiolcrezende 2 года назад

    nota máxima em qualidade e conteúdo. Vale a pena assistir.

  • @leonardopangaio5574
    @leonardopangaio5574 3 года назад +16

    Primeiramente parabéns pelo excelente trabalho que o time está realizando.
    Gostaria de sugerir vídeos com os módulos OS, SYS, PROCESS, SUBPROCESS e outros nessa levada...

    • @lairon5545
      @lairon5545 2 года назад +1

      Boa garoto, seria top falar sobre essas bibliotecas mesmo !
      UP

  • @mateuscastro5593
    @mateuscastro5593 8 месяцев назад

    muito bom esse vídeo, é o que explicou melhor como funciona

  • @GabrielPraga
    @GabrielPraga Год назад

    Parabéns o trabalho excelente de conteúdo!!! tenho uma noção de scrapy e agora com esse vídeo me ajudou muito! Obrigado

  • @fabiosloan3807
    @fabiosloan3807 2 года назад

    Show de bola, entendi muito mais do que no curso que eu to pagando e fazendo...

  • @MateusSilva-ic2mj
    @MateusSilva-ic2mj 3 года назад

    gostei bastante,que Deus abençoe vocês e a familia de vocês sempre

  • @mauriciopc92
    @mauriciopc92 9 месяцев назад

    Animal esse scrapy, agradeço a aula completa!

  • @carlosconde3498
    @carlosconde3498 2 года назад

    Muito bom, isso é um grande inicio para projetos maiores, parabéns e obrigado...

  • @arturcamargo6216
    @arturcamargo6216 2 года назад

    Muito obrigado, seu trabalho é relevante e importante. Aprendi bastante com o vídeo e vai ser bastante útil pra mim

  • @kaiquelopes9386
    @kaiquelopes9386 3 года назад

    Meus canais preferidos hashteg programação, curso em vídeo e programando programas

  • @cdeliamachado2
    @cdeliamachado2 Год назад

    Muito legal. A tua aula é muito boa.

  • @leonardoxavier1825
    @leonardoxavier1825 3 года назад +12

    Muito bom o vídeo! Se pudesse fazer outro vídeo aprofundando um pouco, por exemplo:
    Ensinando como passar esse csv formatado para realizar analises com o pandas, como realizar scraping em sites onde a lista de informações que eu quero está dividida em várias páginas (pág 1, 2, 3), etc.

  • @leticiabrito7549
    @leticiabrito7549 2 года назад

    Muito obrigada! Muito explicativo! Espero que façam um com um site que as atualizações são recorrentes! No aguardo!

  • @ferakafs
    @ferakafs 2 года назад

    JOvem do céu. Conteudo muito topp

  • @gplgomes
    @gplgomes 3 года назад +1

    Eu gostei. Ensinou várias coisas. Valeu Candioto, Candidato a vaga do Lira.

  • @garotodoprograma
    @garotodoprograma 3 года назад +1

    Cara que show, eu amo webscraping, mas não conhecia o scrapy, muito show seu vídeo cara, Sucesso!

  • @Leiras10
    @Leiras10 3 года назад

    Cara, muito boa aula, muito fácil a maneira como você trouxe o conteúdo, parabéns e obrigado!!

  • @helintongustavo9049
    @helintongustavo9049 3 года назад

    Muito bom conteúdo! minha primeira experiência em webscraping, obrigado.

  • @MrPaulopspm
    @MrPaulopspm 2 года назад

    Mano kkkkk que daora isso. Valeu pelo vídeo. Entendi a importância de criar um ambinete virtual tbm

  • @FelipeRocha1
    @FelipeRocha1 2 года назад +1

    Sensacional! Parabéns!

  • @nicoleishikawa950
    @nicoleishikawa950 4 месяца назад

    Adorei o vídeo, os atalhos são incríveis, realmente facilita a vida. Ainda nesse assunto de Webscraping, consegue fazer um Webscraping que puxe os vendedores do mercado livre? Para prospecção de Leads.

  • @BrunoSantoSoares
    @BrunoSantoSoares 3 года назад

    Muito bom Candioto!!! Obrigado por compartilhar e Parabéns pelo conteúdo!

  • @meninoross
    @meninoross 3 года назад +4

    Muito bom os vídeos de vocês, parabéns!!! Minha dúvida é como fazer isso em um site que precisa de login e senha?

  • @ricardomonteiro1803
    @ricardomonteiro1803 2 года назад +9

    Poderia fazer uma aula comparando preço dos produtos de sites diferentes, mostrando quanto custa um produto A em fornecedores diferentes e talvez até fazer um ranking do melhor preço, etc... Parabéns pela aula👏👏👏

    • @JulianoDados
      @JulianoDados 10 месяцев назад

      sabe se tem vídeo sobre isso usando python? (vários sites)

  • @fabiotoniolo
    @fabiotoniolo 3 года назад

    muito boa a dica do selector gadget!

  • @ricardoalmeida7607
    @ricardoalmeida7607 3 года назад +1

    Excelente! Muito obrigado!

  • @jealferreira
    @jealferreira 2 года назад +1

    Top demais, Daniel!
    Eu só tive problema em usar o terminal que não reconheceu o scrapy, mas usei o cmd. Acho que tem relação com a versão do Python que no vídeo é 3.6 e o meu já está no 3.8.
    Mas no final, tudo funcionou perfeitamente.
    Obrigado!

    • @srkenny404
      @srkenny404 Год назад

      Eu estava usando o Python 3.11 e realmente deu errado. Parece que o Scrapy só roda nessas versões mais antigas (usei o Python 3.7 no meu venv)

  • @fabiosandro3290
    @fabiosandro3290 3 года назад +2

    Meus parabéns pelo excelente vídeo 👏👏👏

  • @fernandogalhango2299
    @fernandogalhango2299 2 года назад +1

    Começando os estudos de python com esse vídeo e para um projeto pessoal tbm. Como estamos em temo de copa do mundo, poderia fazer um vídeo mostrando como pegar os dados de alguma copa qualquer no site da Fifa. Tanto como resultados de jogos, escalação e marcadores de gol...

  • @carlosdiego1241
    @carlosdiego1241 2 года назад

    Top! Obrigado por compartilhar essas informações.

  • @diegosousadocarmo9232
    @diegosousadocarmo9232 2 года назад

    Thanks! I've been searching how to get it and this is brilliant :D

  • @carloscoelho8704
    @carloscoelho8704 3 года назад

    Muito bom parceiro. Excelente para quem está começando.

  • @pabloguimaraes
    @pabloguimaraes Год назад

    Gostei da aula. Poderia mostrar depois como ficaria isso, fazendo tipo um cron, agendamento.

  • @frankwilliam8689
    @frankwilliam8689 3 года назад +1

    Mais uma aula TOP, parabéns

  • @flipboxmusic5097
    @flipboxmusic5097 2 года назад +1

    Que aula meu amigo, conteúdo de valor !
    Meus parabéns !

  • @klauseduardodorte4395
    @klauseduardodorte4395 3 года назад

    Perfeito.
    Excelente explicação.

  • @rubialugattimoreira1978
    @rubialugattimoreira1978 2 года назад

    Só professor bom nesse canal. Sou fã

  • @FabioRBelotto
    @FabioRBelotto Год назад

    Muito bom o vídeo.
    Poderia falar um pouco mais sobre scrappy vs requests + Bs4?

  • @grennereis8977
    @grennereis8977 9 месяцев назад

    Olá, ótima aula. Perfeita, como faço no caso de ter mais de uma página na lista de filmes?

  • @jccintr
    @jccintr 2 года назад

    Muito bom. Parabéns pelo excelente vídeo.

  • @leonardoleandro8760
    @leonardoleandro8760 3 года назад +1

    @Hashtag Programação, muito bom !!
    Vocês poderiam fazer uma aula de integração do Python de Análise de Dados com o Google Data Studio, seria muito interesse por ser um ambiente Web.

  • @antonioguilherme1844
    @antonioguilherme1844 Год назад

    top demais esse framework!

  • @edhardsan6979
    @edhardsan6979 2 года назад

    Aula Impressionadora! Adoro o conteúdo de vocês! A hashtag devia se chamar hashtop!

  • @eduardoalvim4885
    @eduardoalvim4885 3 года назад

    Vcs arrasam façam mais videos de webscrapping por favor

  • @silas.braga.
    @silas.braga. 2 года назад

    Conteúdo top, obrigado por produzir.

  • @raffaelegirodoangelin6649
    @raffaelegirodoangelin6649 3 года назад +3

    Maravilha!! Quando vai ter curso completo de Scrapy?

  • @giovannileao
    @giovannileao Год назад

    Obrigado Diogo Defante programador

  • @danrleideoliveira751
    @danrleideoliveira751 2 года назад +1

    Sensacional!

  • @runcall
    @runcall 3 года назад

    Parabens! Maravilha! Gostei muito!

  • @jonasjosino4662
    @jonasjosino4662 2 года назад

    Muito bom vídeo!! Parabéns!

  • @anamachado5323
    @anamachado5323 10 месяцев назад

    OI, faz um video de como usar webscraping para preencher formulario por requests

  • @erikarosa8315
    @erikarosa8315 Год назад +1

    Muito bom o vídeo.

  • @Pellsmine
    @Pellsmine 3 года назад +7

    Cara tem um problema ai, as notas todas foram 9.2, o get ta pegando somente a nota do primeiro filme, fora isso ficou perfeito, parabéns!

  • @eumesmo2042
    @eumesmo2042 3 года назад

    Excelente vídeo, inclusive!

  • @jonasalvesdeazevedojr311
    @jonasalvesdeazevedojr311 3 года назад

    Muito booommm professor. Faz uma aula depois de scrapy pra coletar dados de sites como Americanas, Magalu, Mercado Livre, Shopee etc

  • @m.magrin8862
    @m.magrin8862 2 года назад

    Obrigado pela aula!

  • @johnyramonvoss2250
    @johnyramonvoss2250 2 года назад +1

    boa tarde, tudo bem? queria ver um mini curso para coloetar dados do site da amazon para pegar valor e nome do produto. Muito bom o video.

  • @kamirtrigo4817
    @kamirtrigo4817 Год назад

    Poderia pegar também de indicadores de mercado, bem voltado para o mercado de trabalho

  • @AlexSilva-uk3zb
    @AlexSilva-uk3zb Год назад +1

    muito bom, parabens...

  • @flaviodouglaslopesdias7509
    @flaviodouglaslopesdias7509 3 года назад

    Excelente aula.
    Valeu...

  • @julianooliveira3835
    @julianooliveira3835 2 года назад

    Maravilha meu irmão!

  • @reginaldosarcinellifilho9888
    @reginaldosarcinellifilho9888 2 года назад

    Daniel, Parabéns pelo vídeo, bastante didático! Gostaria de saber se o scrapy consegue também extrair informações de paginas dinâmicas.

  • @leonaldobatalha6564
    @leonaldobatalha6564 2 года назад

    Blz! Estou inscrito no curso de Python Impressionador e estou gostando bastante deste assunto. Lá no curso de Python fala sobre Selenium e do Pyautogui, fazendo uma breve comparação entre estes que mecionei e o Scrapy, quando seria o melhor? ou quando devo usar um deles? Grato.

  • @rafaelsantana9946
    @rafaelsantana9946 2 года назад +1

    Muito obrigado!
    def parse(self, response):
    for indice, filme in enumerate(response.css('.titleColumn')):
    yield {
    'titulo' : filme.css('.titleColumn a::text').get(),
    'ano' : filme.css('.secondaryInfo ::text').get(),
    'nota' : response.css('strong ::text').getall()[indice]
    }

  • @fabianodealmeidamelo5089
    @fabianodealmeidamelo5089 Год назад

    Parabéns!

  • @alviabeck
    @alviabeck 2 года назад

    Muito bom - Obrigado!!!

  • @neliodiassantos
    @neliodiassantos 3 года назад +1

    Olá, pessoal. Muito bom o vídeo! A minha dúvida é pq devemos criar um ambiente virtual em cada projeto?

    • @tiagof5623
      @tiagof5623 3 года назад +3

      Para vc ter um ambiente somente com a bibliotecas q vc for usar sem misturar com o ambiente global. Dessa forma, evita incompatibilidade de bibliotecas e vários problemas. Tbm contribui para uma melhor organização.

  • @marciaceciliadossantospisa50
    @marciaceciliadossantospisa50 3 года назад +1

    Olá, boa noite ! É possível fazer webscraping de comentários da página de fecebook e Instagram. Eu trabalhava fazendo análises qualitativas de comentários nas Redes sociais. E fazia isso manualmente.

  • @ramonoliveiracardoso2833
    @ramonoliveiracardoso2833 3 года назад +10

    Cara, acho que vale a pena uma aprofundada nisso hein.
    Scrapy X Selenium: Quais as diferenças, quando utilizar um ou outro?
    Como fazer uma extração e jogar os resultados direto em um BD?

    • @ramonoliveiracardoso2833
      @ramonoliveiracardoso2833 3 года назад

      Ah, e claro, conteúdo MUITO bom.
      Obrigado e parabéns!

    • @marcelohenriquepsy1491
      @marcelohenriquepsy1491 3 года назад

      preferi fazer no selenium, ta doido maior trampo, essa parada de criar ambiente virtual, via a aula parando e pensando, ja no selenium fiz em 5min o codigo, scrapy deve ser bom para outras coisas

    • @ramonoliveiracardoso2833
      @ramonoliveiracardoso2833 3 года назад +4

      @@marcelohenriquepsy1491 Sim mano, dependendo da situação o scrapy acaba sendo uma "bazuca pra matar uma formiga", se é que me entende. O Selenium te permite fazer as coisas de um jeito mais prático e direto, mas quando você começa a pegar uns problemas maiores começa a ficar complicado (meu cenário).
      Sobre papo de ambiente virtual, isso ai é independente do selenium po. É mais uma boa prática. Dependendo do contexto, dá pra lascar tudo no global mesmo.

    • @danilodelucio
      @danilodelucio 3 года назад +1

      @@marcelohenriquepsy1491 Sendo bem sincero o Daniel perdeu um tempo violento ensinando a criar ambiente virtual e as paradas por CMD, coisa que quem tá começando não compensa aprender isso de cara, só "assusta" mesmo.

    • @extremetrader9418
      @extremetrader9418 2 года назад

      @@marcelohenriquepsy1491 se você não criar ambiente virtual pode danificar o python do seu sistema ou seja qual for a linguagem, no máximo vc teria que formatar seu Pc! Se por algum milagre seus projetos estiverem no GitHub basta fazer o clone e continuar de onde parou!

  • @filipedeasevedo4871
    @filipedeasevedo4871 3 года назад +2

    Muito bom!

  • @luanovamusic4656
    @luanovamusic4656 2 года назад +2

    Boa tarde, pfvr se conseguirem fazer algum vídeo de WebDriver utilizando o internet explorer ajudaria muito.
    Não achei nada na internet sobre, queria selecionar botões e escrever nos input, atualmente o sistema da minha empresa só roda nesse navegador.
    Desde já muito obrigado.

  • @renatomarques7407
    @renatomarques7407 3 года назад

    Parabéns pelo conteúdo foi muito explicativo. Agora me deparei com uma situação que os textos tinha acentos. Onde devo informa o utf8_encode($texto); ?

  • @rafaelnegreiros_analyst
    @rafaelnegreiros_analyst Год назад +1

    Excelente

  • @desouza850
    @desouza850 3 года назад

    to aprendendo muito com esse canal, muito obrigado !

  • @guilhermepimenta1960
    @guilhermepimenta1960 3 года назад +23

    Mano muito bom o vídeo, mas os itens da nota estão errados. Deu 9.2 independente do filme, pq vc ta dizendo q a nota é sempre o primeiro item da lista de notas.
    Faltou utilizar um enumerate no for pra poder iterar pelo índice e pegar a informação correta da nota através do índice.
    For indice,filme in enumerate(filmes):
    Yield{
    ...
    Nota : response.css(...)[indice]
    }
    Mas ótimo vídeo, não tô querendo ser chato mas é pq é uma informação importante hehe.
    Vlw, tmj!

    • @Kgs2050
      @Kgs2050 3 года назад

      Olá @Guilherme Pimenta, tentei o for loop e enumerate acima, mas nao funcionou também. Como conseguiu fazer?

    • @guilhermepimenta1960
      @guilhermepimenta1960 3 года назад

      @@Kgs2050 vc colocou o css seletor correto ?

    • @canaldeumpolitecnico9969
      @canaldeumpolitecnico9969 3 года назад

      @@guilhermepimenta1960 verdade

    • @viniciussalgueiro1953
      @viniciussalgueiro1953 2 года назад +2

      ele me retorna apenas 3 itens e com as notas 9 . e 2 kkkk

    • @Daniel_P
      @Daniel_P 2 года назад +5

      ​@@viniciussalgueiro1953 Tente fazer algo assim:
      def parse(self, response):
      for i, filmes in enumerate(response.css(".titleColumn")):
      yield{
      "title" : filmes.css(".titleColumn a::text").get(),
      "date" : filmes.css(".secondaryInfo::text").get()[1:-1],
      "rate" : response.css("strong::text").getall()[i]
      }
      pass
      E fazer o scrapy crawl novamente

  • @PauloSouza73
    @PauloSouza73 2 года назад +1

    Ótima aula. Parabéns pelo conteúdo.
    Só fiquei em dúvida que os títulos estavam em português (no site) e quando foram extraídos para .json ou .csv estes apareceram em inglês. Outro ponto já mencionado em outros comentários é que as notas ficaram as mesmas para todos os filmes. Abraço e muito obrigado por nos ensinar mais e mais.

  • @ueldermartin
    @ueldermartin Год назад +1

    Muito legal

  • @robertocardoso8268
    @robertocardoso8268 3 года назад +1

    Gostaria de fazer um scraping do Mercado livre. Saber quantos produtos meus concorrentes venderam de um determinado produto

  • @thayanesoaresgarcia6620
    @thayanesoaresgarcia6620 2 года назад +1

    Teria como extrair as infos do perfil do LinkedIn

  • @FutureImports
    @FutureImports 3 года назад +1

    Grava um vídeo pegando dados da Pichau, seria interessante..

  • @depositodigital7544
    @depositodigital7544 2 года назад

    E possível extrair informações de um site de produtos direto para planilha para adicionar produtos em um site shopfy ou loja integrada por exemplo?

  • @LucasSantos-uw5nb
    @LucasSantos-uw5nb 2 года назад

    Gostaria de pegar os resultados dos jogos da NBA de basquete ... Me ajude por favor 🙏🙏🙏🙏🙏