Aprenda Web Scraping de maneira fácil

Поделиться
HTML-код
  • Опубликовано: 12 ноя 2024

Комментарии • 102

  • @pmagoga
    @pmagoga 11 месяцев назад +1

    Brother, sem sacanagem, você tem a melhor didática que já vi na vida!!! 👌

  • @gabrielsousa1406
    @gabrielsousa1406 Год назад +1

    Dei uma olhada em alguns dos vídeos desse canal, e cara... é triste ver que o canal com uma qualidade e didática tão bacana não cresceu! mas obrigada de qualquer forma pelos conteúdos postados.

  • @fernandes7949
    @fernandes7949 2 года назад +1

    sesacional clareza nas explicações! Parabéns direto ao ponto.. Muito bommm

  • @mayconb22
    @mayconb22 3 года назад +31

    Didática: 10. Edição: 10. Domínio do assunto: 10. Relevância: 10. Nota final: 1000. Parabéns pelo vídeo!

    • @Simpledata
      @Simpledata  3 года назад

      Nota do comentário: MAIS DE 8 MIL 🚀
      Muito obrigado Maycon, fiquei muito feliz com o feedback!
      Abraços

    • @rickcomvc
      @rickcomvc 2 года назад

      Assino em baixo Maycon

  • @glebysonsant
    @glebysonsant 4 месяца назад

    Conteúdo muito bom, irmão! Parabéns! 👏👏

  • @Davi_e_Gabi_oficial
    @Davi_e_Gabi_oficial 3 года назад +1

    Se continuar nessa pegada, me mantenho inscrito....

  • @jurandyalves4277
    @jurandyalves4277 2 года назад +1

    Gratidão pelo conteúdo foda, parabéns 👏👏

  • @Davy-Jhones9708
    @Davy-Jhones9708 2 года назад

    Opa cheguei chegando tô aprendendo python... E esse e meu foco de aprendizado... Depois SQL .. ótimo conteúdo pra mim da uma treinada...

  • @beeginnerstech
    @beeginnerstech 2 года назад

    Ganhou uma inscrita, um like, uma mega seguidora, uma aluna com certeza aos seus cursos pq sei que vou absorver. Teve coisa que bugou no meu note mas fiz questão de buscar solução pra fazer o projeto até o final

  • @Simpledata
    @Simpledata  3 года назад +1

    Fala pessoal, tudo beleza?
    Qualquer dúvida podem deixar aqui nos comentários!
    Se tiverem sugestões para próximos vídeos não deixem de comentar também ✌️
    Abraços
    Link do notebook:
    colab.research.google.com/drive/1Q-IP1WnJM7bkcPoUA-i5yq_QyE5FMwM1?usp=sharing

  • @rodrigomoura4977
    @rodrigomoura4977 3 года назад +1

    Cara... que didática fenomenal!

  • @mateuscardososantos3304
    @mateuscardososantos3304 3 года назад +1

    Fabuloso, irmão, incrível!!!

  • @gamermaster9137
    @gamermaster9137 2 года назад

    Parabéns, Primeiro canal com conteúdo de qualidade e didático!

  • @marceloaugusto5379
    @marceloaugusto5379 3 года назад +2

    Faço extração de dados para meu software SaaS há anos e volta meia o youtube me indica vídeos de webscraping. Apesar de não usar a Requests no dia a dia, conheço ela e você deu um show ao explicar o processo todo para se chegar no csv final. Parabéns!

    • @MrJuninhoms
      @MrJuninhoms 2 года назад

      Qual é o seu saas ? Que tipo de informações vc extrai ?

  • @victorrocha70
    @victorrocha70 2 года назад +1

    Muiiito bom, o melhor vídeo sobre o tema que encontrei, disparado! Sua didática é simplesmente ótima!!

  • @theelaine123456789
    @theelaine123456789 3 года назад +4

    Cara, faz uma playlist. A maioria das pessoas procuram vídeos que tenha playlist.
    Muito bom o visual do vídeo e a explicação, adorei.

    • @Simpledata
      @Simpledata  3 года назад

      Obrigado pela dica Elaine 😄
      Vamos fazer playlists para entrar mais fundo em alguns tópicos, no momento estamos criando uma de Machine Learning.
      Você tem alguma sugestão de próximas playlists?

  • @JoaoVictor-bw7js
    @JoaoVictor-bw7js 2 года назад +1

    Voltem com os vídeos, didática ímpar

  • @juniormarinho7166
    @juniormarinho7166 2 года назад +1

    Simplesmente me inscrevi! Pois a didática/edição e tudo mais foram demais!

  • @LeandroOliveira-lz4un
    @LeandroOliveira-lz4un 3 года назад +2

    Parabéns pelo vídeo gente, muito didática aprendi pra caramba

    • @Simpledata
      @Simpledata  3 года назад

      Mestre Man 😀
      Muito obrigado pelo feedback meu amigo.
      Fica sempre a vontade para mandar qualquer dúvida ou sugestão!
      Abraços

  • @carloscaputo
    @carloscaputo 3 года назад +1

    Parabéns pelo vídeo! Você conseguiu explicar de forma rápida, objetiva e com bom um exemplo. Ficaram ótimos os recursos visuais e o passo a passo bem explicado.

    • @Simpledata
      @Simpledata  3 года назад

      Fala Carlos,
      Muito obrigado pelo feedback parceiro!
      Abraços

  • @victormelo3765
    @victormelo3765 3 года назад +1

    Você ensina de uma forma super didática! Ótimo canal! Parabéns.

    • @Simpledata
      @Simpledata  3 года назад +1

      Valeuuu Victor 👊👊👊

  • @george_leao
    @george_leao 3 года назад +2

    Salve galera!! Achei sensacional, didático, interessante, completo e muito bem humorado também!! Parabéns ✌️✌️✌️

    • @Simpledata
      @Simpledata  3 года назад

      Eaii Georgera tudo bom?
      Muito obrigado meu amigo ❤️

  • @ltakato
    @ltakato 3 года назад +3

    Didático e muito divertido!!!

  •  3 года назад +1

    Excelente seu vídeo, de fácil entendimento, me fez avançar mais uns degraus no python.

  • @djcarreybsb
    @djcarreybsb 3 года назад +1

    Muito boa. Seu conhecimento e didática são excelentes. Parabéns e obrigado por nos ajudar

  • @bruhlickd
    @bruhlickd 3 года назад +2

    Eu AMEI: simples, rápido, objetivo, claro.
    Eu queria aprender a como fazer um mapa com todas essas informações no python. Ensina?

  • @OceanAlves23
    @OceanAlves23 3 года назад +1

    Muito bom a aula, já fiz a inscrição de cara no canal. Esperando mais conteúdos.👏👏👏

    • @Simpledata
      @Simpledata  3 года назад +1

      Valeu Alves 👊
      Te espero no próximo video 🚀🚀

  • @gero8049
    @gero8049 3 года назад +1

    muito boa a didática dos vídeos e muito bom a edição do vídeo. Parabéns. Seu canal merece mais inscritos.

  • @TheLucaSeeker
    @TheLucaSeeker 3 года назад +1

    Vídeo ficou TOP meu parceiro! Parabéns!

    • @Simpledata
      @Simpledata  3 года назад

      Valeu Lucas 👊
      Abraços!

  • @gaxsouza
    @gaxsouza 3 года назад +1

    Muito bom o vídeo! Ótimo conteúdo e explicação! Parabéns!

  • @ViniciusGomes
    @ViniciusGomes 2 года назад +1

    Ótimo vídeo, parabéns!

  • @fernandobraga4579
    @fernandobraga4579 3 года назад +7

    Muito bom! Sugestão: prepara um tutorial para o API do Sidra IBGE. Já existe uma biblioteca python, o pysidra. Mas fiquei com muitas dúvidas pra usar.

    • @Simpledata
      @Simpledata  3 года назад +1

      Eai Fernando,
      Nossa não conhecia o Sidra, legal demais!
      Obrigado pela dica, vou dar uma olhada 😉

  • @angeo10
    @angeo10 3 года назад +1

    otimos video no canal não entendo pq param as postagens novas, uma duvida como insere esses desenhos no codigo?

  • @Kuzz7777
    @Kuzz7777 2 года назад

    Como eu faria um web Scraping de um < span > ? toda vez que atualiza o site o valor é alterado alguma dica?

  • @maisakelydemelo2761
    @maisakelydemelo2761 3 года назад +1

    Muito bom! Parabéns, tudo ótimo...

  • @icarovidalfreire2209
    @icarovidalfreire2209 3 года назад +2

    Véi ... depois faça um vídeo explicando como você faz os vídeos! 😂😂😂😂
    Muito bom!
    Parabéns!

  • @JoziasMiguel
    @JoziasMiguel 3 года назад +1

    Muito bom meu amigo. Vc tem algum curso de Analista de dados?

  • @johanssonmartins
    @johanssonmartins 3 года назад +1

    Publica um curso de Big Query + Data Studio, ou se tiver um curso pago, me avisa. sua didática é muito boa. Parabéns

  • @cleytonsantanadesousa4309
    @cleytonsantanadesousa4309 3 года назад +2

    bem didático !!! sucesso

  • @sanchezalexito
    @sanchezalexito Год назад +1

    Además de aprender me reí con lo del "strip" X ) ... no ese tipo de stripr... Buen Video

  • @angeo10
    @angeo10 3 года назад

    gostei da parte do regex pena não ter um vídeo exclusivo para o recurso.

  • @danilo19953
    @danilo19953 2 года назад

    Parabéns pelo Vídeo, top

  • @andrewinkler9538
    @andrewinkler9538 3 года назад +1

    Bom demais. Parabéns!

    • @Simpledata
      @Simpledata  3 года назад

      Fala André
      Muito obrigado parceiro 👊

  • @viniciusTADS
    @viniciusTADS 3 года назад

    sites dinâmicos também é possível ? Existe alguma proteção que barra ?

  • @ronaldoprfguitar7361
    @ronaldoprfguitar7361 3 года назад +1

    Excelente!

  • @NayT0N
    @NayT0N 3 года назад +1

    Excelente vídeio. Seria muito bom se fosse feito outro vídeo com sites que contém dados sendo exibidos de forma assincrona.

  • @leticiasampaio2309
    @leticiasampaio2309 3 года назад +1

    Muito bom!

  • @PabloFreestylebr
    @PabloFreestylebr 2 года назад

    a parte final de export não deu certo o arquivo não salvou e csv no google drive porque será?

  • @angeo10
    @angeo10 3 года назад

    Qual a diferença em criar uma copia do df com => states_df = df.copy() e declarar um novo df com => states_df = df ?

  • @halanfelipe9442
    @halanfelipe9442 2 года назад +1

    Excelente vídeo, muito boa sua didatica.
    Gostaria de saber se é possível criar um grupo de palavras e extrair somente tags que contenha pelo menos uma dessas palavras, a estrutura é algo parecido com isso:
    texto
    link download
    ...
    quero baixar apenas os PDF's relacionados com textos especificos (detalhe o site tem login e senha e esta parte ja resolvi).
    desde ja agradeço pelo conteúdo

  • @gustavosalvadormkt8459
    @gustavosalvadormkt8459 2 года назад

    Muito bom, obrigado!

  • @MrLuilton
    @MrLuilton 2 года назад

    Estou tentando fazer um para coletar os valores de vários produtos no reclame aqui, mas não consigo de forma alguma.

  • @leonardoguimaraes2534
    @leonardoguimaraes2534 2 года назад

    Eu preciso muito de uma ferramenta para captura de dados de um Ecommerce, e ainda mais, eu preciso me logar a ele para ter as informações que eu preciso, exite uma forma de fazer isso?

  • @laurojose60
    @laurojose60 3 года назад

    Ola boa tarde meu amigo esta de parabéns , será que e possível obter dessa formar informações em tempo real de um site , se sim gostaria de pedir a você essas informações Obrigado

  • @jeffreyquirino4307
    @jeffreyquirino4307 3 года назад +2

    Video PANDAS !!! up up ótimo canal !

    • @Simpledata
      @Simpledata  3 года назад

      Valeu Jeff!
      pandas == ❤️

  • @gilbertogcssantos
    @gilbertogcssantos 2 года назад +1

    Top, estou aprendendo python e parei para assistir e gostei muito

  • @ednanmartins4250
    @ednanmartins4250 3 года назад +1

    Mano, muito top o vídeo. Parabéns, era oq eu estava procurando.
    Mas fiquei com uma duvida e não sei como resolver, como conseguiria entrar em um modal? o link dele é o so o site principal mais o #, teria como fazer isso?
    Vlw mano, parabens

  • @lowrhyan567
    @lowrhyan567 3 года назад +1

    Vc sabe algum módulo parecido com BeatifulSoup só que para Lua em vez de Python? Só estou tentando cada vez mais sair do Python.

    • @Simpledata
      @Simpledata  3 года назад

      Fala LowRhyan,
      Se não me engano você consegue fazer a mesma coisa em Lua utilizando o Gumbo

  • @vitorcosta8805
    @vitorcosta8805 3 года назад +1

    Boa Naka!

  • @AntonioOliveiraamo
    @AntonioOliveiraamo 3 года назад

    Ótimo vídeo! Muito obrigado por compartilhar esse conhecimento!
    Só me tira uma dúvida: Por que ao executar o algoritmo no meu computador, demora muito pra pegar os dados de cada Estado? Muito mais lento que o seu. E a Internet aqui é boa.

  • @rickcomvc
    @rickcomvc 2 года назад

    Vídeo top!
    +1 inscrito
    Likeeeeeee

  • @andersonmacedo1523
    @andersonmacedo1523 2 года назад

    Poderia fazer um para analise das apostas do site de apostas da
    Blaze?

  • @julioalejandronavoni6754
    @julioalejandronavoni6754 Год назад

    Exelente!

  • @nanquim
    @nanquim 3 года назад

    Por que eu só consigo importar o beautifulsoup de um notebook? Se eu tento por um arquivo .py não funciona (instalei com pip)

    • @Simpledata
      @Simpledata  3 года назад

      Oi Juliana, tudo bem?
      Acredito que houve algum problema na instalação do beaufitulsoup.
      É possivel importá-lo em um arquivo .py também, confira sua instalação com o comando
      pip freeze

  • @josevitormariano6661
    @josevitormariano6661 3 года назад +1

    Cara, show de bola, aprendi muito com esse vídeo!
    Consegui fazer na minha máquina local e até com algumas modificações... a lista de estados puxo de um arquivo csv, e ao fim, eu estava tentando gravar os dados no SQL Server, mas não consegui...
    Aqui vão algumas dúvidas:
    O que significa o ->dict: , quando posso usa-lo?
    def scrap_state_info(state: str) -> dict:
    Nessa última linha abaixo, no meu código, sempre que rodo, o estado de SP é o primeiro, no seu parece que ele não passa por esse scrap_state_info('SP'), tentei colocar a variável state aí dentro, mas deu erro... É pra ficar SP cravado mesmo?
    return state_dict
    scrap_state_info('SP')
    No meu código, quando eu executo states_df.loc[0].to_list(), o campo governador por ex. vem 'GLADSON DE LIMA CAMELI\xa0\xa0\xa0', como faço para remover?
    E por fim, se puder me ajudar...
    Estou tentando levar os dados para um banco sql, consegui fazer a conexão e até dar um insert pelo python, e aí, tentei fazer o seguinte:
    var = states_df.loc[0].to_list()
    cursor.execute("INSERT INTO IBGE_UF (uf, governador, populacao_estimada, densidade_demografica ,area_territorial, idh, receitas_per_capta, total_veiculos, matriculas_ensino_fundamental, despesas_empenhadas, receita_realizadas) VALUES("+var+")")
    Mas dá erro...Você recomenda fazer de outra forma?
    Se puder sugerir vídeos sobre gravar dados com python para o SQL, me ajudaria muito!!
    Desde já muito Obrigado!!!

    • @Simpledata
      @Simpledata  3 года назад +1

      Fala José, poxa muito obrigado pelo feedback 👊
      Fico muito feliz que o vídeo tenha te ajudado!
      Pode ficar a vontade para mandar dúvidas e sugestões de vídeos meu amigo...
      1) o -> dict é para fins de documentação mesmo. Você informa para quem está lendo que o retorno da função será um dicionário. (Acho que eu podia ter comentado isso hahaha).
      Porém, ele não vai fazer nada além disso, não vai estourar algum tipo de erro caso você esteja retornando algo que não seja um dicionário (algumas linguagens fortemente tipadas fazem isso).
      2) a linha scrap_state_info('SP') era para ir vermos o output da célula conforme evoluíamos a função, pode tirar ela :)
      3) Putz... Acabamos não limpando a coluna do governador.
      Esse \xa0 é um Unicode Character para "No-break space".
      Você pode limpar ele com a função strip igual fizemos com as outras colunas.
      É só trocar a linha 22 da seção clean
      de:
      states_df[num_cols] = states_df[num_cols].apply(lambda x: x.str.strip())
      para
      states_df = states_df.apply(lambda x: x.str.strip())
      Assim todas as colunas ficam sem esses espaços
      4) Gostei da idéia, vou preparar um vídeo mostrando como usar o pandas para ler e escrever dados em bancos de dados SQL.
      Você poderia usar esse código aqui para fazer o insert dinâmico por todas as linhas do dataframe:
      cols = "`,`".join([str(i) for i in states_df.columns.tolist()])
      for i,row in states_df.iterrows():
      sql = "INSERT INTO `IBGE_UF` (`" +cols + "`) VALUES (" + "%s,"*(len(row)-1) + "%s)"
      cursor.execute(sql, tuple(row))
      connection.commit()
      BÔNUS)
      Dá uma olhada no método to_sql do Pandas:
      pandas.pydata.org/docs/reference/api/pandas.DataFrame.to_sql.html
      Você consegue fazer inserts de um dataframe direto pelo pandas, mas vai precisar instalar a lib sqlalchemy ai no seu ambiente. (Cria um conector com o sqlalchemy e dps passa como argumento para o states_df.to_sql)
      Eu gosto bastante dessa abordagem, fica bem mais simples hehehe
      Vou montar um vídeo explicando isso, beleza?
      Obrigado pela pergunta e pela dica de vídeo.
      Abraço José!

  • @fabiomainardes7080
    @fabiomainardes7080 2 года назад

    Vocês realizam o serviço de webscraping ou somente cursos nessa área?

    • @Simpledata
      @Simpledata  2 года назад

      Ainda não realizamos cursos nessa área.
      Caso queira um serviço pode entrar em contato conosco para conversarmos sobre o seu problema!

  • @girleioliveira7382
    @girleioliveira7382 3 года назад +2

    Very good

  • @amandalala1
    @amandalala1 3 года назад +2

    👏👏👏👏

  • @venommotorrockerbass
    @venommotorrockerbass Год назад

    Show

  • @leonardoalbuquerquedeabreu4530
    @leonardoalbuquerquedeabreu4530 3 года назад +2

    Da para usar tambem o REGEX no lugar do beutifull soup, mas e um pouco mais dificinho aprender REGEX

    • @Simpledata
      @Simpledata  3 года назад

      Fala Leonardo,
      É verdade, ao em vez de utilizar seletores de css poderíamos utilizar regex para extrair a label e value dos indicadores.
      Obrigado pela dica!

  • @Rodrigo-tb6kn
    @Rodrigo-tb6kn Год назад

    03:53 :o)

  • @ramomcalea8840
    @ramomcalea8840 Год назад

    nos queremos qui voçe esplique melhor a biblioteca Pandas

  • @johnalmeida160
    @johnalmeida160 2 месяца назад

    Muito bom!

  • @anahidecastro3368
    @anahidecastro3368 3 года назад +2

    👏👏👏👏👏👏