A Maneira Mais Rápida de Web Scraping? Jina AI - Provado!

Поделиться
HTML-код
  • Опубликовано: 10 дек 2024

Комментарии • 85

  • @eu.diegopro
    @eu.diegopro 5 месяцев назад +11

    Ontem passei o dia elaborando o código para raspagem de um site. Esse video teria me economizado bastante tempo rsrs. Excelente como sempre mestre!

    • @jacielrj
      @jacielrj 5 месяцев назад

      Man tá osso, pq com essa aí facilita mas parei de novo pq não quero usar o gpt ou se usar tinha que ser gratis, não quero gastar, tô fazendo pra puxar as noticias do portal da faculdade.

  • @douglasalmeida4684
    @douglasalmeida4684 3 месяца назад +1

    Top de mais, . Eu comecei a mexer com automacao faz 1 mes, desde então estou tentando fazer raspagem mas sem sucesso, até ver esse video.. depois de ver esse video fiz em 20 minutos..salvou de mais..
    Pra ficar melhor ainda, eu queria fazer a "raspagem" sempre que tivesse atualização no site da raspagem....

    • @AndrePrado
      @AndrePrado  3 месяца назад +1

      boa! que bom que deu certo Douglas! não sei se dá pra fazer o que vc quer, mas vc pode raspar todo dia e comparar se tem diferença, pelo menos é uma forma de resolver o problema

  • @dariocsantos
    @dariocsantos Месяц назад

    Cara, esse conteúdo, foi extremamente relevante para mim. Obrigado.

  • @nickvasc
    @nickvasc 5 месяцев назад +2

    Ligue o material! Parabéns!! 🎉

  • @joaotextor4094
    @joaotextor4094 4 месяца назад

    Cara, se tu dá esse conteúdo incrível de graça aqui no RUclips, to muito curioso pra ver o que tem na comunidade paga. Vou aproveitar o final de semana pra conferir. Tá de parabéns.

  • @jacielrj
    @jacielrj 5 месяцев назад +1

    Legal👏👏👏 Vou testar faz tempo que procuro algo assim

  • @nickvasc
    @nickvasc 5 месяцев назад

    Assistindo o vídeo de novo porque ele é top!

  • @JoséluizPilatti
    @JoséluizPilatti 5 дней назад

    👏🏻👏🏻

  • @marvinfiori2541
    @marvinfiori2541 Месяц назад

    Excelente conteúdo!

    • @AndrePrado
      @AndrePrado  Месяц назад

      Que bom que curtiu! 😁

    • @marvinfiori2541
      @marvinfiori2541 Месяц назад

      @@AndrePrado já implementei em 2 apps aqui haha

  • @TiagoMcwb
    @TiagoMcwb 15 дней назад

    nossa que interessante

  • @Wonders_world
    @Wonders_world 5 месяцев назад

    Parabéns e obrigado. Eatava louco procurando uma solução pro meu caso e ajudou

    • @AndrePrado
      @AndrePrado  5 месяцев назад

      é muito boa né? eu gostei demais também! valeu!

  • @cotomax
    @cotomax 5 месяцев назад

    Muito top, este André é prendado demais!

  • @wendellaurindo5343
    @wendellaurindo5343 2 месяца назад

    Muitoo boom🎉

  • @gustavonesi9442
    @gustavonesi9442 3 месяца назад +1

    Boa noite, eu estava precisando de uma dica sua, estou usando o DifyAi como Chatbot para a minha aplicação e nele tem uma requisição GET para o n8n só que nao esta conseguindo fazer a requisição GET, já tentei várias coisas, mas pelo que entendi por o n8n esta sendo inicializado no meu localhost e acho que tem algo no difyai que nao consegue fazer essa requisição em localhost, caso sabia de alguma funcionalidade dessa poderia me dar uma dica

  • @caioguibr
    @caioguibr Месяц назад

    o lance do bot carregar diferentes quantidades é por causa de paginação do site alvo...nao é falha da jina, é particularidade do site. teria que ter uma rotina que indexa o site primeiro e depois faz o scraping

    • @AndrePrado
      @AndrePrado  Месяц назад

      verdade Caio, faz total sentido, obrigado por ajudar

  • @romariooliveira5427
    @romariooliveira5427 Месяц назад

    Ele consegui pegar resultados em tempo real...

    • @AndrePrado
      @AndrePrado  Месяц назад

      ele consegue puxar os dados atualizados, mas vc precisa chamar sempre, não tem uma forma de pegar dados em tempo real ainda

    • @romariooliveira5427
      @romariooliveira5427 Месяц назад

      @@AndrePrado obrigado Andre..segunda feira estou entrando no seu treinamento ...tmj

  • @paulovictoralcantara
    @paulovictoralcantara 5 месяцев назад

    Valeu!! Ótima dica André. Testei aqui agora. Uma pena que não conseguiu pegar dados de um perfil no Instagram. Ainda estou a procura de uma forma de pegar nome e bio de usuários no Instagram.

    • @AndrePrado
      @AndrePrado  5 месяцев назад

      esse problema é bem mais complexo, provavelmente tem algumas libs com código que fazem isso

  • @jhonnydt
    @jhonnydt 5 месяцев назад +1

    Olá André, vídeo sensacional, vai ajudar demais!! Deixa eu perguntar, hoje exite alguma IA que faz web scraping em sites que precisam de dados de busca?

    • @AndrePrado
      @AndrePrado  5 месяцев назад

      obrigado!
      cara, não entendi bem sua pergunta, como assim dados de busca?

    • @jhonnydt
      @jhonnydt 5 месяцев назад

      @@AndrePrado Opa, só vi agora, então, sites que preciso inserir um dado para conseguir a informação na página, como detran, por exemplo.

  • @caioguibr
    @caioguibr Месяц назад +2

    eu cheguei aqui justamente pq eu to precisando trocar de casa e preciso monitorar os sites de imobiliaria pq meu aluguel vai subir 800 e to lascado

  • @alexdonega
    @alexdonega 5 месяцев назад +1

    Descordo 😂 meu software é no code e mais simples e fácil... Haha porém ainda anão lancei no mercado.. Não precisa de N8n... Porém ficou legal sua forma... Parabéns... Vou testar.... ❤

    • @AndrePrado
      @AndrePrado  5 месяцев назад

      hahaha valeeeu! na verdade o Jina também não precisa do n8n, só usei pra agilidade mesmo hahaha

  • @cruzeirocrivellari
    @cruzeirocrivellari 29 дней назад

    To tentando fazer uma automação pra raspar dados de farmacias da região, eu tenho que comprar 2 remedios especificos todo mes, da um trabalheira olhar em 5-6 farmacias diferentes e comparar os preços. Infelizmente o jina nao funciona em alguns deles, como na Pague Menos

    • @AndrePrado
      @AndrePrado  11 дней назад

      pode ser pq o site renderiza de uma forma diferente, infelizmente não é perfeito
      tenta usar o firecrawl por exemplo, se não der, aí precisa ir mais a fundo

  • @gustavosuim
    @gustavosuim 5 месяцев назад

    Andre, excelente video. Alguma sugestão para sites que temos que logar antes de acessar os dados?

    • @AndrePrado
      @AndrePrado  5 месяцев назад

      esse problema é um tipo de problema que depende da plataforma que vc quer fazer o scraping. Em algumas vc consegue simular o login com o próprio scraper, em outras vc precisa ser mais "esperto" hahahah
      Mas é difícil mesmo, não tem uma forma específica de fazer isso dar certo

  • @luisspader6508
    @luisspader6508 3 месяца назад

    Vídeo muito bom. Se puder só aumentar o tamanho da fonte, pois está difícil de ler

    • @AndrePrado
      @AndrePrado  3 месяца назад

      valeu pelo feedback Luis! os próximos vídeos já estão melhores hahaha

  • @Equilibriumtce
    @Equilibriumtce 3 месяца назад

    Meu está alterando a váriavel a cada pesquisa no assist OpenAI,

  • @RuanLeitte
    @RuanLeitte Месяц назад

    Fala andré, tudo na paz? Me tira uma duvida, eu to procurando emprego em um site que tem mais de mil anuncios. Cada anuncio, é disponibilizado o endereço e-mail no corpo de cada anuncio. O site parece o indeed. Como posso usar o webscr para me ajudar coletar esses emails ? É um traampo do caramba ficar abrindo anuncio por anuncio, coletando email por email e mandando curriculo na sequencia.

    • @AndrePrado
      @AndrePrado  Месяц назад

      Ruan, tenta usar o Jina mesmo aí, se vc precisar fazer login aí precisa de algumas ferramentas mais rebuscadas que estão além do meu conhecimento atual hahaha

  • @paulompramalho
    @paulompramalho 6 дней назад

    Amigo, socorro! Como faz no caso de sites que pede login e senha?

    • @AndrePrado
      @AndrePrado  6 дней назад

      não tem jeito, tem que achar outra forma de fazer scraping

  • @abaldiotti
    @abaldiotti 3 месяца назад

    Bom dia, tudo bem?
    Eu preciso fazer um web scrapping em um site com login. É possível?

  •  5 месяцев назад

    👏🏻🚀 valeuuu

  • @danieldias76
    @danieldias76 5 месяцев назад

    Top o conteúdo! André você já chegou a usar o Automa ? To brincando com ele e achei bem legal, você têm alguma opnião sobre ele?

    • @AndrePrado
      @AndrePrado  5 месяцев назад

      nunca mexi cara, é aquela extensão do browser?

  • @PawnxzTM
    @PawnxzTM 4 месяца назад

    Tentei fazer um web scraping no Google Maps com a palavra-chave "Barbearia" em São Paulo, mas não deu certo. Acredito que seja pela questão do scroll infinito e a cada momento que você muda de localização, muda os resultados. Você sabe qual o melhor jeito de resolver isso? Antes eu usava o PhantomBuster, mas ele ficou limitado.

    • @AndrePrado
      @AndrePrado  4 месяца назад

      não sei dizer cara, deve ter ferramentas especializadas nisso no mercado, o Jina é mais simples mesmo

  • @amaica01
    @amaica01 3 месяца назад

    como poderia pegar dados do instagram?

    • @AndrePrado
      @AndrePrado  3 месяца назад

      instagram precisa usar outras ferramentas, pq precisa fazer login, é mais complexo

    • @amaica01
      @amaica01 3 месяца назад

      @@AndrePrado sugere alguma?

  • @gestordescomplica
    @gestordescomplica 4 месяца назад

    Seu curso é pra LEIGO?

    • @AndrePrado
      @AndrePrado  4 месяца назад

      é sim cara, aproveite os 7 dias de garantia e vê se é pra vc, dá tempo de fazer o curso duas vezes

  • @n4d4s
    @n4d4s 5 месяцев назад

    perdão pela minha falta de conhecimento, não sei como funciona direito, mas será q é possivel criar um reader pra pesquisas do youtube sobre determinados temas?
    por exemplo pega o tema "como ganhar dinheiro online"
    ai lê todos os títulos e quantidade de views
    cria um banco de dados com isso, e joga pro gpt avaliar as melhores palavras relativo aos resultados
    ai com essas palavras daria pra ter um parâmetro pra criar videos de outros temas

    • @AndrePrado
      @AndrePrado  5 месяцев назад +1

      dá pra fazer isso sim, é só pegar a url de busca do youtube e jogar no jina:
      r.jina.ai/ruclips.net/user/results?search_query=ganhar+dinheiro+online

  • @LucasOliveira-Labs
    @LucasOliveira-Labs 5 месяцев назад

    minha maior dificuldade nesses videos de webscraping e que todo mundo so faz videoso sem autenticacao, mete um web scraping ai acessando o linkedin ou as autenticacoes do indeed ahahaha

    • @AndrePrado
      @AndrePrado  5 месяцев назад

      scraping com autenticação são outros 500 mesmo, até com código é difícil

  • @SolluSaaS
    @SolluSaaS 3 месяца назад

    Já comparou o Jina com o Firecrawler?

    • @AndrePrado
      @AndrePrado  3 месяца назад +1

      não, mas já usei o firecrawler e achei muito bom

  • @daniloxavier9086
    @daniloxavier9086 5 месяцев назад

    Nunca entendi qual a finalidade pra isso, se eu pudesse ver o público do site aí sim, alguém consegue me explicar pra que serve isso

    • @AndrePrado
      @AndrePrado  5 месяцев назад

      vc pode criar bancos de dados com dados da internet, por exemplo, pegar todos os vídeos do youtube sobre um determinado assunto e fazer um estudo em cima deles (views, titulo, thumb) e ver o que converte melhor

  • @rjperfumado
    @rjperfumado 5 месяцев назад

    Podem dar um retorno do custo em R$ só dessas execuções dele no OpenAI?

    • @AndrePrado
      @AndrePrado  5 месяцев назад

      nos testes que eu fiz na gravação desse vídeo deu 51 centavos de dólar usando o GPT-4o

  • @SUNY21
    @SUNY21 5 месяцев назад

    show

  • @albertojulio
    @albertojulio 5 месяцев назад

    Top ! tava pensado nisso hoje, tas lendo pensamentos André? 🤭

  • @wsapalas
    @wsapalas 5 месяцев назад

    pra sites simples o melhor é o instant datascraper, plugin pra brave/chrome, icone de uma pokebola kkk

  • @walterfish-b6n
    @walterfish-b6n 5 месяцев назад

    Será que tem como pegar 600mil dados em um loop destes aí ? Será que tem persistência?

    • @AndrePrado
      @AndrePrado  5 месяцев назад

      tem sim, mas é arriscado de qualquer forma, no-code ou com código...

    • @walterfish-b6n
      @walterfish-b6n 5 месяцев назад

      @@AndrePrado eu consigo. Mas ultimamente a api mudou e algumas rotas ficaram obsoletas. Queria usar uma IA, que realmente soubesse o que está fazendo.

  • @GunzIf
    @GunzIf 5 месяцев назад

    bro copiaste o video do dev asiatico que fala do Jina

    • @AndrePrado
      @AndrePrado  5 месяцев назад

      eu não copiei, eu falei sobre o Jina, agora se tem um monopólio de asiáticos sobre o Jina eu não to sabendo hahahaha

    • @GunzIf
      @GunzIf 5 месяцев назад

      @@AndrePrado é dificil ser ironico por texto kkkkkkk calm down

    • @GunzIf
      @GunzIf 5 месяцев назад

      torna acessivel pra galera que nao busca tanto. nao vi outro BR falando de Jina ainda.

    • @AndrePrado
      @AndrePrado  5 месяцев назад

      ah tá, entendi hahahaha foi mal