Crea una App de Web Scraping con JavaScript

Поделиться
HTML-код
  • Опубликовано: 27 окт 2024

Комментарии • 39

  • @godidev288
    @godidev288 Год назад +2

    graciass!! me estaba peleando mucho con playwright porfin encuentro un video que va al grano y explica sencillamente 😆

    • @lasfito
      @lasfito  Год назад

      Espero que te haya servido 🤙🏼

  • @SonGoku-pc7jl
    @SonGoku-pc7jl 2 года назад +3

    gracias lasfito, eres un crack, muchisimas gracias por hacer contenido de tanta calidad :) esta clase es digna de verla una y otra vez por toda su calidad en todos los sentidos y por los varios detalles de genialidades que contiene. Enfocado genialmente en todos los sentidos, incluso en el literal con el codigo genial como puro y bien cerca :)

    • @lasfito
      @lasfito  2 года назад

      Gracias, tal parece que a este volviste jaja
      Veamos si el destino te trae de nuevo en algun futuro 🤙🏼

  • @ferstxD
    @ferstxD 2 года назад +1

    Excelente video hermano, estuve esperándolo. Explicas de lo mejor 10/10

    • @lasfito
      @lasfito  2 года назад +1

      Gracias, Fer
      Espero que te haya servido
      Saludos 🤙🏼

  • @Deus-lo-Vuilt
    @Deus-lo-Vuilt 2 года назад +2

    excelente video , gracias compa , estas mamadisimo

    • @lasfito
      @lasfito  2 года назад

      Jajaja
      Un leve 7u7

  • @jamesmoisesllalleperez3079
    @jamesmoisesllalleperez3079 9 месяцев назад +1

    pense que solo se podia con Python, y selenium, seria genia que hagas un video de como ingresar a una pagina y hace ciertos clics o guarda informacion.

    • @lasfito
      @lasfito  9 месяцев назад +1

      Sí, es buena idea de video. Más adelante haré uno así ✌🏼

    • @jamesmoisesllalleperez3079
      @jamesmoisesllalleperez3079 9 месяцев назад +1

      @@lasfito gracias

    • @lasfito
      @lasfito  9 месяцев назад

      Por nada

  • @moviedev874
    @moviedev874 7 месяцев назад +1

    una consulta los comparadores de precios hacen web scraping para obtener los datos como el precio, la actualización de ofertas de los ecommerce?

    • @lasfito
      @lasfito  7 месяцев назад

      La mayoría usa una combinación de scrapping/APIs

  • @cesaryupa9922
    @cesaryupa9922 Год назад +1

    Exclente video, ¿y para el caso en que quiero información de una web con un usuario google en especial?

    • @lasfito
      @lasfito  Год назад

      Ahí es más complicado porque tendrías que iniciar sesión en Google en el navegador de playwright, con lo cual Google podría tomarlo como bot y no pasaría. Lo que podrías hacer es que la sesión esté iniciada y tengas los datos guardados al momento de lanzar el navegador con playwright, pero me parece que cuando se inicia la instancia de browser parte de cero datos compartidos 🤔

    • @juanjosemenesest8325
      @juanjosemenesest8325 Год назад +1

      @@lasfito Existe una función llamada "reuse authentication state" y permite guardar la sesión para que el navegador que abra playwright sea el que contiene esta.

    • @lasfito
      @lasfito  Год назад

      No la conocía, suena muy bien. Le echaré un ojo, gracias ✌🏼

  • @variosvideos1
    @variosvideos1 9 дней назад

    recibo un page.waitForSelector: Timeout 30000ms exceeded.
    Call log:
    - waiting for locator('input[name="q"]') to be visible

    • @lasfito
      @lasfito  6 дней назад

      Significa que hubo un problema con la carga de la página o que el markup del sitio cambió. Puedes tomar una captura de pantalla para revisar el estado de la página

  • @2003MAAP
    @2003MAAP Год назад +1

    Hermano que buen video, algo ando haciendo mal que la primera vez que lo hice lo hice de mi manera y no me funsiono despues copie tu codigo y el mismo problema :( sin embargo aqui sigo tratando de encontrar el por que. gracias por el video!!!

    • @lasfito
      @lasfito  Год назад

      Hola, Ángel
      ¿tendrás algún código de error?

    • @2003MAAP
      @2003MAAP Год назад

      @@lasfito
      internal/process/promises:288
      triggerUncaughtException(err, true /* fromPromise */);
      ^
      page.waitForNavigation: Timeout 30000ms exceeded.
      =========================== logs ===========================
      waiting for navigation until "networkidle"
      ============================================================
      es a timeoutError. por alguna razon no
      este es el error que me a parece, no uso mucho javascrip pero por el momento tengo un preyecto con python selenium y queria ver otras posibilidade de hacer scrapping en tik-tok pero he tenido algunos problemas con la automatizacion de login.
      cualquier opinion seria buena!!!

  • @wizmov
    @wizmov Год назад +1

    Para desplegar este script de scraping alguna opción que no requiera un path ejecutable?

  • @lyrzz_c
    @lyrzz_c 2 года назад +1

    Buen video

    • @lasfito
      @lasfito  2 года назад

      Gracias,
      Un saludo Ryax 🤙🏼

  • @TheSansonius
    @TheSansonius 2 года назад +1

    justo aprendí a hacer scraping con python :D

    • @lasfito
      @lasfito  2 года назад +1

      Si aprendes con JS serás imparable :v

    • @TheSansonius
      @TheSansonius 2 года назад +1

      @@lasfito eso espero :v

  • @dayvizeballos9355
    @dayvizeballos9355 2 года назад +1

    que alternativas me recomiendas para los proyectos que no usan node, solo JS y JSP

    • @lasfito
      @lasfito  2 года назад

      Ya platicamos por Discord, pero igual te paso este link
      medium.com/@sushain_Dilishan/building-web-scraping-api-with-spring-boot-jsoup-a0cc19dbd5dd

  • @lawyercode7311
    @lawyercode7311 Год назад +1

    tienes la repo ? es que estoy intentando hacer lo mismo con perfiles publicos de instagram pero solo las imagenes

    • @lawyercode7311
      @lawyercode7311 Год назад +1

      ya que como recientemente hubo una actualización generar error de autorizacion

    • @lasfito
      @lasfito  Год назад

      Para ese video no tengo repo. Lograste resolver el problema? El error de autenticación es con IG? Lo más seguro es que sea Meta quien te bloquee porque deben tener rastreo de bots y el scrapping entra en esa definición

  • @alexanderbriones5848
    @alexanderbriones5848 Год назад +2

    recibo un page.waitForNavigation: Timeout 30000ms exceeded.
    =========================== logs ===========================
    waiting for navigation until "networkidle"
    ya coloque las esperas
    await page.goto(url)
    await page.waitForTimeout(0); // wait for 1 seconds
    await page.waitForNavigation({ waitUntil: 'networkidle' });

    • @lasfito
      @lasfito  Год назад

      Eso es porque la página tardó más de 30 segundos cargando contenido. Por defecto tiene 30s como límite, puedes desactivarlo o cambiar el método de networkiddle a otro "trigger" para saber cuando haya terminado de cargar.