Web Scraping con Python - Curso con Beautiful Soup

Поделиться
HTML-код
  • Опубликовано: 17 окт 2024

Комментарии • 164

  • @diegomeza2736
    @diegomeza2736 Год назад +70

    Muy bien. Me gustaría que invitaran más colaboradores y el canal tenga más actividad 👍 similar al canal en inglés. La comunidad en español los necesita 🙌

    • @ivanvaras352
      @ivanvaras352 Год назад

      ¿CUÁL ERA EL LENGUAJE DE PROGRAMACIÓN R?

    • @albertopardini1680
      @albertopardini1680 Год назад

      El lenguaje es Python corriendo dentro de google colab que son cuadernos de Jupyter Notebooks@@ivanvaras352

  • @marcosmarval
    @marcosmarval Год назад +12

    Sin haberlo visto aún ya lo guardo en mis listas y le doy su like....gracias 👍

  • @MonicaEstrada-q1n
    @MonicaEstrada-q1n 14 дней назад +2

    Muchas gracias, el curso muy comprehensivo, fácil de entender y replicar.

  • @Autoscraping
    @Autoscraping 9 месяцев назад +5

    Extraordinario material audiovisual que ha sido de gran utilidad para nuestros nuevos colaboradores. ¡Tu generosidad es inmensamente apreciada!

  • @dioco098
    @dioco098 Год назад +3

    JUSTO ESTOY EN LA MATERIA DE MINERIA DE DATOS Y ESTO ES JUSTAMENTE LO QUE BUSCABA

  • @sarismejiasanchez
    @sarismejiasanchez Год назад +11

    Magnífico!
    El curso fue fluido y claro.
    Ahora queda practicar e implementarlo e interactuar con otros sitios de interés!
    No queda más que agradecer por compartir contenido gratuito y de calidad! 🙌😁

  • @tomasheinzmann5421
    @tomasheinzmann5421 3 месяца назад +3

    Me gusto mucho, hace un tiempo que queria aprender como hacer el web scraping, voy a poner en practica los conocimentos, muchas gracias por el video 👍

  • @iliovininino
    @iliovininino Год назад +7

    Impresionantn lo bien que explica Juantorena. Introduce el tema, contextualiza y desarrolla todo en detalle para que no queden conceptos librados al azar. Maravilloso tutorial, muy por encima de muchos contenido pagos que he visto de diversos temas.
    Felicitaciones y muchas gracias por el trabajo.

  • @JavierSalazar-i4f
    @JavierSalazar-i4f Месяц назад +1

    Excelente explicación. Creo que no se puede hacer mejor y la página web de ejemplo para practicar es fabulosa. Mil gracias

  • @juanmanuelb.8392
    @juanmanuelb.8392 2 месяца назад +1

    Gracias Gustavo!! muy claro el curso y muy útil para quienes nos estamos iniciando en estas herramientas.

  • @sarismejiasanchez
    @sarismejiasanchez Год назад +7

    Hasta el momento estoy encantada con el curso, la explicación de las temáticas es amigable y clara, adicional a ello, el repo de GitHub con la presentación y el código a trabajar 🙌 Compartir el conocimiento, gratis y con este nivel de calidad! Simplemente agradecida!
    Hace mucho estaba por reforzar mis conocimientos en el tema y me animé con tu curso 👌 espero llevarlo a feliz término.
    Muchas gracias 🧠😁

  • @milosZcr
    @milosZcr 2 месяца назад +1

    Muy útil, complementa lo que he aprendido en otro tutorial. Además me alegra ver este contenido en español, ya había pasado por el canal de fcc pero en inglés, no sabía que existía este.
    Gracias

  • @krimenet4376
    @krimenet4376 10 месяцев назад +3

    Acabo de finalizar el curso, gracias por vuestro trabajo me ha ayudado para una introducción a Beautiful Soup ahora toca practicar :)

  • @XxXjujio2013XxX
    @XxXjujio2013XxX 6 месяцев назад +1

    Obvio es re contra legal e importante lo que voy a hacer con esto.
    Las palabras salvan vidas.

  • @marcosdemircan2904
    @marcosdemircan2904 Год назад +2

    Superrrrr. Graciassss Milessss al equipo de FreecodeCamp. Bendiciones miless🇨🇺🇨🇺🇨🇺

  • @EmilioAt77
    @EmilioAt77 9 месяцев назад +2

    Buenisimo! Me gustó mucho el cursito, me llevo algunos trucos que no conocía. Los felicito por su trabajo! 👏🏻🍻

  • @rodolfoantoniopizacoronado9680
    @rodolfoantoniopizacoronado9680 4 месяца назад +2

    Excelente clase, muy pedagógico. Muchas gracias

  • @carlosvargas9847
    @carlosvargas9847 Год назад +2

    Muchas gracias Gustavo Juantorena, me facilitaste mucho las cosas, bendiciones. saludos del tabo, chile

  • @FacundoBoladeras
    @FacundoBoladeras Год назад +2

    Increible contenido, muchas gracias por compartir esto de forma gratuita!!

  • @marianocastelli5172
    @marianocastelli5172 3 месяца назад +2

    Muy buena clase. Muchas gracias por compartir el conocimiento. Saludos!

  • @alejandrosan
    @alejandrosan Год назад +2

    Muy buen curso, casos prácticos y ejemplos para varios posibles escenarios, qué calidad este curso!!

  • @DiegoEmeGe
    @DiegoEmeGe Год назад +1

    Muchísimas gracias. Impresionante curso. Es la primera vez con Python y esto tiene un potencial enorme. Muy bien explicado. Enhorabuena.

  • @ronalgranja9301
    @ronalgranja9301 Год назад +3

    Saludos, aquí siempre al dia con los nuevos videos.

  • @sebastiansebastian3158
    @sebastiansebastian3158 11 месяцев назад +1

    Muy bueno el curso. Muchas gracias por todo el contenido y las explicaciones. Excelente calidad!

  • @jorgeguzman9048
    @jorgeguzman9048 Год назад +4

    Apoyo total al canal 🤗 espero algún día ver cursos a la par que FreeCodeCamp la principal

  • @carchobe
    @carchobe 10 месяцев назад +2

    Gracias por este curso, fue de lo mejor 👍

  • @Artemius79
    @Artemius79 Год назад +1

    Muy bueno!. Ojalá tengamos más contenido, aprovechando todo el conocimiento de Gustavo!

  • @CristianArielSanhueza
    @CristianArielSanhueza Год назад +3

    Excelente el contenido!! muchas gracias por generar contenido de calidad en español! Salu2!

  • @rossisilvablas1646
    @rossisilvablas1646 Год назад +2

    Ahora a practicar, muy bueno gracias!!😊

  • @zacky6416
    @zacky6416 Год назад +2

    Gracias freecodecamp y Gustavo! 🙏

  • @Pedro1043ful
    @Pedro1043ful 10 месяцев назад +3

    Minuto 1:34:12 el metodo zip() también funciona con tres listas. Por ejemplo se puede usar esto:
    datos = list(zip(marcas, nombres, precios))

  • @MsVeloz21
    @MsVeloz21 Год назад +3

    Muy bien, lo explicas muy bien, muchas gracias

  • @Kytk7
    @Kytk7 Год назад +3

    Gracias por crear estos cursos ❤❤❤

  • @LeonardoProne
    @LeonardoProne 8 месяцев назад +2

    Enorme clase! muchas gracias

  • @konata_fan
    @konata_fan Год назад +2

    Gracias infinitas, estaba justo necesitando este tema 🎉🎉🎉🎉🎉

  • @DanySordelli
    @DanySordelli Месяц назад +1

    BUen Trabajo. Muy Claro. Gracias!

  • @arielmancuzo9113
    @arielmancuzo9113 Год назад +7

    Todavia no lo veo, pero ya me gusta que tenga imagenes de los simpsons, eso si es mucho muy importante

  • @miguelangeltitorodriguez6742
    @miguelangeltitorodriguez6742 Год назад +2

    Excelente curso , ahora a practicar

  • @JOHNSTIVEN
    @JOHNSTIVEN Год назад +2

    brutal, gracias crack :3, gracias por existir este hermoso canal :3

  • @marcelelopezc369
    @marcelelopezc369 Год назад +1

    Que tema tan interesante y poderoso. Gracias. 🏆🏆🏆

  • @miguelromero2363
    @miguelromero2363 Год назад +2

    Gracias por este curso. Muy lindo!!

  • @esarmiento7
    @esarmiento7 Месяц назад

    Fue chevere aprender hice webscraping junto con selenium, guardando en bases de datos, sacando estadisticas pero un año a eso y no conseguí ni un cliente.

  • @giovannyvanegas88
    @giovannyvanegas88 Год назад +2

    Excelente, gracias por compartir este conocimiento 🤙

  • @jonathandajome690
    @jonathandajome690 Год назад +3

    Vamos!!! 🎉🎉

  • @inghmop
    @inghmop Год назад +2

    Excelente contenido. Muchas gracias.

  • @hugoloncq2612
    @hugoloncq2612 Год назад +1

    Muy buen curso. Agradecido:

  • @jorgediaz6989
    @jorgediaz6989 Год назад +1

    Joder!! me encanta este curso

  • @kevinsantillan4843
    @kevinsantillan4843 8 месяцев назад +1

    Excelente curso

  • @vivracionespositivas
    @vivracionespositivas Год назад +3

    Gracias por compartir..

  • @sam-eq9nt
    @sam-eq9nt 11 месяцев назад +2

    Gracias por compartir

  • @diegoarielsimonelli5902
    @diegoarielsimonelli5902 Год назад +2

    Impecable!!

  • @DarkerDark1
    @DarkerDark1 Год назад +3

    Muuuuchas gracias!!

  • @kimruiz5019
    @kimruiz5019 5 месяцев назад

    mil gracias, muy bueno; a la hora de ponerlo en practica se me dificulta un poco cuando los divs cargan información de bases de datos y servidores internos, ademas de estilos de Javascript, osea las paginas que cargan ventas de usuarios externos como las inmobiliarias.

  • @cipolletti7
    @cipolletti7 Год назад +2

    Excelente 👌

  • @mrj1968
    @mrj1968 Год назад +2

    hermosa clase y muy bien explicada para alguien que recien inicia, existira mas clases sobre web scraping con el mismo instructor?

    • @gustavojuantorena
      @gustavojuantorena Год назад

      Gracias! Por ahora esta. Qué tema de web scraping te gustaría que se enseñe y no está incluído en este curso?

    • @sebastianpardo4002
      @sebastianpardo4002 Год назад +2

      @@gustavojuantorena podria ser algo que se lleve a cabo en las empresas un ejemplo real pero complicado desde el webscraping hasta el data analytic y en lo posible data science para despues poder expresar lo buscado en graficos, como en power BI, Qlickview, etc...

    • @emilianobaldino914
      @emilianobaldino914 2 месяца назад

      Hola, muchas gracias! Alguna librería recomendada para scrapear gran cantidad de texto (400 pag)? @gustavojuantorena

  • @Diegotopizarro
    @Diegotopizarro 2 месяца назад +1

    gracias por esto

  • @JoseTrinidadMorenoGonzalez
    @JoseTrinidadMorenoGonzalez Год назад +4

    🎉Te volaste la barda, con este curso...😂

  • @dante1234565
    @dante1234565 Год назад +2

    Muchas gracias.

  • @rollopaterson-thelastimpre5572
    @rollopaterson-thelastimpre5572 Год назад +2

    Muy util gracias!

  • @carloscacn
    @carloscacn 8 месяцев назад +1

    Hola Saludos muy buen curso. Me trabe en el ejercicio 2. Se debe separar el string de la lista producto y hacer un diccionario q contenga la condicion de la patineta(nueva, usada) y otra con el numero para despues hacer el condicional donde se muestren las q tengan un numero mayor a 3 ???

    • @gustavojuantorena
      @gustavojuantorena 8 месяцев назад +1

      Hola Carlos, qué bueno que te hayas puesto a hacer los ejercicios. Lo podés hacer de muchas formas pero lo importante es poder filtrar y quedarte solo con las patinetas que tengan un número mayor a 3 en su nombre y su correspondientes precios. Separar el string y después usar un condicional me parece una buena estrategia. Vas a tener que tener cuidado que para hacer esa comparación de númeor "mayor" vas a tener que trabajar con valores numéricos (int o float) y no strings. Saludos!

  • @alcobaa
    @alcobaa Год назад +1

    Vamos Argentina, carajo

  • @scavro
    @scavro Год назад +1

    Buen curso

  • @exodavid0780
    @exodavid0780 Год назад +2

    Excelente ❤️

  • @Felipe-gk9mc
    @Felipe-gk9mc Год назад +1

    Ahora necesito un curso de SQL, please.
    Saludos desde Brasil

  • @LeninElio
    @LeninElio Год назад +4

    Excelente, nos podrían compartir presentacion que uso al inicio por favor ?

    • @gustavojuantorena
      @gustavojuantorena Год назад +4

      Hola @LeninElio, las acabo de agregar en el repositorio del curso que está en la descripción. Saludos!

  • @esarmiento7
    @esarmiento7 6 месяцев назад +1

    Hola, se puede hacer un scrap que me guarde el valor de una pagina cada hora? osea es un contador pero quiero capturar que valor tenia a la 1am, 2am, etc. obviamente si apago el equipo no se si se puede desde google colab. gracias.

    • @gustavojuantorena
      @gustavojuantorena 6 месяцев назад +1

      Hola! Si, hay muchas maneras de hacer que un codigo se ejecute cada un determinado tiempo, en sistemas UNIX como Linux y Mac se puede usar un software por terminak que se llama cron (podes buscar "cron jobs"). En Windows podés usar el programador de tareas. Respecto a Colab, suele se un problema porque después de cierto tiempo de inactividad no te deja seguir usándolo, por eso mejor correr el código como un script de Python. Espero que te sirva. Saludos!

    • @esarmiento7
      @esarmiento7 6 месяцев назад +1

      @@gustavojuantorena Gracias, voy a mirarlo.

  • @gabrielag.hernandez8697
    @gabrielag.hernandez8697 Год назад +1

    Hola como están.. mi hijo quiere aprender a programar que tipo de computadora tiene que tener?..desde ya gracias por la información y saludos desde Argentina

    • @Rauru_Py
      @Rauru_Py Год назад +1

      Cualquiera vale. No necesitas nada potente. En Google Colab se hace todo en la nube

    • @gustavojuantorena
      @gustavojuantorena Год назад +1

      Coincido. No se necesita una computadora más allá de lo estándar para empezar a programar. Muchos éxitos para él!

    • @gabrielag.hernandez8697
      @gabrielag.hernandez8697 Год назад +1

      Gracias por la información!!!

  • @bizarrapmusic
    @bizarrapmusic 10 месяцев назад +1

    En la parte de la tabla, si estás mirando constantemente el html de la página. No es mas fácil entonces simplemente hacer un get de la url/table.html ? XD

    • @gustavojuantorena
      @gustavojuantorena 10 месяцев назад

      Hola! Tu observación está muy bien, en este caso el objetivo era mostrar como lidiar con elementos , dónde algunas veces no es tan fácil acceder a la URL dónde está alojada la información.

  • @BlooooodLine
    @BlooooodLine 9 месяцев назад +1

    Donde se encuentra la resolución de los ejercicios finales?

    • @gustavojuantorena
      @gustavojuantorena 9 месяцев назад

      Hola! Cómo digo en el vídeo, si hay dudas las podemos resolver acá en los comentarios. Te trabaste con alguno? Hay una duda puntual?

  • @orlandog1979
    @orlandog1979 Год назад +1

    El web scraping es Ilegal? En algunos lugares no lo permiten y por lo tanto me lleva a una inquietud.. Vale la pena aprenderlo?

    • @gustavojuantorena
      @gustavojuantorena Год назад

      Depende de varios factores: Si la información está pública sin necesidad de utilizar usuario y contraseña, copyright y de los términos y condiciones de la página.

  • @kletis
    @kletis 11 месяцев назад +1

    Muchas gracias por el curso muy util, uno de los problemas que me he encontrado es no poder superar el aceptar cookies. No se como resolverlo.

    • @gustavojuantorena
      @gustavojuantorena 11 месяцев назад

      Hola! Si, no es necesariamente algo sencillo. Fíjate en la.docimentación de la librería requests que se puede pasar un parámetro cookies con un diccionario que contenga las que necesites.

  • @jorgevalbuena4502
    @jorgevalbuena4502 Год назад +3

    😮

  • @esarmiento7
    @esarmiento7 5 месяцев назад

    Hay comunidades de esto? Me gustaria unirme a alguna para ver que cosas van saliendo. Saludos

  • @Matias_Heinze
    @Matias_Heinze Месяц назад +1

    porque aveces me da el resultado y otras no? en otra web lo probé! mismo codigo

    • @gustavojuantorena
      @gustavojuantorena Месяц назад

      Hola Matías. Podrías ser más específico? El código que les compartimos funciona tal cual está en scrapepark, pero los conceptos sí son generales para ser utilizados en otras páginas.

  • @alfredomorales3017
    @alfredomorales3017 8 месяцев назад +1

    ¿como se podria aplicar en alguna pagina que previamente se requeire autenticar?

    • @gustavojuantorena
      @gustavojuantorena 8 месяцев назад +1

      Hola Alfredo, para el caso de autenticación, luego de asegurarte que esa página permite el scraping, deberías usar una herramienta como Selenium o Playwright que te permita emular la acción del navegador. Las ideas generales del curso te van a seguir siendo útiles (por ejemplo cómo acceder al espacio para poner el nombre de usuario y la contraseña), pero BeatifoulSoup no está pensado para ese tipo de casos. Éxitos!

  • @ydvkuldeep5246
    @ydvkuldeep5246 Год назад

    When performing web scraping, if you encounter websites where certain HTML elements, like divs, lack consistent information (for example, one company's div has all details while another company's div is missing revenue information), it can lead to issues when converting the data into a CSV file.

  • @josepifarre9172
    @josepifarre9172 9 месяцев назад

    hola, pip3 install --force-reinstall -v no se instala por ende hay error en todo el codigo, al final de la instalacion dice que hay instalado normalizer.exe en PATH, quito el normalizer.exe?

    • @gustavojuantorena
      @gustavojuantorena 8 месяцев назад +1

      Me podés explicar más sobre el error? La idea es ejecutarlo directamente en Google Colab y ahí no debería aparecer ningún archivo ".exe" porque está corriendo en Linux

    • @josepifarre9172
      @josepifarre9172 8 месяцев назад

      @@gustavojuantorena Si, es que sale una carpeta en windows que es python 11, nunca lo instale, dentro de ella hay un archivo de normalizer.exe que aparecio de la nada, no se donde enviarte las capturas de pantallas.

    • @gustavojuantorena
      @gustavojuantorena 8 месяцев назад +1

      @@josepifarre9172 Te recomiendo que lo ejecutes en Google Colab, es directamente en el navegador y no vas a tener ese problema. En la descripción de este video entrás al link que dice "Código del curso ... " y cuando entres a ese repositorio apretas en el boton "open in colab" que està despuès de "👩‍💻 Accedé al código del curso entrando al siguiente enlace:" De este modo no vas a tener ningún problema con windows porque se va a estar ejecutando en la nube de google con un sistema Linux por detrás. Saludos!

    • @josepifarre9172
      @josepifarre9172 8 месяцев назад +1

      @@gustavojuantorena Muchísimas gracias

    • @gustavojuantorena
      @gustavojuantorena 8 месяцев назад

      @@josepifarre9172 De nada! 😀

  • @ShigureMuOnline
    @ShigureMuOnline 6 месяцев назад +1

    por las puras fue el diccionario url_imagenes cierto? no lo llegaste a usar en la hora 1h:00min

    • @gustavojuantorena
      @gustavojuantorena 6 месяцев назад +1

      Es verdad! Lo definí y no lo usé, muy buena observación. Me imagino que al principio pensé en guardarme todas las urls en esa lista pero al final decidí descargarlas directamente.

    • @ShigureMuOnline
      @ShigureMuOnline 6 месяцев назад +1

      @@gustavojuantorena uy muchas gracias por la rápida respuesta. Gracias me habia quedado con esa duda, ahora puedo vivir tranquilo

  • @esarmiento7
    @esarmiento7 9 месяцев назад +1

    Cual libreria hace el webscraping mas rapido que existe?

    • @gustavojuantorena
      @gustavojuantorena 9 месяцев назад +1

      Hola! No sabría decirte exactamente porque hay diferentes maneras de medir que tan rápido funciona, pero en Python usar BeatifoulSoup es una opción veloz (respecto a Selenium por ejemplo). Así que si aplica al caso de uso, suele ser de lo primero que se utiliza. Saludos!

    • @esarmiento7
      @esarmiento7 9 месяцев назад

      @@gustavojuantorena le puedo hacer scraping a titktok o me boquea la ip? Saludos

    • @gustavojuantorena
      @gustavojuantorena 9 месяцев назад +1

      Primero deberías asegurarte de no estar incumpliendo las condiciones. En ese caso me parece probable que te bloqueen la IP después de algunos requests

    • @str9845
      @str9845 Месяц назад

      bs4 pero no sirve para la mayorias de paginas , lo mejor es Selenium

  • @sarismejiasanchez
    @sarismejiasanchez Год назад

    Me habría gustado tener la explicación del apartado Pedidos HTTP con requests que hay en Colab. ¿Sería un error de edición? Comenzó desde Uso basico de APIs 🤔

    • @gustavojuantorena
      @gustavojuantorena Год назад +2

      Quedó fuera de la edición final, pero no involucra algo que no se explique. Si hay alguna duda puntual decinos!

    • @sarismejiasanchez
      @sarismejiasanchez Год назад

      Una que no tiene que ver con el curso, pero quisiera una recomendación. ¿Que distribución de Linux usas en tu máquina?

    • @gustavojuantorena
      @gustavojuantorena Год назад +1

      @@sarismejiasanchez Uso Ubuntu

    • @sarismejiasanchez
      @sarismejiasanchez Год назад +1

      @@gustavojuantorena gracias ☺️

  • @javieramartinez3146
    @javieramartinez3146 2 месяца назад

    Puedes explicar como es el asunto de los Exploits? como puedo mandar parametros desde python y poder hacr scraping haciendo login en un sitio web?

    • @gustavojuantorena
      @gustavojuantorena 2 месяца назад

      Hola Javier, no creo haber hablado de exploits ¿A qué te referís? Sobre la autenticación podés ver la documentación de la librería Requests que tiene varias opciones, pero también es común usar otras herramientas como Selenium. Saludos!

    • @javieramartinez3146
      @javieramartinez3146 2 месяца назад

      @@gustavojuantorena Hola, me refería al envío de Pos para hacer log in. Agradecido por la buena documentación

    • @gustavojuantorena
      @gustavojuantorena 2 месяца назад

      @@javieramartinez3146 Un ejemplo básico podría ser el siguiente:
      import requests
      from requests.auth import HTTPBasicAuth
      response = requests.get(url de la web',
      auth=HTTPBasicAuth('tu_usuario', 'tu_contrasena'))
      Pero va a depender de otros factores, te recomiendo ir a la documentación de Requests.
      Saludos!

  • @Jralexisg
    @Jralexisg Год назад

    Puedo hacerle web scraping a pdf subidos en la web con datos publicados

    • @gustavojuantorena
      @gustavojuantorena Год назад +1

      Si los archivos PDF están públicos podrías descargarlos de manera similar a cómo nos bajamos las imágenes en este caso. Luego deberías procesar el contenido de ese PDF ya en tu computadora (por ejemplo usando una librería de OCR)

    • @jacarrascom
      @jacarrascom Год назад

      ​@@gustavojuantorena que librería OCR se podría utilizar?

    • @gustavojuantorena
      @gustavojuantorena Год назад

      @@jacarrascom Por ejemplo pytesseract

  • @carloshinojosa7564
    @carloshinojosa7564 Год назад

    Alguien que pueda ayudarme con una duda que tengo?
    Quiero extraer datos de una plataforma. La plataforma pues no es de acceso libre sino que debes pagar una suscripción. Yo estoy construyendo una herramienta que facilita mi interacción con la plataforma y para ello debo extraer algunos datos. ¿Es posible hacer web scraping a una plataforma de paga si sí tienes la suscripción?

    • @gustavojuantorena
      @gustavojuantorena Год назад +2

      Normalmente si hay que poner nombre de usuario y contraseña, hacer scraping no está permitido. Deberías ver los términos y condiciones de la web.

    • @LuisMiguelAndujar
      @LuisMiguelAndujar 10 месяцев назад +1

      Si tienes usuarios y contraseña para entrar Beautiful Soup no es la librería que necesitas para realizar webscrapping tendrías que mirar la librería bastante más potente llamada Selenium.

  • @TheJory248
    @TheJory248 Год назад

    En mi caso la tabla de la que quiero extraer los datos si la muestra en el HTML pero al extraer los datos solo me muestra la etiqueta que la contiene:

    • @gustavojuantorena
      @gustavojuantorena Год назад

      Es alguna duda sobre el curso? O un proyecto de web scraping aparte?

    • @TheJory248
      @TheJory248 Год назад

      @@gustavojuantorena Buenas noches, es aparte sabrás en tu experiencia si existen páginas que de alguna manera cifren los datos para que no puedan ser extraídos?

    • @gustavojuantorena
      @gustavojuantorena Год назад

      @@TheJory248 Hola, si efectivamente puede pasar eso, por ejemplo con cifrado XOR. Podés buscarlo en Google para más información

  • @jamesmoisesllalleperez3079
    @jamesmoisesllalleperez3079 11 месяцев назад

    como hago para esa información luego insertarla en la misma pagina?

    • @gustavojuantorena
      @gustavojuantorena 11 месяцев назад

      Hola JAMES, normalmente uno no tiene acceso para colocar información en una página de internet y modificarla. De eso se encarga aquella persona que la creó y/o la mantiene.

  • @antonioroa3971
    @antonioroa3971 Год назад

    La descarga de las imagenes no funciona del todo bien. . De hecho las imagenes son solo de tamaño 4kB cuando las descargo con el codigo tal cual lo implementas
    Sin embargo si las puedo abrir si las descargo directamente con un tamaño promedio de 200 KB
    Algo no está yendo bien

    • @gustavojuantorena
      @gustavojuantorena Год назад

      Hola @antonioroa3971, no estoy logrando replicar tu problema. Con el código como está implementado se descargan en la misma calidad que en la página, en un rango de tamaños entre 20kbs y 3 Mbs. De todos modos sin dudas esa implementación puede mejorarse! Saludos

  • @franliendro
    @franliendro Год назад

    no era que el próximo curso iba a ser el de videojuegos???

  • @josecarlosvielmanmallada4867
    @josecarlosvielmanmallada4867 Год назад +1

    Buenas, alguien sabe como puedo usar a api de wikipedia en ubuntu linux?

    • @gustavojuantorena
      @gustavojuantorena Год назад

      Hola! En el curso lo usamos en Linux ya que Google Colab está corriendo en una computadora con ese sistema operativo. No hay que hacer nada distitno a correr el código tal cual está, ya que Python es multiplataforma

  • @mikewaldron475
    @mikewaldron475 5 месяцев назад

    me da error:
    ---------------------------------------------------------------------------
    NameError Traceback (most recent call last)
    in ()
    ----> 1 precios
    NameError: name 'precios' is not defined
    ¿Como se soluciona?

    • @gustavojuantorena
      @gustavojuantorena 4 месяца назад

      Hola. El error dice que 'precios' no fue definido, probablemente te haya faltado ejecutar una celda anterior donde se define esa lista.
      Fijate en la celda que comienza con estas lìneas:
      divs = soup.find_all('div', class_='detail-box')
      productos = []
      precios = []
      Saludos!

  • @cobrachess1775
    @cobrachess1775 Год назад

    Que hacer si la página pide un login?

    • @gustavojuantorena
      @gustavojuantorena Год назад

      En principio deberías poder enviar información al servidor, emulando lo que hacés al completar el login manualmente. Una de las maneras mas comunes es emulando un navegador por ejemplo utilizando herramientas como Selenium o Playwright. De todos modos deberías ver que no estés incumpliendo los términos y condiciones de la página. Saludos.

  • @eduardoalfredoperez5059
    @eduardoalfredoperez5059 11 месяцев назад

    Hasta el minuto 31 y 30 segundos todo bien. Cuando se corren las dos ordenes me da error ---------------------------------------------------------------------------
    NameError Traceback (most recent call last)
    in ()
    ----> 1 type(respuesta_sunset)
    NameError: name 'respuesta_sunset' is not defined
    Que quede claro que yo no se nada de programacion. Pero pense que era para todos este video.

    • @eduardoalfredoperez5059
      @eduardoalfredoperez5059 11 месяцев назад

      Usè la data de la misma sunset y dio resultado. Paso derecho al scraping porque la parte de la api es mas confusa que la data de la pagina sunset

    • @eduardoalfredoperez5059
      @eduardoalfredoperez5059 11 месяцев назад

      Y monica me dice que el archico de respuesta es un jSON

    • @gustavojuantorena
      @gustavojuantorena 11 месяцев назад

      Hola Eduardo. No entendí mucho tu problema, ya lo solucionaste? Saludos

  • @_awesomnet_4687
    @_awesomnet_4687 3 месяца назад +1

    Muy buen curso pero siento que le faltó llegar un poco mas a profundidad en los temas

    • @gustavojuantorena
      @gustavojuantorena 3 месяца назад

      Gracias ¿Qué te parece que le faltó?

    • @_awesomnet_4687
      @_awesomnet_4687 3 месяца назад +1

      @@gustavojuantorena Quizás empezar primero con un repaso de python y la forma de manejar itersbles, resaltar al principio que bs4 retorna un objeto de besrifulsoup y no un iterables común. profundizar un poco más con el manejo de excepciones que están en la documentación de la librería, más ejercicios que estén entre cada 1 o 2 módulos para lograr esa sensación de progreso en el aprendizaje. Esto ya es una opinión pero el no usar vscode no está mal pero es el entorno que siempre manejamos así que creo que sería mejor intentar adecuarse ya a la herramienta de trabajo del día a dia

    • @gustavojuantorena
      @gustavojuantorena 3 месяца назад

      @@_awesomnet_4687 Gracias! Lo voy a tener en cuenta para próximos cursos!

  • @franescobar89
    @franescobar89 Год назад +1

    Biologo especializado en neurociencias y doctor en inteligencia artificial... Ahí te veo Skynet

  • @anap5009
    @anap5009 Год назад

    Hola, me encana su canal, tienen videos de Devops? gracias

  • @angellavado8166
    @angellavado8166 9 месяцев назад +1

    como hacer web scraping para paginas dinamicas con insercion con javascript

    • @gustavojuantorena
      @gustavojuantorena 9 месяцев назад +1

      Hola! Para esos casos te van a servir las ideas generales de este curso pero vas a tener que usar una herramienta Selenium o Playwright que te permitan interactuar con páginas más dinámicas que tengan mucho código en JavaScript.

  • @esarmiento7
    @esarmiento7 6 месяцев назад +1

    Que vpn se puede usar para que no bloqueen la ip? saludos.

    • @gustavojuantorena
      @gustavojuantorena 6 месяцев назад +1

      Hola, usar una VPN no suele ser la alternativa ante un bloqueo, lo que suelen hacer algunas personas es ir rotando proxies o buscando otra manera de hacer los pedidos al servidor desde otra IP.

  • @TheSuperxxd
    @TheSuperxxd Год назад

    Chatgpt y era. Mas facil

  • @henrygustavosalazartorrez8297
    @henrygustavosalazartorrez8297 Год назад +2

    Gracias, es algo nuevo que aprender

  • @ramiroromeroacevedo
    @ramiroromeroacevedo Год назад +4

    Excelente 👌