Парсинг сайтов PYTHON

Поделиться
HTML-код
  • Опубликовано: 2 дек 2023
  • В данном видео мы будем решать прикладную задачу python - парсинг сайта. Поговорим об особенностях парсинга сайта, о коде страницы и анализе данных. Все это мы будем делать в среде разработке jupyter lab.
    tg: @let_s_program

Комментарии • 52

  • @user-wv4wu4nf5p
    @user-wv4wu4nf5p 4 месяца назад +7

    У меня даже не базовые, а примитивные знания питона. Оказывается если грамотно объяснить, то даже мне все стало понятно. Огромное спасибо!

    • @let_s_program
      @let_s_program  4 месяца назад

      Спсаибо за такой комментарий!

  • @user-yu1fw6pe1q
    @user-yu1fw6pe1q 2 месяца назад

    Спасибо большое, не нашел никого кто объяснил бы лучше вас.

    • @let_s_program
      @let_s_program  Месяц назад

      Спасибо за комментарий! Скоро видео по тг-боту)

  • @Naxfit
    @Naxfit 4 месяца назад +2

    Посмотрел на одном дыхании. Очень доходчиво объясняете. Спасибо!

  • @fooosters
    @fooosters 4 месяца назад

    Отдельное спасибо за такие подробные объяснения!

  • @user-yq8kt1th9z
    @user-yq8kt1th9z 4 месяца назад

    Офигенно! Жду с нетерпением следующие видео

  • @AA-zk1si
    @AA-zk1si Месяц назад

    Как раз бился над проблемой одинаковых тегов и как убрать пробелы перед конечным результатом. Видос супер!

    • @let_s_program
      @let_s_program  Месяц назад +1

      Спасибо большое! Рад, что помог

  • @FgSOKlSSM3suGkza1089
    @FgSOKlSSM3suGkza1089 4 месяца назад +2

    хотел написать гневный пост про забивание гвоздей микроскопом в извращенной форме (это про обработку тегов как строк), но выше уже все написали))
    а разбор работы range в видео парсинга... это как на лекции по ядерной физике рассказывать таблицу умножения)

    • @let_s_program
      @let_s_program  4 месяца назад

      Спасибо за ваш комментарий! Да, безусловно, способы в видео не самые оптимальные. Единственное, что стоит отметить, что это видео для самых-самых новичков. И может где-то я действительно уходил в дебри)

    • @FgSOKlSSM3suGkza1089
      @FgSOKlSSM3suGkza1089 4 месяца назад +1

      @@let_s_program извините, не хотел никоим образом обидеть. ваше видео уже помогло многим людям, судя по комментариям. прошу счесть мой несколько саркастичный комментарий простым советом по улучшению будущих видео)

  • @MauwTong
    @MauwTong 4 месяца назад +1

    Интересно

  • @user-danche
    @user-danche 5 месяцев назад +2

    Объясняете интересно и понятно, единственное, что хотелось бы меньше слышать это заполнение паузы звуком 'аа'. Ставлю лайк 😊

    • @let_s_program
      @let_s_program  5 месяцев назад

      Спасибо за Ваш комментарий! Буду стараться обращать на это внимание при записи

    • @whosane9923
      @whosane9923 4 месяца назад

      ​@@let_s_programда это легко на монтаже убирается, прям из коробки функция у многих

    • @let_s_program
      @let_s_program  4 месяца назад

      в последнем видео убрал все лишние звуки)@@whosane9923

  • @l1acdy
    @l1acdy Месяц назад

    *Можно поставить таймкоды в описание, вот так: "5:00 - Название". Тогда видео можно будет удобно перематывать, так как таймкоды будут отображаться над полосой просмотра

    • @let_s_program
      @let_s_program  Месяц назад

      Спасибо, попробую!

    • @l1acdy
      @l1acdy Месяц назад

      ​@@let_s_programЯ ошибся немного ┐('~`;)┌. Там без дефиса

  • @pubgmabail3041
    @pubgmabail3041 2 месяца назад +1

    Ееееа харошое видео еееееа но много еееееа

    • @let_s_program
      @let_s_program  2 месяца назад

      Спасибо за комментарий! В следующих видео этого меньше

    • @tworall6282
      @tworall6282 2 месяца назад

      Согласен! Без еееееее было бы идеально)))

  • @circuit55
    @circuit55 4 месяца назад

    perfect dude!

  • @arthurbaghramian143
    @arthurbaghramian143 4 месяца назад

    Можно было еще с середины переместить с помощью lstrip() и не замарачиваться))

  • @Figase
    @Figase 3 месяца назад

    Лучше в Нетворк посмотреть откуда данные приходят и чаще всего в json можно вытащить все данные без ненужного парсинга

  • @CodeStarter
    @CodeStarter Месяц назад

    ааааааааааааааааааааааааааааааааааааааааааааааааааааааа

  • @user-og6sp3ov1h
    @user-og6sp3ov1h 3 месяца назад

    Парень продолжай тему Парсинга !) спасибо тебе !

    • @let_s_program
      @let_s_program  3 месяца назад

      Спасибо! Как победю диплом - сразу в бой)

  • @SenSei_RB
    @SenSei_RB 4 месяца назад

    После нескольких попыток выдало ошибку ... До этого всё работало! Я так понимаю превысил кол-во запросов... :(

    • @let_s_program
      @let_s_program  4 месяца назад

      Да, скороее всего. То есть если смотреть описание ошибки, то она близка к "ограничению прав доступа"

  • @AITradingLab
    @AITradingLab 29 дней назад

    привет, думаю для новичков было бы интересно узнать как установить на комп сам jupiter lab, а потом уже объяснять как с ним работать. Можно, конечно найти эти видосы и на других каналах, но зачем отдавать свою аудиторию другим???

    • @let_s_program
      @let_s_program  28 дней назад +1

      Добрый день! В следующем видео расскажу про этот момент! Спасибо за обратную связь

  • @battlepitek817
    @battlepitek817 4 месяца назад

    здравствуйте, можно ваш тг

    • @let_s_program
      @let_s_program  4 месяца назад

      Добрый день! t.me/let_s_program

  • @user-dt7rp9hr9v
    @user-dt7rp9hr9v 3 месяца назад

    Вы забыли про кодировки, а то иногда такая вот ��� фигня лезет.

    • @let_s_program
      @let_s_program  3 месяца назад

      Добрый день! Хорошее замечание

  • @artur_alf
    @artur_alf 3 месяца назад

    где код?!

    • @let_s_program
      @let_s_program  3 месяца назад +1

      Добрый день! ТГ-канал t.me/let_s_program

  • @tulur
    @tulur 2 месяца назад

    Столько воды пипец. открываем... наводим... вообще то существует специальная панель для выделения элементов на странице. И в целом если человек знает и ищет возможность и способы парсить сайты это подразумевает под собой как минимум знание о том что такое теги и разметка страниц. За инфу в целом спасибо. Мне как раз нужна была информация, по парсингу на питоне. Хотя в нем я нооб)

    • @let_s_program
      @let_s_program  2 месяца назад +1

      Спасибо за комментарий! Это самое первое видео на канале, поэтому я еще подбираю формат. В следующих видео немного скорректировался.

  • @ivankislitsin7861
    @ivankislitsin7861 3 месяца назад

    Это все интересно, только данные методы устарели в 2000 году ))) Вот ответ "Response [406]"

    • @let_s_program
      @let_s_program  3 месяца назад

      Да, можно подобрать более современный метод! Напишите, какой используете вы

  • @user-ss1rl9sy9e
    @user-ss1rl9sy9e 5 месяцев назад +1

    Я так сделал:
    names = [data[i].text.strip('
    ').strip(' ').strip('
    ') for i in range(len(data))]

    • @let_s_program
      @let_s_program  5 месяцев назад

      Интересный способ!

  • @user-jg9tm2nn5s
    @user-jg9tm2nn5s 4 месяца назад +1

    в цикле можно было не играться со строками, а просто написать print(tmp_str.text)

    • @sky_library_for_novels
      @sky_library_for_novels 4 месяца назад

      Согласен так проще,но иногда хочеться сделать свой алгоритм ∠( ᐛ 」∠)_

    • @yrmisi
      @yrmisi 4 месяца назад

      я тоже посмотрел видео и подумал об этом) зачем усложнять)))