Парсинг сайтов PYTHON
HTML-код
- Опубликовано: 2 дек 2023
- В данном видео мы будем решать прикладную задачу python - парсинг сайта. Поговорим об особенностях парсинга сайта, о коде страницы и анализе данных. Все это мы будем делать в среде разработке jupyter lab.
tg: @let_s_program
У меня даже не базовые, а примитивные знания питона. Оказывается если грамотно объяснить, то даже мне все стало понятно. Огромное спасибо!
Спсаибо за такой комментарий!
Спасибо большое, не нашел никого кто объяснил бы лучше вас.
Спасибо за комментарий! Скоро видео по тг-боту)
Посмотрел на одном дыхании. Очень доходчиво объясняете. Спасибо!
Спасибо большое!
Отдельное спасибо за такие подробные объяснения!
Офигенно! Жду с нетерпением следующие видео
Спасибо большое!
Как раз бился над проблемой одинаковых тегов и как убрать пробелы перед конечным результатом. Видос супер!
Спасибо большое! Рад, что помог
хотел написать гневный пост про забивание гвоздей микроскопом в извращенной форме (это про обработку тегов как строк), но выше уже все написали))
а разбор работы range в видео парсинга... это как на лекции по ядерной физике рассказывать таблицу умножения)
Спасибо за ваш комментарий! Да, безусловно, способы в видео не самые оптимальные. Единственное, что стоит отметить, что это видео для самых-самых новичков. И может где-то я действительно уходил в дебри)
@@let_s_program извините, не хотел никоим образом обидеть. ваше видео уже помогло многим людям, судя по комментариям. прошу счесть мой несколько саркастичный комментарий простым советом по улучшению будущих видео)
Интересно
Объясняете интересно и понятно, единственное, что хотелось бы меньше слышать это заполнение паузы звуком 'аа'. Ставлю лайк 😊
Спасибо за Ваш комментарий! Буду стараться обращать на это внимание при записи
@@let_s_programда это легко на монтаже убирается, прям из коробки функция у многих
в последнем видео убрал все лишние звуки)@@whosane9923
*Можно поставить таймкоды в описание, вот так: "5:00 - Название". Тогда видео можно будет удобно перематывать, так как таймкоды будут отображаться над полосой просмотра
Спасибо, попробую!
@@let_s_programЯ ошибся немного ┐('~`;)┌. Там без дефиса
Ееееа харошое видео еееееа но много еееееа
Спасибо за комментарий! В следующих видео этого меньше
Согласен! Без еееееее было бы идеально)))
perfect dude!
You are welcome, dude
Можно было еще с середины переместить с помощью lstrip() и не замарачиваться))
Лучше в Нетворк посмотреть откуда данные приходят и чаще всего в json можно вытащить все данные без ненужного парсинга
ааааааааааааааааааааааааааааааааааааааааааааааааааааааа
бббб
Парень продолжай тему Парсинга !) спасибо тебе !
Спасибо! Как победю диплом - сразу в бой)
После нескольких попыток выдало ошибку ... До этого всё работало! Я так понимаю превысил кол-во запросов... :(
Да, скороее всего. То есть если смотреть описание ошибки, то она близка к "ограничению прав доступа"
привет, думаю для новичков было бы интересно узнать как установить на комп сам jupiter lab, а потом уже объяснять как с ним работать. Можно, конечно найти эти видосы и на других каналах, но зачем отдавать свою аудиторию другим???
Добрый день! В следующем видео расскажу про этот момент! Спасибо за обратную связь
здравствуйте, можно ваш тг
Добрый день! t.me/let_s_program
Вы забыли про кодировки, а то иногда такая вот ��� фигня лезет.
Добрый день! Хорошее замечание
где код?!
Добрый день! ТГ-канал t.me/let_s_program
Столько воды пипец. открываем... наводим... вообще то существует специальная панель для выделения элементов на странице. И в целом если человек знает и ищет возможность и способы парсить сайты это подразумевает под собой как минимум знание о том что такое теги и разметка страниц. За инфу в целом спасибо. Мне как раз нужна была информация, по парсингу на питоне. Хотя в нем я нооб)
Спасибо за комментарий! Это самое первое видео на канале, поэтому я еще подбираю формат. В следующих видео немного скорректировался.
Это все интересно, только данные методы устарели в 2000 году ))) Вот ответ "Response [406]"
Да, можно подобрать более современный метод! Напишите, какой используете вы
Я так сделал:
names = [data[i].text.strip('
').strip(' ').strip('
') for i in range(len(data))]
Интересный способ!
в цикле можно было не играться со строками, а просто написать print(tmp_str.text)
Согласен так проще,но иногда хочеться сделать свой алгоритм ∠( ᐛ 」∠)_
я тоже посмотрел видео и подумал об этом) зачем усложнять)))