Распознавание текста с картинки. Python Tesseract ORC + OpenCV

Гоша Дударь

Просмотров 65 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 20 янв 2025

Комментарии • 104

@iambread666 5 месяцев назад
Долго мучился с установкой, а тут все подробно рассказали, спасибо
@gammahilla 4 месяца назад
нифига подробного на винде, уже 4-ый день сижу не могу понять от куда что скачивать как добавить в PyCharm, если есть возможность объясните
что делать я скачать PyCharm, а дальше ничего не получается
@ЕгорБеляев-ы4щ 4 года назад ⁺¹²
Нету файла для скачивания pytesseract ocr на сайте пишет что нет актуальной версии для установки что делать?
@blwashere 4 года назад ⁺²⁴
можно поступить проще: в терминале(cmd) установить pip и написать: pip install tesseract
@musa_usmanov 3 года назад ⁺²
pip install opencv-python
@blwashere 3 года назад ⁺²
@@musa_usmanov Так тоже ожно)
@timofey-0307 2 года назад
Это не так работает. Нужно проинсталлировать библиотеку + установить tesseract на компьютер
@gooddo1852 4 года назад ⁺³
Ты супер! Продолдай в томже духе
@kirill_bykov 3 года назад ⁺³
6:02 ну зачем? Делается слайс [1:] и всё.
@olzhasshabdenov3362 4 года назад
Гоша, красавчег👍
@msmesh5666 4 года назад ⁺¹
Это даже не он сделал - ruclips.net/video/6DjFscX4I_c/видео.html
@konstbespr619 4 года назад ⁺⁹
Гоша, сделай пожалуйста видео на тему интеграции оплаты в телеграм бота! Нигде нет инфы на эту тему
@Cloudy-zq5yx 4 года назад
Есть.
@konstbespr619 4 года назад
@@Cloudy-zq5yx линк?
@Cloudy-zq5yx 4 года назад
@@konstbespr619 physics is simple aiogram набери
@MrDlop 4 года назад
Может там как в ВК боте?
@MrDlop 4 года назад
Я просто не помню, давно этим не интересовался
@43oiurtjkn9gfds8y98r 4 года назад ⁺¹
Спасибо
@АрманМеликбекян-е4ш 4 года назад ⁺⁹
Сделай курс по data science на python или про ИИ на python. В крайнем случае про нейросеть.
@YanchikDev 4 года назад ⁺¹
Жду видео про template matching
@baukaalimgazy2989 4 года назад
Круто, у меня вчера была идея сделать комментатор бота ВК с искусственным интеллектом который считывает данные с поста и пишет наиболее подходящий коммент и через определенное время проверять сколько лайков набралось и в зависимости от кол-ва лайков менять веса и другие параметры нейросети, но я конечно же отказался от этой идеи, так как не знал считывать текст с картинки и множество других проблем, вот и решена одна проблема, если другие тоже сами по себе решатся, то может сделаю)
@NeuralAIM 4 года назад ⁺¹
Зачем тебе тогда нейросеть? Парсер странички нужен для получения данных, так быстрее, точнее и менее ресурсозатратнее. Не быть тебе программистом)
И уж даже если ты и накодишь нейронку (Даже через тот же tensor) то тебе этого не хватит (Она все равно будет тупой, сколько бы ты данных не вливал) А данных для обучения нужно больше чем пару тысяч фраз...
@puturoi 4 года назад
судя по твоему комменту, не особо ты сечешь, как работает нс, бот и т.д. Чтобы считать текст из поста вообще нвхрен не нужен computervision c tesseractom.
@baukaalimgazy2989 4 года назад
@@NeuralAIM лол нейросеть из видео нужен, чтобы разпознать текст из картинок, а в ВК большинство постов в виде картинки. И я написал в комменте что ещё много заморочек кроме этого, но для генерации комментария GMT2 или 3, который может генерировать текст или статью а не то что коммент, просто если ему дать тему. Или можно ещё что то самому придумать.
@baukaalimgazy2989 4 года назад
@@puturoi лол, я же написал в "ВК", в ВК много постов в виде картинки, и там текст в картинке и либа с этого видео только для того что распознать текст с постов в виде картинки. И я ещё я дополнил что много проблем кроме распознавания текстов и ТД. И я хоть и практический не делал нормальные проекты с нейросетями, но знаю как сделать перцептрон и обратное распространение ошибки, и знаю какие ограничения у вк, у официального или у неофициальных VK API для бота и с ними тоже работал, делал разных ботов ВК
@stoparb357 4 года назад
@@baukaalimgazy2989 а, ты тип хочешь быть самым первым комментатором под постами чи шо
@villainmadless1503 4 года назад ⁺⁴
OCR же, OCR!
@иваниванов-к5т4е 3 года назад ⁺³
Спасибо все супер. Скажи можно ли из js передать картинку в питон который обрабатывает фото и результат отдаёт назад в js?
@zemf4you731 4 года назад ⁺²
Параметры запуска тессеракта абсолютно не за то отвечают, что ты сказал. Oem - способ распознавания, psm (page segmentation mode) - режим сегментации страницы (в основном тессеракт с документами работает, при выщове помощи можно просмотреть все режимы сегментации)
Вместо enumerate и проверку индекса можно было сделать срез, так как нам всё равно необходимо будет хранить считанные данные в памяти, нет смысла пытаться сохратить итератор
@amidl 2 года назад ⁺¹
Больше всего меня удивило, что автор использует аббревиатуру ORC, хотя общепринятой является OCR (о чем автор даже в названии библиотеки мог увидеть).
@МаксОгн 3 года назад
Того файла на сайте нету про Tesseract
@СаятЕралы-я9з 4 года назад ⁺²
ого круто.
@ВладиславБогер 4 года назад
Спасибо.
@ОООГеобур 2 года назад
а можно с нескольких картинок собирать данные в Excel
@MrFog124 4 года назад
Давай видос по считыванию потокового видео с программы и распознавании собственных объектов
@gennady3935 4 года назад
Может кто подсказать, в AWS Textract можно написать price и он выведет только стоимость если она указана, т.е. сопоставляет данные и выводит именно тот текст, который нам нужен. В tesseract есть такое?
@TblKBA_Z 3 года назад
помогите пж, нужно создавать скрины определённой области, загружать их в скрипт, находить символы и их-же писать (как send в ahk, не в командную строку)
@DictorDialog 2 года назад
Всё это будет работать пока фон под текстом не будет пёстрым
@konstantin9888 4 года назад
Гоша. скинь пжл ссылки на репозиторий, тех программ которые ты использовал в качестве примера при работе с OpenCV
@stariy_bog 4 года назад ⁺³
Как сделать что бы распознавал русский текст ?
@the..egoisto 4 года назад
Он же сказал что надо выбрать при загрузке и русский
@stariy_bog 4 года назад
@@the..egoisto скачал а где подключить
Подключаю после конфига выдает ошибку
@Dikobrother 4 года назад ⁺¹
@@stariy_bog Там где конфиг он подключал пишешь , lang='rus'. Перед эти закидываешь файл с языком в папку tessdata с самим тессерактом
@Гриша-ф1б 4 года назад
Ребят подскажите что делать вылазит вот эта ошибка
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
cv2.error: OpenCV(4.4.0) /private/var/folders/nz/vv4_9tw56nv9k3tkvyszvwg80000gn/T/pip-req-build-2rx9f0ng/opencv/modules/imgproc/src/color.cpp:182: error: (-215:Assertion failed) !_src.empty() in function 'cvtColor'
@hinomuratomisaburo4901 3 года назад
фотку название файла обрежь коротким название сделай типо temp.png
@Гриша-ф1б 3 года назад
@@hinomuratomisaburo4901 не получилось
@imperria392 3 года назад
тоже самое, ты если понял как это сделать скажи мне пожалуйста
@imperria392 3 года назад
вообщем я понял, там к нему нужно путь написать
@XEROS282 3 года назад
А как сканировать баркоды через Django?
@diasoralbekov6465 4 года назад
где ссылка на виндовс инсталер
@СергейКитин 4 года назад
Уху питон 🐍
@ДмитрийКлочков-ж8ю 4 года назад ⁺¹
А она может комбинировать языки? К примеру код естественно написан на английском языке ,но у него есть комментарии на русском.
@mikelieber7256 4 года назад
Да, можно. На C#, если воспользоваться библиотекой для тессеракта, ты можешь при инициализации тессеракта указать, например, RUS+ENG, но качество OCR будет чуть ниже.
@shadowcode7752 4 года назад ⁺¹
Запишы курс по rust.
@qwer5822 4 года назад ⁺¹
Видео о том как взломать чужой компьютер - ruclips.net/video/XtMgEfcZgZo/видео.html
@sergozar 3 года назад
А как распознать символы типо "·ê ·Ë· »ê ³ ·³¼ ·Ë"?
@sergeisuslov773 Год назад
Сами же говорите оптикал кхеректал рекгнишн, а потом аббревиатура меняет порядок символов на о-эр-си, когда на самом деле оно о-си-ар
@dictatorsupreme5447 4 года назад
Гоша, сделай пожалуйста видео на тему Перенос HTML сайта на WordPress ?
@VladKochetov 4 года назад
@Гоша Дударь, попробуй сделать урок по numba
@sunmaxplay6491 4 года назад
как быть с 4 строчкой на линуксе?
@Crd51409 4 года назад
Не нужна
@CalmVideo 4 года назад ⁺¹
Всё конечно очень круто, но до того, чтобы понять, мне далековато. :)
Хочу тоже этому научиться (создавать нейросети), но пока чёт не очень получается, но ничего!
@rustc2p256 4 года назад
Для начало изучи основы
@CalmVideo 4 года назад
@@rustc2p256 , стараюсь.
@kirillusenko 4 года назад
Это сложно, но вот курс по которому я пытался изучать tensorflow: ruclips.net/p/PLtPJ9lKvJ4oiz9aaL_xcZd-x0qd8G0VN_
@CalmVideo 4 года назад
@@kirillusenko , спасибо!
@casuale1200 4 года назад
круть
@KuKuRuuZa 3 года назад ⁺²
И не ORC а правильно OCR
@ЕгорБеляев-ы4щ 4 года назад
Гошаааа видео супер но у меня проблема. Тесеракт поставился а вот с opencv проблемы. При написании просто в терминале пайчарма через pip выдаёт ошибку. Проблема с логами. Я не особо сведующий в логировании да и вообще в программировании. Прошу помощи либо у тебя либо друзья подписчики подскажите что сделать чтобы установить opencv. Заранее спасибо
@drfclub777 Год назад
получилось?
@zaralx 4 года назад
Блен ты прям вот во время как раз пишу прошу для бота в игре
@БогданКислов-ж2ж 4 года назад
Когда будет видио про создания игр?
@FDev404 4 года назад ⁺¹
У него этих видео жопой ешь
@dedpihto680 2 года назад ⁺¹
из 7 минутного видео полторы минуты реклама и никчемное вступление, потом еще и посреди ролика впихнул рекламу. топчик
@nikolaydd6219 4 года назад ⁺³
Тесеракт довольно хреновое решение. Сам им пользуюсь и проблем с ним - полно. Хорошее решение это Yandex Vision, но капец какой дорогой.
@nikolaydd6219 4 года назад ⁺¹
Но ведь не удобно работать с Питоном, гораздо удобней было бы сделать программу с интерфейсом, окном и кнопками .
@FDev404 4 года назад
У тебя как то разрозненно всё. Я не очень люблю питухон, но могу сказать, что нужно тебе делать видео более подробные по нему. Расскажи про всё что знаешь. Smtplib, json, datetime, request, tkinter, socket, os, time. Сними самую подробную серию видео по питухону на рутубе и я думаю добьёш 1млн подписчиков к весне 21!!!
@dmitriy2502 3 года назад
Здравствуйте! А подскажите, можно ли этим методом распознавать цифры из потока видео? Например спортивное электронное табло с временем, время минуты +секунды?
@unknown_youtube_user 3 года назад
Метод показанный в видео работает с картинками, если ты разработаешь программу которая будет делать скриншоты и вставлять для считывания, то вполне возможно.
@a1exlovser136 4 года назад
digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.02-20180621.exe возможно вот этот файл нужный
@Lucerbius Год назад ⁺¹
ОэрСи, боже, чувак не может три буквы OCR прочитать в правильном порядке...
А по уроку выпадает ошибка:
cv2.error: OpenCV(4.8.1) D:\a\opencv-python\opencv-python\opencv\modules\highgui\src\window.cpp:1272: error: (-2:Unspecified error) The function is not implemented. Rebuild the library with Windows, GTK+ 2.x or Cocoa support. If you are on Ubuntu or Debian, install libgtk2.0-dev and pkg-config, then re-run cmake or configure script in function 'cvShowImage'
@L3M-carx 8 месяцев назад
А ты не лучше, почитать ошибку можешь а не в комы вставлять. Переустанови библиотеку блять умник
@АнтонКруглышев-к4ц 4 года назад
Плохо работает с русским языком.
@PythononPapyrusRU 4 года назад
Круто!
Неужели ты не любишь его😭😭??? Я про Python. А если и любишь, то почему не подписан на мой канал? Исправь это🤙😎
@ДаниилФотеев-ы1й 3 года назад
Мой коммент будет явно удален, но что я хочу сказать: Гоша, тебе простительно что ты не ученый в сфере компьютерного зрения и машинного обучения. Но готовься пожалуйста лучше. Многая терминология неточна или неверная + про функции питона немного неверно говоришь)
@yes_ss 2 года назад
PermissionError: [WinError 5] Отказано в доступе
@wad_code 4 года назад
Начал с ORC закончит RAC
@irgendwer234 4 года назад ⁺¹
Cnacubo
@tarantinPipka 8 месяцев назад
твои видео все до единого не рабочие , не заработало не чего .. хз , я уже скоко их не смотрел.. вродь пробелма в опен сиви ... она у твоему коде кривая ..щас комент вставлю что пиет джипити
@tarantinPipka 8 месяцев назад
Кажется, возникла проблема с библиотекой OpenCV, которая используется для отображения изображений. Ошибка указывает на то, что функция cv2.imshow() не реализована. Это может быть вызвано неправильной установкой или версией OpenCV.
Попробуйте переустановить OpenCV или обновить его до последней версии. Возможно, вам также потребуется установить зависимости для поддержки графического интерфейса, если вы используете его на Windows.
@pirozhekN 4 года назад
Тессеракт орк
@pavelkross 4 года назад
даешь тоже самое только на C#!!
@СтаниславАлямов 2 года назад
дохлый движок он распознает с кракозябрами.. это капитализм.. хорошие движки платные.. тоже с говорилками...про браузеры вообще молчу.. по моему нам слили чтобы началась гражданская война до того раздражает тупизм некоторого ПО ..вместо нормального функционала команд в консоли приходится лезть черт знает куда...

Следующие

Автовоспроизведение

РАСПОЗНАВАНИЕ АВТОМОБИЛЬНЫХ НОМЕРОВ С ПОМОЩЬЮ PYTHON | КОМПЬЮТЕРНОЕ ЗРЕНИЕ | PYTESSERACT, OPENCV