Я використав гугл stt воно дуже швидке і якісне, так для цього треба інтернет, але воно типу швидше набагато ніж локальне розпізнавання на разберюсі. типу у мене було локальне розпізнавання 6 секунд, а черег гугл 500 мілісекунд
Незрозуміло чому це ESP32 найслабший - від S3 версії він не сильно відрізняється, (пам'яті там трохи більше, лапок менше, і немає USB, зате є ethernet та ЦАП, теж два ядра 240МГц, тільки архітектура LX6 а не LX7, явної різниці в продуктивності я не помітив ) - flash та SDRAM там зовнішні, та залежать від модуля а не чипа.
Цікаве відео. Досі я думав що для голосового керування потрібне щось по типу голосових колонок від гугла чи амазону і був здивований що можна самому на базі ESPHome зібрати власний асистент. І ще більше був здивований що все це може працювати локально. Дякую.
Огромное спасибо очень интересно содержательно, собственно как всегда :-) Как раз недавно пробовал разобраться даже приобрёл атом эхо, буквально как только появился осист вроде все получалось несмотря на том что тогда было намного меньше возможностей, но на данный момент что-то у меня получилось но не совсем :-) как раз не хватало вашего видео ещё раз спасибо последнее время скучал за вашими Трудами по теме хом ассистента Желаю вам успехов всего наилучшего А також скоріш нам Перемоги
Дякую за відео, супер! Можливо колись реалізуюю. Але зараз не користуюся Home Assistant (старий ноут жере багато світла), мені вистачає Node-red на старенькому смартфоні, плануюю налаштувати його на тв-пристівкі. Саме в Node-red пробував налаштувати голосове керування, на телефоні розпізнається голос гуглом, по mqtt передається в Node-red де вручну прописані команди-дії, і прилітає назад відповідь. Все працює та гострої потреби в цьому поки немає. Маю тільки пару ламп і автоматизація керування бойлером в залежності від потужності сонячної системи. Хотілося б зробити колонку для сповіщень, бачив відоси для home assistant, а от як їх подружити з Node-red не став розбиратися
Вітаю. Запрошую всіх на гітхаб сторінку проєкту для покращення розпізнавання української. Якщо звична вам фраза не розпізнається, напишіть про це. Я займаюся перекладом один і не можу врахувати всіх вподобань. На даний момент ми маємо загальну проблему для всіх мов, в яких залежно від відмінку міняється закінчення або корінь слів. Простого рішення цієї проблеми поки що не знайшли.Тому щоб розпізнавання фрази 'світло на кухні' працювало - треба длдати аліас 'кухні' для вашої еріа 'кухня'
На звичайній ESP32 артефакти звуку. Спробував більш потужну S3 - з нею здається біда у ESPHome ((.... Таким чином або ESP32 використовувати виключно для мікрофону, а звук виводити на інший медіапрогравач. Як варіант 2 ESP32 у одній коробці, одна для мікрофона, друга як програвач.
@@bootuseua я вже не памʼятаю подробиць, але здається перебрав всі можливі варіанти та обидва фреймворки, але у голові так і залишився стейтмент що S3 esphome підтримує частково та щось там про доопрацювання. Можливо я не до кінця розібрався у питанні. Але плата з S3 та підсилювачем так і валяється вся вже у пилюці....
тому цей варіант має право на життя (хоча кількість вайфаю у хаті не дуже є бажання збільшувати) ruclips.net/video/gGcskjKtArU/видео.htmlsi=BCvUhWCx9Qeuckla
Дякую за цікаве та унікальне відео. Було б цікаво дізнатись про голосових помічників Home Assistant Cloud. Відео про ліфт та акцент класне) Тільки дивлюсь в напрямку голосового поміника. Сподіваюсь він у мене буде.
@@bohdan_sv вітаю Богдане. Бачив ваші статті. Голосовий помічник колись може й стане нормою для нас. В ХА є Хоумкіт брідж, тож можна зробити керування голосом деякими функціями через Сірі. А хто оплатив HA Cloud, то може користуватись Алексою.
Здивований, чомусь вважав що процесінг АЦП на ESP не повинен бути потужним... Тобто усі перетворення голосу у текст і навпаки виконуються за допомогою АРІ інтернет-сервісів. Аж раптом 😂 моя ESP 8266 на 80 мГц - атцтой 😂🎉😢😢
Так і є. Звук оцифровується в передається далі. Але ж якщо потрібно цифру в голос перетворити, то подавайте ще буфер. А це оперативна пам'ять. Якщо її не вистачає, то є глюки.
Цікаво відео) Whisper працює без інтернету? Я робив через VOSK розпізнавання і мікрофон PS3 Eye. Тепер хочеться чогось більшого, ніж керування, якогось розуміння контексту та діалогові розмови)
Вау ! Приємно здивований цим бомбезним відео ! Увімкнув дзвіночок. Зберіг у свій список корисних відео. Локальний голосовий text-to-speach українською шукав давно. Якість не вважаю поганою. Можна жити ! Поки все облаштується, TTS українською стане краще.
@@bootuseua на якій ОС? Бо ніде не можу знайти людську інструкцію, як на Ubuntu встановити... Може на якусь іншу ОС... RPI купляти не хочу. В мене сервак крутиться на нетбуці з Ubuntu 22.04. Хочу туди НА спробувати.
Взагалі то на Proxmox крутиться. Але рекомендовані 2 варіанта - debian 12 , ну або ставити HAOS ( там Bulidroot як операційна). На убунті гарантовано отримаєте помилку і головний біль.
@@bootuseua чудово! я коли малий був, то ідей було міліон. А зараз буденність мене поглинула! Продавай готові рішення і заробиш мільйон) я б зміг допомогти ідеями котрі не можу втілити
@@bootuseua В мене стоїть echo dot і echo pop в різних кімнатах, проблем ніяких немає, затримка значно менша. Голос англійською, поки використовую тільки розумні розетки. Класно працює разом із музичними плеєрами.
@@bootuseua Українською. Модель - medium. Дуже довго, до 10 секунд. Досить часто відрізняється одна буква, але результат вже невдалий. Наприклад "винкни світло", "іка погода" 😢
У відео ви зазначили що можна використовувати у якості асистента з мікрофоном камеру з протоколом RTSP, можна про це трошки детальніше бо маю камеру з непоганим мікрофоном і динаміком Dahua K35 і хочу спробувати використати її?
Роскажіть, будь ласка, яким пристроєм ви вмикаєте світло в кімнаті і на кухні ? Наступний крок - датчик присутності людини і складні алгоритми керування світлом в залежності від часу (яскрава чи нічна підсвітка), місця (працюєте, дивитесь телевізор, обідаєте), ваших звичок та інших факторів. Це моя мета. Це і буде розумний будинок в плані світла, коли не треба нічого тицяти на телефоні, або говорити. Воно повинно все робити саме. Якщо пофантазувати, то команди голосом можуть коригувати алгоритми керування пристроями. Особливо якщо вони повторюються в одному місці або в один час. Але зараз це зробити не можна. Поки )))
Звісно ліньки встати. А ще ліньки підсвічувати телефоном собі під ноги, щоб не перечепитися через кота, який на відміну від тебе добре бачить в темряві, та чомусь завжди хоче вплестися поміж ногами, коли ти зпросоня прямуєш до білого каменю по своїх справах. Також купа датчиків, якими можна обвішати всю квартиру своїх батьків, що вже досить не молоді, дозволяють проконтролювати чи не забули вони щось вимкнути, не протікає десь вода та чи знаходяться показники температури і вологості в оптимальних значеннях. Налаштовані голосові повідомлення також дозволяють вчасно щось зробити за розкладом, або не пропустити якусь подію. Застосувань дуже багато і це значно полегшує повсякденне життя.
@@bootuseua а я тепер собі теж хочу такий кубик, що буде зловісно світити червоними очима в темряві, коли озвучуватиме повідомлення. А ще їм можна буде лякати кота ахахаххахахаха.
Нарешті я зрозумів як скористатись цим голосовим помічником. Ні, дякую, залишаюсь на Rhasspy 😅. А пристрій на esp32 - вогонь. А я все думаю як мені распбері та мікрофон від PSeye в колонку запхати... 😂
@@bootuseua Неочикуванно. Поки що якось складно все це робити через HA. Rhasspy готовий продукт сам по собі - окремим контейнером працює будь де. Робив би з нуля - може і замислився б. Rhasspy налаштовано на роспізнавання російську мову. Українська в Rhasspy, нажаль, не підтримується (давно не перевіряв це). На повідомлення голосом - англійська через Espeask. Словник з реченнями здебільшого майже статичний (зовсім небагато приладів), який визиває intent_script у HA. Все не так цікаво як у Вас, коли назва приладу або зони роспізнається...👍
Я навіть з людьми розмовляю рідко та мало, тож розмовляти із залізякою то не моє. Але цікаво, використовується чи ні відео прискорювач задля роботи нейросітки при розпізнаванні голосу? Може тому так довго розпізнає, що все робиться силами процесора.
@@bootuseua Зрозуміло. Колись була інтеграція plex assistant, там через dialogflow можна було прикрутити гугл асистент, і просити його включати фільми які є в plex, було прикольно.
Привіт, Дякую друже за мега якісний контент українською мовою
Я використав гугл stt воно дуже швидке і якісне, так для цього треба інтернет, але воно типу швидше набагато ніж локальне розпізнавання на разберюсі. типу у мене було локальне розпізнавання 6 секунд, а черег гугл 500 мілісекунд
Putin huilo - це пасхалочка? )))
"Scotlaaand... Freeedooom" (c) 😅🤣😂
Незрозуміло чому це ESP32 найслабший - від S3 версії він не сильно відрізняється, (пам'яті там трохи більше, лапок менше, і немає USB, зате є ethernet та ЦАП, теж два ядра 240МГц, тільки архітектура LX6 а не LX7, явної різниці в продуктивності я не помітив ) - flash та SDRAM там зовнішні, та залежать від модуля а не чипа.
Канал справжня знахідка! Дякую за україномовний контент!
І не кажіть. Сам переглядаю з задоволенням.
@@bootuseua :)
Цікаве відео. Досі я думав що для голосового керування потрібне щось по типу голосових колонок від гугла чи амазону і був здивований що можна самому на базі ESPHome зібрати власний асистент. І ще більше був здивований що все це може працювати локально. Дякую.
Огромное спасибо очень интересно содержательно, собственно как всегда :-)
Как раз недавно пробовал разобраться даже приобрёл атом эхо, буквально как только появился осист вроде все получалось несмотря на том что тогда было намного меньше возможностей, но на данный момент что-то у меня получилось но не совсем :-) как раз не хватало вашего видео ещё раз спасибо последнее время скучал за вашими Трудами по теме хом ассистента
Желаю вам успехов всего наилучшего
А також скоріш нам Перемоги
Тільки зранку прочитав про таку можливість, а на вечір вже відео є.
Інтеграція HA з ChatGPT : ruclips.net/video/pAKqKTkx5X4/видео.htmlfeature=shared
Дуже круто, дякую! по такій крутій інструкції можна пробувати повторювати!
Чекаємо на українську алісу
Камера вогонь 🔥) куб прикольний 😅 контент цікавий
Дякую за відео, супер! Можливо колись реалізуюю. Але зараз не користуюся Home Assistant (старий ноут жере багато світла), мені вистачає Node-red на старенькому смартфоні, плануюю налаштувати його на тв-пристівкі. Саме в Node-red пробував налаштувати голосове керування, на телефоні розпізнається голос гуглом, по mqtt передається в Node-red де вручну прописані команди-дії, і прилітає назад відповідь. Все працює та гострої потреби в цьому поки немає. Маю тільки пару ламп і автоматизація керування бойлером в залежності від потужності сонячної системи. Хотілося б зробити колонку для сповіщень, бачив відоси для home assistant, а от як їх подружити з Node-red не став розбиратися
Вітаю. Запрошую всіх на гітхаб сторінку проєкту для покращення розпізнавання української. Якщо звична вам фраза не розпізнається, напишіть про це. Я займаюся перекладом один і не можу врахувати всіх вподобань.
На даний момент ми маємо загальну проблему для всіх мов, в яких залежно від відмінку міняється закінчення або корінь слів. Простого рішення цієї проблеми поки що не знайшли.Тому щоб розпізнавання фрази 'світло на кухні' працювало - треба длдати аліас 'кухні' для вашої еріа 'кухня'
Дякую за відео та огляд! Дуже цікава тема, продовжуйте!
20:49 нарешті нормальні конфігурації ;)
Класне відео! Розкривайте тему далі!
Так чую треба анг вчити 😂
Так там пару фраз всього.. Не дуже вивчиш.
На звичайній ESP32 артефакти звуку. Спробував більш потужну S3 - з нею здається біда у ESPHome ((.... Таким чином або ESP32 використовувати виключно для мікрофону, а звук виводити на інший медіапрогравач. Як варіант 2 ESP32 у одній коробці, одна для мікрофона, друга як програвач.
А фреймворк esp-idf використовували?
@@bootuseua я вже не памʼятаю подробиць, але здається перебрав всі можливі варіанти та обидва фреймворки, але у голові так і залишився стейтмент що S3 esphome підтримує частково та щось там про доопрацювання. Можливо я не до кінця розібрався у питанні. Але плата з S3 та підсилювачем так і валяється вся вже у пилюці....
тому цей варіант має право на життя (хоча кількість вайфаю у хаті не дуже є бажання збільшувати) ruclips.net/video/gGcskjKtArU/видео.htmlsi=BCvUhWCx9Qeuckla
Коментар з декількох слів для підтримки цього каналу та просування відео :)
Дякую за детальне пояснення. Якраз думаю налаштувати у себе вдома.
Дякую за цікаве та унікальне відео. Було б цікаво дізнатись про голосових помічників Home Assistant Cloud. Відео про ліфт та акцент класне) Тільки дивлюсь в напрямку голосового поміника. Сподіваюсь він у мене буде.
@@bohdan_sv вітаю Богдане. Бачив ваші статті. Голосовий помічник колись може й стане нормою для нас. В ХА є Хоумкіт брідж, тож можна зробити керування голосом деякими функціями через Сірі. А хто оплатив HA Cloud, то може користуватись Алексою.
Здивований, чомусь вважав що процесінг АЦП на ESP не повинен бути потужним... Тобто усі перетворення голосу у текст і навпаки виконуються за допомогою АРІ інтернет-сервісів. Аж раптом 😂 моя ESP 8266 на 80 мГц - атцтой 😂🎉😢😢
Так і є. Звук оцифровується в передається далі. Але ж якщо потрібно цифру в голос перетворити, то подавайте ще буфер. А це оперативна пам'ять. Якщо її не вистачає, то є глюки.
супер
Дякую за цікавий контент
Супер. Тема актуальна і цікава.
Цікаво відео) Whisper працює без інтернету? Я робив через VOSK розпізнавання і мікрофон PS3 Eye.
Тепер хочеться чогось більшого, ніж керування, якогось розуміння контексту та діалогові розмови)
Дякую за інформаційний огляд та приклади
Вау ! Приємно здивований цим бомбезним відео ! Увімкнув дзвіночок. Зберіг у свій список корисних відео.
Локальний голосовий text-to-speach українською шукав давно. Якість не вважаю поганою. Можна жити ! Поки все облаштується, TTS українською стане краще.
Доброго дня. У Вас Home Assistant на Windows встановлено, чи на окремому сервері?
На окремому сервері, бо має працювати 24/7.
@@bootuseua на якій ОС? Бо ніде не можу знайти людську інструкцію, як на Ubuntu встановити... Може на якусь іншу ОС... RPI купляти не хочу. В мене сервак крутиться на нетбуці з Ubuntu 22.04. Хочу туди НА спробувати.
Взагалі то на Proxmox крутиться. Але рекомендовані 2 варіанта - debian 12 , ну або ставити HAOS ( там Bulidroot як операційна). На убунті гарантовано отримаєте помилку і головний біль.
@@bootuseua Дякую
@@ppiixxiiqq ну особисто я тримаю на дебіан11/12 в докері. воно само собі в докері підтягує те що йому треба.
Дуже гарно! А звідки ти поглинаєш все це?
гугл + досвід + гугл
@@bootuseua чудово! я коли малий був, то ідей було міліон. А зараз буденність мене поглинула! Продавай готові рішення і заробиш мільйон) я б зміг допомогти ідеями котрі не можу втілити
Прикольно.
У мене знайомий все на Алексу зав'язав.
Ну от я теж дивлюся на Алексу, але як вона зараз в Україні працює? Чи знайомий не в Україні. Бо там теж досить легко її підв'язати до HA.
@@bootuseua В мене стоїть echo dot і echo pop в різних кімнатах, проблем ніяких немає, затримка значно менша. Голос англійською, поки використовую тільки розумні розетки. Класно працює разом із музичними плеєрами.
@@stapieboy а якість звуку?
@@bootuseua ну мій echo dot 3 має вихід на дкек то я колонки приєднав, все супер, а так то нормальний, хоча в кожного свої вимоги)
Ніяк не можу налаштувати Echo Dot 5. На телефон Алексу можу встановити, а от колонку підключити не можу. Як вам це вдалось?
як добитись надійного розпізнавання хоч з другого, третього разу?
Англійською?
@@bootuseua Українською. Модель - medium. Дуже довго, до 10 секунд. Досить часто відрізняється одна буква, але результат вже невдалий. Наприклад "винкни світло", "іка погода" 😢
@@telefast5848 я українську так і не поборов. Складна вона для розпізнавання
А є і складніші мови, там, мабуть, взагалі сумно
У відео ви зазначили що можна використовувати у якості асистента з мікрофоном камеру з протоколом RTSP, можна про це трошки детальніше бо маю камеру з непоганим мікрофоном і динаміком Dahua K35 і хочу спробувати використати її?
Вже готується таке відео.
Пробую зараз розібратись сам але щося заблукав у документації WebTRC@@bootuseua
github.com/AlexxIT/StreamAssist + github.com/AlexxIT/go2rtc
StreamAssist та go2rtc від AlexIT стануть в нагоді.
@@bootuseua Дякую
Корисно. Дякую.
Корисне відео
Роскажіть, будь ласка, яким пристроєм ви вмикаєте світло в кімнаті і на кухні ?
Наступний крок - датчик присутності людини і складні алгоритми керування світлом в залежності від часу (яскрава чи нічна підсвітка), місця (працюєте, дивитесь телевізор, обідаєте), ваших звичок та інших факторів.
Це моя мета. Це і буде розумний будинок в плані світла, коли не треба нічого тицяти на телефоні, або говорити. Воно повинно все робити саме.
Якщо пофантазувати, то команди голосом можуть коригувати алгоритми керування пристроями. Особливо якщо вони повторюються в одному місці або в один час. Але зараз це зробити не можна. Поки )))
Розумні вимикачі - Aqara E1, світлодіодна підсвітка - Gledopto (було на каналі), + Wled від Смартлайт (теж було)
Звісно ліньки встати. А ще ліньки підсвічувати телефоном собі під ноги, щоб не перечепитися через кота, який на відміну від тебе добре бачить в темряві, та чомусь завжди хоче вплестися поміж ногами, коли ти зпросоня прямуєш до білого каменю по своїх справах. Також купа датчиків, якими можна обвішати всю квартиру своїх батьків, що вже досить не молоді, дозволяють проконтролювати чи не забули вони щось вимкнути, не протікає десь вода та чи знаходяться показники температури і вологості в оптимальних значеннях. Налаштовані голосові повідомлення також дозволяють вчасно щось зробити за розкладом, або не пропустити якусь подію. Застосувань дуже багато і це значно полегшує повсякденне життя.
Шановний, ви майстер коментарів 80 левела. Дякую. Кіт буде в наступному відео.
@@bootuseua а я тепер собі теж хочу такий кубик, що буде зловісно світити червоними очима в темряві, коли озвучуватиме повідомлення. А ще їм можна буде лякати кота ахахаххахахаха.
Ну кота цим кубом не злякати.. :-)
@@bootuseua так можна ж на нього з куба шипіти :)
O!!!!
Пізнавально
Нарешті я зрозумів як скористатись цим голосовим помічником. Ні, дякую, залишаюсь на Rhasspy 😅. А пристрій на esp32 - вогонь. А я все думаю як мені распбері та мікрофон від PSeye в колонку запхати... 😂
Так цей весь софт саме від розробників Rhasspy. А Rhasspy у вас на яку мову налаштовано?
@@bootuseua Неочикуванно. Поки що якось складно все це робити через HA. Rhasspy готовий продукт сам по собі - окремим контейнером працює будь де.
Робив би з нуля - може і замислився б.
Rhasspy налаштовано на роспізнавання російську мову. Українська в Rhasspy, нажаль, не підтримується (давно не перевіряв це). На повідомлення голосом - англійська через Espeask.
Словник з реченнями здебільшого майже статичний (зовсім небагато приладів), який визиває intent_script у HA.
Все не так цікаво як у Вас, коли назва приладу або зони роспізнається...👍
який мікрофон використовується для запису відео? Чудово звучить.
Сама дешева петличка від Boya. З усіх мікрофонів пише найкраще, але крок праворуч чи ліворуч і облом..
@@bootuseua зрозуміло, здивований. Можливо справа в іще в пост обробці чи то просто природній голос звучить чудово )
Постобробки дуже мало. Вдало підібраний напрямок до мікрофона. Як петличка біля шиї він працює жахливо, а як звичайний мікрофон - бімба.
Привет как всегда познавательно и доходчиво, а можно по поподробнее про атом ехо и как прошить
Буде окреме відео. Але як тільки приїде.
Ок большое спасибо тоже закажу.А ещё вопрос а сколько можно будет подключить ,чтобы в разных к 0:02 омнатах??
Обмежень на кількість нема.
Я навіть з людьми розмовляю рідко та мало, тож розмовляти із залізякою то не моє. Але цікаво, використовується чи ні відео прискорювач задля роботи нейросітки при розпізнаванні голосу? Може тому так довго розпізнає, що все робиться силами процесора.
Все силами процесора.
hey, Jarvis. ЧОМУ НЕ ДЕРЖАВНОЮ?
А чи можна православний гугл асистент прикрутить?
Там досить складно все. Але на мобілу можна поставити. Але до ХА його прикручувати - це купа рухів і воно того не варте абсолютно.
@@bootuseua Зрозуміло. Колись була інтеграція plex assistant, там через dialogflow можна було прикрутити гугл асистент, і просити його включати фільми які є в plex, було прикольно.