AI Лебедев | Stalker Voices - голосовая модель RVC v2 | Примеры возможностей
HTML-код
- Опубликовано: 7 фев 2025
- Это голосовая модель, основанная на речи лидера группировки "Чистое небо" - Лебедева. В ролике показаны возможности преобразования речи, результат из RVC Text-to-Speech на английском и русском языках.
Мои контакты:
VK: warlock700
Группа VK: warlock...
Модель RVC v.2: www.weights.gg...
Тема на Ap-Pro.ru: ap-pro.ru/foru...
Музыка: • Kino - Calm Night (pos...
Поддержать канал: www.donational... - Игры
Как обычно идеальное видео
За положительную оценку, безусловно, спасибо.) Но косяки есть, до идеала очень далеко. Мне они видны, но исправить их было бы весьма трудозатратно.
Модель отлично справилась. Я думаю тебе нужно потренироваться говорить с его же интонацией, тогда будет отлично!
Где-то - да, где-то не совсем справилась. Сравниваю с другими моделями, которые даже при меньшем объеме речи выдавали лучше результаты.
Не спорю, а подтверждаю, что если стараться говорить с той же манерой, что персонаж, то результат будет лучше. Но я такими актёрским данными не обладаю, а так же самих голосовых моделей у меня много - под все не адаптируешься...)
А хорошо вышло, Лебедев уставший такой получился
Это просто я не очень эмоционален...) Но тут согласен, пошло на пользу. Кто сюжет ЧН знает, тот поймет.
@@Warlock7OO А можно Моргана? Пожалуйста-пожалуйста 🙏
@@Shadow_Rogue, речь о Моргане из сталкер Зов Припяти, либо о Моргане Фримане?
Если о Форгане из Сталкера, но он говорит голосом Долговцев и такая модель уже имеется на канале:
ruclips.net/video/N1fVi0wAiE4/видео.html&t=
Отличие от Моргана только в эффекте "голоса из под шлема".
очень крутые модельки) ждем теперь бармена
Спасибо.)
Модель Бармена будет, но нет гарантии, что она получится качественной, поскольку чистого голоса удалось набрать на 3 минуты, а для качественной модели нужно где-то 5-7 и более.
Возможно, удастся компенсировать недостаток образцов другими ролями Вилкова - актера озвучки, который дал голос Бармену
Как я не пытался - модель все равно выдает артефакты и ощущение акцента. Как выяснялось - модель работает так именно с моим голосом. Не исключено, что при использовании Вами такой проблемы не возникнет.
По поводу эффектов диалога - курсор не удалось сделать естественным, а так же мне не удалось снять кручение значка радиации своего курсора. Пытался это сделать сам, но без работы в After Effects это вряд ли получилось бы, что потребовало бы много времени, поэтому оставил, как есть.
Акцент и проблемы в речи не особо явны, так что всё равно получилось вполне добротно
@@the_exe151, я очень надеюсь, что когда я наконец-то соберу все голоса и выполню их сортировку, (то есть будет собрано и разбито по папкам все, что возможно из сталкера и метро) а после переобучу образцы речи на других претрейнах, то все эти проблемы сойдут на нет.
Но до этого далеко пока что. И не всегда есть возможность и желание этим заниматься, процесс нудным и в случае с некоторыми голосами вызывает трудности в том, куда тправить тот, либо иной голосовой фрагмент. Особенно часто встречаю это с голосом Германа.
@@Warlock7OO это понятное дело, но и вас никто не гонит. Занимайтесь этим когда есть силы и желание. Торопится некуда. Лучше отдохнуть чтобы после отдыха полноценно работать, чем доводить себя до истощения
@@the_exe151, все так, но приходиться себя заставлять, иначе не исключен фактор полной потери интереса. Ну и, частично, подгоняет меня именно тот фактор, насколько долгим является обучение голосовых моделей. Каждое обучение обходится в 3-8 часов, в зависимости от количества речи. То есть чем быстрее я соберу материал, тем быстрее я начну создавать по 2-3 модели в день, поскольку пока что у меня не реализуется потенциал ПК, мощности которого могли уйти на обучение.
Очень даже годно! А какие голоса остались замоделить и как все голоса из сталкера будут сделаны то будут какие нибудь дальнейшие планы?
Сейчас не имею доступа к своему ПК, поэтому перечислю по памяти модели, что проходят тестирование, либо по которым необходимо подготовить материал:
Борода-Ной;
Бармен (Бар 100 рентген);
Наемники.
Будут еще организованы и обучены модели из метро:
Мельник; (Метро Исход)
Анна; (Метро Исход)
Анна; (Метро 2033 1-2 часть)
Артем.
Это в ожидаемом будущем, после чего буду делать еще сортировку голос из Метро
Как только все модели выйдут в релиз, то в дальнейшем модели будут переобучаться на других претрейнах, (кроме официального есть еще 4 варианта) осуществляться постобработка материала в попытках усовершенствовать материал и т.д.
На текущем этапе почти все голоса из сталкера отсортированы полностью для сюжетных фраз, остались только скриптовые фразы NPC группировок.
Так же еще необходимо сделать сортировку фраз из Метро.
Между выпуском моделей по сталкеру и метро будут выходить голосовые модели по Warcraft III.
По окончанию сортировки они так же будут переобучены на других претрейнах.
@@Warlock7OO будем ждать. И ещё вопрос: Будет ли голос военного из мегафона? думаю что он будет иметь очень хорошую поопулярность.
@@kokadacha, я посмотрел информацию на сталкер-вики, если речь о комментариях командира поста, то их озвучивал Андрей Прохоров. Такая модель на канале уже имеется.
Тем более модели, которые имеют какого-либо рода эффекты (хор, реверб, рация), без предобработки выдают очень плохой результат. Исключением можно назвать только эффект голоса из под шлема, где тот был создан обрезкой определенного частотного диапазона через эквалайзер.
Гораздо проще преобразовать голос Прохорова, а затем наложить эффект рации/мегафона на него.
А будут ли голоса из раций/пда? Или не желательно чтобы голоса были уже с эффектами?
В этом случае будет недостаточно материала для создания таких моделей. Хотя не знаю, каким на выходе будет результат, если использовать эффект рации, вместе с обычным голосом.
В любом случае стараюсь делать чистые модели, поскольку эффект рации можно при пост-обработке добавить.
А можно сделать ии голос наемников с акцентом из ТЧ?
Тут немного все неоднозначно. RVC обучает голоса на англоязычном претрейне и модели hubert - акцент возникает сам по себе, если увеличить значение "индекса поиска черт" в самом RVC.
Но сам по себе эффект акцента RVC неспособна воссоздать. То есть и Ашота, ни Вано, ни наемников из ТЧ получить не получится - необходимо самостоятельно изображать акцент, а затем преобразовывать голос.
К слову, наемников из ТЧ озвучивает Андрей Прохоров, поэтому пробуйте воссоздать голосом акцент, а затем преобразовывайте полученный результат моделью Андрея Прохорова при увеличиенном до 0.7 или даже 1 "индекса поиска черт".
@@Warlock7OO ну я про тех наемников, которые озвучивает Владимир Терещук. У них озвучка находится по такой директории human_02/killer
@@FBU.official, теперь понял, о какой озвучке речь. Еще не добрался до сортировки голосов из папок NPC, только недавно закончил сортировку голосов из кампаний трех частей серии.
Скорее всего результат будет не лучшим. Терещук озвучил преимущественно боевые фразы, на которых максимум 2 минуты можно материала набрать, от силы три.
Основным материалом для набора всегда были папки "idle" и "jokes", но в первом случае это Герман, а во втором Прохоров. Поэтому материала будет очень и очень мало, но попробовать можно.
На крайний случай расширю этими фразами будущий дата-сет по военным или Терещуку. Сейчас бы посоветовал использовать именно его модель, (военные) поскольку акцент точно получит не удастся с помощью RVC.
@@Warlock7OO хорошо
Можеш сделать Ai Гонта RVC v2 Вольный Сталкер перед тем как ты делал Флинт RVC v2 Хорошо.
Поскольку в Зов Припяти я не играл, (кампанию) то посмотрел, кто его озвучивал.
Да, со временем будет модель, но она будет не только по Гонте, а будет составлена на речи всех персонажей, которых озвучивал Иван Розин:
Булава
Вобла
Гаваец
Гарик (проводник)
Гонта
Друг Медведя
Спартак
Тополь
Торба
Шутник
Щепка
Лейтенант Соколов
Через голос Лебедева всё равно пробивается другой
Да, это неизбежно, поскольку происходит преобразование моей речи.
Если речь была английская, то можно было бы выкрутить черты голосовой модели на большие значения, тогда было бы больше похоже на Лебедева. Но поскольку с обучением на русском языке у RVC имеются проблемы, то при повышении данного параметра возникает акцент. Тем более, что моя речь очень плохо подходит под данную модель, не первый раз замечаю это.
@@Warlock7OO надо попросить других людей
@@elstan690 , моей основной задачей является создание и демонстрация моделей. Для остальных целей уже модолелам, либо иным группам, потребуется искать самостоятельно людей для озвучки.
Звучит хорошо, только интонации не хватает и как будто чуть чуть шепелявит старый))
Довольно трудно, во всяком случае мне, пытаться изобразить характерные интонации и манеры персонажей, максимум мне допустимое - работа с тоном.
В остальном - моему голосу не очень подходит данная модель, поэтому на нем присутствует максимальное количество искажений и коверканий.