AI Лебедев | Stalker Voices - голосовая модель RVC v2 | Примеры возможностей

Warlock700

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 7 фев 2025
Это голосовая модель, основанная на речи лидера группировки "Чистое небо" - Лебедева. В ролике показаны возможности преобразования речи, результат из RVC Text-to-Speech на английском и русском языках.
Мои контакты:
VK: warlock700
Группа VK: warlock...
Модель RVC v.2: www.weights.gg...
Тема на Ap-Pro.ru: ap-pro.ru/foru...
Музыка: • Kino - Calm Night (pos...
Поддержать канал: www.donational...
Игры

Комментарии • 34

@katergmod 11 месяцев назад ⁺²
Как обычно идеальное видео
@Warlock7OO 11 месяцев назад ⁺¹
За положительную оценку, безусловно, спасибо.) Но косяки есть, до идеала очень далеко. Мне они видны, но исправить их было бы весьма трудозатратно.
@God_Tyur 11 месяцев назад ⁺⁷
Модель отлично справилась. Я думаю тебе нужно потренироваться говорить с его же интонацией, тогда будет отлично!
@Warlock7OO 11 месяцев назад ⁺²
Где-то - да, где-то не совсем справилась. Сравниваю с другими моделями, которые даже при меньшем объеме речи выдавали лучше результаты.
Не спорю, а подтверждаю, что если стараться говорить с той же манерой, что персонаж, то результат будет лучше. Но я такими актёрским данными не обладаю, а так же самих голосовых моделей у меня много - под все не адаптируешься...)
@kolovanbl4 11 месяцев назад ⁺⁴
А хорошо вышло, Лебедев уставший такой получился
@Warlock7OO 11 месяцев назад ⁺¹
Это просто я не очень эмоционален...) Но тут согласен, пошло на пользу. Кто сюжет ЧН знает, тот поймет.
@Shadow_Rogue 10 месяцев назад
@@Warlock7OO А можно Моргана? Пожалуйста-пожалуйста 🙏
@Warlock7OO 10 месяцев назад
@@Shadow_Rogue, речь о Моргане из сталкер Зов Припяти, либо о Моргане Фримане?
Если о Форгане из Сталкера, но он говорит голосом Долговцев и такая модель уже имеется на канале:
ruclips.net/video/N1fVi0wAiE4/видео.html&t=
Отличие от Моргана только в эффекте "голоса из под шлема".
@TrollBestMiner 10 месяцев назад
очень крутые модельки) ждем теперь бармена
@Warlock7OO 10 месяцев назад ⁺¹
Спасибо.)
Модель Бармена будет, но нет гарантии, что она получится качественной, поскольку чистого голоса удалось набрать на 3 минуты, а для качественной модели нужно где-то 5-7 и более.
Возможно, удастся компенсировать недостаток образцов другими ролями Вилкова - актера озвучки, который дал голос Бармену
@Warlock7OO 11 месяцев назад ⁺¹
Как я не пытался - модель все равно выдает артефакты и ощущение акцента. Как выяснялось - модель работает так именно с моим голосом. Не исключено, что при использовании Вами такой проблемы не возникнет.
По поводу эффектов диалога - курсор не удалось сделать естественным, а так же мне не удалось снять кручение значка радиации своего курсора. Пытался это сделать сам, но без работы в After Effects это вряд ли получилось бы, что потребовало бы много времени, поэтому оставил, как есть.
@the_exe151 11 месяцев назад ⁺²
Акцент и проблемы в речи не особо явны, так что всё равно получилось вполне добротно
@Warlock7OO 11 месяцев назад ⁺²
@@the_exe151, я очень надеюсь, что когда я наконец-то соберу все голоса и выполню их сортировку, (то есть будет собрано и разбито по папкам все, что возможно из сталкера и метро) а после переобучу образцы речи на других претрейнах, то все эти проблемы сойдут на нет.
Но до этого далеко пока что. И не всегда есть возможность и желание этим заниматься, процесс нудным и в случае с некоторыми голосами вызывает трудности в том, куда тправить тот, либо иной голосовой фрагмент. Особенно часто встречаю это с голосом Германа.
@the_exe151 11 месяцев назад ⁺¹
@@Warlock7OO это понятное дело, но и вас никто не гонит. Занимайтесь этим когда есть силы и желание. Торопится некуда. Лучше отдохнуть чтобы после отдыха полноценно работать, чем доводить себя до истощения
@Warlock7OO 11 месяцев назад ⁺²
@@the_exe151, все так, но приходиться себя заставлять, иначе не исключен фактор полной потери интереса. Ну и, частично, подгоняет меня именно тот фактор, насколько долгим является обучение голосовых моделей. Каждое обучение обходится в 3-8 часов, в зависимости от количества речи. То есть чем быстрее я соберу материал, тем быстрее я начну создавать по 2-3 модели в день, поскольку пока что у меня не реализуется потенциал ПК, мощности которого могли уйти на обучение.
@kokadacha 10 месяцев назад
Очень даже годно! А какие голоса остались замоделить и как все голоса из сталкера будут сделаны то будут какие нибудь дальнейшие планы?
@Warlock7OO 10 месяцев назад ⁺¹
Сейчас не имею доступа к своему ПК, поэтому перечислю по памяти модели, что проходят тестирование, либо по которым необходимо подготовить материал:
Борода-Ной;
Бармен (Бар 100 рентген);
Наемники.
Будут еще организованы и обучены модели из метро:
Мельник; (Метро Исход)
Анна; (Метро Исход)
Анна; (Метро 2033 1-2 часть)
Артем.
Это в ожидаемом будущем, после чего буду делать еще сортировку голос из Метро
Как только все модели выйдут в релиз, то в дальнейшем модели будут переобучаться на других претрейнах, (кроме официального есть еще 4 варианта) осуществляться постобработка материала в попытках усовершенствовать материал и т.д.
На текущем этапе почти все голоса из сталкера отсортированы полностью для сюжетных фраз, остались только скриптовые фразы NPC группировок.
Так же еще необходимо сделать сортировку фраз из Метро.
Между выпуском моделей по сталкеру и метро будут выходить голосовые модели по Warcraft III.
По окончанию сортировки они так же будут переобучены на других претрейнах.
@kokadacha 10 месяцев назад
@@Warlock7OO будем ждать. И ещё вопрос: Будет ли голос военного из мегафона? думаю что он будет иметь очень хорошую поопулярность.
@Warlock7OO 10 месяцев назад ⁺¹
@@kokadacha, я посмотрел информацию на сталкер-вики, если речь о комментариях командира поста, то их озвучивал Андрей Прохоров. Такая модель на канале уже имеется.
Тем более модели, которые имеют какого-либо рода эффекты (хор, реверб, рация), без предобработки выдают очень плохой результат. Исключением можно назвать только эффект голоса из под шлема, где тот был создан обрезкой определенного частотного диапазона через эквалайзер.
Гораздо проще преобразовать голос Прохорова, а затем наложить эффект рации/мегафона на него.
@MsRad56 10 месяцев назад ⁺¹
А будут ли голоса из раций/пда? Или не желательно чтобы голоса были уже с эффектами?
@Warlock7OO 10 месяцев назад
В этом случае будет недостаточно материала для создания таких моделей. Хотя не знаю, каким на выходе будет результат, если использовать эффект рации, вместе с обычным голосом.
В любом случае стараюсь делать чистые модели, поскольку эффект рации можно при пост-обработке добавить.
@FBU.official 10 месяцев назад ⁺¹
А можно сделать ии голос наемников с акцентом из ТЧ?
@Warlock7OO 10 месяцев назад
Тут немного все неоднозначно. RVC обучает голоса на англоязычном претрейне и модели hubert - акцент возникает сам по себе, если увеличить значение "индекса поиска черт" в самом RVC.
Но сам по себе эффект акцента RVC неспособна воссоздать. То есть и Ашота, ни Вано, ни наемников из ТЧ получить не получится - необходимо самостоятельно изображать акцент, а затем преобразовывать голос.
К слову, наемников из ТЧ озвучивает Андрей Прохоров, поэтому пробуйте воссоздать голосом акцент, а затем преобразовывайте полученный результат моделью Андрея Прохорова при увеличиенном до 0.7 или даже 1 "индекса поиска черт".
@FBU.official 10 месяцев назад
@@Warlock7OO ну я про тех наемников, которые озвучивает Владимир Терещук. У них озвучка находится по такой директории human_02/killer
@Warlock7OO 10 месяцев назад
@@FBU.official, теперь понял, о какой озвучке речь. Еще не добрался до сортировки голосов из папок NPC, только недавно закончил сортировку голосов из кампаний трех частей серии.
Скорее всего результат будет не лучшим. Терещук озвучил преимущественно боевые фразы, на которых максимум 2 минуты можно материала набрать, от силы три.
Основным материалом для набора всегда были папки "idle" и "jokes", но в первом случае это Герман, а во втором Прохоров. Поэтому материала будет очень и очень мало, но попробовать можно.
На крайний случай расширю этими фразами будущий дата-сет по военным или Терещуку. Сейчас бы посоветовал использовать именно его модель, (военные) поскольку акцент точно получит не удастся с помощью RVC.
@FBU.official 10 месяцев назад
@@Warlock7OO хорошо
@YURIJ_WAYS 10 месяцев назад
Можеш сделать Ai Гонта RVC v2 Вольный Сталкер перед тем как ты делал Флинт RVC v2 Хорошо.
@Warlock7OO 10 месяцев назад
Поскольку в Зов Припяти я не играл, (кампанию) то посмотрел, кто его озвучивал.
Да, со временем будет модель, но она будет не только по Гонте, а будет составлена на речи всех персонажей, которых озвучивал Иван Розин:
Булава
Вобла
Гаваец
Гарик (проводник)
Гонта
Друг Медведя
Спартак
Тополь
Торба
Шутник
Щепка
Лейтенант Соколов
@elstan690 11 месяцев назад
Через голос Лебедева всё равно пробивается другой
@Warlock7OO 11 месяцев назад
Да, это неизбежно, поскольку происходит преобразование моей речи.
Если речь была английская, то можно было бы выкрутить черты голосовой модели на большие значения, тогда было бы больше похоже на Лебедева. Но поскольку с обучением на русском языке у RVC имеются проблемы, то при повышении данного параметра возникает акцент. Тем более, что моя речь очень плохо подходит под данную модель, не первый раз замечаю это.
@elstan690 10 месяцев назад
@@Warlock7OO надо попросить других людей
@Warlock7OO 10 месяцев назад
@@elstan690 , моей основной задачей является создание и демонстрация моделей. Для остальных целей уже модолелам, либо иным группам, потребуется искать самостоятельно людей для озвучки.
@truepacifist 10 месяцев назад
Звучит хорошо, только интонации не хватает и как будто чуть чуть шепелявит старый))
@Warlock7OO 10 месяцев назад
Довольно трудно, во всяком случае мне, пытаться изобразить характерные интонации и манеры персонажей, максимум мне допустимое - работа с тоном.
В остальном - моему голосу не очень подходит данная модель, поэтому на нем присутствует максимальное количество искажений и коверканий.