Уважаемый друг, Вы оказали неоценимую помощь нашему татарскому театру Камала. Нам нужно было преобразовать голос актрисы, в голос татарской певицы, которая, к сожалению, уже ушла из жизни. И результат превзошёл все ожидания! Я звукорежиссёр этого спектакля, и я хотел бы выразить вам огромную благодарность за ценный совет. Шлю вам привет из Казани, Республика Татарстан.
Автор делится полезной информацией, без воды и лишней духоты. Так-же автор поясняет за каждый ползунок, каждое поле в каждой программе. Рекомендую к просмотру
Ты просто лучший! Не знаю как и описать мои эмоции, целый день убил на способы других блогеров, зашел к тебе и с первого раза получилось. Спасибо тебе огромное!
Хотел бы вернуться с обратной связью по гайду: это действительно самая понятная и подробная инструкция на русском языке! В качестве датасета использовал два альбома моего любимого исполнителя, вырезал вокал с помощью uvr и ещё вручную через Audacity почистил каждую запись от остатков инструментала - чтобы нейросеть не училась на музыке. На выходе получил свыше получаса чистого вокала. Поставил обучение на 250 эпох, но у меня на 4060ti одна эпоха занимала 3-5 минут: то ли я что-то не так настроил, то ли дело в датасете, то ли для моей видеокарты это было тяжеловато. В итоге после 12 часов тренировки я не выдержал и прекратил на 210 эпохе. Тем не менее, результат поражает - модель действительно реалистичная и почти идентична оригиналу. Дорожки сводил при помощи вышеупомянутого Audacity, там это делается в 2 нажатия. Хочу дотренировать модель до 250 эпох и сравнить результат. Но он и так потрясающий! С меня лайк и подписка на канал. Спасибо, Андрей!
Кстати реально странно, у меня на 2060 Super одна эпоха проходит за 35 сек. p.s. перепроверил, с 25 эпохи сейчас за 25 секунд проходит, пока что я на 29, посмотрим как будет.
@@hagaroma3D да, чем меньше длительность файлов для тренировки. Тем она быстрее. 10-15 минут оптимально, и чтобы качество норм было и чтобы не так долго тренилось)
У вас в консоли (которая черное окно в самом начале запуска программы) пишется ошибка, но скорее всего вам не нужно ее читать и там банальное - вы попробовали дважды обработать проект с одинаковым название. Нужно удалить в папке программы logs все кроме папки mute и заново проделать все шаги. Если не поможет - смотреть что выводит в консоли и гуглить.
@@ЕвгенийНужнов-к6э Причиной оказалась видеокарта. До этого у меня была rx 5600 xt, сейчас rtx 4070 ti и все заработало. амд не подходит для работы, они заточены исключительно под игры
Один из лучших гайдов, мне например больше всего помог блок с настройкой пресетов в UVR, спасибо большое! А насчет создания самого аи кавера скажу что лучше поставить в дополнение mangio-crepe, по мне он гораздо лучше и реалистичнее конвертит голос нежели pm или harvest
важная деталь. если вы хотите загрузить свою уже готовую голосовую модель которую вы например скачали на каком-то форуме, то чтобы она отображалась в RVC надо закинуть файл .pth в папку:" ...\RVC...\weights".
Советую batch size per GPU не трогать, а оставить, как есть, потому что программа определяет вашу видеокарту. Если выставить слишком много, то либо упадет ошибка, либо эпохи будут идти слишком долго, так как будет задействована оперативная память вместо видеопамяти. Плюс вы заметите по температуре, что видеокарта загружена не полностью. Изначально ставил, как было сказано в ролике, мол сколько гигабайт видеопамяти. У меня RTX 2060 и ставил 6, в итоге эпохи шли по 7 минут, что очень долго. Оставил по умолчанию 3, и они стали идти по 1 минут 20 секунд, что в масштабах 200-300 эпох уже намного лучше. А так большое спасибо за ролик!
так видеопамяти на самом деле меньше без округления, типо карта на 4 гига например а памяти там 3.84 + винда сьедает, можно просто -1 или -2 поставить от колва памяти
16:20 у меня не показываются эпохи в консоли. В окне "Output information" время дошло до 90/90 и пошло дальше, пока не дошло до 2000/90. Потом я просто офнул. Кто знает как исправить помогите пожалуйста. Видяха - 1060 на 3 гига.
@@knyaz770 у меня 1050 Ти. Попробовал выставить batch на 3 гига вместо 4 - заработало. Но эпохи очень медленно идут (40 минут - одна эпоха). Но у людей такая проблема возникает и с мощным железом. Вот и гадаю, почему лыжи не едут
У меня есть готовая модель, я жму рефреш и ничего не происходит . Что я делаю не так? В модели есть pth и index файлы, а в списке моделей ее не видно. Я может где-то путь не указал? Или эта нейронка видит модели, тренированные только непосредственно внутри нее?
Cделай пожалуйста гайд как дотренировать какую-то из эпох или напиши в коменты. Многим тут актуально будет. Если допустим произошла ошибка или резко вырубился свет. Заранее спасибо
При запуске вылазит ошибка как исправить ? | WARNING | xformers | A matching Triton is not available, some optimizations will not be enabled. Error caught was: No module named 'triton' 2024-09-16 01:38:56 | WARNING | xformers | Triton is not available, some optimizations will not be enabled. This is just a warning: No module named 'triton'
По началу всё работало как в видео, но когда я нажимаю тренировать модель (16:09) у меня пишут ошибку: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc2 in position 26: invalid continuation byte Traceback (most recent call last): Не знаю что делать в этом случае...
Доброй ночи. Все сделал как рассказано в видосе и получилось, но когда попробовал повторить все время вылезает ошибка "AttributeError: 'NoneType' object has no attribute 'dtype'", в чем может быть проблема?
Возник вопрос,если в папке откуда будут браться аудио файлы,но сами файлы будут формата мп3 и вав,будет ли это все работать?У меня выходит ошибка,связанно ли это с форматами?
Выглядит очень впечатляюще! Сам я вообще ноль в работе с AI (даже как запустить на компе Stable Diffusion не понял), но сейчас вроде даже всё понял. Надеюсь моя 1050 справится...
Спасибо огромное за подробный разбор! А в какой из программ лучше получится изменить голос по обученной модели? Сделать convert в RVC, либо загрузить модель в AI Voice Changer и там сделать преобразование?
Разобрался) В RVC у меня качественней выходная запись получилась. Если я правильно понял, то Voice Changer больше подходит для разговоров в прямом эфире и сохранение готовой записи в нем проблематичнее. А в RVC с сохранением проблем нет. К тому же прослушивать варианты с разными настройками также лучше в RVC. В общем, в моем случае, когда нужен именно измененный аудио файл, а не прямой эфир, то лучше RVC. Может быть я что-то и упустил в настройках Voice Changer, но пока остановился на RVC.
Тестил в сервисе, качество поразило просто, искусственный интеллект делает свое дело, честно в одном вокале я даже услышал чуточку больше, чем с музыкой. Эта же программа так же качественно все делает?
Что делать, если загрузил аудиофайл формата mp3 весом 14 мегабайт в RVC (сайт Gradio) и при нажатии Process Data аутпут окно пустует или выдаёт ошибку (рамка загорается)? В кодовой строке выписывает в конце Failed. Feature Extraction также пустует, но рамка горит и в кодовой строке происходит нарезка. При нажатии на Train Model также выдаёт ошибку. Перезагружать пробовал, менять расположение файла, а также избавлялся разным путём от кириллицы в пути к файлу.
Блин, я несколько часов провозился, в итоге процесс пошел и каждая эпоха обучается примерно 15-17 минут 🙄 Карта 3050Ti бат ставил уже даже 3, оно все равно долго обучает. Что делать? Почему так?
Здравствуйте, подскажите пожалуйста, аудиофайлы только в вав формате грузить или мр3 тоже подойдут, и можно ли использовать две видеокарты в сли режиме для ускорения обработки, заранее спасибо.
Здравствуйте, ответьте на вопрос. Когда я нажимаю на ..model inference.. выбираю на готовый вокал, потом выбираю путь к вокалу, чтобы его изменить, далее нажимаю на ..convert.. и у меня появляется ошибка. В окне с черном фоне пишет: attributeError: NoneType object has no attribute dtype
На шаге 2а в RVC переработка файлов сначала стартует, затем завершается и сразу же возникает Error: Connection errored out. Соответственно, во всех последующих шагах то же самое. RVC скачивал по всем приведённым ссылкам.
Автор, здравствуйте. А если я уже загрузил готовые модели голоса(например, певца), у меня два файла: файл1.index и файл2.pth. Как мне сразу начать обработку "вокала" песни без тренировки ? Возможно, я пропустил это в видео, спасибо.
У меня почему то выдает ошибку. 2023-09-07 16:16:44 | WARNING | xformers | A matching Triton is not available, some optimizations will not be enabled. Error caught was: No module named 'triton' 2023-09-07 16:16:44 | WARNING | xformers | Triton is not available, some optimizations will not be enabled. This is just a warning: No module named 'triton'
и у меня такая же ошибка. Почитал на англоязычных форумах пишут, что можно игнорировать этот модуль и что для xformer он не важен. Я загрузил датасет на 18 минут, пачку для видеокарты оставил по-умолчанию, как прога выставила. Итого одна эпоха идет 65 сек.
подскажите пожалуйста почему на последнем этапе тренировке, после нажатия train model, в командной строке выдаёт ошибку UnicodeDecodeError: 'utf-8' codec can't decode byte 0xca in position 11: invalid continuation byte
Может ли встроенное ограничение на майнинг в видеокарте влиять на скорость просчёта? У меня первые эпохи на RTX 3080 10 VRAM обрабатывались 7:56, 5:39, 2:37, 1:58 (ММ:СС), полсле 5ой чуть ускорился, стал делать от 1:10 до 1:40 по времени, но всё равно это слишком долго, хотя у нас видеокарты примерно одинаковые и в таком случае тоже материал должен обрабатываться в среднем по 30 секунд за эпоху, а не в 2-3 раза дольше Я нашёл способ - нужно зайти в logs/название_модели/config.json поменять fp16 с false на true Также в configs/XXk.json поменять тоже fp16 с false на true (где XX - частота дискретизации, например 40k.json) У меня сразу стали эпохи идти по 6 секунд
Пошел на стареньком хсеоне 1155 и рх580 китайскаЯ чую 200 эпох, так глядишь через 200 эпох закончит тренить)) ошибка была какие-то папки не видел я их с папки логс/mute скопировал в папку под названием голоса и пошел 58 секунд 1эпоха, за исключением некоторых по 1'5 -2 минуты в голос закинул, где то 7 файлов в месте протяженностью 4 минуты, отпишусь что там стало даст Бог
Привет, а если хочешь наложить свой голос, на определённую песню, т.е. есть возможность записать голос, определённым образом, есть ли какие то советы какой должна быть запись? Нужно ли напевать прям текст песни, на которую потом хочешь наложить голос, или наоборот это может навредить только? Если песня будет на английском, есть ли смысл начитывать текст или напевать на английском? Если нет музыкальных данных, нужно ли записывать специально низкий голос и высокий, или тихий и громкий, даже если это будет неумело?
Голос должен быть как написал, и высокий и низкий и тихий и громкий, как можно более широкий диапазон. Можно и попеть, можно и по английски, если будешь на нем песни делать потом, в русском некоторых звуков нет. Что в английском есть. В общем как можно разнообразнее все делай
Здраствуйте, асскажите пожалуйста как скачать Xtts? Просто я хочу перевести речь в видео с русского на английский, но не понимаю что нужно скачать, какие программы, слышал что Xtts поможет но только сам не могу разобраться как его поставить.
Супер! Хотел всегда скопировать голос "Человека в черном" - Уильяма - персонажа из сериала мир дикого запада, которого озвучивает Станислав Концевич. Вот бы научиться
Извини, что беспокою, я ту проблему решил, теперь появилась другая. У меня высвечивается ошибка при тренировке: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcc in position 9: invalid continuation byte. Как мне это решить?
Не подскажите, кто сталкивался с такой ошибкой и как решали данную проблему? RuntimeError: The size of tensor a (24) must match the size of tensor b (16) at non-singleton dimension 2 Поставил 10 файлов трениться, 350 эпох, но переодически в самом начале процесса возникает данная ошибка
@@KseniaPavlova нет, просто подольше будет обрабатывать, но можно скачать версию для АМД, на сайте есть, будет побыстрее и галочку можно будет поставить
друг, не заморачивайся с путями при копировании. очень сложно делаешь. есть простой метод. выбираешь файл, удерживаешь шифт и нажимаешь правую кнопку мыши - появится контекстное меню, там будет строка копировать как путь, нажимаешь эту строку, и вставляешь куда надо.
Уважаемый друг,
Вы оказали неоценимую помощь нашему татарскому театру Камала. Нам нужно было преобразовать голос актрисы, в голос татарской певицы, которая, к сожалению, уже ушла из жизни. И результат превзошёл все ожидания!
Я звукорежиссёр этого спектакля, и я хотел бы выразить вам огромную благодарность за ценный совет.
Шлю вам привет из Казани, Республика Татарстан.
Автор делится полезной информацией, без воды и лишней духоты.
Так-же автор поясняет за каждый ползунок, каждое поле в каждой программе.
Рекомендую к просмотру
подскажи за что отвечает ползунок searcj feature ratio и куда его крутить что меняеться если не 0.75 а допустим 0.10 ?
автор говна пожрал, вместо того чтобы показать куда кидать уже готовые модели, мусолит какую-то хуйню про каверы из своих моделей,
Небреши
Ты просто лучший! Не знаю как и описать мои эмоции, целый день убил на способы других блогеров, зашел к тебе и с первого раза получилось. Спасибо тебе огромное!
Плюсую
11:50 что делать, если я вставляю путь и ничего не выходит?
блин я в восторге от этого парня очень понятно все объясняет и все получается, уже который гайд смотрю
Привет. У тебя все получилось? Мне нужно аудио сделать, плачу 1000 сразу. У меня с мака не получается просто
СТАС АЙ КАК ПРОСТО УЧИТЬ ДЕЛАТЬ AI COVER 😱😱😱
Стас Ай Как Кавер
Стас Ай как узко
Тоже так подумал)) только без каламбурчиков)
Зеленского
что делать, если я вставляю путь и ничего не выходит?
Это бомба, очень рад что встретил ваш канал!)
Это просто топовый туториал! Полная инфа! Да, можно было бы чуточку намонтировать, чтобы быстрее было, но это грех жаловаться! Спасибо тебе!
Хотел бы вернуться с обратной связью по гайду: это действительно самая понятная и подробная инструкция на русском языке!
В качестве датасета использовал два альбома моего любимого исполнителя, вырезал вокал с помощью uvr и ещё вручную через Audacity почистил каждую запись от остатков инструментала - чтобы нейросеть не училась на музыке. На выходе получил свыше получаса чистого вокала. Поставил обучение на 250 эпох, но у меня на 4060ti одна эпоха занимала 3-5 минут: то ли я что-то не так настроил, то ли дело в датасете, то ли для моей видеокарты это было тяжеловато. В итоге после 12 часов тренировки я не выдержал и прекратил на 210 эпохе. Тем не менее, результат поражает - модель действительно реалистичная и почти идентична оригиналу. Дорожки сводил при помощи вышеупомянутого Audacity, там это делается в 2 нажатия. Хочу дотренировать модель до 250 эпох и сравнить результат. Но он и так потрясающий! С меня лайк и подписка на канал. Спасибо, Андрей!
Большое спасибо за развернутую обратную связь. Да, время обработки зависит от длинны датасета, чем его больше чем дольше обработка)
Кстати реально странно, у меня на 2060 Super одна эпоха проходит за 35 сек.
p.s. перепроверил, с 25 эпохи сейчас за 25 секунд проходит, пока что я на 29, посмотрим как будет.
Я кажется понял, может дело в том, что у меня файлов меньше чем у автора? Скорее всего..
@@hagaroma3D да, чем меньше длительность файлов для тренировки. Тем она быстрее. 10-15 минут оптимально, и чтобы качество норм было и чтобы не так долго тренилось)
@@ba1yya Речь о длительности каждого файла? У меня всего 30 файлов гс. примерно от нескольких секунд до пару минут.
Что делать, если после нажатия "train model" выскакивает вот этот текст "训练结束, 您可查看控制台训练日志或实验文件夹下的train.log" и дальше ничего больше не происходит?
Пните, пожалуйста, когда найдете ответ...
У вас в консоли (которая черное окно в самом начале запуска программы) пишется ошибка, но скорее всего вам не нужно ее читать и там банальное - вы попробовали дважды обработать проект с одинаковым название. Нужно удалить в папке программы logs все кроме папки mute и заново проделать все шаги. Если не поможет - смотреть что выводит в консоли и гуглить.
Здравствуйте , нашли причину?
@@ЕвгенийНужнов-к6э Нет, использовал другую нейронку
@@ЕвгенийНужнов-к6э Причиной оказалась видеокарта. До этого у меня была rx 5600 xt, сейчас rtx 4070 ti и все заработало. амд не подходит для работы, они заточены исключительно под игры
Дружище, ты - лучший, спасибо тебе большое! Настройка пресетов в UVR - это вообще золото!
Спасибо ☺️
Скоро по нему дополнение выйдет. Чтобы еще лучше голос отделить, новые фишки откапал)
Буду тоже ждать@@ba1yya
@@ba1yya топ!!!
@@ba1yya Классно, классный!!!:))).
11:50 что делать, если я вставляю путь и ничего не выходит?
Низкий поклон за такую инфу. Очень понятная подача.
Спасибо большое) У меня всё получилось) Теперь Ариана Гранде будет петь песни, которые я захочу)
Один из лучших гайдов, мне например больше всего помог блок с настройкой пресетов в UVR, спасибо большое!
А насчет создания самого аи кавера скажу что лучше поставить в дополнение mangio-crepe, по мне он гораздо лучше и реалистичнее конвертит голос нежели pm или harvest
11:50 что делать, если я вставляю путь и ничего не выходит?
8:52 Вы можете переименовать файл с названием RU по пути RVC-beta0717\i18n в en_US и тогда весь интерфейс будет на русском
Жестко помог, спасибо за удобный гайд!
Часа 3 ушла разобраться, потому что иногда вылезали какие-то ошибки, но я смог, гайд хороший, спасибо!
важная деталь. если вы хотите загрузить свою уже готовую голосовую модель которую вы например скачали на каком-то форуме, то чтобы она отображалась в RVC надо закинуть файл .pth в папку:" ...\RVC...\weights".
Чувак, ты реально крут) Очень классный гайд!
Вау, я думал это намного сложнее, спасибо
Советую batch size per GPU не трогать, а оставить, как есть, потому что программа определяет вашу видеокарту.
Если выставить слишком много, то либо упадет ошибка, либо эпохи будут идти слишком долго, так как будет задействована оперативная память вместо видеопамяти. Плюс вы заметите по температуре, что видеокарта загружена не полностью.
Изначально ставил, как было сказано в ролике, мол сколько гигабайт видеопамяти. У меня RTX 2060 и ставил 6, в итоге эпохи шли по 7 минут, что очень долго. Оставил по умолчанию 3, и они стали идти по 1 минут 20 секунд, что в масштабах 200-300 эпох уже намного лучше.
А так большое спасибо за ролик!
Спасибо! Видяха 3070ti ставил 8 и каждая эпоха занимала 1:30 минуты, поставил 4 и теперь всего 37 секунд
@@lamer8716 как остановить процесс? Или можно просто поменять цифру не останавливая?
Ох, хороший вопрос. Я обычно дожидался сохранения и закрывал консоль. Потом просто выбирал последнее сохранение и менял настройки@@skeptikteam8539
4090 с установкой на 12, одна эпоха 2,89 сек
так видеопамяти на самом деле меньше без округления, типо карта на 4 гига например а памяти там 3.84 + винда сьедает, можно просто -1 или -2 поставить от колва памяти
Спасибо мужик, от всего сердца.
Это очень круто! Спасибо за видео)
Просто огромное спасибо за гайд
Медаль этому мужчине! Я чуть башку не сломал.
16:20 у меня не показываются эпохи в консоли. В окне "Output information" время дошло до 90/90 и пошло дальше, пока не дошло до 2000/90. Потом я просто офнул.
Кто знает как исправить помогите пожалуйста.
Видяха - 1060 на 3 гига.
Такая же проблема. Не нашли решение?
@@kaiiraw К сожалению нет. Полагаю дело в слабом пк, а именно видеокарте.
@@knyaz770 у меня 1050 Ти. Попробовал выставить batch на 3 гига вместо 4 - заработало. Но эпохи очень медленно идут (40 минут - одна эпоха). Но у людей такая проблема возникает и с мощным железом. Вот и гадаю, почему лыжи не едут
на самом деле, спасибо огромное за гайд, было очень полезно.
11:50 что делать, если я вставляю путь и ничего не выходит?
У меня есть готовая модель, я жму рефреш и ничего не происходит . Что я делаю не так? В модели есть pth и index файлы, а в списке моделей ее не видно. Я может где-то путь не указал? Или эта нейронка видит модели, тренированные только непосредственно внутри нее?
То же
в какую папку закидывать готовые модели натренированого голоса?
В папку /logs. Должно выглядеть так: раздел/logs/имя модели/ имя.pth и имя.index
Cделай пожалуйста гайд как дотренировать какую-то из эпох или напиши в коменты. Многим тут актуально будет. Если допустим произошла ошибка или резко вырубился свет. Заранее спасибо
На моменте обработки модели после начала конвертирования вылезает ошибка AttributeError: 'NoneType' object has no attribute 'dtype'
что делать?
@kekodesu удалось решить проблему?????
При запуске вылазит ошибка как исправить ?
| WARNING | xformers | A matching Triton is not available, some optimizations will not be enabled.
Error caught was: No module named 'triton'
2024-09-16 01:38:56 | WARNING | xformers | Triton is not available, some optimizations will not be enabled.
This is just a warning: No module named 'triton'
Что делать если в командной строке пишут системе не удалось найти указанный путь?
вчерa 2 чaсa не мог рaзобрaться, a сегодня после роликa нa изи сделaл) спaсибо!
Системе не удаётся найти указанный путь к питону, как указать ему?
Хрен знает. Та же проблема...
@@Aleksiy_kokushkow аналогично.автор не отвечает конечно
Мне с этим помогла перезагрузка компа😂
ахаха я в восторге + угаре, это супер угар, у меня власть которая и не снилась моему отцу
'utf-8' codec can't decode byte 0xc8 in position 11: invalid continuation byte выбивает вот такое, подскажите что делать ?
Нашли решение?
Это из-за русских символов. Надо хранить rvc по пути только с английскими символами
По началу всё работало как в видео, но когда я нажимаю тренировать модель (16:09) у меня пишут ошибку:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc2 in position 26: invalid continuation byte
Traceback (most recent call last):
Не знаю что делать в этом случае...
Что то где то у тебя на русском написано, путь или файлы на русском
@@ba1yya я всё перепроверил и нашёл несколько русских символов, после исправления заново начал весь процесс, теперь всё хорошо.
Спасибо за помощь
@@Lis_Gleys у меня такая же фигня была , я там где то выше написал что нужно сделать
Спасибо, объяснил все без воды и по факту! Хороший гайд, лайк однозначно!
Доброй ночи. Все сделал как рассказано в видосе и получилось, но когда попробовал повторить все время вылезает ошибка "AttributeError: 'NoneType' object has no attribute 'dtype'", в чем может быть проблема?
в названии файла с вокалом не дописал .wav
У меня такая же фигня была, надо было указать путь к самому аудио, а не к папке, где оно лежит. По крайней мере у меня было так
а как разделить несколько дорожок. например басс или гитара. на uvr5
Возник вопрос,если в папке откуда будут браться аудио файлы,но сами файлы будут формата мп3 и вав,будет ли это все работать?У меня выходит ошибка,связанно ли это с форматами?
А можно ли наоборот мне напеть мелодию , а неиросеть вставит на эту мелодию голос известного певца (русского) ?
Ну да, делай rvc певца и вставляй в свой вокал
Отличный гайд,спасибо что научили делать ai каверы!!!
Выглядит очень впечатляюще! Сам я вообще ноль в работе с AI (даже как запустить на компе Stable Diffusion не понял), но сейчас вроде даже всё понял. Надеюсь моя 1050 справится...
Если не справится, на канале есть вторая часть этого видео. Где не на своем железе это делаем все)
@@ba1yya Спасибо большое!
1050 справилась?
@@леонидлеонов-к4к Мне совестно признаться в этом, но как-то ещё не успел попробовать - всё никак не дохожу(
Спасибо огромное за подробный разбор! А в какой из программ лучше получится изменить голос по обученной модели? Сделать convert в RVC, либо загрузить модель в AI Voice Changer и там сделать преобразование?
Разобрался) В RVC у меня качественней выходная запись получилась. Если я правильно понял, то Voice Changer больше подходит для разговоров в прямом эфире и сохранение готовой записи в нем проблематичнее. А в RVC с сохранением проблем нет. К тому же прослушивать варианты с разными настройками также лучше в RVC.
В общем, в моем случае, когда нужен именно измененный аудио файл, а не прямой эфир, то лучше RVC. Может быть я что-то и упустил в настройках Voice Changer, но пока остановился на RVC.
На 1050 не получиться прогоны делать? У меня не выходит, хотя все этапы до этого удалось сделать.
Тестил в сервисе, качество поразило просто, искусственный интеллект делает свое дело, честно в одном вокале я даже услышал чуточку больше, чем с музыкой. Эта же программа так же качественно все делает?
Что делать, если загрузил аудиофайл формата mp3 весом 14 мегабайт в RVC (сайт Gradio) и при нажатии Process Data аутпут окно пустует или выдаёт ошибку (рамка загорается)? В кодовой строке выписывает в конце Failed. Feature Extraction также пустует, но рамка горит и в кодовой строке происходит нарезка. При нажатии на Train Model также выдаёт ошибку. Перезагружать пробовал, менять расположение файла, а также избавлялся разным путём от кириллицы в пути к файлу.
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 11: invalid start byte пишет и дальше не идет
Решилось, я убрал символы в пути к папке, и заработало. Ну и русские буквы тож надо убирать.
@@shprotov04 Привет такая же ошибка, как приблизительно назвать папку !?Русских букв вроде нет
@@fedormikhailovich5993 назови folder. И закинь ее в корень
@@fedormikhailovich5993 имя пользователя(компьютера) на русском?
Блин, я несколько часов провозился, в итоге процесс пошел и каждая эпоха обучается примерно 15-17 минут 🙄
Карта 3050Ti бат ставил уже даже 3, оно все равно долго обучает. Что делать? Почему так?
почему на припеве звук искажает?
8:34 Подскажите пожалуйста, как на Маке открыть файл расширения Bat ????
поставь CrossOver он эмулирует винду и в нем запусти этот файл
Здравствуйте, подскажите пожалуйста, аудиофайлы только в вав формате грузить или мр3 тоже подойдут, и можно ли использовать две видеокарты в сли режиме для ускорения обработки, заранее спасибо.
У меня на 11:55 выдает ошибку ValueError: Invalid literal for int() with base 20: 'wav'
Как ее можно решить?
а что делать если у меня уже есть скачанный pth файл и я хочу его туда загрузить как мне это сделать?
очень подробный и понятный гайд, спасибо!
У меня на моменте кнопки process data пишет error в правом диалоговом окне на двух компах такая проблема , в чем дело кто в курсе ?
У меня программа пишет, что такого файла или каталога нет. Что делать?
Спасибо, всё получилось)
Здраствуйте, а что делать если при установке выдает "системе не удается найти указаный путь"?
Здравствуйте, ответьте на вопрос. Когда я нажимаю на ..model inference.. выбираю на готовый вокал, потом выбираю путь к вокалу, чтобы его изменить, далее нажимаю на ..convert.. и у меня появляется ошибка. В окне с черном фоне пишет: attributeError: NoneType object has no attribute dtype
такая же фигня
@@eugeneskillov7788удалось решить проблему? С такое же столкнулся....
а что делать если на моменте где надо выбрать эпоху для обработки голоса у меня не появляется каталог?
а в чём проблема если при запуске rvc браузер на мгновение открывается и тут же пропадает?
у меня видюха слабая, не получается процесс запустить в ювр(
Тогда либо делать на процессоре. Либо немного в качестве отделения пожертвовать и на различных онлайн ресурсах это делать. Рекомендую второй вариант
@@ba1yya я просто не включаю гпу конвершон)
Так тоже можно, да. Но дольше обрабатывается
обновил, теперь rtx 3060, норм будет?
Что делать: "К сожалению у вас нету видеокарты, которая поддерживает тренировку модели."? Видеокарта есть.
На шаге 2а в RVC переработка файлов сначала стартует, затем завершается и сразу же возникает Error: Connection errored out. Соответственно, во всех последующих шагах то же самое. RVC скачивал по всем приведённым ссылкам.
как установить RVC на macbook?
Автор, здравствуйте. А если я уже загрузил готовые модели голоса(например, певца), у меня два файла: файл1.index и файл2.pth. Как мне сразу начать обработку "вокала" песни без тренировки ? Возможно, я пропустил это в видео, спасибо.
Лучший! Спасибо тебе! Если смогу провернуть темку одну, задоначу тебе!
Я почему-то не вижу модели в Inferencing Timbre, хотя все сделал правильно в Train. Как это исправить? Обновлял всеравно ничего нет.
У меня почему то выдает ошибку. 2023-09-07 16:16:44 | WARNING | xformers | A matching Triton is not available, some optimizations will not be enabled.
Error caught was: No module named 'triton'
2023-09-07 16:16:44 | WARNING | xformers | Triton is not available, some optimizations will not be enabled.
This is just a warning: No module named 'triton'
аналогичная штука, уже че только не пробовал
и у меня такая же ошибка. Почитал на англоязычных форумах пишут, что можно игнорировать этот модуль и что для xformer он не важен. Я загрузил датасет на 18 минут, пачку для видеокарты оставил по-умолчанию, как прога выставила. Итого одна эпоха идет 65 сек.
а что если в при нажатии "process gata" всегда ошибка, не трогал потоки процессора, даже папку сохронения указал на англ и без пробелов
когда запускаю файл go web пишет «системе не удалось найти указанный путь»
тоже самое
Есть способы разделить дуэт на два вокала?
подскажите пожалуйста почему на последнем этапе тренировке, после нажатия train model, в командной строке выдаёт ошибку UnicodeDecodeError: 'utf-8' codec can't decode byte 0xca in position 11: invalid continuation byte
Потому-что программа хранится по пути, в котором содержатся символы кириллицы.
Может ли встроенное ограничение на майнинг в видеокарте влиять на скорость просчёта? У меня первые эпохи на RTX 3080 10 VRAM обрабатывались 7:56, 5:39, 2:37, 1:58 (ММ:СС), полсле 5ой чуть ускорился, стал делать от 1:10 до 1:40 по времени, но всё равно это слишком долго, хотя у нас видеокарты примерно одинаковые и в таком случае тоже материал должен обрабатываться в среднем по 30 секунд за эпоху, а не в 2-3 раза дольше
Я нашёл способ - нужно зайти в logs/название_модели/config.json поменять fp16 с false на true
Также в configs/XXk.json поменять тоже fp16 с false на true (где XX - частота дискретизации, например 40k.json)
У меня сразу стали эпохи идти по 6 секунд
Сколько минут записей должно быть в папке, когда мы указываем путь на эту самую папку с голосовыми записями нужного мне голоса?
А кто-нибудь знает, как использовать модель, которая уже готова (без тренировки) и возможно ли это?
У кого-то получилось решить данную ошибку AttributeError: 'NoneType' object has no attribute 'dtype' ?????
Все сделал по гайду, и в конце узнал что на амд надо другую версию, щас попробую
Пошел на стареньком хсеоне 1155 и рх580 китайскаЯ чую 200 эпох, так глядишь через 200 эпох закончит тренить)) ошибка была какие-то папки не видел я их с папки логс/mute скопировал в папку под названием голоса и пошел 58 секунд 1эпоха, за исключением некоторых по 1'5 -2 минуты в голос закинул, где то 7 файлов в месте протяженностью 4 минуты, отпишусь что там стало даст Бог
Привет, а если хочешь наложить свой голос, на определённую песню, т.е. есть возможность записать голос, определённым образом, есть ли какие то советы какой должна быть запись? Нужно ли напевать прям текст песни, на которую потом хочешь наложить голос, или наоборот это может навредить только? Если песня будет на английском, есть ли смысл начитывать текст или напевать на английском? Если нет музыкальных данных, нужно ли записывать специально низкий голос и высокий, или тихий и громкий, даже если это будет неумело?
Голос должен быть как написал, и высокий и низкий и тихий и громкий, как можно более широкий диапазон. Можно и попеть, можно и по английски, если будешь на нем песни делать потом, в русском некоторых звуков нет. Что в английском есть. В общем как можно разнообразнее все делай
четкий вопрос
как готовую модель подргузить в панельку?
Есть в краткое и понятное видео?
Здраствуйте, асскажите пожалуйста как скачать Xtts? Просто я хочу перевести речь в видео с русского на английский, но не понимаю что нужно скачать, какие программы, слышал что Xtts поможет но только сам не могу разобраться как его поставить.
У меня вопрос, любого можно голос певца изменить, и как найти голос определённого вокалиста?
Супер! Хотел всегда скопировать голос "Человека в черном" - Уильяма - персонажа из сериала мир дикого запада, которого озвучивает Станислав Концевич. Вот бы научиться
Что делать, если пишет: "Системе не удаётся найти указанный путь"?
выше мой комент прочтине из новых
По какому принципу вы выбрали алгоритмы для разделения вокала от плюса.
Отличный гайд, последовательный и без воды, респект, но английский всё таки выучи)
что делать если не выходит комадная строка при открытии гоу веб
что нужно делать ты узнал??????
Извини, что беспокою, я ту проблему решил, теперь появилась другая. У меня высвечивается ошибка при тренировке: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcc in position 9: invalid continuation byte. Как мне это решить?
Где то русские буквы на пути есть
@@ba1yya а если их нет?(((
@@Azat_Unusov777нашли решение?
А если я хочу сделать голосом другого исполнителя, а не друга, что сохранять?
Не подскажите, кто сталкивался с такой ошибкой и как решали данную проблему?
RuntimeError: The size of tensor a (24) must match the size of tensor b (16) at non-singleton dimension 2
Поставил 10 файлов трениться, 350 эпох, но переодически в самом начале процесса возникает данная ошибка
Настройки буфера меньше надо ставить
Я сделал как показано но файли коророе ми тренерировали не показивает что делат
Вылетает ошибка - Connection errored out и на этом всё. P.S. Отвечаю сам себе - ошибку вызывает Касперский, пока не отключишь так и будет глючить.
граждане, а что делать, если у меня Амд? как учить на проце, есть ли там кнопка какая то для этого, а то ошибка просто выпадает.
у меня недоступна галочка gpu conversion интересно это потому что у меня amd?
Именно поэтому)
@ba1yya у меня тоже не возможно установить эту галочку! это плохо??
@@KseniaPavlova нет, просто подольше будет обрабатывать, но можно скачать версию для АМД, на сайте есть, будет побыстрее и галочку можно будет поставить
друг, не заморачивайся с путями при копировании. очень сложно делаешь. есть простой метод. выбираешь файл, удерживаешь шифт и нажимаешь правую кнопку мыши - появится контекстное меню, там будет строка копировать как путь, нажимаешь эту строку, и вставляешь куда надо.
Спасибо дорогой за науку.