Это всё очень полезно, очень ждем текст в аудио, на русском. Eleven labs, конечно топ, но хочется локально, с эмоциональным окрасом и правильной фонетикой :)
Хорошее дело делаете, спасибо! Попробовал, результат такой. Опция "45М" выдала ошибку сервера на файлах мр3 длительностью 30 сек и 13 мин - не сработал ИИ, но грубое распознавание прошло где-то пятой части файла, потом интерес к моему файлу пропал. Опция "1.8G" грубое распознавание провела, а ИИ обработал только короткий файл. На большем - ошибка сервера.
Здравствуйте. Быстрее всего ошибаи из-за очередей. Сервер один, а наплыв пользователей значительный. Вис сервер несаолько раз. Там транскрибация на процессоре, и параллельно llm на видеокарте.. и сервер работает, ставит в очередь пользоватплей, но потом виснет при одновременной работе для нескольких пользователей. Нужно более мощное железо, но у меня пока нет ресурсов к его приобретению
В этом ее тоже нет, диаризацию я докручиваю отдельной нейросетью на основе лингвистического анализы извлеченных сырых данных. Использую локальную нейросеть Gemma для этого. Будем смотреть, справится ли с задачей.
@MrDewiar я попробовал обрабатывать ChatGPT, но столкнулся с тем, что он фантазирует сильно, хотя и правильно разбивает на диалоги, а иногда даже подписывает говорящих сам. Клод делает точнее, но всё равно быстро кончается лимиты обработки. Gemeni не смог заставить выдать диалог. Он хотел отвечать на вопросы по интервью, пересказывать, делать выводы... Но сам транскрипт не выдавал
Это всё очень полезно, очень ждем текст в аудио, на русском. Eleven labs, конечно топ, но хочется локально, с эмоциональным окрасом и правильной фонетикой :)
Да, буду пробовать запускать такое решение
Благодарим!
Валера, спасибо 🤝
Это очень умно и круто. Это то за что действительно можно заплатить
Будем развивать! Спасибо за хороший отзыв!
Очень круто! Скорей бы это все работало на большие объемы данных.
Спасибо. Это от железа зависит. Если появятся возможности приобрести более мощное оборудование, все заработает лучше
Хорошее дело делаете, спасибо! Попробовал, результат такой. Опция "45М" выдала ошибку сервера на файлах мр3 длительностью 30 сек и 13 мин - не сработал ИИ, но грубое распознавание прошло где-то пятой части файла, потом интерес к моему файлу пропал. Опция "1.8G" грубое распознавание провела, а ИИ обработал только короткий файл. На большем - ошибка сервера.
Здравствуйте. Быстрее всего ошибаи из-за очередей. Сервер один, а наплыв пользователей значительный. Вис сервер несаолько раз. Там транскрибация на процессоре, и параллельно llm на видеокарте.. и сервер работает, ставит в очередь пользоватплей, но потом виснет при одновременной работе для нескольких пользователей. Нужно более мощное железо, но у меня пока нет ресурсов к его приобретению
Спасибо. Недавно расшифровывал интервью при помощи Whisper , но есть засада: нет диаризации. То есть есть, но через правое ухо. Попробую на этом
В этом ее тоже нет, диаризацию я докручиваю отдельной нейросетью на основе лингвистического анализы извлеченных сырых данных. Использую локальную нейросеть Gemma для этого. Будем смотреть, справится ли с задачей.
@MrDewiar я попробовал обрабатывать ChatGPT, но столкнулся с тем, что он фантазирует сильно, хотя и правильно разбивает на диалоги, а иногда даже подписывает говорящих сам. Клод делает точнее, но всё равно быстро кончается лимиты обработки. Gemeni не смог заставить выдать диалог. Он хотел отвечать на вопросы по интервью, пересказывать, делать выводы... Но сам транскрипт не выдавал
Ребята вы лучшие! Сделайте возможность для доната!
Благодарю, подумаем, спасибо 🤝
08:36 Не понял как встраивать в сайты и телеграм?
Пожалуйста, посмотрите в моих видео есть об этом.
Благодарю за ответ, как понимаю вы портативки не делаете и народу не раздаёте, а делаете все у себя.
Это невозможно раздать, требуется мощная видеокарта (у меня на 24Gb). Я разворачиваю на своем сервере, и даю на бесплатное использование. Пока так.
@MrDewiar ясно, у меня rtx 2060 на 12 gb, юзаю и flux и gguf дистиллированный xxs от llama 3.1 на 27b.
На gemini 2.0 либо цены не верные указаны, либо что-то не так списывает, снимает за запрос раз в 10 больше чем на gemini 1.5
Спасибо за информацию, проверю. Сегодня сравнивал его ответы с версией Gemini 1.0 PRO EXP, и она лучше, чем Gemini 2
Это бесплатно?
Да, полностью бесплатно
08:36 Не понял как встраивать в сайты и телеграм?
Здравствуйте. Это очерь просто. Посмотрите в моих видео.. конструктор ассистентов, там есть ролики об этом