- Видео 65
- Просмотров 198 822
Ruslan Dev
Малайзия
Добавлен 20 янв 2016
Программирование, машинное обучение, жизнь экспата - основные темы моего канала. Я веду этот видеоблог, совмещая в нем советы инженера-программиста с приключениями и впечатлениями путешественника.
Разработка LLM: сбор датасета с помощью GPT-4o | файнтюнинг Llama 3
В этом видео я собираю собственный датасет с помощью GPT-4o и обучаю на нем Llama 3.
Датасет: huggingface.co/datasets/ruslandev/tagengo-subset-gpt-4o
Модель, обученная на датасете: huggingface.co/ruslandev/llama-3-8b-gpt-4o
Установка gptchain и консольные команды для файнтюнинга - @immers.cloud-faintuning-i-kvantizaciya-llama-3-70b
Бенчмарк MT-Bench - @immers.cloud-benchmarki-bolshih-yazykovyh-modelei-multiyazychnyi-mt-bench
💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/
Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров...
Датасет: huggingface.co/datasets/ruslandev/tagengo-subset-gpt-4o
Модель, обученная на датасете: huggingface.co/ruslandev/llama-3-8b-gpt-4o
Установка gptchain и консольные команды для файнтюнинга - @immers.cloud-faintuning-i-kvantizaciya-llama-3-70b
Бенчмарк MT-Bench - @immers.cloud-benchmarki-bolshih-yazykovyh-modelei-multiyazychnyi-mt-bench
💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/
Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров...
Просмотров: 389
Видео
Как обучить свой GPT-4o - Часть 1 - Бенчмарки
Просмотров 1,7 тыс.14 дней назад
В этом видео я рассказываю о способах оценки (evaluation) больших языковых моделей и о новом GPT-4o (Omni). 💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/ Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU). Сервис предлагает кон...
Файнтюнинг и квантизация Llama-3 70B
Просмотров 1,5 тыс.21 день назад
В этом видео я показываю процесс файнтюнинга Llama 3 70B и квантизации модели с конвертацией в формат GGUF. 💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/ Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU). Сервис предлагает кон...
Файнтюнинг на примере Llama 3 + QLoRA. ПРОЩЕ и ЭФФЕКТИВНЕЕ чем когда-либо
Просмотров 3,2 тыс.Месяц назад
В этом видео я показываю, как выполнить файнтюнинг Llama 3 максимально просто, как настроить GPU и программный стек. 💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/ Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU). Сервис предл...
Портирую Grok на Huggingface Transformers. Илон Маск открыл доступ к весам Грок
Просмотров 9102 месяца назад
Телеграм: t.me/ruslandevlive Colab с кодом для запуска Grok в 4bit: colab.research.google.com/drive/1dAVYndwwH8Ir6mPy7BBblvFFzZ05TTRt?usp=sharing Код, взятый за основу, и веса в формате Pytorch: huggingface.co/keyfan/grok-1-hf
Обучаю нейросеть для ВИДЕО методом Sora. Университет Пекина разрабатывает Sora с открытым кодом
Просмотров 1,1 тыс.3 месяца назад
Телеграм: t.me/ruslandevlive Colab с кодом для обучения: colab.research.google.com/drive/1wWqvTUNkD5itXyjwU_a7gaWePNZHA4X5?usp=sharing Latte: github.com/Vchitect/Latte Проект Пекинского университета (Open Sora): github.com/PKU-YuanGroup/Open-Sora-Plan Статья про ViT: arxiv.org/abs/2010.11929
Как обучить нейросеть, на которой работает Sora. Практический гайд по Diffusion Transformer
Просмотров 2,3 тыс.3 месяца назад
Телеграм: t.me/ruslandevlive Colab с кодом для файнтюнинга - colab.research.google.com/drive/1kqy_IO_HzKwTeIUnmk-e_2-bi3AVyIp9 Sora (технический отчет) openai.com/research/video-generation-models-as-world-simulators Diffusion Transformers github.com/facebookresearch/DiT MaskDiT github.com/Anima-Lab/MaskDiT
Discord бот для распознавания речи на лету - Whisper, RTP/UDP
Просмотров 6954 месяца назад
В виде продолжения одного из моих старых видео по распознаванию речи с помощью модели Whisper я сделал пошаговый разбор передачи аудио по RTP/UDP с распознаванием в реальном времени. Мой брат Александр помог с кодом Discord бота на Golang. Исходный код: github.com/RuslanPeresy/voicertp Телеграм: t.me/ruslandevlive
Планы, тренды AI и зимний Гонконг
Просмотров 6635 месяцев назад
Всем привет, всех с Новым Годом! В этом видео я рассказал о любопытных тенденциях в AI, которые могут задать направление развития индустрии на 2024 год. А заодно показал замечательные виды Гонконга, который я посетил во время новогодних праздников. Приятного просмотра! Телеграм-канал: t.me/ruslandevlive AppAgent: appagent-official.github.io/ CogAgent & CogVLM: github.com/THUDM/CogVLM LivePhoto:...
AI бот для Телеграм - подробное руководство. Python, Langchain, Llama2 + деплой и API
Просмотров 3,2 тыс.6 месяцев назад
Всем привет! 🔔 Сначала подпишись: youtube.com/@ruslandev/?sub_confirmation=1 Это - вторая часть гайда по разработке ИИ бота для Телеграм. Предыдущее видео - ruclips.net/video/OGu_fbSV_uI/видео.html Здесь я собрал всю самую важную информацию для разработчиков о том, как использовать мощный функционал ИИ технологий HuggingFace и библиотеки Langchain для создания ботов. 00:00 - Введение 0:32 - Обл...
Глава OpenAI уходит в Microsoft - будет ли GPT-5? Минусы Assistants API
Просмотров 1 тыс.6 месяцев назад
Всем привет, как сегодня стало известно, глава OpenAI Cэм Альтман и сооснователь Грег Брокман уходят в Microsoft, в связи с чем возникает вопрос, что будет с GPT-5 и дальнейшим развитием платформы? В этом видео я поделился своими мыслями об этом, а также о минусах OpenAI Assistants API. Подписывайтесь на мой Телеграм канал: t.me/ruslandevlive
I found a BUG in GPT-4 Vision... AI haven't passed the street art challenge
Просмотров 1 тыс.7 месяцев назад
Всем привет, такого вы еще не видели - GPT-4V(ision), ИИ зрение - пытается анализировать уличную живопись в Малайзии. Телеграм: t.me/ruslandevlive Музыка: "Savfk - The Travelling Symphony" is under a Creative Commons Attribution 4.0 International License (CC BY 4.0) ruclips.net/user/savfkmusic Music promoted by BreakingCopyright: bit.ly/the-travelling-symphony-song
OPENAI ASSISTANTS API: Теперь создавать ИИ помощников НАМНОГО проще | Обновления OpenAI DevDay
Просмотров 5 тыс.7 месяцев назад
🔔 Сначала подпишись: youtube.com/@ruslandev/?sub_confirmation=1 Всем привет, это видео я записал по итогам OpenAI DevDay, их первой конференции для разработчиков, которая действительно обещает рассвет ИИ разработки. Я сделал обзор с примерами кода на самое привлекательное для программистов обновление: Assistants API с доступом к Code Interpreter, Retrieval и Function calling. В видео я показыва...
Bus travel across Malaysia. The life of a digital nomad
Просмотров 2947 месяцев назад
Всем привет! Нельзя все время программировать - когда я не программирую, я путешествую. Смотрите лучшие кадры из моего путешествия по Малайзии. В этом видео вы найдете информацию, полезную для цифрового кочевника. Приятного просмотра, подписывайтесь на мой телеграм-канал: t.me/ruslandevlive Музыка: "yangkaiji - Emperor's Battle" is under a Creative Commons (CC BY-SA 3.0) license. soundcloud.com...
Я написал свой Code Interpreter. Телеграм бот на LangChain и опенсорсных ИИ моделях
Просмотров 2,8 тыс.10 месяцев назад
Я написал свой Code Interpreter. Телеграм бот на LangChain и опенсорсных ИИ моделях
Пример ИИ приложения на Python, LangChain и ChatGPT (OpenAI API)
Просмотров 6 тыс.11 месяцев назад
Пример ИИ приложения на Python, LangChain и ChatGPT (OpenAI API)
QLoRA: обучал нейросеть 20 ЧАСОВ В GOOGLE COLAB на РУССКОМ ДАТАСЕТЕ. Впечатляет
Просмотров 9 тыс.11 месяцев назад
QLoRA: обучал нейросеть 20 ЧАСОВ В GOOGLE COLAB на РУССКОМ ДАТАСЕТЕ. Впечатляет
Уехал на Филиппины. Черногория пересмотрит дело
Просмотров 432Год назад
Уехал на Филиппины. Черногория пересмотрит дело
Montenegro: corrupt police tried to extort me for money
Просмотров 1,3 тыс.Год назад
Montenegro: corrupt police tried to extort me for money
Новый ИИ монстр от OpenAI - ChatGPT пишет код на C++ и Fortran
Просмотров 4 тыс.Год назад
Новый ИИ монстр от OpenAI - ChatGPT пишет код на C и Fortran
OpenAI Whisper: новая модель распознавания речи. Discord бот на Whisper & GPT-3, часть 1
Просмотров 3,5 тыс.Год назад
OpenAI Whisper: новая модель распознавания речи. Discord бот на Whisper & GPT-3, часть 1
Python + GPT-3 = The Very First Streaming Bot on YouTube
Просмотров 1 тыс.Год назад
Python GPT-3 = The Very First Streaming Bot on RUclips
Переехал в Черногорию. IT эмиграция: что иметь в виду
Просмотров 1,5 тыс.Год назад
Переехал в Черногорию. IT эмиграция: что иметь в виду
Python и базы данных. SqlAlchemy. Сессия
Просмотров 2,4 тыс.3 года назад
Python и базы данных. SqlAlchemy. Сессия
Python и базы данных. SqlAlchemy. Query, Join, lazy loading
Просмотров 3,4 тыс.3 года назад
Python и базы данных. SqlAlchemy. Query, Join, lazy loading
Python и базы данных. SqlAlchemy. Relationships, первичный и вторичный ключи
Просмотров 7 тыс.3 года назад
Python и базы данных. SqlAlchemy. Relationships, первичный и вторичный ключи
Python и базы данных. SqlAlchemy. Введение
Просмотров 2,7 тыс.3 года назад
Python и базы данных. SqlAlchemy. Введение
REST API (Python): Админ-панель. Часть 3 - декоратор для ограничения доступа к админке
Просмотров 1 тыс.3 года назад
REST API (Python): Админ-панель. Часть 3 - декоратор для ограничения доступа к админке
Руслан, в очередной раз спасибо за то, что делишься столь полезной практической информацией! Если есть возможность, то расскажи насколько глубоко зашита цензура в llama 3 и насколько сложно изменить ее зацензуренный ответ на дообучении. Также еще хотелось бы увидеть промпты, которые во время бенчмарка были оценены низко, то есть GPT4 считает, что твоя модель не справилась с ответом. Это поможет понять слабые темы модели. А еще, возвращаясь к цензуре, у самой GPT4 хватает табуированных тем и она может ставить 1, даже если твоя модель ответила верно. Потом, если спросить GPT4, почему она оценила ответ на 1, то она скажет, что вообще на этот вопрос (по ее мнению) ответа давать нельзя, потому и 1. А это может снижать общую оценку бенчмарка из-за того, что сам арбитр весьма такой себе.
а можно видео фантюна на каком нибудь кондовом железе, типа связки двух 3090 или 3 ох P40
Про файнтюнинг нейронок для картинок будет? Там как раз SD3 вышла.
Молодец, хороший контент
привет, hi, it's not clear. This is probably an advertisement for those in the know.нихера непонятно. Наверно это реклама или что?
@pavelsavelev880 Напишу как собственник и бизнесмен (и родитель, обучающий СВОИХ детей, а не чужих). Когда Coplot подсказывает программисту продолжение кода, он использует не код Microsoft (это табу и жлобство), а код, ранее написанный другими (глупыми) программистами. Создалась среда "бес-собственности" (бессовестности), которая уже погубила души программистов и программирование. За программистов код пишет (точнее, использует ранее написанный чужой код) ChatGPT, а программисты выдают код за свой (и получают денежки от глупого Заказчика). Это временно и это чувствуют уже все, и боятся. По динамике последней сотни лет в 2060 году исчезнет последний работник, производящий материальные ценности. Уже сегодня 2/3 трудоспособного населения оказывают друг другу услуги (типа массажа и написания кода). Деньги, прибыль потеряли всякий экономический смысл (цены в магазинах назначаются политически).
С нетерпением ждём следующее видео!
Просто супер! Посмотрел с огромным удовольствием!
спасибо
спасибо. это нужное видео
Привет 👋 было бы круто если бы она в конце ответа не как обычно говорила бы чем ещё помочь а сначала бы предложила свой собственный вопрос для продления темы которая рассказывала только что, что бы вопрос её был на столько интересным от которого не возможно было-бы удержатся и сказать ей , да я хочу знать ответ на этот вопрос , тем самым она могла бы затягивать общение все глубже и обширней в той теме которая началась из начально !)
Старательный парнишка, странный контент. Чего мы своего разработали так и не ясно. Это называется нерелевантный заголовок
хорошее видео, спасибо
было бы супер, до обучить Llama3 русскому. вы ее потом выбросите в отрытый доступ после до обучения?
если все получится с датасетом и обучением - да, веса выложу
1:21
расскажите пожалуйста как в LLM на вход подавать картинки и звук, чтоб обучать её на этом датасете...
Пока есть только видео по DiT (Sora) - файнтюнинг на изображениях и видеоданных, здесь на канале. Возможно сделаю еще про распознавание изображений
спасибо, полезное видео
Главная фишка 4o в том что она быстро работает с голосом и картинками. Что бы обучить аналог GPT-4o одного только текста не достаточно. Нужен ещё дата-сет с аудио и видео (картинками). Естественно для этого понадобится работать с мультимодальной моделью типа Reka Core. Так что тема ролика в твоём видео не раскрыта.
"Нативная" мультимодальность GPT-4o - это пока только слухи. Будет технический отчёт об архитектуре модели, будет и обзор на него. А это видео о том, как использовать текстовый инференс этой модели для файнтюнинга.
Что значит "свой"? То есть мы обучаем GPT, но работаем на дядю. А он даже спасибо не скажет.
Насколько я понял, ChatGPT обучается в рамках частной сессии. Temporary? А сама модель глобально обучается лишь со стороны open ai
@pavelsavelev880 Напишу как собственник и бизнесмен (и родитель, обучающий СВОИХ детей, а не чужих). Когда Coplot подсказывает программисту продолжение кода, он использует не код Microsoft (это табу), а код, ранее написанный другими глупыми программистами. Создалась среда "бес-собственности" (бессовестности), которая уже погубила души программистов и программирование. За программистов код пишет (то есть использует ранее написанный код) ChatGPT, а программисты выдают код за свой (и получают денежки от глупого Заказчика). Это временно и это чувствуют все, и боятся. По динамике последней сотни лет в 2060 году исчезнет последний работник, производящий материальные ценности. Уже сегодня 2/3 трудоспособного населения оказывают друг другу услуги (типа массажа и написания кода). Деньги, прибыль потеряли всякий экономический смысл (цены в магазинах назначаются политически).
Как хорошо что ты делаешь тавие ролики.
Да это интересно. Спасибо за Вашу работу.
Спасибо. Есть ли команда чтобы приостановить файнтюнинг, сохранить состояние модели, а затем команда чтобы продолжить файнтюнинг с места остановки?
файнтюнинг - непрерывный процесс, но каждые 500 шагов автоматически создается чекпоинт
@@ruslandev спасибо вам, понял
прегонишь в gguf llama-3-8b-samantha модель?
В gptchain есть команда с инструкцией, можешь сам сконвертировать
@@ruslandevну я в обучении не разбираюсь сори.
эта модель запустится на 3080ti 32г оперативы или не хватит? у меня есть 64г но нет свободных слотов в материнке(
не нехватает оперативки. жаль чуть меньше не создал модель.
Ну надо пробовать что получилось
Что Вы знаете о rugtp? Есть смысл смотреть в её сторону или лучше взять lama3 и попробовать дообучить на русском датасете? Было бы интересно узнать, как создать самому датасет в рамках какого-то домена знаний? Например, взяв литературу по определённой тематике.
лучше взять llama 3 в репозитории датасета из этого видео - tagengo есть код, с помощью которого этот датасет был создан через запросы к gpt-4
Может скинемся денюжкой на обучение? А после уже получим результат для общественности?
дождались!😁спасибо!
Спасибо за видео! Стали примерно понятны время и бюджеты, необходимых для дообучения таких больших моделей как 70B. Что касается метрик, то хотелось бы подробнее узнать про эти самые метрики, по которым сравниваются LLM и строятся всяческие топы моделей, например на Huggingface. Потому что по определенным бенчмаркам в топе зачастую вижу малоизвестные открытые модели (чаще всего дообученная llama), которые вроде там заявляются чуть ли не на уровне ChatGPT 4. В реальных же задачах (например, генерация кода) они обычно ничего выдающегося не показывают и сильно отстают от пресловутого ChatGPT. То есть по факту, возможно, идет подгон под бенчмарк. Поэтому интересна сама природа этих метрик: что и как измеряют самые популярные из них и насколько им следует, на твой взгляд, доверять.
Добрый день а вашу модель можно скачать и потестить на мак ос в ml studio?
Там как раз вроде бы guff если не ошибаюсь
Следующее видео про квантизацию, файл gguf из него - на моем Huggingface
@@ruslandev спасиб
Очень годный контент спасибо.
Спасибо! Очень интересно и весьма наглядно.
Вышла новая часть - Файнтюнинг и квантизация Llama-3-70B ruclips.net/video/ML4M1UQHxbU/видео.html Я обучил самую большую пока Ламу на мультиязычном датасете, и она начала следовать инструкциям на русском. А также я показал процесс квантизации модели с сохранением в формат gguf.
Что за ужасный микрофон.
Всё интересно, квантизация тоже, но также интересует дообучение модели и практические рекомендации по сбору хорошего датасета для русского языка
Руслан, спасибо за твои видео!!!
Да, было бы интересно. Так же было бы интересно стоимости на подобные обучения. и цены на развертывание обученных моделей. к примеру Llama3 8B и Llama3 70B в какую сумму влетит если развернуть на данном сервисе? Заранее спасибо!
Можешь показать, как сделать автономный, эффективный переводчик (чем больше языков, тем лучше, но для начала русский- английский хватило бы)? Какую модель лучше использовать и как?
Я экспериментировал с Llama 3 7b Q8 на Llama.cpp, так и она и Gemma Q8 болеют словоблудием и после правильного ответа начинают рассказывать всякую дичь или повторяют одно и то же. Иногда даже дополняют мой вопрос своими домыслами и на это уже пытаются ответить, но эта проблема исчезает в интерактивном режиме. И так же эта проблема не актуальна в GPT4ALL. Я думаю, что это можно как-то устранить с помощью правильного подбора параметров --temp и --чего-то-там-repeat
Первое предложение автору. Если тебе не хватает денег на те или иные эксперименты, то предлагаю делать краудфандинг. Можно прям тут на ютубе - типа хотите посмотреть на файн-тюнинг и квантизацию llama 3 70b - скидывайте бабосы
Да. Очень интересно! Продолжи пожалуйста по квантизацию и создание gguf
Мужик спасибо. Давно хотел что-то подобное 🔥
да хотим увидеть квантилизацию
Интересно, продолжай в том же духе 👍
Квантизацию модели с последующей конвертацией в GGUF поддерживаю.
Было бы интересно получить инструкцию по дообучения на своих данных. Например у меня есть excel таблица с данными, скормили эту таблицу LLM, а она после отвечает по таблице. Такое возможно?
Это возможно и уже реализовано в некоторых сервисах на основе LLM. Думаю они для этого могут не дообучать исходную модель, а конвертировать данные в векторную форму и хранить в векторной базе данных. Сервис, получая запрос пользователя, выполняет поиск в базе данных и передаёт близкие по смыслу вложения в качестве подсказки модели. На основе запроса, подсказки и собственных данных, модель формирует ответ.