Видео 65
Просмотров 198 822

Как обучить свой GPT-4o - Часть 1 - Бенчмарки

10:18

Файнтюнинг и квантизация Llama-3 70B

13:16

Файнтюнинг на примере Llama 3 + QLoRA. ПРОЩЕ и ЭФФЕКТИВНЕЕ чем когда-либо

10:24

Портирую Grok на Huggingface Transformers. Илон Маск открыл доступ к весам Грок

10:16

Обучаю нейросеть для ВИДЕО методом Sora. Университет Пекина разрабатывает Sora с открытым кодом

10:31

Как обучить нейросеть, на которой работает Sora. Практический гайд по Diffusion Transformer

11:52

Разработка LLM: сбор датасета с помощью GPT-4o | файнтюнинг Llama 3

В этом видео я собираю собственный датасет с помощью GPT-4o и обучаю на нем Llama 3.
Датасет: huggingface.co/datasets/ruslandev/tagengo-subset-gpt-4o
Модель, обученная на датасете: huggingface.co/ruslandev/llama-3-8b-gpt-4o
Установка gptchain и консольные команды для файнтюнинга - @immers.cloud-faintuning-i-kvantizaciya-llama-3-70b
Бенчмарк MT-Bench - @immers.cloud-benchmarki-bolshih-yazykovyh-modelei-multiyazychnyi-mt-bench
💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/
Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров...

Видео

Как обучить свой GPT-4o - Часть 1 - Бенчмарки

10:18

Как обучить свой GPT-4o - Часть 1 - Бенчмарки

Просмотров 1,7 тыс.14 дней назад

В этом видео я рассказываю о способах оценки (evaluation) больших языковых моделей и о новом GPT-4o (Omni). 💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/ Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU). Сервис предлагает кон...

13:16

Файнтюнинг и квантизация Llama-3 70B

Просмотров 1,5 тыс.21 день назад

В этом видео я показываю процесс файнтюнинга Llama 3 70B и квантизации модели с конвертацией в формат GGUF. 💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/ Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU). Сервис предлагает кон...

Файнтюнинг на примере Llama 3 + QLoRA. ПРОЩЕ и ЭФФЕКТИВНЕЕ чем когда-либо

10:24

Файнтюнинг на примере Llama 3 + QLoRA. ПРОЩЕ и ЭФФЕКТИВНЕЕ чем когда-либо

Просмотров 3,2 тыс.Месяц назад

В этом видео я показываю, как выполнить файнтюнинг Llama 3 максимально просто, как настроить GPU и программный стек. 💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/ Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU). Сервис предл...

Портирую Grok на Huggingface Transformers. Илон Маск открыл доступ к весам Грок

10:16

Портирую Grok на Huggingface Transformers. Илон Маск открыл доступ к весам Грок

Просмотров 9102 месяца назад

Телеграм: t.me/ruslandevlive Colab с кодом для запуска Grok в 4bit: colab.research.google.com/drive/1dAVYndwwH8Ir6mPy7BBblvFFzZ05TTRt?usp=sharing Код, взятый за основу, и веса в формате Pytorch: huggingface.co/keyfan/grok-1-hf

Обучаю нейросеть для ВИДЕО методом Sora. Университет Пекина разрабатывает Sora с открытым кодом

10:31

Обучаю нейросеть для ВИДЕО методом Sora. Университет Пекина разрабатывает Sora с открытым кодом

Просмотров 1,1 тыс.3 месяца назад

Телеграм: t.me/ruslandevlive Colab с кодом для обучения: colab.research.google.com/drive/1wWqvTUNkD5itXyjwU_a7gaWePNZHA4X5?usp=sharing Latte: github.com/Vchitect/Latte Проект Пекинского университета (Open Sora): github.com/PKU-YuanGroup/Open-Sora-Plan Статья про ViT: arxiv.org/abs/2010.11929

Как обучить нейросеть, на которой работает Sora. Практический гайд по Diffusion Transformer

11:52

Как обучить нейросеть, на которой работает Sora. Практический гайд по Diffusion Transformer

Просмотров 2,3 тыс.3 месяца назад

Телеграм: t.me/ruslandevlive Colab с кодом для файнтюнинга - colab.research.google.com/drive/1kqy_IO_HzKwTeIUnmk-e_2-bi3AVyIp9 Sora (технический отчет) openai.com/research/video-generation-models-as-world-simulators Diffusion Transformers github.com/facebookresearch/DiT MaskDiT github.com/Anima-Lab/MaskDiT

Discord бот для распознавания речи на лету - Whisper, RTP/UDP

20:53

Discord бот для распознавания речи на лету - Whisper, RTP/UDP

Просмотров 6954 месяца назад

В виде продолжения одного из моих старых видео по распознаванию речи с помощью модели Whisper я сделал пошаговый разбор передачи аудио по RTP/UDP с распознаванием в реальном времени. Мой брат Александр помог с кодом Discord бота на Golang. Исходный код: github.com/RuslanPeresy/voicertp Телеграм: t.me/ruslandevlive

12:37

Планы, тренды AI и зимний Гонконг

Просмотров 6635 месяцев назад

Всем привет, всех с Новым Годом! В этом видео я рассказал о любопытных тенденциях в AI, которые могут задать направление развития индустрии на 2024 год. А заодно показал замечательные виды Гонконга, который я посетил во время новогодних праздников. Приятного просмотра! Телеграм-канал: t.me/ruslandevlive AppAgent: appagent-official.github.io/ CogAgent & CogVLM: github.com/THUDM/CogVLM LivePhoto:...

AI бот для Телеграм - подробное руководство. Python, Langchain, Llama2 + деплой и API

36:20

AI бот для Телеграм - подробное руководство. Python, Langchain, Llama2 + деплой и API

Просмотров 3,2 тыс.6 месяцев назад

Всем привет! 🔔 Сначала подпишись: youtube.com/@ruslandev/?sub_confirmation=1 Это - вторая часть гайда по разработке ИИ бота для Телеграм. Предыдущее видео - ruclips.net/video/OGu_fbSV_uI/видео.html Здесь я собрал всю самую важную информацию для разработчиков о том, как использовать мощный функционал ИИ технологий HuggingFace и библиотеки Langchain для создания ботов. 00:00 - Введение 0:32 - Обл...

Глава OpenAI уходит в Microsoft - будет ли GPT-5? Минусы Assistants API

8:16

Глава OpenAI уходит в Microsoft - будет ли GPT-5? Минусы Assistants API

Просмотров 1 тыс.6 месяцев назад

Всем привет, как сегодня стало известно, глава OpenAI Cэм Альтман и сооснователь Грег Брокман уходят в Microsoft, в связи с чем возникает вопрос, что будет с GPT-5 и дальнейшим развитием платформы? В этом видео я поделился своими мыслями об этом, а также о минусах OpenAI Assistants API. Подписывайтесь на мой Телеграм канал: t.me/ruslandevlive

I found a BUG in GPT-4 Vision... AI haven't passed the street art challenge

9:57

I found a BUG in GPT-4 Vision... AI haven't passed the street art challenge

Просмотров 1 тыс.7 месяцев назад

Всем привет, такого вы еще не видели - GPT-4V(ision), ИИ зрение - пытается анализировать уличную живопись в Малайзии. Телеграм: t.me/ruslandevlive Музыка: "Savfk - The Travelling Symphony" is under a Creative Commons Attribution 4.0 International License (CC BY 4.0) ruclips.net/user/savfkmusic Music promoted by BreakingCopyright: bit.ly/the-travelling-symphony-song

OPENAI ASSISTANTS API: Теперь создавать ИИ помощников НАМНОГО проще | Обновления OpenAI DevDay

11:30

OPENAI ASSISTANTS API: Теперь создавать ИИ помощников НАМНОГО проще | Обновления OpenAI DevDay

Просмотров 5 тыс.7 месяцев назад

🔔 Сначала подпишись: youtube.com/@ruslandev/?sub_confirmation=1 Всем привет, это видео я записал по итогам OpenAI DevDay, их первой конференции для разработчиков, которая действительно обещает рассвет ИИ разработки. Я сделал обзор с примерами кода на самое привлекательное для программистов обновление: Assistants API с доступом к Code Interpreter, Retrieval и Function calling. В видео я показыва...

Bus travel across Malaysia. The life of a digital nomad

17:19

Bus travel across Malaysia. The life of a digital nomad

Просмотров 2947 месяцев назад

Всем привет! Нельзя все время программировать - когда я не программирую, я путешествую. Смотрите лучшие кадры из моего путешествия по Малайзии. В этом видео вы найдете информацию, полезную для цифрового кочевника. Приятного просмотра, подписывайтесь на мой телеграм-канал: t.me/ruslandevlive Музыка: "yangkaiji - Emperor's Battle" is under a Creative Commons (CC BY-SA 3.0) license. soundcloud.com...

2:34

Поигрался с CodeLlama

Просмотров 4709 месяцев назад

Поигрался с CodeLlama

Я написал свой Code Interpreter. Телеграм бот на LangChain и опенсорсных ИИ моделях

14:03

Я написал свой Code Interpreter. Телеграм бот на LangChain и опенсорсных ИИ моделях

Просмотров 2,8 тыс.10 месяцев назад

Я написал свой Code Interpreter. Телеграм бот на LangChain и опенсорсных ИИ моделях

4:09

Threads. Обзор приложения

Просмотров 50811 месяцев назад

Threads. Обзор приложения

Пример ИИ приложения на Python, LangChain и ChatGPT (OpenAI API)

15:38

Пример ИИ приложения на Python, LangChain и ChatGPT (OpenAI API)

Просмотров 6 тыс.11 месяцев назад

Пример ИИ приложения на Python, LangChain и ChatGPT (OpenAI API)

QLoRA: обучал нейросеть 20 ЧАСОВ В GOOGLE COLAB на РУССКОМ ДАТАСЕТЕ. Впечатляет

9:26

QLoRA: обучал нейросеть 20 ЧАСОВ В GOOGLE COLAB на РУССКОМ ДАТАСЕТЕ. Впечатляет

Просмотров 9 тыс.11 месяцев назад

QLoRA: обучал нейросеть 20 ЧАСОВ В GOOGLE COLAB на РУССКОМ ДАТАСЕТЕ. Впечатляет

Уехал на Филиппины. Черногория пересмотрит дело

5:58

Уехал на Филиппины. Черногория пересмотрит дело

Просмотров 432Год назад

Уехал на Филиппины. Черногория пересмотрит дело

Montenegro: corrupt police tried to extort me for money

8:41

Montenegro: corrupt police tried to extort me for money

Просмотров 1,3 тыс.Год назад

Montenegro: corrupt police tried to extort me for money

Новый ИИ монстр от OpenAI - ChatGPT пишет код на C++ и Fortran

7:39

Новый ИИ монстр от OpenAI - ChatGPT пишет код на C++ и Fortran

Просмотров 4 тыс.Год назад

Новый ИИ монстр от OpenAI - ChatGPT пишет код на C и Fortran

OpenAI Whisper: новая модель распознавания речи. Discord бот на Whisper & GPT-3, часть 1

18:13

OpenAI Whisper: новая модель распознавания речи. Discord бот на Whisper & GPT-3, часть 1

Просмотров 3,5 тыс.Год назад

OpenAI Whisper: новая модель распознавания речи. Discord бот на Whisper & GPT-3, часть 1

Python + GPT-3 = The Very First Streaming Bot on YouTube

29:21

Python + GPT-3 = The Very First Streaming Bot on YouTube

Просмотров 1 тыс.Год назад

Python GPT-3 = The Very First Streaming Bot on RUclips

Переехал в Черногорию. IT эмиграция: что иметь в виду

4:28

Переехал в Черногорию. IT эмиграция: что иметь в виду

Просмотров 1,5 тыс.Год назад

Переехал в Черногорию. IT эмиграция: что иметь в виду

Python и базы данных. SqlAlchemy. Сессия

16:47

Python и базы данных. SqlAlchemy. Сессия

Просмотров 2,4 тыс.3 года назад

Python и базы данных. SqlAlchemy. Сессия

Python и базы данных. SqlAlchemy. Query, Join, lazy loading

21:58

Python и базы данных. SqlAlchemy. Query, Join, lazy loading

Просмотров 3,4 тыс.3 года назад

Python и базы данных. SqlAlchemy. Query, Join, lazy loading

Python и базы данных. SqlAlchemy. Relationships, первичный и вторичный ключи

16:53

Python и базы данных. SqlAlchemy. Relationships, первичный и вторичный ключи

Просмотров 7 тыс.3 года назад

Python и базы данных. SqlAlchemy. Relationships, первичный и вторичный ключи

Python и базы данных. SqlAlchemy. Введение

21:46

Python и базы данных. SqlAlchemy. Введение

Просмотров 2,7 тыс.3 года назад

Python и базы данных. SqlAlchemy. Введение

REST API (Python): Админ-панель. Часть 3 - декоратор для ограничения доступа к админке

15:37

REST API (Python): Админ-панель. Часть 3 - декоратор для ограничения доступа к админке

Просмотров 1 тыс.3 года назад

REST API (Python): Админ-панель. Часть 3 - декоратор для ограничения доступа к админке

@TheMr0day 14 часов назад
Руслан, в очередной раз спасибо за то, что делишься столь полезной практической информацией! Если есть возможность, то расскажи насколько глубоко зашита цензура в llama 3 и насколько сложно изменить ее зацензуренный ответ на дообучении. Также еще хотелось бы увидеть промпты, которые во время бенчмарка были оценены низко, то есть GPT4 считает, что твоя модель не справилась с ответом. Это поможет понять слабые темы модели. А еще, возвращаясь к цензуре, у самой GPT4 хватает табуированных тем и она может ставить 1, даже если твоя модель ответила верно. Потом, если спросить GPT4, почему она оценила ответ на 1, то она скажет, что вообще на этот вопрос (по ее мнению) ответа давать нельзя, потому и 1. А это может снижать общую оценку бенчмарка из-за того, что сам арбитр весьма такой себе.
@user-ey2vv1dl3n 17 часов назад
а можно видео фантюна на каком нибудь кондовом железе, типа связки двух 3090 или 3 ох P40
@mr.grixakrushkas5667 18 часов назад
Про файнтюнинг нейронок для картинок будет? Там как раз SD3 вышла.
@stepanfilonov 19 часов назад
Молодец, хороший контент
@pacman777 5 дней назад
привет, hi, it's not clear. This is probably an advertisement for those in the know.нихера непонятно. Наверно это реклама или что?
@user-dk2uc6dx8k 13 дней назад
@pavelsavelev880 Напишу как собственник и бизнесмен (и родитель, обучающий СВОИХ детей, а не чужих). Когда Coplot подсказывает программисту продолжение кода, он использует не код Microsoft (это табу и жлобство), а код, ранее написанный другими (глупыми) программистами. Создалась среда "бес-собственности" (бессовестности), которая уже погубила души программистов и программирование. За программистов код пишет (точнее, использует ранее написанный чужой код) ChatGPT, а программисты выдают код за свой (и получают денежки от глупого Заказчика). Это временно и это чувствуют уже все, и боятся. По динамике последней сотни лет в 2060 году исчезнет последний работник, производящий материальные ценности. Уже сегодня 2/3 трудоспособного населения оказывают друг другу услуги (типа массажа и написания кода). Деньги, прибыль потеряли всякий экономический смысл (цены в магазинах назначаются политически).
@toster8240 14 дней назад
С нетерпением ждём следующее видео!
@toster8240 14 дней назад
Просто супер! Посмотрел с огромным удовольствием!
@leoniddzhabiev 14 дней назад
спасибо
@leoniddzhabiev 15 дней назад
спасибо. это нужное видео
@user-rc6ze3ue3v 15 дней назад
Привет 👋 было бы круто если бы она в конце ответа не как обычно говорила бы чем ещё помочь а сначала бы предложила свой собственный вопрос для продления темы которая рассказывала только что, что бы вопрос её был на столько интересным от которого не возможно было-бы удержатся и сказать ей , да я хочу знать ответ на этот вопрос , тем самым она могла бы затягивать общение все глубже и обширней в той теме которая началась из начально !)
@dosmc241 15 дней назад
Старательный парнишка, странный контент. Чего мы своего разработали так и не ясно. Это называется нерелевантный заголовок
@leoniddzhabiev 15 дней назад
хорошее видео, спасибо
@galandec2000 15 дней назад
было бы супер, до обучить Llama3 русскому. вы ее потом выбросите в отрытый доступ после до обучения?
@ruslandev 15 дней назад
если все получится с датасетом и обучением - да, веса выложу
@user-iz9sj1nn5q 16 дней назад
1:21
@goga-pro2024 16 дней назад
расскажите пожалуйста как в LLM на вход подавать картинки и звук, чтоб обучать её на этом датасете...
@ruslandev 15 дней назад
Пока есть только видео по DiT (Sora) - файнтюнинг на изображениях и видеоданных, здесь на канале. Возможно сделаю еще про распознавание изображений
@topodin 16 дней назад
спасибо, полезное видео
@user-cc2lp9tz7r 16 дней назад
Главная фишка 4o в том что она быстро работает с голосом и картинками. Что бы обучить аналог GPT-4o одного только текста не достаточно. Нужен ещё дата-сет с аудио и видео (картинками). Естественно для этого понадобится работать с мультимодальной моделью типа Reka Core. Так что тема ролика в твоём видео не раскрыта.
@ruslandev 16 дней назад
"Нативная" мультимодальность GPT-4o - это пока только слухи. Будет технический отчёт об архитектуре модели, будет и обзор на него. А это видео о том, как использовать текстовый инференс этой модели для файнтюнинга.
@user-dk2uc6dx8k 16 дней назад
Что значит "свой"? То есть мы обучаем GPT, но работаем на дядю. А он даже спасибо не скажет.
@pavelsavelev880 14 дней назад
Насколько я понял, ChatGPT обучается в рамках частной сессии. Temporary? А сама модель глобально обучается лишь со стороны open ai
@user-dk2uc6dx8k 14 дней назад
@pavelsavelev880 Напишу как собственник и бизнесмен (и родитель, обучающий СВОИХ детей, а не чужих). Когда Coplot подсказывает программисту продолжение кода, он использует не код Microsoft (это табу), а код, ранее написанный другими глупыми программистами. Создалась среда "бес-собственности" (бессовестности), которая уже погубила души программистов и программирование. За программистов код пишет (то есть использует ранее написанный код) ChatGPT, а программисты выдают код за свой (и получают денежки от глупого Заказчика). Это временно и это чувствуют все, и боятся. По динамике последней сотни лет в 2060 году исчезнет последний работник, производящий материальные ценности. Уже сегодня 2/3 трудоспособного населения оказывают друг другу услуги (типа массажа и написания кода). Деньги, прибыль потеряли всякий экономический смысл (цены в магазинах назначаются политически).
@user-ed1rs5ph3u 16 дней назад
Как хорошо что ты делаешь тавие ролики.
@user-sy5mv8cu7v 16 дней назад
Да это интересно. Спасибо за Вашу работу.
@topodin 21 день назад
Спасибо. Есть ли команда чтобы приостановить файнтюнинг, сохранить состояние модели, а затем команда чтобы продолжить файнтюнинг с места остановки?
@ruslandev 20 дней назад
файнтюнинг - непрерывный процесс, но каждые 500 шагов автоматически создается чекпоинт
@topodin 17 дней назад
@@ruslandev спасибо вам, понял
@alex_great23 23 дня назад
прегонишь в gguf llama-3-8b-samantha модель?
@ruslandev 16 дней назад
В gptchain есть команда с инструкцией, можешь сам сконвертировать
@alex_great23 16 дней назад
@@ruslandevну я в обучении не разбираюсь сори.
@alex_great23 23 дня назад
эта модель запустится на 3080ti 32г оперативы или не хватит? у меня есть 64г но нет свободных слотов в материнке(
@alex_great23 23 дня назад
не нехватает оперативки. жаль чуть меньше не создал модель.
@user-ed1rs5ph3u 23 дня назад
Ну надо пробовать что получилось
@AlekseyIT 24 дня назад
Что Вы знаете о rugtp? Есть смысл смотреть в её сторону или лучше взять lama3 и попробовать дообучить на русском датасете? Было бы интересно узнать, как создать самому датасет в рамках какого-то домена знаний? Например, взяв литературу по определённой тематике.
@ruslandev 24 дня назад
лучше взять llama 3 в репозитории датасета из этого видео - tagengo есть код, с помощью которого этот датасет был создан через запросы к gpt-4
@noino5458 24 дня назад
Может скинемся денюжкой на обучение? А после уже получим результат для общественности?
@galandec2000 24 дня назад
дождались!😁спасибо!
@TheMr0day 24 дня назад
Спасибо за видео! Стали примерно понятны время и бюджеты, необходимых для дообучения таких больших моделей как 70B. Что касается метрик, то хотелось бы подробнее узнать про эти самые метрики, по которым сравниваются LLM и строятся всяческие топы моделей, например на Huggingface. Потому что по определенным бенчмаркам в топе зачастую вижу малоизвестные открытые модели (чаще всего дообученная llama), которые вроде там заявляются чуть ли не на уровне ChatGPT 4. В реальных же задачах (например, генерация кода) они обычно ничего выдающегося не показывают и сильно отстают от пресловутого ChatGPT. То есть по факту, возможно, идет подгон под бенчмарк. Поэтому интересна сама природа этих метрик: что и как измеряют самые популярные из них и насколько им следует, на твой взгляд, доверять.
@toto_ro_ro 24 дня назад
Добрый день а вашу модель можно скачать и потестить на мак ос в ml studio?
@toto_ro_ro 24 дня назад
Там как раз вроде бы guff если не ошибаюсь
@ruslandev 24 дня назад
Следующее видео про квантизацию, файл gguf из него - на моем Huggingface
@toto_ro_ro 23 дня назад
@@ruslandev спасиб
@f_cklive1572 24 дня назад
Очень годный контент спасибо.
@toster8240 24 дня назад
Спасибо! Очень интересно и весьма наглядно.
@ruslandev 24 дня назад
Вышла новая часть - Файнтюнинг и квантизация Llama-3-70B ruclips.net/video/ML4M1UQHxbU/видео.html Я обучил самую большую пока Ламу на мультиязычном датасете, и она начала следовать инструкциям на русском. А также я показал процесс квантизации модели с сохранением в формат gguf.
@I-love-GO-and-PHP 25 дней назад
Что за ужасный микрофон.
@softgpt 26 дней назад
Всё интересно, квантизация тоже, но также интересует дообучение модели и практические рекомендации по сбору хорошего датасета для русского языка
@dinissaet9578 26 дней назад
Руслан, спасибо за твои видео!!!
@galandec2000 28 дней назад
Да, было бы интересно. Так же было бы интересно стоимости на подобные обучения. и цены на развертывание обученных моделей. к примеру Llama3 8B и Llama3 70B в какую сумму влетит если развернуть на данном сервисе? Заранее спасибо!
@user-sc4cs9sp6g Месяц назад
Можешь показать, как сделать автономный, эффективный переводчик (чем больше языков, тем лучше, но для начала русский- английский хватило бы)? Какую модель лучше использовать и как?
@user-sc4cs9sp6g Месяц назад
Я экспериментировал с Llama 3 7b Q8 на Llama.cpp, так и она и Gemma Q8 болеют словоблудием и после правильного ответа начинают рассказывать всякую дичь или повторяют одно и то же. Иногда даже дополняют мой вопрос своими домыслами и на это уже пытаются ответить, но эта проблема исчезает в интерактивном режиме. И так же эта проблема не актуальна в GPT4ALL. Я думаю, что это можно как-то устранить с помощью правильного подбора параметров --temp и --чего-то-там-repeat
@user-sc4cs9sp6g Месяц назад
Первое предложение автору. Если тебе не хватает денег на те или иные эксперименты, то предлагаю делать краудфандинг. Можно прям тут на ютубе - типа хотите посмотреть на файн-тюнинг и квантизацию llama 3 70b - скидывайте бабосы
@ValentinYefimov Месяц назад
Да. Очень интересно! Продолжи пожалуйста по квантизацию и создание gguf
@user-qv6ph1bt6l Месяц назад
Мужик спасибо. Давно хотел что-то подобное 🔥
@goga-pro2024 Месяц назад
да хотим увидеть квантилизацию
@snowiedigga Месяц назад
Интересно, продолжай в том же духе 👍
@unzerror8208 Месяц назад
Квантизацию модели с последующей конвертацией в GGUF поддерживаю.
@noino5458 Месяц назад
Было бы интересно получить инструкцию по дообучения на своих данных. Например у меня есть excel таблица с данными, скормили эту таблицу LLM, а она после отвечает по таблице. Такое возможно?
@vlad-n-ag Месяц назад
Это возможно и уже реализовано в некоторых сервисах на основе LLM. Думаю они для этого могут не дообучать исходную модель, а конвертировать данные в векторную форму и хранить в векторной базе данных. Сервис, получая запрос пользователя, выполняет поиск в базе данных и передаёт близкие по смыслу вложения в качестве подсказки модели. На основе запроса, подсказки и собственных данных, модель формирует ответ.

Ruslan Dev

Видео

Комментарии