Ruslan Dev
Ruslan Dev
  • Видео 65
  • Просмотров 198 822
Разработка LLM: сбор датасета с помощью GPT-4o | файнтюнинг Llama 3
В этом видео я собираю собственный датасет с помощью GPT-4o и обучаю на нем Llama 3.
Датасет: huggingface.co/datasets/ruslandev/tagengo-subset-gpt-4o
Модель, обученная на датасете: huggingface.co/ruslandev/llama-3-8b-gpt-4o
Установка gptchain и консольные команды для файнтюнинга - @immers.cloud-faintuning-i-kvantizaciya-llama-3-70b
Бенчмарк MT-Bench - @immers.cloud-benchmarki-bolshih-yazykovyh-modelei-multiyazychnyi-mt-bench
💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/
Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров...
Просмотров: 389

Видео

Как обучить свой GPT-4o - Часть 1 - Бенчмарки
Просмотров 1,7 тыс.14 дней назад
В этом видео я рассказываю о способах оценки (evaluation) больших языковых моделей и о новом GPT-4o (Omni). 💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/ Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU). Сервис предлагает кон...
Файнтюнинг и квантизация Llama-3 70B
Просмотров 1,5 тыс.21 день назад
В этом видео я показываю процесс файнтюнинга Llama 3 70B и квантизации модели с конвертацией в формат GGUF. 💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/ Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU). Сервис предлагает кон...
Файнтюнинг на примере Llama 3 + QLoRA. ПРОЩЕ и ЭФФЕКТИВНЕЕ чем когда-либо
Просмотров 3,2 тыс.Месяц назад
В этом видео я показываю, как выполнить файнтюнинг Llama 3 максимально просто, как настроить GPU и программный стек. 💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/20240424-3934851-128/ Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU). Сервис предл...
Портирую Grok на Huggingface Transformers. Илон Маск открыл доступ к весам Грок
Просмотров 9102 месяца назад
Телеграм: t.me/ruslandevlive Colab с кодом для запуска Grok в 4bit: colab.research.google.com/drive/1dAVYndwwH8Ir6mPy7BBblvFFzZ05TTRt?usp=sharing Код, взятый за основу, и веса в формате Pytorch: huggingface.co/keyfan/grok-1-hf
Обучаю нейросеть для ВИДЕО методом Sora. Университет Пекина разрабатывает Sora с открытым кодом
Просмотров 1,1 тыс.3 месяца назад
Телеграм: t.me/ruslandevlive Colab с кодом для обучения: colab.research.google.com/drive/1wWqvTUNkD5itXyjwU_a7gaWePNZHA4X5?usp=sharing Latte: github.com/Vchitect/Latte Проект Пекинского университета (Open Sora): github.com/PKU-YuanGroup/Open-Sora-Plan Статья про ViT: arxiv.org/abs/2010.11929
Как обучить нейросеть, на которой работает Sora. Практический гайд по Diffusion Transformer
Просмотров 2,3 тыс.3 месяца назад
Телеграм: t.me/ruslandevlive Colab с кодом для файнтюнинга - colab.research.google.com/drive/1kqy_IO_HzKwTeIUnmk-e_2-bi3AVyIp9 Sora (технический отчет) openai.com/research/video-generation-models-as-world-simulators Diffusion Transformers github.com/facebookresearch/DiT MaskDiT github.com/Anima-Lab/MaskDiT
Discord бот для распознавания речи на лету - Whisper, RTP/UDP
Просмотров 6954 месяца назад
В виде продолжения одного из моих старых видео по распознаванию речи с помощью модели Whisper я сделал пошаговый разбор передачи аудио по RTP/UDP с распознаванием в реальном времени. Мой брат Александр помог с кодом Discord бота на Golang. Исходный код: github.com/RuslanPeresy/voicertp Телеграм: t.me/ruslandevlive
Планы, тренды AI и зимний Гонконг
Просмотров 6635 месяцев назад
Всем привет, всех с Новым Годом! В этом видео я рассказал о любопытных тенденциях в AI, которые могут задать направление развития индустрии на 2024 год. А заодно показал замечательные виды Гонконга, который я посетил во время новогодних праздников. Приятного просмотра! Телеграм-канал: t.me/ruslandevlive AppAgent: appagent-official.github.io/ CogAgent & CogVLM: github.com/THUDM/CogVLM LivePhoto:...
AI бот для Телеграм - подробное руководство. Python, Langchain, Llama2 + деплой и API
Просмотров 3,2 тыс.6 месяцев назад
Всем привет! 🔔 Сначала подпишись: youtube.com/@ruslandev/?sub_confirmation=1 Это - вторая часть гайда по разработке ИИ бота для Телеграм. Предыдущее видео - ruclips.net/video/OGu_fbSV_uI/видео.html Здесь я собрал всю самую важную информацию для разработчиков о том, как использовать мощный функционал ИИ технологий HuggingFace и библиотеки Langchain для создания ботов. 00:00 - Введение 0:32 - Обл...
Глава OpenAI уходит в Microsoft - будет ли GPT-5? Минусы Assistants API
Просмотров 1 тыс.6 месяцев назад
Всем привет, как сегодня стало известно, глава OpenAI Cэм Альтман и сооснователь Грег Брокман уходят в Microsoft, в связи с чем возникает вопрос, что будет с GPT-5 и дальнейшим развитием платформы? В этом видео я поделился своими мыслями об этом, а также о минусах OpenAI Assistants API. Подписывайтесь на мой Телеграм канал: t.me/ruslandevlive
I found a BUG in GPT-4 Vision... AI haven't passed the street art challenge
Просмотров 1 тыс.7 месяцев назад
Всем привет, такого вы еще не видели - GPT-4V(ision), ИИ зрение - пытается анализировать уличную живопись в Малайзии. Телеграм: t.me/ruslandevlive Музыка: "Savfk - The Travelling Symphony" is under a Creative Commons Attribution 4.0 International License (CC BY 4.0) ruclips.net/user/savfkmusic Music promoted by BreakingCopyright: bit.ly/the-travelling-symphony-song
OPENAI ASSISTANTS API: Теперь создавать ИИ помощников НАМНОГО проще | Обновления OpenAI DevDay
Просмотров 5 тыс.7 месяцев назад
🔔 Сначала подпишись: youtube.com/@ruslandev/?sub_confirmation=1 Всем привет, это видео я записал по итогам OpenAI DevDay, их первой конференции для разработчиков, которая действительно обещает рассвет ИИ разработки. Я сделал обзор с примерами кода на самое привлекательное для программистов обновление: Assistants API с доступом к Code Interpreter, Retrieval и Function calling. В видео я показыва...
Bus travel across Malaysia. The life of a digital nomad
Просмотров 2947 месяцев назад
Всем привет! Нельзя все время программировать - когда я не программирую, я путешествую. Смотрите лучшие кадры из моего путешествия по Малайзии. В этом видео вы найдете информацию, полезную для цифрового кочевника. Приятного просмотра, подписывайтесь на мой телеграм-канал: t.me/ruslandevlive Музыка: "yangkaiji - Emperor's Battle" is under a Creative Commons (CC BY-SA 3.0) license. soundcloud.com...
Поигрался с CodeLlama
Просмотров 4709 месяцев назад
Поигрался с CodeLlama
Я написал свой Code Interpreter. Телеграм бот на LangChain и опенсорсных ИИ моделях
Просмотров 2,8 тыс.10 месяцев назад
Я написал свой Code Interpreter. Телеграм бот на LangChain и опенсорсных ИИ моделях
Threads. Обзор приложения
Просмотров 50811 месяцев назад
Threads. Обзор приложения
Пример ИИ приложения на Python, LangChain и ChatGPT (OpenAI API)
Просмотров 6 тыс.11 месяцев назад
Пример ИИ приложения на Python, LangChain и ChatGPT (OpenAI API)
QLoRA: обучал нейросеть 20 ЧАСОВ В GOOGLE COLAB на РУССКОМ ДАТАСЕТЕ. Впечатляет
Просмотров 9 тыс.11 месяцев назад
QLoRA: обучал нейросеть 20 ЧАСОВ В GOOGLE COLAB на РУССКОМ ДАТАСЕТЕ. Впечатляет
Уехал на Филиппины. Черногория пересмотрит дело
Просмотров 432Год назад
Уехал на Филиппины. Черногория пересмотрит дело
Montenegro: corrupt police tried to extort me for money
Просмотров 1,3 тыс.Год назад
Montenegro: corrupt police tried to extort me for money
Новый ИИ монстр от OpenAI - ChatGPT пишет код на C++ и Fortran
Просмотров 4 тыс.Год назад
Новый ИИ монстр от OpenAI - ChatGPT пишет код на C и Fortran
OpenAI Whisper: новая модель распознавания речи. Discord бот на Whisper & GPT-3, часть 1
Просмотров 3,5 тыс.Год назад
OpenAI Whisper: новая модель распознавания речи. Discord бот на Whisper & GPT-3, часть 1
Python + GPT-3 = The Very First Streaming Bot on YouTube
Просмотров 1 тыс.Год назад
Python GPT-3 = The Very First Streaming Bot on RUclips
Переехал в Черногорию. IT эмиграция: что иметь в виду
Просмотров 1,5 тыс.Год назад
Переехал в Черногорию. IT эмиграция: что иметь в виду
Python и базы данных. SqlAlchemy. Сессия
Просмотров 2,4 тыс.3 года назад
Python и базы данных. SqlAlchemy. Сессия
Python и базы данных. SqlAlchemy. Query, Join, lazy loading
Просмотров 3,4 тыс.3 года назад
Python и базы данных. SqlAlchemy. Query, Join, lazy loading
Python и базы данных. SqlAlchemy. Relationships, первичный и вторичный ключи
Просмотров 7 тыс.3 года назад
Python и базы данных. SqlAlchemy. Relationships, первичный и вторичный ключи
Python и базы данных. SqlAlchemy. Введение
Просмотров 2,7 тыс.3 года назад
Python и базы данных. SqlAlchemy. Введение
REST API (Python): Админ-панель. Часть 3 - декоратор для ограничения доступа к админке
Просмотров 1 тыс.3 года назад
REST API (Python): Админ-панель. Часть 3 - декоратор для ограничения доступа к админке

Комментарии

  • @TheMr0day
    @TheMr0day 14 часов назад

    Руслан, в очередной раз спасибо за то, что делишься столь полезной практической информацией! Если есть возможность, то расскажи насколько глубоко зашита цензура в llama 3 и насколько сложно изменить ее зацензуренный ответ на дообучении. Также еще хотелось бы увидеть промпты, которые во время бенчмарка были оценены низко, то есть GPT4 считает, что твоя модель не справилась с ответом. Это поможет понять слабые темы модели. А еще, возвращаясь к цензуре, у самой GPT4 хватает табуированных тем и она может ставить 1, даже если твоя модель ответила верно. Потом, если спросить GPT4, почему она оценила ответ на 1, то она скажет, что вообще на этот вопрос (по ее мнению) ответа давать нельзя, потому и 1. А это может снижать общую оценку бенчмарка из-за того, что сам арбитр весьма такой себе.

  • @user-ey2vv1dl3n
    @user-ey2vv1dl3n 17 часов назад

    а можно видео фантюна на каком нибудь кондовом железе, типа связки двух 3090 или 3 ох P40

  • @mr.grixakrushkas5667
    @mr.grixakrushkas5667 18 часов назад

    Про файнтюнинг нейронок для картинок будет? Там как раз SD3 вышла.

  • @stepanfilonov
    @stepanfilonov 19 часов назад

    Молодец, хороший контент

  • @pacman777
    @pacman777 5 дней назад

    привет, hi, it's not clear. This is probably an advertisement for those in the know.нихера непонятно. Наверно это реклама или что?

  • @user-dk2uc6dx8k
    @user-dk2uc6dx8k 13 дней назад

    @pavelsavelev880 Напишу как собственник и бизнесмен (и родитель, обучающий СВОИХ детей, а не чужих). Когда Coplot подсказывает программисту продолжение кода, он использует не код Microsoft (это табу и жлобство), а код, ранее написанный другими (глупыми) программистами. Создалась среда "бес-собственности" (бессовестности), которая уже погубила души программистов и программирование. За программистов код пишет (точнее, использует ранее написанный чужой код) ChatGPT, а программисты выдают код за свой (и получают денежки от глупого Заказчика). Это временно и это чувствуют уже все, и боятся. По динамике последней сотни лет в 2060 году исчезнет последний работник, производящий материальные ценности. Уже сегодня 2/3 трудоспособного населения оказывают друг другу услуги (типа массажа и написания кода). Деньги, прибыль потеряли всякий экономический смысл (цены в магазинах назначаются политически).

  • @toster8240
    @toster8240 14 дней назад

    С нетерпением ждём следующее видео!

  • @toster8240
    @toster8240 14 дней назад

    Просто супер! Посмотрел с огромным удовольствием!

  • @leoniddzhabiev
    @leoniddzhabiev 14 дней назад

    спасибо

  • @leoniddzhabiev
    @leoniddzhabiev 15 дней назад

    спасибо. это нужное видео

  • @user-rc6ze3ue3v
    @user-rc6ze3ue3v 15 дней назад

    Привет 👋 было бы круто если бы она в конце ответа не как обычно говорила бы чем ещё помочь а сначала бы предложила свой собственный вопрос для продления темы которая рассказывала только что, что бы вопрос её был на столько интересным от которого не возможно было-бы удержатся и сказать ей , да я хочу знать ответ на этот вопрос , тем самым она могла бы затягивать общение все глубже и обширней в той теме которая началась из начально !)

  • @dosmc241
    @dosmc241 15 дней назад

    Старательный парнишка, странный контент. Чего мы своего разработали так и не ясно. Это называется нерелевантный заголовок

  • @leoniddzhabiev
    @leoniddzhabiev 15 дней назад

    хорошее видео, спасибо

  • @galandec2000
    @galandec2000 15 дней назад

    было бы супер, до обучить Llama3 русскому. вы ее потом выбросите в отрытый доступ после до обучения?

    • @ruslandev
      @ruslandev 15 дней назад

      если все получится с датасетом и обучением - да, веса выложу

  • @user-iz9sj1nn5q
    @user-iz9sj1nn5q 16 дней назад

    1:21

  • @goga-pro2024
    @goga-pro2024 16 дней назад

    расскажите пожалуйста как в LLM на вход подавать картинки и звук, чтоб обучать её на этом датасете...

    • @ruslandev
      @ruslandev 15 дней назад

      Пока есть только видео по DiT (Sora) - файнтюнинг на изображениях и видеоданных, здесь на канале. Возможно сделаю еще про распознавание изображений

  • @topodin
    @topodin 16 дней назад

    спасибо, полезное видео

  • @user-cc2lp9tz7r
    @user-cc2lp9tz7r 16 дней назад

    Главная фишка 4o в том что она быстро работает с голосом и картинками. Что бы обучить аналог GPT-4o одного только текста не достаточно. Нужен ещё дата-сет с аудио и видео (картинками). Естественно для этого понадобится работать с мультимодальной моделью типа Reka Core. Так что тема ролика в твоём видео не раскрыта.

    • @ruslandev
      @ruslandev 16 дней назад

      "Нативная" мультимодальность GPT-4o - это пока только слухи. Будет технический отчёт об архитектуре модели, будет и обзор на него. А это видео о том, как использовать текстовый инференс этой модели для файнтюнинга.

  • @user-dk2uc6dx8k
    @user-dk2uc6dx8k 16 дней назад

    Что значит "свой"? То есть мы обучаем GPT, но работаем на дядю. А он даже спасибо не скажет.

    • @pavelsavelev880
      @pavelsavelev880 14 дней назад

      Насколько я понял, ChatGPT обучается в рамках частной сессии. Temporary? А сама модель глобально обучается лишь со стороны open ai

    • @user-dk2uc6dx8k
      @user-dk2uc6dx8k 14 дней назад

      @pavelsavelev880 Напишу как собственник и бизнесмен (и родитель, обучающий СВОИХ детей, а не чужих). Когда Coplot подсказывает программисту продолжение кода, он использует не код Microsoft (это табу), а код, ранее написанный другими глупыми программистами. Создалась среда "бес-собственности" (бессовестности), которая уже погубила души программистов и программирование. За программистов код пишет (то есть использует ранее написанный код) ChatGPT, а программисты выдают код за свой (и получают денежки от глупого Заказчика). Это временно и это чувствуют все, и боятся. По динамике последней сотни лет в 2060 году исчезнет последний работник, производящий материальные ценности. Уже сегодня 2/3 трудоспособного населения оказывают друг другу услуги (типа массажа и написания кода). Деньги, прибыль потеряли всякий экономический смысл (цены в магазинах назначаются политически).

  • @user-ed1rs5ph3u
    @user-ed1rs5ph3u 16 дней назад

    Как хорошо что ты делаешь тавие ролики.

  • @user-sy5mv8cu7v
    @user-sy5mv8cu7v 16 дней назад

    Да это интересно. Спасибо за Вашу работу.

  • @topodin
    @topodin 21 день назад

    Спасибо. Есть ли команда чтобы приостановить файнтюнинг, сохранить состояние модели, а затем команда чтобы продолжить файнтюнинг с места остановки?

    • @ruslandev
      @ruslandev 20 дней назад

      файнтюнинг - непрерывный процесс, но каждые 500 шагов автоматически создается чекпоинт

    • @topodin
      @topodin 17 дней назад

      ​​@@ruslandev спасибо вам, понял

  • @alex_great23
    @alex_great23 23 дня назад

    прегонишь в gguf llama-3-8b-samantha модель?

    • @ruslandev
      @ruslandev 16 дней назад

      В gptchain есть команда с инструкцией, можешь сам сконвертировать

    • @alex_great23
      @alex_great23 16 дней назад

      ​@@ruslandevну я в обучении не разбираюсь сори.

  • @alex_great23
    @alex_great23 23 дня назад

    эта модель запустится на 3080ti 32г оперативы или не хватит? у меня есть 64г но нет свободных слотов в материнке(

    • @alex_great23
      @alex_great23 23 дня назад

      не нехватает оперативки. жаль чуть меньше не создал модель.

  • @user-ed1rs5ph3u
    @user-ed1rs5ph3u 23 дня назад

    Ну надо пробовать что получилось

  • @AlekseyIT
    @AlekseyIT 24 дня назад

    Что Вы знаете о rugtp? Есть смысл смотреть в её сторону или лучше взять lama3 и попробовать дообучить на русском датасете? Было бы интересно узнать, как создать самому датасет в рамках какого-то домена знаний? Например, взяв литературу по определённой тематике.

    • @ruslandev
      @ruslandev 24 дня назад

      лучше взять llama 3 в репозитории датасета из этого видео - tagengo есть код, с помощью которого этот датасет был создан через запросы к gpt-4

  • @noino5458
    @noino5458 24 дня назад

    Может скинемся денюжкой на обучение? А после уже получим результат для общественности?

  • @galandec2000
    @galandec2000 24 дня назад

    дождались!😁спасибо!

  • @TheMr0day
    @TheMr0day 24 дня назад

    Спасибо за видео! Стали примерно понятны время и бюджеты, необходимых для дообучения таких больших моделей как 70B. Что касается метрик, то хотелось бы подробнее узнать про эти самые метрики, по которым сравниваются LLM и строятся всяческие топы моделей, например на Huggingface. Потому что по определенным бенчмаркам в топе зачастую вижу малоизвестные открытые модели (чаще всего дообученная llama), которые вроде там заявляются чуть ли не на уровне ChatGPT 4. В реальных же задачах (например, генерация кода) они обычно ничего выдающегося не показывают и сильно отстают от пресловутого ChatGPT. То есть по факту, возможно, идет подгон под бенчмарк. Поэтому интересна сама природа этих метрик: что и как измеряют самые популярные из них и насколько им следует, на твой взгляд, доверять.

  • @toto_ro_ro
    @toto_ro_ro 24 дня назад

    Добрый день а вашу модель можно скачать и потестить на мак ос в ml studio?

    • @toto_ro_ro
      @toto_ro_ro 24 дня назад

      Там как раз вроде бы guff если не ошибаюсь

    • @ruslandev
      @ruslandev 24 дня назад

      Следующее видео про квантизацию, файл gguf из него - на моем Huggingface

    • @toto_ro_ro
      @toto_ro_ro 23 дня назад

      @@ruslandev спасиб

  • @f_cklive1572
    @f_cklive1572 24 дня назад

    Очень годный контент спасибо.

  • @toster8240
    @toster8240 24 дня назад

    Спасибо! Очень интересно и весьма наглядно.

  • @ruslandev
    @ruslandev 24 дня назад

    Вышла новая часть - Файнтюнинг и квантизация Llama-3-70B ruclips.net/video/ML4M1UQHxbU/видео.html Я обучил самую большую пока Ламу на мультиязычном датасете, и она начала следовать инструкциям на русском. А также я показал процесс квантизации модели с сохранением в формат gguf.

  • @I-love-GO-and-PHP
    @I-love-GO-and-PHP 25 дней назад

    Что за ужасный микрофон.

  • @softgpt
    @softgpt 26 дней назад

    Всё интересно, квантизация тоже, но также интересует дообучение модели и практические рекомендации по сбору хорошего датасета для русского языка

  • @dinissaet9578
    @dinissaet9578 26 дней назад

    Руслан, спасибо за твои видео!!!

  • @galandec2000
    @galandec2000 28 дней назад

    Да, было бы интересно. Так же было бы интересно стоимости на подобные обучения. и цены на развертывание обученных моделей. к примеру Llama3 8B и Llama3 70B в какую сумму влетит если развернуть на данном сервисе? Заранее спасибо!

  • @user-sc4cs9sp6g
    @user-sc4cs9sp6g Месяц назад

    Можешь показать, как сделать автономный, эффективный переводчик (чем больше языков, тем лучше, но для начала русский- английский хватило бы)? Какую модель лучше использовать и как?

  • @user-sc4cs9sp6g
    @user-sc4cs9sp6g Месяц назад

    Я экспериментировал с Llama 3 7b Q8 на Llama.cpp, так и она и Gemma Q8 болеют словоблудием и после правильного ответа начинают рассказывать всякую дичь или повторяют одно и то же. Иногда даже дополняют мой вопрос своими домыслами и на это уже пытаются ответить, но эта проблема исчезает в интерактивном режиме. И так же эта проблема не актуальна в GPT4ALL. Я думаю, что это можно как-то устранить с помощью правильного подбора параметров --temp и --чего-то-там-repeat

  • @user-sc4cs9sp6g
    @user-sc4cs9sp6g Месяц назад

    Первое предложение автору. Если тебе не хватает денег на те или иные эксперименты, то предлагаю делать краудфандинг. Можно прям тут на ютубе - типа хотите посмотреть на файн-тюнинг и квантизацию llama 3 70b - скидывайте бабосы

  • @ValentinYefimov
    @ValentinYefimov Месяц назад

    Да. Очень интересно! Продолжи пожалуйста по квантизацию и создание gguf

  • @user-qv6ph1bt6l
    @user-qv6ph1bt6l Месяц назад

    Мужик спасибо. Давно хотел что-то подобное 🔥

  • @goga-pro2024
    @goga-pro2024 Месяц назад

    да хотим увидеть квантилизацию

  • @snowiedigga
    @snowiedigga Месяц назад

    Интересно, продолжай в том же духе 👍

  • @unzerror8208
    @unzerror8208 Месяц назад

    Квантизацию модели с последующей конвертацией в GGUF поддерживаю.

  • @noino5458
    @noino5458 Месяц назад

    Было бы интересно получить инструкцию по дообучения на своих данных. Например у меня есть excel таблица с данными, скормили эту таблицу LLM, а она после отвечает по таблице. Такое возможно?

    • @vlad-n-ag
      @vlad-n-ag Месяц назад

      Это возможно и уже реализовано в некоторых сервисах на основе LLM. Думаю они для этого могут не дообучать исходную модель, а конвертировать данные в векторную форму и хранить в векторной базе данных. Сервис, получая запрос пользователя, выполняет поиск в базе данных и передаёт близкие по смыслу вложения в качестве подсказки модели. На основе запроса, подсказки и собственных данных, модель формирует ответ.