QLoRA: обучал нейросеть 20 ЧАСОВ В GOOGLE COLAB на РУССКОМ ДАТАСЕТЕ. Впечатляет

Поделиться
HTML-код
  • Опубликовано: 29 июн 2023
  • 🔔 Сначала подпишись: youtube.com/@ruslandev/?sub_c...
    Опенсорсные ИИ модели уже освоили русский. И любой может обучить свою модель на дешевом GPU и даже в Google Colab!
    Telegram: t.me/ruslandevlive
    Discord: / discord
    QLoRA: github.com/artidoro/qlora
    Гуанако (демо): huggingface.co/spaces/uwnlp/g...
  • НаукаНаука

Комментарии • 22

  • @DrSergeyKibalnikov
    @DrSergeyKibalnikov 3 месяца назад +2

    QLoRA: обучал нейросеть 20 ЧАСОВ В GOOGLE COLAB на РУССКОМ ДАТАСЕТЕ. Впечатляет
    00:00:00 Обучение чат-бота на домашнем компьютере
    • Автор рассказывает о возможности обучения чат-бота на домашнем компьютере с использованием Google Colab и графического процессора.
    • Ранее это было невозможно из-за необходимости больших вычислительных мощностей и использования шестнадцатибитных типов данных.
    00:01:08 Метод обучения "Кьюлора"
    • Кьюлора - эффективный подход для файн-тюнинга, который позволяет обучать модель на небольшом наборе данных, сохраняя качество.
    • Кьюлора уменьшает потребление памяти и использует четырехбитные типы данных для хранения весов и параметров модели.
    00:03:42 Результаты обучения
    • Автор демонстрирует результаты обучения модели "Гуанако" на русскоязычном датасете.
    • Несмотря на то, что модель не знает русский язык, она начинает осваивать его и генерировать осмысленные ответы.
    00:08:08 Преимущества метода "Кьюлора"
    • Кьюлора позволяет обучать модели с большим количеством параметров на домашнем компьютере.
    • При небольшом количестве, но подходящем качестве данных, можно добиться лучших результатов.

  • @AlexAlex-ei7zf
    @AlexAlex-ei7zf 5 месяцев назад +6

    Шалом, чувак! Тема очень интересная и полезная. Спасибо. Добра Тебе и позитива

  • @strategy_love
    @strategy_love 3 месяца назад +1

    Огонь, Спасибо! Очень интересно. Оставляю коммент)

  • @vasilylukichev-pp4sh
    @vasilylukichev-pp4sh 6 месяцев назад +2

    Спасибо,здорово👍

  • @Artem36
    @Artem36 11 месяцев назад +4

    Очень классная тема

  • @leoniddzhabiev
    @leoniddzhabiev 22 дня назад

    хорошее видео, спасибо

  • @achmedzhanov_nail
    @achmedzhanov_nail 6 месяцев назад +1

    Какие вы используете инструменты для автоматической оценки качества llm? Делать это в ручную каждый раз не очень эффективно

  • @Rokinso
    @Rokinso 5 месяцев назад

    Мне нравится голос! Такой аристокрктический. 🤵

  • @achmedzhanov_nail
    @achmedzhanov_nail 6 месяцев назад

    А будет сравнение результата обучения на yandex q и на втором датасэте?

  • @wildberris4832
    @wildberris4832 7 месяцев назад

    Спасибо, а можно консультацию купить у Вас и сколько стоить будет?

    • @ruslandev
      @ruslandev  7 месяцев назад +1

      Заходите в телеграм по ссылке под видео, спрашивайте бесплатно. Отвечу когда смогу

  • @cybertruck_cmd
    @cybertruck_cmd 4 месяца назад

    а как сохранить дообученную модель?

  • @tumikosha
    @tumikosha 5 месяцев назад

    так а за коллаб платить пришлось или нет? во сколько денег встало обучение?

    • @ruslandev
      @ruslandev  5 месяцев назад

      Только за подписку pro+, она даёт больше памяти и доступ к премиум GPU. Стоила 50 долларов в месяц

  • @user-xo1yo6hi3u
    @user-xo1yo6hi3u 8 месяцев назад

    +

  • @vosatorp
    @vosatorp 5 месяцев назад

    Имеет ли смысл файнтюнить через open-source модели, или лучше не париться и сделаьт finetune через OpenAI API?

    • @ruslandev
      @ruslandev  5 месяцев назад +1

      файнтюнинг OpenAI не пробовал. Разница думаю в том что при файнтюнинге открытой модели есть полный доступ к весам

  • @vosatorp
    @vosatorp 5 месяцев назад

    Где можно найит ссылку на google colab?

    • @ruslandev
      @ruslandev  5 месяцев назад +1

      Я начал с вот этого колаба - colab.research.google.com/drive/1VoYNfYDKcKRQRor98Zbf2-9VQTtGJ24k?usp=sharing и дальше модифицировал под свою модель

  • @vosatorp
    @vosatorp 5 месяцев назад

    Звук подлагивает немного, из-за чего так?

    • @DenShustrik
      @DenShustrik 5 месяцев назад

      При монтаже происходит нежелательное наложение звука при переходах.

  • @I-love-GO-and-PHP
    @I-love-GO-and-PHP Месяц назад

    Что за ужасный микрофон.