Открытые модели и их обучение

Поделиться
HTML-код
  • Опубликовано: 12 сен 2024
  • Рассматриваем инструменты для работы с открытыми и бесплатными LLM и сами модели. Разбираемся в способах дообучения и затачивания моделей под ваши нужды. Обсудили как работает и зачем нужен портал Huggingface, посмотрели с практической стороны на модели Llama, BLOOM, Vicuna, Falcon, Open-Assistant. Поговорили о методах обучения моделей, таких как LoRA, RLHF, Soft prompting, fine-tuning.
    Записаться на мероприятия и вступить в сообщество: codex.town
    Телеграм: t.me/cryptoEssay
    Ссылка на презентацию: docs.google.co...

Комментарии • 9

  • @user-hb3vm2er8k
    @user-hb3vm2er8k Год назад +2

    Спасибо за видео. Очень хотел увидеть инструкцию по файн - тюнингу. Жаль не успели.
    Пожалуйста, в следующем видео постарайтесь более предметно разбирать, или хотя бы отсылать к внятным источникам: по правильной подготовке размеченного файла для дообучения (было откровением, что неразмеченный файл диалогов тоже полезен), по выбору наиболее подходящей для дообучения модели (для использования в чатах поддержкити консультаций) и т.д.
    Вообще, ваш канал находка! Допишите реквизиты для доната в описание.

  • @ruslanzlotnikov5457
    @ruslanzlotnikov5457 Год назад +1

    Спасибо огромное!
    Очень толково и доходчиво.
    Расширяет кругозор так что голова идёт кругом😅

  • @seoonlyRU
    @seoonlyRU Год назад +2

    неплохо так))) лайк от СЕООНЛИ!

  • @achmedzhanov_nail
    @achmedzhanov_nail 9 месяцев назад +1

    Не согласен с сравнением transformers и llama cpp как плееров mp3, эти библиотеки разные форматы читают, первая - torch, а вторая ggml.

  • @ArsenGuzhva
    @ArsenGuzhva Год назад +3

    Степан, гучність відео на RUclips, здається, було б краще збільшити в два рази. Викручую на максимум, щоб слухати.

    • @ArsenGuzhva
      @ArsenGuzhva Год назад +1

      І останні 30 хвилин вийшли трохи скомкані. Можна більш деталізовано повторити як окреме повноцінне відео на годину

  • @istambul78ds56
    @istambul78ds56 Год назад +1

    Тяжко на эти мучения смотреть. Одно хорошо, нейросети создадут потребность в мощных компьютерах, а то программисты сидят на всяких дохленьких машинках, и рынку это диктуют - вместо мощности бесшумность, "энергоэффективность" и тонкость, а теперь будут покупать машины как для видеомонтажа, соответственно, и эти машины тоже станут бесшумнее, энергоэффективнее и тоньще

  • @bars374
    @bars374 3 месяца назад

    Уважаемый автор! Очень плохое объяснение, гость может и умный, но не умеет объяснять. Лучше вы бы сами объяснили, у вас отлично это получается. Не ховите больше этого лектора, пусть занимается своим делом, а не объяснениями