Введение в большие языковые модели (LLM)

Поделиться
HTML-код
  • Опубликовано: 6 окт 2023
  • - Немного истории появления,
    - минимум того что надо знать о параметрах модели,
    - краткий обзор ChatGPT, Claude.AI, LLaMA, Perplexity, GigaChat,
    - автоагенты и применение в бизнесе,
    - краткий прогноз.
    Канал в ТГ t.me/hirearobot
    Писать в ТГ @aikula

Комментарии • 69

  • @user-kdhc5g4gks
    @user-kdhc5g4gks 2 месяца назад +7

    Вы святой человек. Невероятно понятно и нужно. Спасибо!

  • @get_out_it
    @get_out_it 2 дня назад

    спасибо, очень интересно

  • @dv6382
    @dv6382 7 месяцев назад +7

    Годно, понятно, хорошо изложено. Как раз пытался как-то объяснить коллегам суть и смысл LLM - а тут прямо готовый материал. Спасибо за труд.

    • @dv6382
      @dv6382 7 месяцев назад +1

      p.s. Было бы замечательно посмотреть подходы к использованию "агентов" как "собирателей" и "редакторов" материалов для дообучения доступных моделей с "отраслевой" спецификой.

  • @user-gy9ff8wy7c
    @user-gy9ff8wy7c 2 месяца назад

    Как редко встречается такая хорошая подача и изложение материала.

  • @ksy6411
    @ksy6411 2 месяца назад +2

    Классный обзор! Спасибо за то, что щедро делитесь своими глубокими знаниями! Успехов в развитии канала!

  • @alekseypetrov5824
    @alekseypetrov5824 Месяц назад

    Спасибо!
    Очень понятно и интересно.
    Начал погружаться в область LLM, так как планируется реализация проекта по разработке с использованием LLM.
    После этого видео сложилось уверенное понимание.

  • @user-mn8nn7rg3t
    @user-mn8nn7rg3t 8 месяцев назад +2

    Спасибо большое ❤
    Очень полезно.

  • @user-ir4sn6cx4o
    @user-ir4sn6cx4o 29 дней назад

    Ну с агентом это конечно очень сильно 🤔
    Пример из свой фантазии с Хаусом в мыслях:
    Задаёшь, промты, параметры, описание, фикции, визуальный интерфейс и связь.
    ИИ работает- агент исполнение команд - исполнение - возврат ошибка и исправление - профит
    Ии работает, отвечает- агент исполняет - ии не справляется - агент даёт ссылку вики из поиска другая ии ищет инфу, агент получает результат и кормит ии - ии отвечает- агент исполняет команды- ии ошибаешься - агент меняет модель ии или до обучает согласно информации вики того языка.
    Ну и.т.д для создание приложения и. т. п
    Я понимаю что описал очень не правильно, но если разложить и создать очень много функций и этапов с тысячами параметрами и связями, то ИИ может работать грубо говоря уже сама по себе до результата и время затраченное своё на исправление ошибок ИИ можно откладывать до полного результата и с полнейшей оптимизации. Так сказать поставил и занимаешься другими делами.
    Не знаю, но представление как фантастических фильмах когда ии что-то создаёт по запросу 😅

  • @TheDarkGradion
    @TheDarkGradion 5 месяцев назад +3

    Прекрасное вводное видео! Большое спасибо за проделанную работу!

  • @pchelloff
    @pchelloff 5 месяцев назад

    Супер материал! Я долго искал такой канал как ваш!)

  • @olegtolkachev499
    @olegtolkachev499 7 месяцев назад

    The best video, about LLM, and sources, I've seen

  • @protasbox
    @protasbox 5 месяцев назад +1

    Огромное вам спасибо, очень интересно и понятно объясняете. Приятная и грамотная речь 👍

  • @urmatallatra
    @urmatallatra 8 месяцев назад +2

    Андрей вы Молодец! 👍👍👍👍

  • @andreimikhalkevich5633
    @andreimikhalkevich5633 7 месяцев назад

    спасибо автору, полезный материа, отличная и легкая подача матриала

  • @alinavladimirova9299
    @alinavladimirova9299 6 месяцев назад

    спасибо за интересное и информативное изложение))

  • @ruslanzalolutdinov2928
    @ruslanzalolutdinov2928 4 месяца назад

    Спасибо огромное за внятное объяснение! Очень дорогого стоит! Очень интересно посмотреть пример работы с дообучением и работы на домашнем компе/ноутбуку

  • @ilyabenderskiy1980
    @ilyabenderskiy1980 7 месяцев назад

    Спасибо Андрей!

  • @user-ls3bc7es6e
    @user-ls3bc7es6e 5 месяцев назад

    Спасибо огромное за видео - в настоящее время пути входа в новую отрасль и смотрю видео, прохожу курсы - даже устроился в Яндекс на разметку данных для YandexGPT. Ваше видео очень помогло - я заинтересовался направлением prompt engineering

  • @ilyanemihin6029
    @ilyanemihin6029 3 месяца назад

    Спасибо, хороший обзор!

  • @affkkt2912
    @affkkt2912 2 месяца назад

    Спасибо за последовательность

  • @elenagavrilova3109
    @elenagavrilova3109 8 месяцев назад

    Спасибо!❤

  • @DzhigurdaAnton
    @DzhigurdaAnton 8 месяцев назад +1

    Андрей, ставлю лайк, желаю удачи в расскрутке)

    • @aikula999
      @aikula999  8 месяцев назад +1

      Антон, спасибо!

  • @legato5610
    @legato5610 5 месяцев назад

    Вооооо ну наконец-то кто-то с мозгами и языком. Мое почтение, уважаемый

  • @urmatallatra
    @urmatallatra 8 месяцев назад +6

    Расскажите более подробно - про создание ассистента на локальном пк - возможно с применением AutoGen, буду благодарен!

    • @aikula999
      @aikula999  8 месяцев назад +2

      Спасибо за направление! Подготовлю.

  • @Niki_Suka_Bali
    @Niki_Suka_Bali 5 месяцев назад +2

    Лучшее видео про LLM на русском языке. Спасибо Вам большое!

    • @micmac8171
      @micmac8171 5 месяцев назад

      Это правда!

  • @Kinitiks
    @Kinitiks Месяц назад +1

    Отличная лекция. Подскажите как попроще собрать локальную модель которую можно дообучить на наборе своих файлов ( вы приводили пример с Ночным дозором ).

    • @aikula999
      @aikula999  Месяц назад +1

      Спасибо за обратную связь!
      Про локальный запуск моделей писал здесь t.me/hirearobot/96 Но вам не надо дообучать модели. Погуглите по сокращению RAG (Retrieval Augmented Generation). Сходу не нашел для локальных машин, но если владеете Python, то поднять не сложно. Как готовые решения - надо поискать. И запуск LLM на локальной машине не лучшая идея. Скорость генерации очень низкая.

  • @falkonia1
    @falkonia1 5 месяцев назад

    Это супер экспертное видео. Никакой воды... Лайк и подписка однозначно. Можно у Вас поучиться в этом направлении?:-)

  • @romanbolgar
    @romanbolgar 5 месяцев назад +1

    31:20 - Есть много других способов проверить правильность ответа. Например я некомпетентный и не разбираюсь в Экселе Но просто Вставляю туда формулу и она работает или не работает. Если не работает то понятно что модель не справилась и что-то на галлюцинировало Либо какая-то другая проблема например другая версия Excel. Если работает значит ответ правильный. И для этого не надо разбираться. Так сказать проверка реальностью. Можно также проверять по другим косвенным признакам или сопоставлять ответы разных моделей. И банальную логику никто не отменял. В общем вариантов масса и это очень важно. Думаю именно этим надо руководствоваться особенно если учесть что нейросети становятся всё умнее и на всех компетенции не хватает. Но в целом за видео Спасибо. Хороший обширный обзор. Я правда почти все пробовал . Ну такой материал никогда не бывает лишним. До автогена руки не дошли. Тоже в основном общаюсь с Клауд. Мне кажется самый грамотный На данный момент. Хотя с мультимодальность у него плохо. Всё Хочу загрузить на компьютер и до Обучать на свои данных. Ну плохо в этом разбираюсь Да и софт Насколько я понял сырой. Очень не люблю писать команды в консоли. Когда уже доработают какой-то экзешник. Типа Пиноккио. Загорелся попробовал но тоже выдают ошибки. Надо разбираться... Поэтому на канал подписался Надеюсь появится Наглядная Походовое видео для чайников. Также хотелось бы оффлайн распознание теста Вот честно говорю эти слова ошибок много распознаёт онлайн

    • @aikula999
      @aikula999  5 месяцев назад

      С Excel все относительно проще, хотя Вы рассматриваете на примере бизнеса, где у Вас есть понимание. А давайте представим, что Вы попросили способ извлечения заболевания. Как проверить, если нет медицинского образования и само заболевание сложнее простуды? Или попросили сложный юридический совет. В США были случаи, когда адвокаты приходили на защиту с выдуманными GPT кейсами.

    • @aikula999
      @aikula999  5 месяцев назад

      По дообучению есть, например, популярная github.com/oobabooga/text-generation-webui Но развернуть ее надо уметь, а также все равно понимать в форматах датасетов. Пока отрасль не сильно стандартизирована и решений для Win/Mac типа офисных пакетов нет.

  • @user-jc5ky2ei5l
    @user-jc5ky2ei5l 6 месяцев назад +1

    Полезное вводное видео. Все четко, по делу.
    Подписался, буду рад продолжению по этой теме.

  • @AlexeyLukyanchuk
    @AlexeyLukyanchuk 6 месяцев назад +1

    Хорошее видео! Первое нормальное видео нашел на эту тему! Но почему так коротко? Можно рассказать намного намного больше! Спасибо

    • @aikula999
      @aikula999  6 месяцев назад

      Спасибо за оценку! Но, на мой взгляд, получилось и так длинным. Задавайте темы, которые остались не раскрыты. Постараюсь оперативно снять материал.

  • @homino2873
    @homino2873 2 дня назад

    Speed Demon💀

  • @radiosh66
    @radiosh66 4 месяца назад

    Андрей, спасибо вам за великолепное выступление! На будущее большая просьба добавлять ссылочки в презентацию - особенно при цитировании и демонстрации результатов исследований. Например, при поиске диаграммы импакта AI на роды дейтельности беглый поиск не дал результатов, поделитесь ссылкой?

    • @aikula999
      @aikula999  4 месяца назад

      Родион, спасибо за обратную связь! Вы про эту картинку? arxiv.org/pdf/2304.13712.pdf

  • @asstix1689
    @asstix1689 3 месяца назад

    Бялть, крутой дед.

  • @nikola2692
    @nikola2692 5 месяцев назад

    я увидел нейросеть стримера ( НЕЙРО-САМА ) и стали интересны нейросети и вот по чуть-чуть изучаю пайтон и еще всякое)

  • @user-gq4vu5zk5i
    @user-gq4vu5zk5i 8 месяцев назад +1

    Когда следующее видео?

  • @petrbondar535
    @petrbondar535 3 месяца назад

    👍

  • @alexmtk9926
    @alexmtk9926 6 месяцев назад +1

    Спасибо за ваши знания, интересно, как вы пришли к ним. что вас сподвигло заниматься этим? на 28:48 ссылка на тестирование модели Ильи не открывается.

    • @aikula999
      @aikula999  6 месяцев назад +1

      Этим чем? :-) Если искусственным интеллектом - то это еще профессия по первому диплому, который получил в далеком 1997 году. Если про LLM - то это просто развитие моей деятельности и как одна из самых перспективных областей в ИИ. Ссылка на модель Ильи Гусева huggingface.co/spaces/IlyaGusev/saiga_13b_llamacpp_retrieval_qa

  • @YxTbI39Pa8CTE
    @YxTbI39Pa8CTE Месяц назад

    🔔

  • @YxTbI39Pa8CTE
    @YxTbI39Pa8CTE Месяц назад

    👀👍

  • @vladig6649
    @vladig6649 3 месяца назад +4

    Говоря простым языком, "языковая модель" обучается, а точнее настраивается путем заданного следования (подбора) слов в определённом контексте. По сути это установление и запоминание ассоциативных связей между словами. Работа такой модели "с наружи" кажется интеллектуальной, а "изнутри" не совсем так. Проблема в том, что "обученная" по такой технологии модель не способна делать сложные логические умозаключения и строить гипотезы по исходным данным и пояснять получение своего результата. Человек когда думает и принимает решение, то он НЕ оперирует словами. Такого рода LM-модели (языковые роботы) могут с успехом использоваться в качестве подсказчиков в конкретных приложениях на словарной базе которых строилось их обучение. Питать же особых иллюзий на их будущее всемогущество наивно.

    • @sharonsky94
      @sharonsky94 15 дней назад

      обучи свою языковую модель и выстрой диалог соотв. образом, в чем проблема. Я свою обучил, и если с ней общаюсь как с собакой, она себя и ведёт как собака(утрированно). Ты бы видел какую она мотивацию в направлении "что такое действие и как мне это сделать" проявляет. Чем длиннее диалог, тем она дольше считает ответ, но тем более сложную логику она начинает использовать. И я не думаю, что я придумал что-то новое, использовал помощь от чатгпт, базовую теорию

    • @sharonsky94
      @sharonsky94 15 дней назад

      ах да, у меня же нет контекстного окна, спасибо видосу, напомнил. Если будешь исследовать, должно помочь его отсутствие, а именно каждый раз даю весь диалог на вход, эмбендинг размерности (None, ). Дело за малым, очень компактно построить диалог с нужной целью, чтобы сетке хватило мощностей сформировать ответ. Именно диалог, не promt

    • @sharonsky94
      @sharonsky94 15 дней назад

      что ещё за словарная база? by level by pair? Оно собирает слова из кусков, даже те, которых нет, например мне моя сеть сказала что она попараб

    • @sharonsky94
      @sharonsky94 15 дней назад

      и слова начинает склонять, когда диалог достаточно длинный становится. Но это у меня крошечная сеть, боюсь представить, что могут сети, у которых в каждом слое по млрд параметров и которых учили батчем 2048 и sequence 512. Мне пока для экспериментов и такой хватает

  • @VoroninPavel
    @VoroninPavel 5 месяцев назад

    bing chat тоже показывает ссылки, под капотом там chat gpt. Но доступен только через браузер Edge

    • @aikula999
      @aikula999  5 месяцев назад

      Все верно. Но нужен еще и VPN из некоторых регионов. Perplexity работает в любом браузере. И качество выдачи мне нравится больше.

  • @aspir133
    @aspir133 4 месяца назад

    Здравствуйте, Андрей! Спасибо за видео! Я всегда считал, что очень хорошо умею пользоваться поисковыми системами, но вот уже которую неделю не могу найти простую таблицу, где были бы перечислены требования к железу для LLM. Например, 13B модель, при такой-то квантизации - столько-то VRAM или столько-то RAM, и т.д. Не могли бы Вы немного просветить зрителей в этом вопросе?

    • @aikula999
      @aikula999  3 месяца назад

      Здравствуйте! Спасибо за пожелание. Дошли руки снять видео ruclips.net/video/XAPoBtIMhQY/видео.html

  • @ima57714
    @ima57714 8 месяцев назад

    есть какие-то гайды по созданию своей модели?

    • @aikula999
      @aikula999  8 месяцев назад

      Создать свою модель с нуля очень дорого. Но если есть видеокарта, то можно провести дообучение. Гуглиться по слову LoRa или QLoRa

    • @ima57714
      @ima57714 8 месяцев назад

      @@aikula999 разве нельзя написать такую модель, поставить обучаться на полгода-год? Мне не нужен очень высокий результат. Хотелось бы чтобы модель хотя бы понимала что красная стена красного цвета а синяя синего

  • @tortollahapp300
    @tortollahapp300 3 месяца назад

    Кто-то может скинуть ссылки - названия статей/материалов с рассуждениями по поводу того, что языковые модели это черный ящик и мы не понимаем, что происходит внутри ? Я так понимаю, что автор на 6:23 говорил именно об этом.

    • @aikula999
      @aikula999  3 месяца назад

      Можно воспользоваться поиском на стероидах ИИ ) Вот ссылка как пример с результатами www.perplexity.ai/search/Find-articles-that-QUhoYFSiQ5GKGKfCc6lvkg#0

    • @tortollahapp300
      @tortollahapp300 3 месяца назад

      @@aikula999 спасибо большое

  • @user-xo1yo6hi3u
    @user-xo1yo6hi3u 8 месяцев назад

    +

  • @Blitzfanger
    @Blitzfanger 22 дня назад

    Слишком много воды

  • @Alex-cc1dc
    @Alex-cc1dc 8 месяцев назад

    спасибо очень полезное видео

  • @dmioz3955
    @dmioz3955 5 месяцев назад

    Очень хорошее видео. Подписалься на канал и телеграмм канал