Прощай chatGPT | Как пользоваться LM Studio | Установка Llama, falcon, mistral!

Поделиться
HTML-код
  • Опубликовано: 22 окт 2024
  • Как пользоваться LM Studio для работы с LLM Llama, falcon, mistral.
    Создал видео гайд LM Studio, где расскажу как устанавливать текстовые модели локально на свой компьютер.
    ►ПОЛЕЗНЫЕ ССЫЛКИ:
    LM Studio: lmstudio.ai/
    🔥 Подписывайтесь на наш канал, следите за новыми полезными роликами, пишите комментарии и приятного просмотра!
    ►СОЦ. СЕТИ:
    Telegram: t.me/tehnomani...
    Группа VK: tehno_m...
    Дзен: dzen.ru/filimo...
    Boosty: boosty.to/tehn...
    #llm #нейросеть #чатбот

Комментарии • 68

  • @tehno.maniak
    @tehno.maniak  2 месяца назад +4

    Буду очень рад, если оценишь данный ролик лайком и просмотром!
    А еще заходи на канал и смотри другие мои видео:
    - Фильтр нецензурной лексики за 5 минут: ruclips.net/video/UrtMJoF_gbk/видео.html
    - ОБЛАЧНОЕ ХРАНИЛИЩЕ на RASPBERRY PI и UMBREL OS!: ruclips.net/video/F6zXwtZdHrc/видео.html

    • @maikmaik1389
      @maikmaik1389 Месяц назад

      А эта модель работает с немецким языком?

    • @PyCoder-pg5em
      @PyCoder-pg5em 2 дня назад

      ​@@maikmaik1389 , да, должна

  • @zikyry
    @zikyry 2 месяца назад +2

    Все супер! На убунту тоже работает, спасибо!

    • @tehno.maniak
      @tehno.maniak  2 месяца назад

      Рад, что помог🔥

  • @goodhuman4387
    @goodhuman4387 2 месяца назад +4

    Вот это интересно и полезно!

    • @tehno.maniak
      @tehno.maniak  2 месяца назад

      Рад, что помог💪🏻

  • @romanbolgar
    @romanbolgar Месяц назад +1

    Спасибо. Жаль Пока нет времени пробовать. Интересно было бы увидеть как дообучить модель на своих данных.

    • @tehno.maniak
      @tehno.maniak  23 дня назад

      Пока не изучал это(

  • @VasylynaSkyba
    @VasylynaSkyba 2 месяца назад +2

    Комментарий в поддержку и благодарность. И ещё несколько слов для алгоритма продвижения)

    • @tehno.maniak
      @tehno.maniak  2 месяца назад

      Спасибо большое🔥🔥

  • @obehobeh9984
    @obehobeh9984 Месяц назад +2

    Пора научиться, если показываешь код, увеличивать его в размерах

  • @tsiunchique
    @tsiunchique 2 месяца назад +1

    Круто! Спасибо

    • @tehno.maniak
      @tehno.maniak  2 месяца назад

      Рад, что помог🔥

  • @Xelasilli
    @Xelasilli 2 месяца назад +5

    Спойлер: вы будете всё равно использовать чатжпт и клауду потому что они умнее и удобнее. Всё что локальное и с текстом лишь прикольная игрушка.

    • @tehno.maniak
      @tehno.maniak  2 месяца назад

      ну не скажи, как персональный помощник он может неплохо выручать))

    • @tehno.maniak
      @tehno.maniak  2 месяца назад

      есть определенная усталость включать впн каждый раз))

    • @МихаилЗимницкий-я2й
      @МихаилЗимницкий-я2й 2 месяца назад

      @@tehno.maniak используй dns и не будет нужды переключать

    • @4you4ever100
      @4you4ever100 2 месяца назад

      ​@@tehno.maniakпоэтому я отдельный браузер с включенным впн поставил

    • @Andrey_AKA_Zumz
      @Andrey_AKA_Zumz 2 месяца назад

      ​@@tehno.maniak, так настройте маршрутизацию нормально, чтобы vpn был постоянно включен, но через него шел трафик только на те ресурсы, которым необходим vpn.

  • @KAZVAZ05
    @KAZVAZ05 7 дней назад +1

    процессор без поддержки avx2 .есть смысл пробовать ставить ламу?

    • @KAZVAZ05
      @KAZVAZ05 7 дней назад

      Минимальные требования: M1/M2/M3 Mac или ПК с Windows / Linux с процессором, поддерживающим AVX2.

    • @tehno.maniak
      @tehno.maniak  7 дней назад

      Сомневаюсь((

    • @tehno.maniak
      @tehno.maniak  7 дней назад

      если так указано, врядли потянет

  • @КириллШанин-у6и
    @КириллШанин-у6и 2 месяца назад +2

    Спасибо за видео! Есть несколько вопросов по этой программе:
    1. Нужно ли получать доступ к моделям (как это реализовано на hugging face, пример, llama 3.1)
    2. Есть ли возможность дообучать модели на своих данных?
    3. Есть ли поддержка AMD GPU?

    • @tehno.maniak
      @tehno.maniak  2 месяца назад

      Рад, что помог🔥
      Нет, все доступно в рамках самой программы)
      По вопросам 2 и 3 честно не подскажу(

    • @PyCoder-pg5em
      @PyCoder-pg5em 2 дня назад

      Нет. Скорее всего, ты имел ввиду другое, т.к. дообучать llm на локальном железе проблемно, легче арендовать сервер с a100 или h1000, маленький файн-тюнинг потребует несколько часов на таком железе на это уйдёт несколько часов, обойдётся в пару тысяч рублей. Но нужно подготовить датасет на несколько тысяч примеров (я не очень разбираюсь в обучении, информацию взял из одного видео с ютуба).
      То что тебе нужно называется RAG. Но это сложно и в lm studio этого нет. Можешь почитать про RAG и написать свою реализацию (займёт всего пару сотен строк кода), использую веб сервер lm studio. Но для этого я советую тебе использовать ollama.

  • @RomanMalik-q5b
    @RomanMalik-q5b 19 дней назад

    Привіт. Подскажи какую IDE можно удобнее всего использовать для программирования на языке java но не на компьютере а на андроид смартфоне, то есть чтоб можно было писать и компилировать код на джаве на андроид смартфоне. Благодарю.

  • @abyssincat
    @abyssincat 9 дней назад +1

    А у меня при запуске лм студиа нет главного окна, первым идет чат😐

    • @tehno.maniak
      @tehno.maniak  9 дней назад

      потыкай там кнопки, точно должно быть)

  • @sdfasdfssdfsdf
    @sdfasdfssdfsdf 21 день назад +1

    GitHub Copilot модель можно подключить и как? )) Интересно посмотреть видео на эту тему...
    Плохо что в этом LM Studio нет модели Meta Llama 3.1 8B на 405B 😕

    • @antonmanukyan3307
      @antonmanukyan3307 15 дней назад

      Интересно, что у вас за конфигурация, для запуска модели на 405B параметров, нужно несколько ускорителей по 80 gb vram.

    • @sdfasdfssdfsdf
      @sdfasdfssdfsdf 14 дней назад

      @@antonmanukyan3307 я уже понял, что моя видеокарта не потянет 😁
      Так что, ещё не определился какой моделью GPT пользоваться 🧐

    • @inquisitive5418
      @inquisitive5418 9 дней назад

      @@antonmanukyan3307он просто клоун пустозвон, вот и плетет ерунду

    • @PyCoder-pg5em
      @PyCoder-pg5em 2 дня назад

      Там llama.cpp под капотом, насколько я знаю, можно запустить любую gguf модель

  • @MrCans94
    @MrCans94 22 дня назад

    GPU (LM Runtime Dependent)
    Такая надпись при просмотре ресурсов в настройке, слева CPU виден какой-то код, а справа где GPU не видно ничего..
    No LM Runtime found for model format 'gguf'!
    Ошибка при загрузке модели..

  • @Nikolos7
    @Nikolos7 2 месяца назад

    благодарю за наводку - интересно. А описания загружаемым картинкам она может давать?

    • @tehno.maniak
      @tehno.maniak  23 дня назад

      Рад помочь! с картинками нет, пока не работает(

    • @PyCoder-pg5em
      @PyCoder-pg5em 2 дня назад

      Не знаю как именно с lm studio, но да! Можно загружать картинки, есть открытые мультимодальные модели.

    • @PyCoder-pg5em
      @PyCoder-pg5em 2 дня назад

      ​@@tehno.maniak , не знаю как в lm studio, но картинки элэлэмить можно! Есть мультмодальные модели. Посмотри про ollama, она крутая. Также можешь сделать видео про неё для новичков

  • @GrabsOrion
    @GrabsOrion 2 месяца назад +1

    Насколько лама3 хороша в ответах по коду в сравнении с gpt-3.5turbo?

    • @tehno.maniak
      @tehno.maniak  2 месяца назад

      Я так скажу, тяжело сказать gpt3.5 сто проц с русским хорошо работает, у llama встречаются проблемы частенько
      по хорошему, вопросы надо на английском писать для лучшего результата
      а по коду, прогу прям не напишет llama, но точечные вопросы отрабатывает неплохо, на уровне с gpt3.5 я бы сказал

    • @PyCoder-pg5em
      @PyCoder-pg5em 2 дня назад

      Для кода советуют deepseek coder, я не пробовал, но вроде он крут. Для русского языка советую mistral-nemo и qwen

  • @flenk41
    @flenk41 2 месяца назад +2

    Вопрос а чем хуже ChatGPT ?)

    • @tehno.maniak
      @tehno.maniak  2 месяца назад

      он платный, нужен интернет и впн, данные уходят openai))

    • @flenk41
      @flenk41 2 месяца назад +1

      @@tehno.maniak НУ впн да и он не платный

    • @lichtn9713
      @lichtn9713 2 месяца назад +1

      @@flenk41 как раз таки платный, не знаю где ты им пользуешься но на официальном сайте он платный.

    • @tehno.maniak
      @tehno.maniak  2 месяца назад +1

      Бесплатный он имеет очень ограниченное количество запросов, а бесплатно модель попроще))

    • @tehno.maniak
      @tehno.maniak  2 месяца назад

      ++

  • @avelickov
    @avelickov 22 дня назад +1

    Эта модель знает vb6 ?

    • @tehno.maniak
      @tehno.maniak  22 дня назад

      так не скажу, лучше уточнить на сайте)

  • @ANUBIS-cr9dk
    @ANUBIS-cr9dk Месяц назад

    там есть не все модели, как я загружу в ней нужную мне модель ?

    • @tehno.maniak
      @tehno.maniak  Месяц назад

      а какая тебе нужна?

    • @PyCoder-pg5em
      @PyCoder-pg5em 2 дня назад

      Там есть папка, куда скачиваются модели. Просто создай в ней подпапку и положи нужную модель в формате gguf.
      Точно сказать как именно это сделать не могу, давно не пользовался, но точно знаю, что можно

  • @Redfal
    @Redfal 2 месяца назад +1

    свет страшный как будто зеленкой облили

    • @tehno.maniak
      @tehno.maniak  2 месяца назад

      поработую над этим))

  • @Павел-ш6с4ф
    @Павел-ш6с4ф 2 месяца назад

    Вероятно автор видео из Латвии или Эстонии... Информацию про LM Srudio уже двести раз пережевали и обсудили. На поиграться и не более... для нормальной работы не походит... тупит. Пишет с ошибкаи..если только клауд и ЖПТ по апи не подключить...остальные модели шлак... даже лама 3

    • @KLRiyDQvdCwYjRkdCINGNYLQviA
      @KLRiyDQvdCwYjRkdCINGNYLQviA 2 месяца назад +1

      Так такие нейросети для RAG используют

    • @PyCoder-pg5em
      @PyCoder-pg5em 2 дня назад

      Для обычного пользователя, честно, да. Но для программиста - нет, если ему интересен ИТ. Можно RAG прикрутить, создать агента и т.д. Да и не такие они тупые, скачай mistral-nemo

  • @AniChiKoo
    @AniChiKoo 2 месяца назад

    Проверил, хрень если честно, слабая моделька

    • @tehno.maniak
      @tehno.maniak  23 дня назад

      для нетребовательных задач вполне подходит))