Быстрее пули! Бесплатная нейросеть GROQ - прямой конкурент GPT4! на базе Mixtral8x7b

Local RAG using Ollama and Anything LLM

Как установить на своем компьютере нейросеть для языков программирования Mistral AI Codestral

Uncle Howdy returns with sinister friends: Raw highlights, June 17, 2024

Aurora Abilities | Ability Reveal & Gameplay

Watch live: SpaceX Falcon 9 rocket launches 20 Starlink satellites from Vandenberg, California

Запускаем RAG через llama3 с помощью LM studio и Anything LLM на своем компьютере

НейроИнжиниринг 3000

Просмотров 2,6 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 2 май 2024
в данном видео рассмотрим
- скачивание llm модели llama 3 7b
- запуск сервера с llama 3 через LM studio
- подключение сервера LM studio к anything LLM
- подключение базы знаний к anything LLM
- запуск RAG через anything LLM на llama 3 7b

Комментарии • 9

@jfima 3 дня назад
Привет. Спасибо, что записал это видео! Очень полезно было для меня узнать про этот инструмент и понять как ты его используешь. Но лучше записывай весь экран, так как ты кликал на список документов и мне было непонятно где этот интерфейс находится. Дело в том, что в новой версии Anything LLM интерфейс немного изменился.
@Technology-rv8fo 8 дней назад
Как залить в студию модель и где скачивать модели помимо этой студии, с других сайтов?
@darweenge Месяц назад ⁺²
Скажите, а как может быть CPU в LMStudio загружен на 450% на минуте 10:36? У меня кстати GPT4All гоняет модели существеннол быстрее чем LMStudio с чем это может быть связано?
@misterfox3464 Месяц назад
У меня такая же лажа) у меня 2 процессора вообще ... А нагружает только 1... По итогу я использую только 50% производительности
@konevyn 25 дней назад
Скажите ТЗ на создание локальной LLM с коучингом можете выполнить?
@azabogdan1 Месяц назад
Цьому рішенню вже рік воно вже не актуальне, ніхто вже не розбиває на точну кількість символів ембедінги
@AlekseyIT Месяц назад
А что актуально на данный момент?
@azabogdan1 Месяц назад
@@AlekseyIT longchain, якщо для проду то RAG тільки з розподіленням на смислові частини, а не по 1000 символів +-200. Робота з кодом напряму, як то vanna-ia для БД. Велике контексте вікно. llama3 крута штука, але не для ембедінгів які по контексту розподілити неможливо через anysingllm. Мало того що неможливо вивести точні данні з великого вбудування, ще й галюцинацій буде по всім прикладам типовим. Буде всі типові приклади брати не з RAG, а з моделі. Тому мультіагент треба для закриття цього. Та і якщо anysingllm піднімати то треба і з пам'яті гратись і з навчанням показувати що правильно, а що ні. В результаті anysingllm дасть лише відсотків 50 чогось користано все інше буде далеке від RAG.
@azabogdan1 Месяц назад
@@AlekseyIT та і взагалі все що з RAG в проді потребує лише найкращої на ринку моделі, llama3 в такій комбінації буде працювати гірше ніж просто те саме згодувати gpt-4 напряму в чат

Следующие

Автовоспроизведение

Быстрее пули! Бесплатная нейросеть GROQ - прямой конкурент GPT4! на базе Mixtral8x7b

Быстрее пули! Бесплатная нейросеть GROQ - прямой конкурент GPT4! на базе Mixtral8x7b

Local RAG using Ollama and Anything LLM

Local RAG using Ollama and Anything LLM

Как установить на своем компьютере нейросеть для языков программирования Mistral AI Codestral

Как установить на своем компьютере нейросеть для языков программирования Mistral AI Codestral

Uncle Howdy returns with sinister friends: Raw highlights, June 17, 2024

Uncle Howdy returns with sinister friends: Raw highlights, June 17, 2024

Aurora Abilities | Ability Reveal & Gameplay

Aurora Abilities | Ability Reveal & Gameplay

Watch live: SpaceX Falcon 9 rocket launches 20 Starlink satellites from Vandenberg, California

Watch live: SpaceX Falcon 9 rocket launches 20 Starlink satellites from Vandenberg, California

Sabrina Carpenter - Please Please Please in the Live Lounge

Sabrina Carpenter - Please Please Please in the Live Lounge

Векторные базы данных: мощный инструмент для современного анализа данных

Векторные базы данных: мощный инструмент для современного анализа данных

Переадресація портів на роутері

Переадресація портів на роутері

AutoGen Studio 2.0 Tutorial - Skills, Multi-Agent Teams, and REAL WORLD Use Cases (NO CODE)

AutoGen Studio 2.0 Tutorial - Skills, Multi-Agent Teams, and REAL WORLD Use Cases (NO CODE)

Как обнаружить вредоносные программы в Windows

Как обнаружить вредоносные программы в Windows

Crazy FAST RAG | Ollama | Nomic Embedding Model | Groq API

Crazy FAST RAG | Ollama | Nomic Embedding Model | Groq API

8 апреля 2024 г.

8 апреля 2024 г.

Глава OpenAI СЭМ АЛЬТМАН на Microsoft Build 2024 | ПОЧЕМУ СЕЙЧАС САМЫЙ ВАЖНЫЙ МОМЕНТ В ЭПОХЕ ИИ

Глава OpenAI СЭМ АЛЬТМАН на Microsoft Build 2024 | ПОЧЕМУ СЕЙЧАС САМЫЙ ВАЖНЫЙ МОМЕНТ В ЭПОХЕ ИИ

Пишем REST API сервис на Go - УЛЬТИМАТИВНЫЙ гайд

Пишем REST API сервис на Go - УЛЬТИМАТИВНЫЙ гайд

Основы Docker: установка Docker Desktop (2023)

Основы Docker: установка Docker Desktop (2023)

Stray Kids "ATE" Trailer

Stray Kids "ATE" Trailer

JASMIN TRANS TOSHKENTDAGI UYIDAN INTERVYU 2024 #shokuz

JASMIN TRANS TOSHKENTDAGI UYIDAN INTERVYU 2024 #shokuz

Продолжаем играть в симулятор Школьника // SchoolBoy Runaway

Продолжаем играть в симулятор Школьника // SchoolBoy Runaway

WATCH: Kim Jong-Un and Putin Travel in Open Car | Putin Visits North Korea | Times Now World

WATCH: Kim Jong-Un and Putin Travel in Open Car | Putin Visits North Korea | Times Now World

Не ожидал найти такого артиста среди прохожих! 😳

Не ожидал найти такого артиста среди прохожих! 😳

Поехать к бабушке или в детдом? #shorts #iribaby

Поехать к бабушке или в детдом? #shorts #iribaby

Кто умнее - Надя Джабраилова или школьники? Шоу Иды Галич 1-11.

Кто умнее - Надя Джабраилова или школьники? Шоу Иды Галич 1-11.