How to Build LLMs on Your Company’s Data While on a Budget

Evaluating LLM-based Applications

How large language models work, a visual intro to transformers | Chapter 5, Deep Learning

THE GOOBERS JOINED SPRUNKI..

The Neon Faction Is BACK - TABS (final update)

How SpaceX Landed A Rocket... Without Landing Legs. Catching a Giant Rocket With Giant Chopsticks

How to Train Your Own Large Language Models

Databricks

Просмотров 42 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 15 окт 2024

Комментарии • 8

@syednaveed1391 Год назад ⁺⁸
Super useful. I am a physician, tried fine tune using cancer documents. It didn't work. Found your video Thanks
@BlackThorne Год назад ⁺¹⁷
00:35 🧠 Business Use Case: Training Large Language Models (LLMs)
01:45 💡 Reasons for Training LLMs: Customization, Cost Efficiency
02:40 🔀 Training Process: Data Pipelines, Model Training, Inference
05:16 📊 Data Processing: Filtering, Anonymization, Pre-processing
08:23 🔤 Tokenizer & Vocabulary Training: Custom Vocabulary, Benefits, Challenges
13:09 🎯 Model Evaluation: Human Eval Framework, Code Metrics vs. NLP Metrics
18:35 ⚙ Model Training & Specs: Model Size, Training Objective, Attention Mechanisms
20:55 📈 Model Training Challenges: Data Determinism, Loss Curve Spikes
23:41 🔄 Generation vs. Evaluation: Separating the Process
24:08 🚀 Deployment: Building Inference Stack, Managed Services
24:52 🖥 Model training involves GPU and model size considerations, pre/post-processing, and server/client-side logic.
25:49 🧠 Evaluating your model is crucial; define success criteria early to guide the training process.
26:02 🔄 Rapid iteration is valuable for testing model behavior and improving user experience.
26:29 ⏳ Ensure compatibility between training and inference stacks to avoid sub-optimal results.
26:57 🔄 Customization drives the desire to train LLMs with one's data; various approaches exist.
27:51 📚 Retrieval-based augmentation involves fetching relevant context to guide model responses.
28:08 🤖 Contextual prompting improves model's domain-specific knowledge, even if not originally trained.
28:21 💡 Embeddings and semantic similarity prioritize context selection for retrieval.
30:01 🎯 Fine-tuning methods vary in complexity; consider instruction tuning and training from scratch.
31:25 🔄 Models struggle with varying data formats, short-form content, and changing facts.
32:35 🌍 Custom domain data presents challenges; careful selection and use of embeddings is key.
33:37 🌶 Fine-tuning is complex; unsupervised fine-tuning for new domain knowledge has limitations.
35:18 🚫 Agents might become redundant as models absorb useful functionalities.
36:00 🔄 Balancing training data mix is challenging; no established formula, lots of variables.
37:11 💾 Data iteration tools are crucial as data, not GPUs, becomes the bottleneck for model advancement.
@mohsenghafari7652 6 месяцев назад ⁺²
hi. please help me. how to create custom model from many pdfs in Persian language? tank you.
@dilipjha08 4 месяца назад
Thanks for knowledge sharing to the technology user. It was very details about the dlt as well as streaming tables and comprison between it and demo of the topic was very perfect.
@goodstuff5666 4 месяца назад ⁺¹
Very nice tutorial! Could you guys share the slides? Thanks.
@CalebFenton Год назад ⁺²
Thanks for the info and esp the hot takes.
@AnandShah-ds 11 месяцев назад ⁺²
That was the best part. Should have been a opener.
@Qube_Cz Месяц назад
🎯 Key points for quick navigation:
00:22 *📊 Tým v replit trénoval vlastní velké jazykové modely, jako je replet kód v13b, z důvodu efektivity nákladů a úpravy pro konkurenci s Copilotem.*
01:59 *🛠️ Vlastní trénink LLMS je efektivní zejména pro použití s autokompletními funkcemi, kde každý stisk klávesy vyžaduje rychlou odpověď.*
03:19 *🔄 Proces tréninku LLMS zahrnuje datové potrubí, trénink modelů a hostování inference, což vyžaduje důkladné plánování a správu dat.*
08:23 *🗣️ Tokenizér a vlastní slovník jsou klíčové pro trénink LLMS, umožňují nastavení specifického slovníku pro doménu (např. kód) a rychlejší trénink a inference.*
13:55 *🧪 Specifikace modelu, jako velikost a architektura, jsou klíčové pro výkon LLMS a musí být pečlivě zvoleny podle požadavků aplikace.*
25:35 *🧠 Dobré vyhodnocení modelu je klíčové pro úspěšné trénování vlastního velkého jazykového modelu.*
26:02 *🔄 Pravidelná rychlá iterace během testování modelu je důležitá pro jeho efektivní vývoj.*
26:29 *📊 Důkladně propojte svůj tréninkový cyklus s infrastrukturními požadavky, aby nedocházelo k suboptimálním výsledkům.*
26:41 *⏳ Trénink vlastního velkého modelu je dlouhodobý proces, který vyžaduje trpělivost.*
26:57 *🌐 Personalizace je hlavním důvodem, proč lidé trénují vlastní velké jazykové modely.*
27:24 *🛠️ Existují tři přístupy k použití vlastních dat s LLM: kontextové podněcování, získávání informací a jemné naladění.*
29:31 *🔍 Při jemném ladění je důležité zohlednit specifické požadavky domény a změny ve vstupních datech.*
Made with HARPA AI

Следующие

Автовоспроизведение

How to Build LLMs on Your Company’s Data While on a Budget

How to Build LLMs on Your Company’s Data While on a Budget

Evaluating LLM-based Applications

Evaluating LLM-based Applications

How large language models work, a visual intro to transformers | Chapter 5, Deep Learning

How large language models work, a visual intro to transformers | Chapter 5, Deep Learning

THE GOOBERS JOINED SPRUNKI..

THE GOOBERS JOINED SPRUNKI..

The Neon Faction Is BACK - TABS (final update)

The Neon Faction Is BACK - TABS (final update)

How SpaceX Landed A Rocket... Without Landing Legs. Catching a Giant Rocket With Giant Chopsticks

How SpaceX Landed A Rocket... Without Landing Legs. Catching a Giant Rocket With Giant Chopsticks

New Heroes: Aided Dagr & Rearmed Marianne (Fire Emblem Heroes)

New Heroes: Aided Dagr & Rearmed Marianne (Fire Emblem Heroes)

Generative AI in a Nutshell - how to survive and thrive in the age of AI

Generative AI in a Nutshell - how to survive and thrive in the age of AI

[Webinar] LLMs for Evaluating LLMs

[Webinar] LLMs for Evaluating LLMs

Training Your Own AI Model Is Not As Hard As You (Probably) Think

Training Your Own AI Model Is Not As Hard As You (Probably) Think

How ChatGPT is Trained

How ChatGPT is Trained

[1hr Talk] Intro to Large Language Models

[1hr Talk] Intro to Large Language Models

Fine-tuning Large Language Models (LLMs) | w/ Example Code

Fine-tuning Large Language Models (LLMs) | w/ Example Code

A Complete Overview of Word Embeddings

A Complete Overview of Word Embeddings

"How to give GPT my business knowledge?" - Knowledge embedding 101

"How to give GPT my business knowledge?" - Knowledge embedding 101

LLMOps: Everything You Need to Know to Manage LLMs

LLMOps: Everything You Need to Know to Manage LLMs

КАПСУЛА ВРЕМЕНИ. Волга стояла много лет. ПОЕДЕТ?

КАПСУЛА ВРЕМЕНИ. Волга стояла много лет. ПОЕДЕТ?

Влад СЧАСТЛИВЫЙ, Степашку принесли домой где море подарков, а он не отходит от папы)

Влад СЧАСТЛИВЫЙ, Степашку принесли домой где море подарков, а он не отходит от папы)

Cool Parenting Gadget Against Mosquitos! 🦟👶

Cool Parenting Gadget Against Mosquitos! 🦟👶

Вертикальный мангал адвоката Егорова

Вертикальный мангал адвоката Егорова

When Khabib dropped Conor McGregor 👀 #nocommentary

When Khabib dropped Conor McGregor 👀 #nocommentary

Lp. Сердце Вселенной #30 ДВА В ОДНОМ [Один человек]• Майнкрафт

Lp. Сердце Вселенной #30 ДВА В ОДНОМ [Один человек]• Майнкрафт

ОЖИВЛЕНИЕ МЕРТВЕЦА! "25 ЛЕТ В БОЛОТЕ" СКОВАЛО ЛЬДОМ | НАДО ВЫЖИТЬ. ДИКАЯ, ГЛУХАЯ ТАЙГА!

ОЖИВЛЕНИЕ МЕРТВЕЦА! "25 ЛЕТ В БОЛОТЕ" СКОВАЛО ЛЬДОМ | НАДО ВЫЖИТЬ. ДИКАЯ, ГЛУХАЯ ТАЙГА!