- Видео 33
- Просмотров 7 558
Russian NLP
Добавлен 30 авг 2020
Here we talk about NLP, Large Language Models, and AGI.
Илья Козиев "Генеративная поэзия" (21.11.2024)
Обзор методов генеративной поэзии.
Презентация: clck.ru/3EmGem
Презентация: clck.ru/3EmGem
Просмотров: 30
Видео
Данил Астафуров "Интерпретируемость языковых моделей" (13.11.24)
Просмотров 126День назад
В рамках доклада разбирается серия статей Anthropic: ↗️ Towards Monosemanticity: Decomposing Language Models With Dictionary Learning transformer-circuits.pub/2023/monosemantic-features/index.html ↗️ Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet transformer-circuits.pub/2024/scaling-monosemanticity/index.html ↗️ Evaluating feature steering: A case study in miti...
Антон Емельянов "Методы для обнаружения утечек данных в LLM" (19.09.2024)
Просмотров 1942 месяца назад
Доклад посвящен разбору современных методов детекции утечек данных в LLM. Статьи: * DETECTING PRETRAINING DATA FROM LARGE LANGUAGE MODELS (arxiv.org/pdf/2310.16789) * Min-K% : Improved Baseline for Detecting Pre-Training Data from Large Language Models (arxiv.org/pdf/2404.02936) * Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models (arxiv.org/...
Мария Тихонова "AI Agents. Benchmarking" (07.09.2024)
Просмотров 1522 месяца назад
Доклад посвящен оценке AI-агентов, бенчмаркам, которые для этого есть, и вызовам, которые сегодня стоят перед исследователями в области агентов. Спикер: t.me/mashkka_ds (tg) Слайды: clck.ru/3D4bAX Материалы и ссылки по теме: t.me/mashkka_ds/1710
Алена Феногенова "Обзор конференции ACL'24" (29.08.2024)
Просмотров 1132 месяца назад
Доклад представляет из себя обзор основных работ ведущей NLP конференции ACL'24 Бангкок. Слайды: clck.ru/3CuzaZ
Алена Феногенова "Как ревьюить статьи?" (03.07.2024)
Просмотров 944 месяца назад
В докладе Алена рассказывает о процедуре ревью на ведущих мировых конференциях и делится опытом того, как правильно ревьюить статьи. Слайды тут: clck.ru/3BmVLj
Федор Черногорский "RAG benchmarking" (04.07.2023)
Просмотров 2454 месяца назад
В докладе рассматриваются различные способы оценки RAG систем и способы формирования датасетов для тестирования RAG пайплайнов. Презентация clck.ru/3BhKqS
Мария Тихонова "Главные вопросы про статьи и Research" (29.02.2024)
Просмотров 2518 месяцев назад
Вебинар посвящен тому, как и зачем делать исследования и как писать научные статьи. На вебинаре Мария Тихонова рассказывает про основные правила написания статей и про то, как максимально "безболезненно их писать". Что при этом обязательно стоит учесть, на чем сделать акцент и как распределить свое время. Надеемся, что вебинар убедит вам в том, что статьи - это интересно и нестрашно, главное за...
Алена Феногенова "InstructScore & Leveraging Large Language Models for NLG Evaluation" (15.02.2024)
Просмотров 1059 месяцев назад
Автоматическая оценка генеративных задач представляет собой огромное поле для исследований. В данном докладе мы рассмотрим новую метрику InstructScore, которая является fine-grained подходом для оценки генераций текстов, и общий обзор, посвященный NLG оценке, в котором авторы предложили таксономию генеративных подходов. INSTRUCTSCORE: Explainable Text Generation Evaluation with Finegrained Feed...
Федор Черногорский "Методы фильтрации и сбора данных для instruction tuning" (08.02.2024)
Просмотров 1389 месяцев назад
Обзор и сравнение методов сбора данных для instruction tuning, а также оценка влияния различных параметров sft сетов (quality, complexity, diversity, etc.). Многие работы утверждают, что количество данных при файнтюне - не самый важный параметр, и при должном внимании к сбору датасета можно поднять качество модели при меньших затратах вычислений. Слайды: clck.ru/38fAS2
Мария Тихонова - Исследователь 2023 года #shorts
Просмотров 22510 месяцев назад
Мария Тихонова - Исследователь 2023 года #shorts
Мурат Апишев "Методы Кодирования Позиционной информации в Transformer" (8.12.2023)
Просмотров 22011 месяцев назад
Мурат Апишев "Методы Кодирования Позиционной информации в Transformer" (8.12.2023)
Мария Тихонова, Дани Эль-Айясс "Как найти общий язык с ИИ? Как применять ИИ в работе и жизни?"
Просмотров 23711 месяцев назад
Мария Тихонова, Дани Эль-Айясс "Как найти общий язык с ИИ? Как применять ИИ в работе и жизни?"
Мария Тихонова "Генеративный ИИ: Новые возможности нейронных сетей" (20.11.23)
Просмотров 240Год назад
Мария Тихонова "Генеративный ИИ: Новые возможности нейронных сетей" (20.11.23)
Павел Гращенков “Составляющие как элементарные единицы высказывания” (27.10.2023)
Просмотров 103Год назад
Павел Гращенков “Составляющие как элементарные единицы высказывания” (27.10.2023)
Петр Суровцев "Основы Русского Жестового Языка" (13.10.2023)
Просмотров 171Год назад
Петр Суровцев "Основы Русского Жестового Языка" (13.10.2023)
Крайнов Роман, Александр Нагаев "Visual Transformers" (06.10.2023)
Просмотров 182Год назад
Крайнов Роман, Александр Нагаев "Visual Transformers" (06.10.2023)
Анастасия Козлова "Comparison of Transformer Attention and Human Attention" (29.09.2023)
Просмотров 124Год назад
Анастасия Козлова "Comparison of Transformer Attention and Human Attention" (29.09.2023)
Мурат Апишев "Мультимодальные модели на основе архитектуры Transformer" (15.09.2023)
Просмотров 265Год назад
Мурат Апишев "Мультимодальные модели на основе архитектуры Transformer" (15.09.2023)
Данил Астафуров "Decoding Strategies" (01.09.2023)
Просмотров 101Год назад
Данил Астафуров "Decoding Strategies" (01.09.2023)
Павел Лебедев "Как делать данные: Сколько их нужно и каких?" (30.07.2023)
Просмотров 130Год назад
Павел Лебедев "Как делать данные: Сколько их нужно и каких?" (30.07.2023)
Павел Лебедев "Открытые проблемы и приложения больших языковых моделей" (11.08.2023)
Просмотров 282Год назад
Павел Лебедев "Открытые проблемы и приложения больших языковых моделей" (11.08.2023)
урфу когда-нибудь???)
Лекция класс! Все доходчиво и ясно