Swin Transformer论文精读【论文精读】

BERT (预训练Transformer模型)

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (Paper Explained)

The Most Illegal Baseball Bat Ever Created

Vermont vs. Marshall: 2024 NCAA men’s soccer championship highlights

Boston FBI announce arrest of two Iranians in connection with fatal drone strike

Vision Transformer (ViT) 用于图片分类

Shusen Wang

Просмотров 28 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 10 фев 2025
Vision Transformer (ViT) 是很新的模型，2020年10月挂在 arXiv 上，2021年正式发表。在所有的公开数据集上，ViT 的表现都超越了最好的 ResNet。前提是要在足够大的数据集上预训练 ViT。在越大的数据集上做预训练，ViT 的优势越明显。
课件： github.com/wan...
参考文献：
Dosovitskiy et al. An image is worth 16×16 words: transformers for image recognition at scale. In ICLR, 2021.

Комментарии • 43

Следующие

Автовоспроизведение

Swin Transformer论文精读【论文精读】

Swin Transformer论文精读【论文精读】

BERT (预训练Transformer模型)

BERT (预训练Transformer模型)

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (Paper Explained)

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (Paper Explained)

The Most Illegal Baseball Bat Ever Created

The Most Illegal Baseball Bat Ever Created

Vermont vs. Marshall: 2024 NCAA men’s soccer championship highlights

Vermont vs. Marshall: 2024 NCAA men’s soccer championship highlights

Boston FBI announce arrest of two Iranians in connection with fatal drone strike

Boston FBI announce arrest of two Iranians in connection with fatal drone strike

Madison Police identify school shooter as 15-year-old female student

Madison Police identify school shooter as 15-year-old female student

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

ViT论文逐段精读【论文精读】

ViT论文逐段精读【论文精读】

【人工智能】Transformer论文《Attention Is All You Need》发表六周年回顾 | 八名作者如今都在干什么 | 多人创立独角兽公司

【人工智能】Transformer论文《Attention Is All You Need》发表六周年回顾 | 八名作者如今都在干什么 | 多人创立独角兽公司

把CNN搬运到ViT的开山之作：Swin Transformer，为什么效果那么好？

把CNN搬运到ViT的开山之作：Swin Transformer，为什么效果那么好？

从编解码和词嵌入开始，一步一步理解Transformer，注意力机制(Attention)的本质是卷积神经网络(CNN)

从编解码和词嵌入开始，一步一步理解Transformer，注意力机制(Attention)的本质是卷积神经网络(CNN)

【博士Vlog】2024最新模型Mamba详解，Transformer已死，你想知道的都在这里了！

【博士Vlog】2024最新模型Mamba详解，Transformer已死，你想知道的都在这里了！

Vision Transformer for Image Classification

Vision Transformer for Image Classification

Transformers (how LLMs work) explained visually | DL5

Transformers (how LLMs work) explained visually | DL5

Transformer模型(2/2): 从Attention层到Transformer网络

Transformer模型(2/2): 从Attention层到Transformer网络

HOW EMPIRES DISAPPEARED 2 ⚔️ #countryhumans

HOW EMPIRES DISAPPEARED 2 ⚔️ #countryhumans

The World's Maximum Security Prison: CECOT (The most evil are kept here)

The World's Maximum Security Prison: CECOT (The most evil are kept here)

ХАХАХА РЕБЯТА МЕНЯ БОИТСЯ СМЕЛОСТЬ?? #машмилаш

ХАХАХА РЕБЯТА МЕНЯ БОИТСЯ СМЕЛОСТЬ?? #машмилаш

Handshake rating med Spånga P12A🤝 #fotboll24

Handshake rating med Spånga P12A🤝 #fotboll24

IEM KATOWICE 2025 GRAND FINAL BO5

IEM KATOWICE 2025 GRAND FINAL BO5

БИТВА БЛОГЕРОВ - 22:00 РИСКОВАННАЯ АТАКА [ВСЕ В ИГРУ]

БИТВА БЛОГЕРОВ - 22:00 РИСКОВАННАЯ АТАКА [ВСЕ В ИГРУ]

Natus Vincere vs Team Spirit - IEM Katowice 2025 - Semifinal

Natus Vincere vs Team Spirit - IEM Katowice 2025 - Semifinal