CLIP 论文逐段精读【论文精读】

13 Transformer的多头注意力，Multi-Head Self-Attention（从空间角度解释为什么做多头）

Houdini Algorithmic Live #111 - Field-based Anisotropic Remeshing

Was The Dream SMP Bad?

RYAN REYNOLDS & HUGH JACKMAN | CHICKEN SHOP DATE

Deadpool & Wolverine - Movie Review

ViT论文逐段精读【论文精读】

Mu Li

Просмотров 48 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 29 ноя 2021
更多论文：github.com/mli/paper-reading

Комментарии • 46

@louisyuliu7200 Год назад ⁺²
感谢老师精彩的讲解和清楚的分析！
@xuzhang2431 2 года назад ⁺¹²
讲得太棒了！非常感谢！！
@pantan4206 2 года назад ⁺⁴
感谢老师！B站看完了来这里再来点赞
@user-wv5dc3ut9o Год назад ⁺⁵
感謝大神細心講解
@twyunghui 2 года назад ⁺¹
謝謝講解得非常清楚
@chrischen6 9 месяцев назад ⁺²
謝謝老師講解非常清楚很受用
@user-wm1yb3zi9x 11 месяцев назад ⁺⁵
这个哥们讲的内容很喜欢！👍
@morningstar618z8 Год назад ⁺⁵
讲得太好了，清晰明了，幽默风趣，全程无尿点！
@Rocky-px8jg 2 года назад ⁺¹
谢谢作者分享！
@geesehoward8838 Год назад
讲得太仔细了，非常感谢！！
@zeweichu550 Год назад
讲得非常好👍学习了
@lionhuang9209 2 года назад ⁺²
谢谢讲解！
@lionhuang9209 2 года назад ⁺²
Great presentation!
@huangjames8130 Год назад ⁺⁷
所以長話短說
先用CNN(或其他方法）得到足夠小的feature map，再用transformer跑
@Zhichaodeng2023 9 месяцев назад
讲的很清透！点赞
@yifanbai3072 2 года назад ⁺⁵
Zhu老师讲的很棒，感谢
@nicolezhao9597 Год назад ⁺²
请问老师叫什么名字？
@yafengyang1099 Год назад
讲的太好了
@muyuanliu3175 4 месяца назад
讲的真的好
@zhanlucas935 2 года назад
感谢感谢！！！
@xyh6552 6 месяцев назад
cnn和transformer基本上是同一件事情，只不过cnn更先进在特征就是tags，trasformer先进在不用一个单位一个单位滑动，但是实际上特征层和tags是一件事情的话特征层比tags的attention内积更高效，这类似于用所有basis和前几个特征函数近似，trasformer低效在要标注和attention本身，高效在不需要一个单位一个单位摞
@mingzhaochina Год назад
真棒！
@alphaprofold5707 2 года назад ⁺²
来龙去脉，前因后果，讲的太好了
@tedmsxu Год назад ⁺²
这个人的水平至少是国内优青水平～！
@baijiu_yaya 6 месяцев назад ⁺¹
44:15处，应该是√d而不是d/2
@user-dv4su5jw8n Год назад
哈哈
@user-dq1en7zd8r Год назад ⁺¹
怎么找不到老师的 VITS 解读了呢？
@xufenghu3063 2 года назад ⁺¹
嘿嘿来了
@incameet Год назад ⁺²
What is the name of the speaker?
@liqiushui2427 Год назад
44分30秒不应该是根号D嘛
@grhaonan 11 месяцев назад
Transformer base 的head 数目好像是8吧
@xyh6552 6 месяцев назад
消融实验结果差不多是因为加是完全不对的，加所带来的特征在动力系统里面全都平均掉了
@xyh6552 6 месяцев назад
位置信息如何加进去是个编码问题，要尽可能的保证信息无损的同时占用空间小，f（attention（x），position）应该比直接把位置信息加在x里面好
@x7lwavuj976 2 года назад ⁺¹¹
老師整容了？
@albertwang5974 2 года назад
这是另外一个人！
@nicolezhao9597 Год назад ⁺¹
请问老师叫什么名字？
@dayeye2011 4 месяца назад ⁺¹
这位帅哥是谁？
@jinhuizhang702 2 года назад ⁺¹
沐神呢
@user-lp2lu2ms8o 9 месяцев назад ⁺²
為什麼是224/16=14
然後input = 14*14
為何不是input = 16*16
input 是一個一個patch 的意思嗎?
@huachengli1786 7 месяцев назад ⁺¹
我的理解和你一样。一张图类比一句话。所以一个patch类比于一个词。如果word embedding 是512，那ViT里对应的就是16x16。
@huachengli1786 7 месяцев назад ⁺¹
你理解的是对的，所以文章标题是 An Image is Worth 16x16 words🤣
@user-lp2lu2ms8o 7 месяцев назад ⁺¹
@@huachengli1786 哈哈我還沒有發現
@hailuyin9915 Год назад
大神
@jeffreyhao1343 2 года назад
-------------------------------
Pretty good, done.
-------------------------------
@jeffreyhao1343 2 года назад
ViT-FRCNN and SETR
@jeffreyhao1343 2 года назад
Transformer论文逐段精读: ruclips.net/video/nzqlFIcCSWQ/видео.html

Следующие

Автовоспроизведение

CLIP 论文逐段精读【论文精读】

CLIP 论文逐段精读【论文精读】

13 Transformer的多头注意力，Multi-Head Self-Attention（从空间角度解释为什么做多头）

13 Transformer的多头注意力，Multi-Head Self-Attention（从空间角度解释为什么做多头）

Houdini Algorithmic Live #111 - Field-based Anisotropic Remeshing

Houdini Algorithmic Live #111 - Field-based Anisotropic Remeshing

Was The Dream SMP Bad?

Was The Dream SMP Bad?

RYAN REYNOLDS & HUGH JACKMAN | CHICKEN SHOP DATE

RYAN REYNOLDS & HUGH JACKMAN | CHICKEN SHOP DATE

Deadpool & Wolverine - Movie Review

Deadpool & Wolverine - Movie Review

I bought Tara her Dream Car!

I bought Tara her Dream Car!

BERT 论文逐段精读【论文精读】

BERT 论文逐段精读【论文精读】

GAN论文逐段精读【论文精读】

GAN论文逐段精读【论文精读】

斯坦福 2022 年 AI 指数报告精读【论文精读】

斯坦福 2022 年 AI 指数报告精读【论文精读】

Transformer论文逐段精读

Transformer论文逐段精读

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

Vision Transformer for Image Classification

Vision Transformer for Image Classification

Explaining the ZTE Sanctions: Why is it so hard to create microchips?

Explaining the ZTE Sanctions: Why is it so hard to create microchips?

自动驾驶技术是个啥？李永乐老师告诉你靠不靠谱

自动驾驶技术是个啥？李永乐老师告诉你靠不靠谱

Swin Transformer论文精读【论文精读】

Swin Transformer论文精读【论文精读】

Сражение ИРП ВДВ России и Польский аналог! Жажда победы!

Сражение ИРП ВДВ России и Польский аналог! Жажда победы!

😨 Майнкрафт но Можно СЪЕСТЬ ВСЕ ЧТО УГОДНО | #shorts

😨 Майнкрафт но Можно СЪЕСТЬ ВСЕ ЧТО УГОДНО | #shorts

Qizim 61-qism | Anons | Qizimning nomusini kim tiklaydi?

Qizim 61-qism | Anons | Qizimning nomusini kim tiklaydi?

Disparos en la colectora de la General Paz: ladrón atropelló a los policías que lo quisieron detener

Disparos en la colectora de la General Paz: ladrón atropelló a los policías que lo quisieron detener

Best Toilet Gadgets and #Hacks you must try!!💩💩

Best Toilet Gadgets and #Hacks you must try!!💩💩

ИГРАЮ БЕЗ ПАЛЬЦЕВ ВСЕ КАТКИ НА ТОП 1😱С ВЕБКОЙ В ПАБГ МОБАЙЛ 💛PUBG MOBILE

ИГРАЮ БЕЗ ПАЛЬЦЕВ ВСЕ КАТКИ НА ТОП 1😱С ВЕБКОЙ В ПАБГ МОБАЙЛ 💛PUBG MOBILE

Inside Out 2 vs AnythingAlexia Outlines Memes #shorts #animation #insideout2 #joy #anxiety

Inside Out 2 vs AnythingAlexia Outlines Memes #shorts #animation #insideout2 #joy #anxiety

Я совсем перестала думать в Токио 😮 Удобства в Японии #япония #токио #shorts #жизньвяпонии

Я совсем перестала думать в Токио 😮 Удобства в Японии #япония #токио #shorts #жизньвяпонии