AVX-512的過去和CPU設計的未來 | 當代處理器設計的難題與解答

科技公賣局

Просмотров 30 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 4 янв 2025

Комментарии • 146

@royluo971 3 года назад ⁺⁷⁶
AVX-512目前主要是方便直接把一些小型的神经网络直接跑在CPU上而不需要特别off-loading到GPU上，因为小型神经网络采用INT8的数据表达后直接在CPU上通过AVX-512执行的性能跟GPU几乎没有区别，这样从业者就不需要另外购买独立GPU，能够省下一大笔预算。
@luolisave 3 года назад
原来如此
@hongyihuang3560 3 года назад ⁺⁷
工业上除了mobile真的没理由把神经网络塞到CPU上。云上要求的是throughput高，但CPU又不是搞throughput的。mobile为的是低功耗剪成本，况且intel不在mobile市场上玩，为了啥？AVX真的不会活得久，现在codec都有硬件加速加减码了。活不久了
@hongyihuang3560 3 года назад ⁺⁶
我想加一句，市场的需求往往是非理性的，CPU真的不适合跑神经网络。从一名遵守工匠精神的工程师起点来说，我只能说这相当于intel说好的请大家吃粤菜，最后让一名川厨做了一桌的湘菜。相信大家给点时间回过头来最后会顿悟AVX512这是个糟糕的决策
@ryoushousou8774 3 года назад ⁺³
@@hongyihuang3560 赞同你的观点。我也觉得AVX512有点鸡肋，论并行度比不上显卡，“食之无味，弃之也不可惜”。
@achemgliu1139 3 года назад ⁺⁵
icelake部分avx指令throughput可以到0.5~0.33，相当于两并发或者三并发，可以了。
然后codec的应用的话，对于一些新出来的codec（典型：av1/h266）在硬件厂商还没有弄出硬件codec之前，avx512还是有点用的，然后一些专业用户（例如压制组）为了追求质量也喜欢用CPU压
@tp27273529 3 года назад ⁺⁴⁴
給還沒看完影片的人的小總結
AVX-512就是一個代替GPU做平行運算的指令
然後未來的CPU就像鹽酥雞一樣怎麼搭都不奇怪
@shps100606 3 года назад
因為大家對鹹酥雞已經吃上癮了。
@artnotes 3 года назад ⁺¹⁷
其实GPU的问题是在于 Vector计算中间如果带着很多分支判断，就会导致卡的很惨。然后来回吧数据从CPU 和GPU推拉性能损失更大。所以对于混合Vector和分支预判的最后只能用CPU来处理（希望Nvidia Grace能解决这个问题），所以当初很多买 Phi的都是很多都是进行数学优化计算（MILP，混合整数线性规划，其实就是一个加强复杂版本的整数规划，MILP是一个NPH问题，但是现实中大量的数学优化问题都是这个类型）。
@poyaochang3122 3 года назад ⁺¹
這好像叫branch divergence對吧
@skyhey1189 3 года назад ⁺⁹
You are so good at presentation! It socked me that you explained such a difficult and complex topic in a very interesting and laymen friendly fashion.
@Tech4AllYall 3 года назад ⁺¹
That’s the whole point of this channel, glad that you feel this way
@CaptainScorpio24 3 года назад
@@Tech4AllYall please add subtitles for English speaking people 🤗
@阿綸的全勳學院 3 года назад ⁺⁶
太感謝你了你的影片都很有內容和深度
已經訂閱你的頻道了期待你更多精彩的內容
@iokwong1871 5 месяцев назад
難得一見的高質量影片，兩年後看的，居然還是非常到位。
@yaus0527 3 года назад ⁺²
終於有新片
@maylogger 3 года назад ⁺²
活著真好活著訂閱這個頻道 👍
@linjianru 2 года назад
讲的很清楚，非常感谢。
@changhsinliu9784 3 года назад ⁺¹
您的影片很有料，很棒，看完就訂閱外加往回看之前的影片。
@henry41224 3 года назад ⁺¹⁵
想聽聽看公賣局對AMD在11/9的HPC發表會的心得感想謝謝
@李侑00878 3 года назад ⁺⁴
活著真好！
@KanelwChen 3 года назад ⁺¹⁷
建議不要跳過AVX 1.0 /AVX 2.0的演進，跳過三四年這些指令集的發展會讓一些人不清楚AVX發展成AVX-512的前因後果。
@corychan1223 3 года назад ⁺¹
很好的主題，支持
@sophist9340 3 года назад ⁺¹⁰
对于普通游戏玩家，AVX-512存在的意义在于游戏机模拟器(console emulation) 的性能提升，Ps3模拟(RCPC3) 和Switch模拟 (Yuzu)在 AVX-512开启下可以获得约20%的性能提升
@Tech4AllYall 3 года назад ⁺⁵
的確，PS3 emulator是少數在利用AVX的消費者族群，其中一個原因也跟cell processor的架構有關，其實也跟Xeon Phi有類似的概念
@idryman 3 года назад ⁺⁸
感謝你介紹硬體指令集的差異。我是撰寫高效能軟體的工程師，這些硬體知識對於我們團隊佈局未來開發方向非常有幫助。
@azrae26 3 года назад ⁺²
什麼時候才會出RISCV下集....好想看
@lcc6102 2 года назад
多謝你的影片 , 學到了好多!
@lijrwei1972 3 года назад ⁺¹
大小核是一個權衡的方式，面積，發熱，功能都能全面，至於散熱，其實大家都能忍受３個或４個槽位的顯卡了，反觀CPU散熱還是小的多,如不計面積,及功耗,全都做大核,效能一定比較好,做到最極致,就是CPU及GPU整合在一起,AVX線程可以更多,或許比單買CPU加上GPU更超值，CPU,GPU不分家可能才是處理器廠商一直保留AVX的最大意義
@handswasher 3 года назад ⁺¹²
4:51 「與其在 CPU 上面加速這類運算，不如把他交給原本就是設計來執行平行運算的 GPU 來處理不就好了？」
這讓我想起推土機時代的 AMD，其對未來的判斷是：堆核心、重整數運算、浮點運算交給 GPU。
當年的 AMD 和現在的 Intel，給我的觀感是：都錯位了，一個超前於時代，一個落後於時代，理想很豐滿而現實很骨感。
@stephensu4371 Год назад
我覺得AMD推土機系列與其說是單純的堆核心，不如說他的一個模組是相當於其他人的一個核心，他一個核心相當於別人的一個線程，然後通過不斷增加整數單元來推高整數性能，可惜超過了時代，當時的software沒有對多線程和GPU加速進行優化，不然很不錯的，現在的Intel的大小核也有類似的問題，就是一個software要分散到這麼多線程如何並行也是個大問題
@wildwallker 3 года назад ⁺¹
感謝有趣又明瞭的介紹
@benchouchc7 3 года назад ⁺²
到時候可能會出現以能效核帶AVX512核心，用Infinity catch作緩沖的異構Zen
@moorelin1658 3 года назад ⁺⁷
Linux之父會不喜歡AVX-512的主因是，AVX-512主要的功能是在「大量」浮點運算上面。從linux的角度來看，這個就只要給專責的gpu來處理就好了，沒必要在cpu的部分再加上一套。
這樣就像是專為加速gpu而設計的魔法架構，雖然在打電玩的時候會很爽，但是平常幾乎用不到，所以沒有效率。
目前在特定的軟體上AVX-512還是會有需求，主要大概是成本考量，畢竟商業上「支援也是一筆成本」。
個人認為在「個人」電腦上，AVX-512是不需要的，但是「專業」電腦上AVX-512可能還是需要的。intel的做法只是為了達成規模經濟，及客戶依賴。不過這些近年來已經慢慢被打破了。
「個人」用的家用電腦中，大部分的時間還是拿來上網、文書、下載、看片，AVX-512沒那麼大的需求。
至於有沒有替代方案，apu不就是了。不然兩家公司不會一直推內顯。不過，軟體廠商不太願支援就是了。
@edwin1031 6 месяцев назад
伺服器cpu比較不需要AVX-512 所以Bergamo才使用Zen 4c 但是intel是消費級cpu也這樣搞
@luke1987515 3 года назад
活著真好！👍🏼
@SKTTWkartrider 3 года назад ⁺⁴
看到 6:18 忍不住糾正一下，Thread在台灣的譯名是執行緒，而非線程
@Tech4AllYall 3 года назад
我太習慣用英文了，不習慣用中文描述這個
下次改進🙏🏻
@SKTTWkartrider 3 года назад ⁺¹
@@Tech4AllYall 感謝～BTW，你的英語唸的很好聽！加油
@810602jay 3 года назад ⁺⁴
1:10 發現眉頭不見了跟我心裡的OS一樣哈哈🤣🤣🤣
@pingchang99 2 года назад
做向量计算的非常有用。我做过一个project，没有avx-512，就只能用GPU了，贵了几千。
@drsecu4352 3 года назад
我已經運用所有資源來訂閱你ㄌ
U質頻道
@AllenKuokwyshell 3 года назад ⁺¹
x86 系統一直以來都由數家大公司所制定。而一貫的商業模式總是希望用一種晶片統包所以可能的市場。但是隨著晶片市場的改變與ARM SoC的加入競爭，x86 CPU也不得不做出更多樣的變化來應付各種需求。過去x86也曾經想要跨足SoC市場，但競爭不過ARM與MIPS為主的SoC。可克制化核心在x86領域一直是個夢想，未來如何做到持續相容與更多客製系統來投放在不同領域，對x86的發展有絕對性的影響。就目前狀況來說，多數人用不到AVX(除非你要跑計算、模擬等等用途)。更多人是拿AVX作為超頻燒機的準則來使用。所以一般消費者絕對樂意拿更多核心或是更少的支出來換AVX。然而x86的特色不就是CISC，能塞入各種奇葩指令卻又能保持一貫的相容。取與捨中如何保持彈性，就看這兩家x86大廠能激出甚麼火花吧！
@cchwann1 3 года назад
x86 新舊指令集一直都受專利保護, 主要也是 Intel 說的算, 少部分讓 AMD 或其他廠商有話語權. 後進來的系統廠商, 如果牽涉到主運算晶片設計, 要麻接受 Intel 下的遊戲規則, 還是使用 ARM-based or RISC-V 比較有主導生態系機會. 例如手機就不用受到 Intel 牽制 (但卻被 Qualcomm 的專利保護給牽制住)
@Tech4AllYall 3 года назад ⁺²
其實我們已經看到客製化的x86 SoC，自從上一代Xbox/Play station開始就是客製的AMD SoC，PS5上面的Zen 2核心看來跟一般Zen 2也不太一樣(FPU上面好像有些微變動?)，Intel新的IDM 2.0也有提到客製x86 SoC/CPU，但會不會連ISA extension都開放客製這我就不敢說了，畢竟這會是個長期的影響
@bigbygaming3946 3 года назад ⁺²⁵
其實不管有沒有用如果你的電腦只是拿來打遊戲以現在的CPU對遊戲來講是已經效能過剩
AMD ZEN 3 定義了CPU的新標準而Intel也沒有從此一蹶不振拿出了可以看得12代應對
不管你喜不喜歡 AMD或Intel 廠家有競爭最大的受益者就是消費者
大家才有更高的IPC 更多的核心更合理的價格買到CPU 以前4C8T 剛出來都要1萬出頭現在1萬出頭至少都有8C16T
希望AMD跟Intel未來能在顯卡市場打壓到NVIDIA NVIDIA已經獨霸顯卡市場各種吃相難看極致的刀工
NVIDIA跟板廠還有經銷商才不管他賣顯卡的錢是從礦工手上賺來的還是遊戲玩家的手上賺來的
希望在競爭之下大家才能用合理的價格買心儀的新顯卡
最後希望疫情趕快趨緩虛擬貨幣能大跌跌破挖礦賺來的錢都不能打平電費這樣大家就不用去買黃牛卡了!
@芒果的法環攻略教學武 3 года назад ⁺¹
真香，現在最大的問題是軟體跟不上很多遊戲優化都很差尤其對多核
@FlameRat_YehLon 3 года назад ⁺¹
我现在台式电脑上用着从几年前的笔记本上抠下来的CPU，玩游戏也没什么大问题，反而是2070S的显卡在拉到4K或者在VR下会跑满都不够用。
@franky7451 3 года назад ⁺²
各類型的CPU依目前的發展來看應該不會有誰取代誰的問題，
我比較在乎的是價格競爭的市場，便宜的CPU他不香嗎
@三流实况 Год назад
功耗太高了
@ryoushousou8774 3 года назад
这个问题让我想到sublime，vscode和IntelliJ IDEA。三者对应编辑器，介于IDE和编辑器之间的轻量代码编辑器和IDE。感觉CPU引入AVX-512就是在并行度上前进了一小步，有点像vscode在编辑器向IDE的方向上前进了一小步，vscode现在是最流行的开发工具？
感觉有点像，又好像没什么关系。😂😂😂
@KaLeungYip 3 года назад ⁺³
其實Intel一路都有提供「個人化」CPU定製服務（即是半客製化解決方案），只是這個服務是沒有正式公開。
基本上只有Dell、HP、Lenovo等有自己生產、銷售與保養伺服器的企業可以向Intel提出定製要求。
以這些企業都不會對外公開發售便用有關CPU的伺服器，只有當數據中心向這些企業發出特別要求時，這些企業先會向數據中心提供有關伺服器以合乎要求。
以一般人只可以在由數據中心淘汰下來的「洋垃圾」伺服器找到有關CPU。
原因是Intel對「個人化」CPU定製服務的購買數量是有要求和Intel對這些「個人化」CPU是不會提供任何保養。
@Tech4AllYall 3 года назад ⁺²
這個服務其實只是客製的記憶體通道數量(譬如8個減少到6個)，都沒有真的開一個新的光罩、做一款特製的晶片，跟大家對客製的想像不太一樣
@robin80829 3 года назад
未來IDM 2.0代工可能會有嗎
@leonpano 3 года назад
CPU應該不太需要保養吧
出問題那應該就是壞掉了可以直接丟掉的那種
@KaLeungYip 3 года назад
@@leonpano 「CPU應該不太需要保養」……一粒幾百美元的CPU都還「可以」這樣說。
但是對一粒以千美元起跳的CPU來說，是不可以。
因為會願意花大量金錢購買，除了極小數的有錢玩家，大部分都是公司購買。
它們願意花大量金錢購買不單是因為它背後代表是高效能，同時代表高可靠性。
因為這些CPU使用的年期最小都是五年，長的十年都有。
所以當中出現問題，不是說即刻買新電腦來更換便可以，會有其他問題發生。
處理不好，會對生意做成不小的影響。
@barrychan3022 2 года назад
我不完全懂,但你確實說得好, 👍
@TickleFurryPawFeet 3 года назад
我知道啊。LTT讲过那款显卡啊。
@jayjun67 3 года назад ⁺²
最近還有一個趨勢，CPU取代顯卡成為下一代挖礦熱門人選
@wyattliu3637 3 года назад
rtm
@robin80829 3 года назад ⁺¹
以前為了解AVX512 對動畫渲染的作用，也看了一些到底AVX到底是啥，為啥能加速；最後再看AVX-512的產業實際應用，目前好像只有Pixar Rendeman針對其開發，所以硬體需求就標註至少要AVX，而其它公司的渲染器則多只要SSE4。感覺也是其它公司沒有急迫性，所以也不想為其調整。
@Tech4AllYall 3 года назад ⁺³
也可以先支援普及率更高的AVX2
@robin80829 3 года назад ⁺²
反而GPU的渲染器用Optix跟CUDA速度比RTX卡普及還快XD
@徐子翔-c9o 3 года назад
指令集的普及一向緩慢，像現在還有很多軟體只需要SSE2及以前的指令集就可以運作了，這也讓Pentium 4直到現在依然能用於日常文書用（雖然很慢）
@shps100606 3 года назад
按照apple的做法，很快就會看到把整個主機板收納到一個超巨型處理器的情況出現了。
反之，另一個陣營則是傾向發展更多元化的特殊規格硬體來適配不同市場。
通用設計的時代開始過去，我們將因為長期隔離，而演化成不同物種。
@JayTsang 3 года назад
@科技公賣局那個 Xeon Phi 卡有多重 :D :D :D
@karasgee5582 3 года назад ⁺¹
想想那個封裝還有怎麼設計一定很精采果然活著真好
@ddx1969 3 года назад ⁺²
很棒的內容，讓我這樣的懶人了解 avx-512 是幹嘛的...
另外, Alder 的 a 應該發 [ ɔ ] 的音
@Tech4AllYall 3 года назад
我都念ikea😉
@_w62_ 2 года назад
先請局長大人收下小的膝蓋。小的終於知道為何人們用GPU挖礦了。可以用Michael Jordan 作例子，局長大人學識之淵，見識之博，令小的直有醍醐灌頂之感。回說上期蘋果之長遠戰略，可能是瞄準雲端伺服器業者這一塊。小的愚見。
@kawazoekazuki 3 года назад
未來只會把不同區塊的晶片分開來layout
並且使用不同步進來做晶片
Intel在14nm吃太多虧了
這也導致出現了一堆F, KF, K不同型號的出現
想必是把晶圓上測試能用的都拿出來
可能之前只有出到Bin A
現在連Bin F之後的都得賣了
回到CPU設計
AMD的EPYC的Side by side封裝只是開始
想想如果利用2.5D封裝裡面的Interposer搭配上TSMC的CoWos, 記憶體延遲會更低
甚至是像Intel的EMIB還可以不用使用晶圓等級的Interposer而只需要一片銅
未來高階封裝只會更多
當然要面對的挑戰也會更大
@Tech4AllYall 3 года назад ⁺¹
你提到Binning讓我想到一件很有趣的事情。Intel和AMD其實都在進行很激烈的binning。Intel 14nm上激烈的binning是因為製程卡關，只好靠binning挑出的golden sample來壓榨性能，同樣的，MCM設計的AMD也在激烈的，或是說積極的進行binning，這其實是MCM先天上的優勢，更高的良率讓他可以劃分出很多不同等級的bin(低電壓、高頻率等等特性)，兩家廠商都在積極的挑選晶片，但他們的出發點卻非常不同，但積極binning的也連帶的殺死了超頻，silicon lottery就是其中一個受害者，未來GPU也改採MCM設計的話，超頻恐怕要成為絕學了。
CPU設計的部分，我們已經看到MI250X上面用了類似EMIB的silicon bridge，而且他不用full silicon interposer，而是fan-out package，我很期待未來有更多的fan-out設計，比起interposer的成本更低，更適合用在消費者產品上
@kawazoekazuki 3 года назад
@@Tech4AllYall 其實這個技術也不是第一天了，在Vega16/20就已經開始使用，只是那時候是一個GPU加上一個HBM, 目前就是放大成(1+4)*2這樣，我相信GPU間應該還有一個die去做溝通並非兩個GPU分開作業，看到Intel的新封裝Fovores才覺得恐怖，晶片大小差距如此之大，技術層面應該很高
@歸虛 3 года назад
這讓我想起 amd在 A-10 7850K那一代做的嘗試
它原本的打算是如果內顯不使用，可以當FPU用
可惜不清楚發生什麼樣的問題，結果此功能不了了之
如果這種方式可行那麼也打開另一個路子
AVX-512或以後需要什麼大量的平行運算，做在APU內顯裡面就行了一兼二顧
或是用M.2介面來支援需要額外添加的特別的運算卡如AVX-512方面的或是微型GPU卡或
就跟早期386配387，需要特別運算那就額外加FPU(或GPU DPU)單元唄
@ciyuezhang5969 3 года назад
某种意义上 Apple Silicon 这种把 CPU 和 GPU 合在一起的设计是不是更能代表 AVX-512 的初衷？既然想要更强的向量运算那就干脆挂一个 GPU 上去 😂 然后靠超大内存带宽来补偿速度问题
@jacky6757 2 года назад
其实最重要的是统一内存或更为重要的是内存同调 Memory Coherence。当内存不是统一的，CPU的内存和GPU的内存需要大量互相传输，运算将会非常的缓慢。
希望博主也能谈一谈 ARM 中的 NEON 吧！
@kicoyang 3 года назад
已經有明年Apple M1 max 雙CPU 和 4 CPU的消息出來了，報導指出，M1晶片早已預留多CPU設計架構
但若說Intel的Xeon是因應伺服器的需求，單核效能並非突出，M1多CPU的架構，定位在哪裡？伺服器嗎？適合多人多工嗎？適合開多虛擬機嗎？不知道是否有人可以說明這部分的疑問
但值得玩味的是，本來許多Mac粉，臆測Apple的桌機產品，應該可以提高M1 max的時脈來提升速度，但若按流出的消息，Apple沒選擇提高時脈，而是選擇多CPU架構，不知道用意上有什麼差別？
最後，令人迷惑的是，按M1晶片的架構設計，GPU和記憶體的添加靈活性很受限，但仍選擇這樣的方案，不知道對需要高效GPU運算以及需要高記憶體的工作需求領域，是怎麼想的
@蒼之月日常 3 года назад
活著真好
@rexlin5830 3 года назад ⁺²
跑一些科學計算的也需要avx512吧
@kit00001 3 года назад
能不能这样理解，avx512的指令集是服务于多核心的处理器，并且减低多核心做相关运算所带来的功耗的，那么问题来了，n卡的cuda的核心数都是千级的，难道avx512在128的核心就能发挥同等水平吗，如果是的话，intel atom就yes了
@cchwann1 3 года назад
AMD 支援 AVX-512 是不是因為要支援 neural engine? 畢竟 Apple M1 都有了. 以後在消費端也許有更多應用(非訓練, 但也許是即時推導). 而且 TSMC 新製程可以讓晶片成長幅度不會像 Intel 誇張的大.
@Tech4AllYall 3 года назад
這個就要等明年底的發表會了
五奈米製程雖然在面積上也會有一定的幫助，但當所有元件都縮小，AVX-512 unit還是佔了很大的比例
@奈米-fps 3 года назад ⁺⁴
好吧我承認我的專題CNN確實是用cpu訓練的反正資料庫也就幾百張照片幾分鐘就能訓練完，當初教授還問我有沒有用到實驗室那台裝了3080的電腦…
@Tech4AllYall 3 года назад ⁺⁷
：有啊，那個挖礦的性能蠻好的
@mingstar8872 Год назад
一直没听清512是怎么发音的，weird ?
@woodyliu2242 3 года назад
Do you think Intel will rise up again, or will die painfully?
@Tech4AllYall 3 года назад
Hard to say, but at least for now, Intel 7 seems to be doing well. It clocks very high and to see them making a separate 6+0 sku means that the top die is yielding well that they don’t even have enough dies with no functioning little cores
@user-lu4gp5rk4x 3 года назад
這個人一萬訂閱了 0...0
@w888w 3 года назад ⁺⁴
其實可以喝個水，潤潤喉！㊗️💯🎉
在🇹🇼活著真好！
@ShouSinWang 3 года назад ⁺²
其實聽不懂在公三小我只是在期待片尾有沒有新的幹話.....
@edwin1031 6 месяцев назад
結果amd沒推出異質架構阿
@充气娃娃鱼 3 года назад
很好奇Intel的集显在运算时会不会让AVX-512过来帮下忙？
@Tech4AllYall 3 года назад
目前看來是沒有
@此名稱無法顯示 3 года назад ⁺¹
Bilibili上好像有人到你影片
@此名稱無法顯示 3 года назад ⁺¹
連結
@Tech4AllYall 3 года назад ⁺¹
Bruh 我並沒有授權任何人轉到那邊
@蕭輔辰-z2c 3 года назад
AVX512怎麼感覺有點像久多良木健的夢想
@deersiong 2 года назад ⁺¹
台灣版的林亦
@ryoushousou8774 3 года назад
AVX512对操作系统开发人员造成了额外负担，Linus喷他也可以理解。有意思的是Linus喷完后转到了AMD，可是AMD接下来也要出AVX512了，Linus现在怎么选？
@Tech4AllYall 3 года назад
就看接下來會不會有人再問他這個問題了
當然他第一次被問的時候只有Intel支援AVX-512
@歸虛 3 года назад
我個人看法是 Linus畢竟著重還是在個人PC方面
而AVX-512就以前來看，比較是伺服器會用到的；而個人電腦能運用到的場景少
現在也要看有多少軟體或遊戲等有支援到AVX-512 或AXV的指令集
天下之勢 "合久必分分久必合" 也許也可以用在電腦的發展上
@asakotube 3 года назад
影片尾巴離題了
@bearlin6136 3 года назад ⁺¹
Apple 的 ARM 處理器真的是來勢洶洶，看到有人在port Linux到Mac Mini M1 ，就知道不單純；Apple做CPU，剛開始看似為了喝牛奶而養牛，現在看來離賣牛奶的日子不遠了。
@chainqueueing5474 3 года назад
那是 Linus Torvalds 個人想法
若對比人類的染色體, 及生命的運作的複雜性 AV-512 實在算不了甚麼
只能說大自然告訴你你的想像力不要被侷限了
@jaggerwang1998 3 года назад
口才好好，一镜竟然能坚持那么久才到下一镜
@luolisave 3 года назад
很有道理，感谢分享。更少的大核和更多的小核是未来的趋势, 现有的技术条件下每瓦特的性能表现更加重要了。
@alexchen9554 3 года назад
10900K 使用者表示?? 雖然功耗爆炸高再加一張 RTX4000
@stephensu4371 Год назад
我是第三種人，我很喜歡avx512
@neko_0xff 3 года назад ⁺¹
這Linus的插圖.....
@s901510011 3 года назад
Larrabee?
@TsingYiTube 3 года назад
以為是某AV片的編號🤣
@Tech4AllYall 3 года назад
NYKD-54
@TsingYiTube 3 года назад
@@Tech4AllYall 嘩! 估到不是好東西, 但始終都google了🤣
@Tech4AllYall 3 года назад
哈哈哈哈哈抱歉抱歉
@juliussf2153 3 года назад
马上还有amx 你是不是也搞个ppt解释下
@CasparLi 4 месяца назад
两年后回看avx512，还是没啥人喜欢，大小核设计也只是跑分厉害。并行计算真的交给GPU就好啦！
@maxyang7919 3 года назад ⁺³
感谢CPU厂商坚持把AVX做进CPU不然显卡会更难买到！🤣
@徐子翔-c9o 3 года назад
確實，可以使一些小型的類神經網路（或其他應用）直接在CPU上完成而無需顯卡加速
@wl7915 3 года назад ⁺²
打破零人點贊的慘劇（是不是有點太早了）
@pbs0083 3 года назад ⁺¹
然而 512目前還不適合在一般人的PC中使用... 大多數時候用不到... 而且能耗比不理想
@cyue8862 3 года назад
當需要多核、低能耗的應用場景時，就會發現x86的架構太笨重，更換成ARM/RISC-V等RISC架構的處理器會是較好的選擇，Linux和Windows也都開始往Arm架構轉移了。對於SIMD向量運算，ARM也提供了消費性應用的128bit的NEON 指令集，而2048bit的ARM SVE指令集目前只有富岳超級計算機（已連續四屆第一名）在使用。對一般用戶的人工智能的應用需求，Apple在CPU晶片上塞入了專用的NPU，或許更有性能/能耗優勢。
@rongziwang8722 3 года назад
我一直看成 AV x 512.
@luelue666 3 года назад
整天想 AV片嗎？
@ctoid 2 года назад
現在回來看發現封面是Linus在說nvidia fck u
@Tech4AllYall 2 года назад ⁺¹
哈哈哈內行欸
@sunglan2004 3 года назад ⁺¹
AVX 512 我不是很了解，但聽了網上很多大神的分析都說，AVX 512 對普通大眾用戶來說幾乎用不到，而且會增加CPU 功耗，另外又有說顯卡已可以代替AVX 512，而且效果更理想。。。我都一臉懵了，到底CPU 上的AVX 512 有沒有用。
@Tech4AllYall 3 года назад ⁺¹
看了就懂了😉
@yaus0527 3 года назад
肯定有用但用不用得好是另一會事
@TNParadise 3 года назад ⁺²
@@Tech4AllYall 請聽、我、解釋 :)
@corychan1223 3 года назад
面積還吃很多，變成很有用的散熱片(誤
@edmondhung6097 3 года назад ⁺⁵
GPU運算除了開發外，實際運算還要先把數據複製到VRAM上，再運算，再複製回RAM，這一來一回的延時，如果資料量不多的話CPU都算完了。AVX512都有類似的問題，不過是因爲能耗問題而降頻，可是改頻後再加速的時間比算完一次AVX512指令要長，結果普通的指令也因降頻而減慢，所以也有關掉AVX512還是比較快的情況。當然這是指簡中只有一條AVX指令的情況，長時間連續的AVX指令還是會有差。當然這是一段時間前的資料，我亦並非開發者，資料可能有誤，有錯請指正。順帶一提，VRAM跟RAM的延遲亦是甚麼ResizeBAR，Unified memory 想要減輕或解決的問題
@78rx52 3 года назад ⁺¹
但小核心不支援AVX512 導致大核要關AVX512
@TWALBEVA 3 года назад
你講到另一個重點了，硬體設計廠商會鼓催異質運算，讓他們針對不同需求提供最佳化的硬體
但實務上，硬體是服務軟體的。湊足一堆最佳化的硬體，變相得把問題丟給軟體。而且要使用那些硬體，也不是呼之即來。
所以才會出現Alder Lake上面AVX512使用的難題。
在混搭的領域之中，要不就硬體妥協，要不就軟體妥協。
你這問題還需要時間(去開發更成熟的工具)來解決
@劉奕彤-q6g 3 года назад
民用本來就不需要AVX512
@robinvonnegut7987 3 года назад
Heterogeneous computing is king!
@sunnyli123 3 года назад
好想你喔
@degenchen7095 3 года назад
發現眉頭不見
@antangao4431 3 года назад
真TM的硬核
@missjohn4889 3 года назад
Alderlake不支持avx512
@ww311721 3 года назад
在M1面前, 就能耗和核心數和平行運算來說, X86都是垃圾.
顯卡也是一樣, 功耗越做越大, 最終將成為瓶頸, A家在製程上較先進每瓦效能優於I家N家, 但什麼時候才有輕便高較能又低功耗的PC出現?
只有M1能實現也太可悲

Следующие

Автовоспроизведение