AVX-512的過去和CPU設計的未來 | 當代處理器設計的難題與解答

Поделиться
HTML-код
  • Опубликовано: 1 окт 2024

Комментарии • 146

  • @tp27273529
    @tp27273529 2 года назад +44

    給還沒看完影片的人的小總結
    AVX-512就是一個代替GPU做平行運算的指令
    然後未來的CPU就像鹽酥雞一樣怎麼搭都不奇怪

    • @shps100606
      @shps100606 2 года назад

      因為大家對鹹酥雞已經吃上癮了。

  • @royluo971
    @royluo971 2 года назад +76

    AVX-512目前主要是方便直接把一些小型的神经网络直接跑在CPU上而不需要特别off-loading到GPU上,因为小型神经网络采用INT8的数据表达后直接在CPU上通过AVX-512执行的性能跟GPU几乎没有区别,这样从业者就不需要另外购买独立GPU,能够省下一大笔预算。

    • @luolisave
      @luolisave 2 года назад

      原来如此

    • @hongyihuang3560
      @hongyihuang3560 2 года назад +7

      工业上除了mobile真的没理由把神经网络塞到CPU上。云上要求的是throughput高,但CPU又不是搞throughput的。mobile为的是低功耗剪成本,况且intel不在mobile市场上玩,为了啥?AVX真的不会活得久,现在codec都有硬件加速加减码了。活不久了

    • @hongyihuang3560
      @hongyihuang3560 2 года назад +6

      我想加一句,市场的需求往往是非理性的,CPU真的不适合跑神经网络。从一名遵守工匠精神的工程师起点来说,我只能说这相当于intel说好的请大家吃粤菜,最后让一名川厨做了一桌的湘菜。相信大家给点时间回过头来最后会顿悟AVX512这是个糟糕的决策

    • @ryoushousou8774
      @ryoushousou8774 2 года назад +3

      @@hongyihuang3560 赞同你的观点。我也觉得AVX512有点鸡肋,论并行度比不上显卡,“食之无味,弃之也不可惜”。

    • @achemgliu1139
      @achemgliu1139 2 года назад +5

      icelake部分avx指令throughput可以到0.5~0.33,相当于两并发或者三并发,可以了。
      然后codec的应用的话,对于一些新出来的codec(典型:av1/h266)在硬件厂商还没有弄出硬件codec之前,avx512还是有点用的,然后一些专业用户(例如压制组)为了追求质量也喜欢用CPU压

  • @artnotes
    @artnotes 2 года назад +17

    其实GPU的问题是在于 Vector计算中间如果带着很多分支判断,就会导致卡的很惨。然后来回吧数据从CPU 和GPU推拉性能损失更大。所以对于混合Vector和分支预判的最后只能用CPU来处理(希望Nvidia Grace能解决这个问题),所以当初很多买 Phi的都是很多都是进行数学优化计算(MILP,混合整数线性规划,其实就是一个加强复杂版本的整数规划,MILP是一个NPH问题,但是现实中大量的数学优化问题都是这个类型)。

    • @poyaochang3122
      @poyaochang3122 2 года назад +1

      這好像叫branch divergence對吧

  • @henry41224
    @henry41224 2 года назад +15

    想聽聽看 公賣局 對AMD在11/9的HPC發表會的心得感想 謝謝

  • @bigbygaming3946
    @bigbygaming3946 2 года назад +25

    其實不管有沒有用 如果你的電腦只是拿來打遊戲 以現在的CPU對遊戲來講是已經效能過剩
    AMD ZEN 3 定義了CPU的新標準 而Intel也沒有從此一蹶不振 拿出了可以看得12代應對
    不管你喜不喜歡 AMD或Intel 廠家有競爭 最大的受益者就是消費者
    大家才有更高的IPC 更多的核心 更合理的價格 買到CPU 以前4C8T 剛出來都要1萬出頭 現在1萬出頭至少都有8C16T
    希望AMD跟Intel未來能在顯卡市場打壓到NVIDIA NVIDIA已經獨霸顯卡市場 各種吃相難看 極致的刀工
    NVIDIA跟板廠還有經銷商 才不管他賣顯卡的錢 是從礦工手上賺來的還是遊戲玩家的手上賺來的
    希望在競爭之下 大家才能用合理的價格 買心儀的新顯卡
    最後希望疫情趕快趨緩 虛擬貨幣能大跌 跌破挖礦賺來的錢 都不能打平電費 這樣大家就不用去買黃牛卡了!

    • @芒果的法環攻略教學武
      @芒果的法環攻略教學武 2 года назад +1

      真香,現在最大的問題是軟體跟不上 很多遊戲優化都很差尤其對多核

    • @FlameRat_YehLon
      @FlameRat_YehLon 2 года назад +1

      我现在台式电脑上用着从几年前的笔记本上抠下来的CPU,玩游戏也没什么大问题,反而是2070S的显卡在拉到4K或者在VR下会跑满都不够用。

  • @KanelwChen
    @KanelwChen 2 года назад +17

    建議不要跳過AVX 1.0 /AVX 2.0的演進,跳過三四年這些指令集的發展會讓一些人不清楚AVX發展成AVX-512的前因後果。

  • @handswasher
    @handswasher 2 года назад +12

    4:51 「與其在 CPU 上面加速這類運算,不如把他交給原本就是設計來執行平行運算的 GPU 來處理不就好了?」
    這讓我想起推土機時代的 AMD,其對未來的判斷是:堆核心、重整數運算、浮點運算交給 GPU。
    當年的 AMD 和現在的 Intel,給我的觀感是:都錯位了,一個超前於時代,一個落後於時代,理想很豐滿而現實很骨感。

    • @stephensu4371
      @stephensu4371 Год назад

      我覺得AMD推土機系列與其說是單純的堆核心,不如說他的一個模組是相當於其他人的一個核心,他一個核心相當於別人的一個線程,然後通過不斷增加整數單元來推高整數性能,可惜超過了時代,當時的software沒有對多線程和GPU加速進行優化,不然很不錯的,現在的Intel的大小核也有類似的問題,就是一個software要分散到這麼多線程如何並行也是個大問題

  • @sophist9340
    @sophist9340 2 года назад +10

    对于普通游戏玩家,AVX-512存在的意义在于游戏机模拟器(console emulation) 的性能提升,Ps3模拟(RCPC3) 和Switch模拟 (Yuzu)在 AVX-512开启下可以获得约20%的性能提升

    • @Tech4AllYall
      @Tech4AllYall  2 года назад +5

      的確,PS3 emulator是少數在利用AVX的消費者族群,其中一個原因也跟cell processor的架構有關,其實也跟Xeon Phi有類似的概念

  • @阿綸的全勳學院
    @阿綸的全勳學院 2 года назад +6

    太感謝你了 你的影片都很有內容和深度
    已經訂閱你的頻道了 期待你更多精彩的內容

  • @skyhey1189
    @skyhey1189 2 года назад +9

    You are so good at presentation! It socked me that you explained such a difficult and complex topic in a very interesting and laymen friendly fashion.

    • @Tech4AllYall
      @Tech4AllYall  2 года назад +1

      That’s the whole point of this channel, glad that you feel this way

    • @CaptainScorpio24
      @CaptainScorpio24 2 года назад

      @@Tech4AllYall please add subtitles for English speaking people 🤗

  • @moorelin1658
    @moorelin1658 2 года назад +7

    Linux之父會不喜歡AVX-512的主因是,AVX-512主要的功能是在「大量」浮點運算上面。從linux的角度來看,這個就只要給專責的gpu來處理就好了,沒必要在cpu的部分再加上一套。
    這樣就像是專為加速gpu而設計的魔法架構,雖然在打電玩的時候會很爽,但是平常幾乎用不到,所以沒有效率。
    目前在特定的軟體上AVX-512還是會有需求,主要大概是成本考量,畢竟商業上「支援也是一筆成本」。
    個人認為在「個人」電腦上,AVX-512是不需要的,但是「專業」電腦上AVX-512可能還是需要的。intel的做法只是為了達成規模經濟,及客戶依賴。不過這些近年來已經慢慢被打破了。
    「個人」用的家用電腦中,大部分的時間還是拿來上網、文書、下載、看片,AVX-512沒那麼大的需求。
    至於有沒有替代方案,apu不就是了。不然兩家公司不會一直推內顯。不過,軟體廠商不太願支援就是了。

  • @810602jay
    @810602jay 2 года назад +4

    1:10 發現眉頭不見了 跟我心裡的OS一樣哈哈🤣🤣🤣

  • @edwin1031
    @edwin1031 3 месяца назад

    伺服器cpu比較不需要AVX-512 所以Bergamo才使用Zen 4c 但是intel是消費級cpu也這樣搞

  • @奈米的槍戰日常
    @奈米的槍戰日常 2 года назад +4

    好吧 我承認 我的專題CNN確實是用cpu訓練的 反正資料庫也就幾百張照片 幾分鐘就能訓練完,當初教授還問我有沒有用到實驗室那台裝了3080的電腦…

    • @Tech4AllYall
      @Tech4AllYall  2 года назад +7

      :有啊,那個挖礦的性能蠻好的

  • @ShouSinWang
    @ShouSinWang 2 года назад +2

    其實聽不懂在公三小我只是在期待片尾有沒有新的幹話.....

  • @seanfu522
    @seanfu522 2 года назад +1

    台灣版的林亦

  • @SKTTWkartrider
    @SKTTWkartrider 2 года назад +4

    看到 6:18 忍不住糾正一下,Thread在台灣的譯名是執行緒,而非線程

    • @Tech4AllYall
      @Tech4AllYall  2 года назад

      我太習慣用英文了,不習慣用中文描述這個
      下次改進🙏🏻

    • @SKTTWkartrider
      @SKTTWkartrider 2 года назад +1

      @@Tech4AllYall 感謝~BTW,你的英語唸的很好聽!加油

  • @idryman
    @idryman 2 года назад +8

    感謝你介紹硬體指令集的差異。我是撰寫高效能軟體的工程師,這些硬體知識對於我們團隊佈局未來開發方向非常有幫助。

  • @rexlin5830
    @rexlin5830 2 года назад +2

    跑一些科學計算的也需要avx512吧

  • @李侑儕
    @李侑儕 2 года назад +4

    活著真好!

  • @benchouchc7
    @benchouchc7 2 года назад +2

    到時候可能會出現以能效核帶AVX512核心,用Infinity catch作緩沖的異構Zen

  • @franky7451
    @franky7451 2 года назад +2

    各類型的CPU依目前的發展來看應該不會有誰取代誰的問題,
    我比較在乎的是價格競爭的市場,便宜的CPU他不香嗎

  • @lijrwei1972
    @lijrwei1972 2 года назад +1

    大小核是一個權衡的方式,面積,發熱,功能都能全面,至於散熱,其實大家都能忍受3個或4個槽位的顯卡了,反觀CPU散熱還是小的多,如不計面積,及功耗,全都做大核,效能一定比較好,做到最極致,就是CPU及GPU整合在一起,AVX線程可以更多,或許比單買CPU加上GPU更超值,CPU,GPU不分家可能才是處理器廠商一直保留AVX的最大意義

  • @azrae26
    @azrae26 2 года назад +2

    什麼時候才會出RISCV下集....好想看

  • @ddx1969
    @ddx1969 2 года назад +2

    很棒的內容,讓我這樣的懶人了解 avx-512 是幹嘛的...
    另外, Alder 的 a 應該發 [ ɔ ] 的音

  • @KaLeungYip
    @KaLeungYip 2 года назад +3

    其實Intel一路都有提供「個人化」CPU定製服務(即是半客製化解決方案),只是這個服務是沒有正式公開。
    基本上只有Dell、HP、Lenovo等有自己生產、銷售與保養伺服器的企業可以向Intel提出定製要求。
    以這些企業都不會對外公開發售便用有關CPU的伺服器,只有當數據中心向這些企業發出特別要求時,這些企業先會向數據中心提供有關伺服器以合乎要求。
    以一般人只可以在由數據中心淘汰下來的「洋垃圾」伺服器找到有關CPU。
    原因是Intel對「個人化」CPU定製服務的購買數量是有要求和Intel對這些「個人化」CPU是不會提供任何保養。

    • @Tech4AllYall
      @Tech4AllYall  2 года назад +2

      這個服務其實只是客製的記憶體通道數量(譬如8個減少到6個),都沒有真的開一個新的光罩、做一款特製的晶片,跟大家對客製的想像不太一樣

    • @robin80829
      @robin80829 2 года назад

      未來IDM 2.0代工可能會有嗎

    • @leonpano
      @leonpano 2 года назад

      CPU應該不太需要保養吧
      出問題那應該就是壞掉了 可以直接丟掉的那種

    • @KaLeungYip
      @KaLeungYip 2 года назад

      @@leonpano 「CPU應該不太需要保養」……一粒幾百美元的CPU都還「可以」這樣說。
      但是對一粒以千美元起跳的CPU來說,是不可以。
      因為會願意花大量金錢購買,除了極小數的有錢玩家,大部分都是公司購買。
      它們願意花大量金錢購買不單是因為它背後代表是高效能,同時代表高可靠性。
      因為這些CPU使用的年期最小都是五年,長的十年都有。
      所以當中出現問題,不是說即刻買新電腦來更換便可以,會有其他問題發生。
      處理不好,會對生意做成不小的影響。

  • @bearlin6136
    @bearlin6136 2 года назад +1

    Apple 的 ARM 處理器真的是來勢洶洶,看到有人在port Linux到Mac Mini M1 ,就知道不單純;Apple做CPU,剛開始看似為了喝牛奶而養牛,現在看來離賣牛奶的日子不遠了。

  • @maylogger
    @maylogger 2 года назад +2

    活著真好 活著訂閱這個頻道 👍

  • @changhsinliu9784
    @changhsinliu9784 2 года назад +1

    您的影片很有料,很棒,看完就訂閱外加往回看之前的影片。

  • @CasparLi
    @CasparLi Месяц назад

    两年后回看avx512, 还是没啥人喜欢,大小核设计也只是跑分厉害。并行计算真的交给GPU就好啦!

  • @wl7915
    @wl7915 2 года назад +2

    打破零人點贊的慘劇(是不是有點太早了)

  • @edwin1031
    @edwin1031 3 месяца назад

    結果amd沒推出異質架構阿

  • @jayjun67
    @jayjun67 2 года назад +2

    最近還有一個趨勢,CPU取代顯卡成為下一代挖礦熱門人選

  • @mingstar8872
    @mingstar8872 Год назад

    一直没听清512是怎么发音的,weird ?

  • @karasgee5582
    @karasgee5582 2 года назад +1

    想想那個封裝還有怎麼設計 一定很精采 果然 活著真好

  • @_w62_
    @_w62_ 2 года назад

    先請局長大人收下小的膝蓋。小的終於知道為何人們用GPU挖礦了。可以用Michael Jordan 作例子,局長大人學識之淵,見識之博,令小的直有醍醐灌頂之感。回說上期蘋果之長遠戰略,可能是瞄準雲端伺服器業者這一塊。小的愚見。

  • @kicoyang
    @kicoyang 2 года назад

    已經有明年Apple M1 max 雙CPU 和 4 CPU的消息出來了,報導指出,M1晶片早已預留多CPU設計架構
    但若說Intel的Xeon是因應伺服器的需求,單核效能並非突出,M1多CPU的架構,定位在哪裡?伺服器嗎?適合多人多工嗎?適合開多虛擬機嗎?不知道是否有人可以說明這部分的疑問
    但值得玩味的是,本來許多Mac粉,臆測Apple的桌機產品,應該可以提高M1 max的時脈來提升速度,但若按流出的消息,Apple沒選擇提高時脈,而是選擇多CPU架構,不知道用意上有什麼差別?
    最後,令人迷惑的是,按M1晶片的架構設計,GPU和記憶體的添加靈活性很受限,但仍選擇這樣的方案,不知道對需要高效GPU運算以及需要高記憶體的工作需求領域,是怎麼想的

  • @yaus0527
    @yaus0527 2 года назад +2

    終於有新片

  • @stephensu4371
    @stephensu4371 Год назад

    我是第三種人,我很喜歡avx512

  • @AllenKuokwyshell
    @AllenKuokwyshell 2 года назад +1

    x86 系統一直以來都由數家大公司所制定。而一貫的商業模式總是希望用一種晶片統包所以可能的市場。但是隨著晶片市場的改變與ARM SoC的加入競爭,x86 CPU也不得不做出更多樣的變化來應付各種需求。過去x86也曾經想要跨足SoC市場,但競爭不過ARM與MIPS為主的SoC。可克制化核心在x86領域一直是個夢想,未來如何做到持續相容與更多客製系統來投放在不同領域,對x86的發展有絕對性的影響。就目前狀況來說,多數人用不到AVX(除非你要跑計算、模擬等等用途)。更多人是拿AVX作為超頻燒機的準則來使用。所以一般消費者絕對樂意拿更多核心或是更少的支出來換AVX。然而x86的特色不就是CISC,能塞入各種奇葩指令卻又能保持一貫的相容。取與捨中如何保持彈性,就看這兩家x86大廠能激出甚麼火花吧!

    • @cchwann1
      @cchwann1 2 года назад

      x86 新舊指令集一直都受專利保護, 主要也是 Intel 說的算, 少部分讓 AMD 或其他廠商有話語權. 後進來的系統廠商, 如果牽涉到主運算晶片設計, 要麻接受 Intel 下的遊戲規則, 還是使用 ARM-based or RISC-V 比較有主導生態系機會. 例如手機就不用受到 Intel 牽制 (但卻被 Qualcomm 的專利保護給牽制住)

    • @Tech4AllYall
      @Tech4AllYall  2 года назад +2

      其實我們已經看到客製化的x86 SoC,自從上一代Xbox/Play station開始就是客製的AMD SoC,PS5上面的Zen 2核心看來跟一般Zen 2也不太一樣(FPU上面好像有些微變動?),Intel新的IDM 2.0也有提到客製x86 SoC/CPU,但會不會連ISA extension都開放客製這我就不敢說了,畢竟這會是個長期的影響

  • @ctoid
    @ctoid 2 года назад

    現在回來看發現封面是Linus在說nvidia fck u

  • @ryoushousou8774
    @ryoushousou8774 2 года назад

    这个问题让我想到sublime,vscode和IntelliJ IDEA。三者对应编辑器,介于IDE和编辑器之间的轻量代码编辑器和IDE。感觉CPU引入AVX-512就是在并行度上前进了一小步,有点像vscode在编辑器向IDE的方向上前进了一小步,vscode现在是最流行的开发工具?
    感觉有点像,又好像没什么关系。😂😂😂

  • @barrychan3022
    @barrychan3022 2 года назад

    我不完全懂,但你確實說得好, 👍

  • @neko_0xff
    @neko_0xff 2 года назад +1

    這Linus的插圖.....

  • @iokwong1871
    @iokwong1871 2 месяца назад

    難得一見的高質量影片,兩年後看的,居然還是非常到位。

  • @pingchang99
    @pingchang99 2 года назад

    做向量计算的非常有用。我做过一个project,没有avx-512,就只能用GPU了,贵了几千。

  • @kit00001
    @kit00001 2 года назад

    能不能这样理解,avx512的指令集是服务于多核心的处理器,并且减低多核心做相关运算所带来的功耗的,那么问题来了,n卡的cuda的核心数都是千级的,难道avx512在128的核心就能发挥同等水平吗,如果是的话,intel atom就yes了

  • @chainqueueing5474
    @chainqueueing5474 2 года назад

    那是 Linus Torvalds 個人想法
    若對比人類的染色體, 及生命的運作的複雜性 AV-512 實在算不了甚麼
    只能說大自然告訴你 你的想像力不要被侷限了

  • @三流实况
    @三流实况 Год назад

    功耗太高了

  • @w888w
    @w888w 2 года назад +4

    其實可以喝個水,潤潤喉!㊗️💯🎉
    在🇹🇼活著真好!

  • @robin80829
    @robin80829 2 года назад +1

    以前為了解AVX512 對動畫渲染的作用,也看了一些到底AVX到底是啥,為啥能加 速;最後再看AVX-512的產業實際應用,目前好像只有Pixar Rendeman針對其開發,所以硬體需求就標註至少要AVX,而其它公司的渲染器則多只要SSE4。感覺也是其它公司沒有急迫性,所以也不想為其調整。

    • @Tech4AllYall
      @Tech4AllYall  2 года назад +3

      也可以先支援普及率更高的AVX2

    • @robin80829
      @robin80829 2 года назад +2

      反而GPU的渲染器用Optix跟CUDA速度比RTX卡普及還快XD

    • @徐子翔-c9o
      @徐子翔-c9o 2 года назад

      指令集的普及一向緩慢,像現在還有很多軟體只需要SSE2及以前的指令集就可以運作了,這也讓Pentium 4直到現在依然能用於日常文書用(雖然很慢)

  • @shps100606
    @shps100606 2 года назад

    按照apple的做法,很快就會看到把整個主機板收納到一個超巨型處理器的情況出現了。
    反之,另一個陣營則是傾向發展更多元化的特殊規格硬體來適配不同市場。
    通用設計的時代開始過去,我們將因為長期隔離,而演化成不同物種。

  • @ciyuezhang5969
    @ciyuezhang5969 2 года назад

    某种意义上 Apple Silicon 这种把 CPU 和 GPU 合在一起的设计是不是更能代表 AVX-512 的初衷?既然想要更强的向量运算那就干脆挂一个 GPU 上去 😂 然后靠超大内存带宽来补偿速度问题

    • @jacky6757
      @jacky6757 2 года назад

      其实最重要的是统一内存 或更为重要的是 内存同调 Memory Coherence。 当内存不是统一的,CPU的内存和GPU的内存需要大量互相传输,运算将会非常的缓慢。
      希望博主也能谈一谈 ARM 中的 NEON 吧!

  • @蕭輔辰-z2c
    @蕭輔辰-z2c 2 года назад

    AVX512怎麼感覺有點像久多良木健的夢想

  • @JayTsang
    @JayTsang 2 года назад

    @科技公賣局 那個 Xeon Phi 卡有多重 :D :D :D

  • @alexchen9554
    @alexchen9554 2 года назад

    10900K 使用者表示?? 雖然功耗爆炸高 再加一張 RTX4000

  • @cchwann1
    @cchwann1 2 года назад

    AMD 支援 AVX-512 是不是因為要支援 neural engine? 畢竟 Apple M1 都有了. 以後在消費端也許有更多應用(非訓練, 但也許是即時推導). 而且 TSMC 新製程可以讓晶片成長幅度不會像 Intel 誇張的大.

    • @Tech4AllYall
      @Tech4AllYall  2 года назад

      這個就要等明年底的發表會了
      五奈米製程雖然在面積上也會有一定的幫助,但當所有元件都縮小,AVX-512 unit還是佔了很大的比例

  • @corychan1223
    @corychan1223 2 года назад +1

    很好的主題,支持

  • @drsecu4352
    @drsecu4352 2 года назад

    我已經運用所有資源來訂閱你ㄌ
    U質頻道

  • @degenchen7095
    @degenchen7095 2 года назад

    發現眉頭不見

  • @wildwallker
    @wildwallker 2 года назад +1

    感謝有趣又明瞭的介紹

  • @歸虛
    @歸虛 2 года назад

    這讓我想起 amd在 A-10 7850K那一代做的嘗試
    它原本的打算是 如果內顯不使用,可以當FPU用
    可惜不清楚發生什麼樣的問題,結果此功能不了了之
    如果這種方式可行 那麼也打開另一個路子
    AVX-512或以後需要什麼大量的平行運算,做在APU內顯裡面就行了 一兼二顧
    或是用M.2介面來支援需要額外添加的特別的運算卡 如AVX-512方面的或是微型GPU卡 或
    就跟早期386配387,需要特別運算那就額外加FPU(或GPU DPU)單元唄

  • @juliussf2153
    @juliussf2153 2 года назад

    马上还有amx 你是不是也搞个ppt解释下

  • @kawazoekazuki
    @kawazoekazuki 2 года назад

    未來只會把不同區塊的晶片分開來layout
    並且使用不同步進來做晶片
    Intel在14nm吃太多虧了
    這也導致出現了一堆F, KF, K不同型號的出現
    想必是把晶圓上測試能用的都拿出來
    可能之前只有出到Bin A
    現在連Bin F之後的都得賣了
    回到CPU設計
    AMD的EPYC的Side by side封裝只是開始
    想想如果利用2.5D封裝裡面的Interposer搭配上TSMC的CoWos, 記憶體延遲會更低
    甚至是像Intel的EMIB還可以不用使用晶圓等級的Interposer而只需要一片銅
    未來高階封裝只會更多
    當然 要面對的挑戰也會更大

    • @Tech4AllYall
      @Tech4AllYall  2 года назад +1

      你提到Binning讓我想到一件很有趣的事情。Intel和AMD其實都在進行很激烈的binning。Intel 14nm上激烈的binning是因為製程卡關,只好靠binning挑出的golden sample來壓榨性能,同樣的,MCM設計的AMD也在激烈的,或是說積極的進行binning,這其實是MCM先天上的優勢,更高的良率讓他可以劃分出很多不同等級的bin(低電壓、高頻率等等特性),兩家廠商都在積極的挑選晶片,但他們的出發點卻非常不同,但積極binning的也連帶的殺死了超頻,silicon lottery就是其中一個受害者,未來GPU也改採MCM設計的話,超頻恐怕要成為絕學了。
      CPU設計的部分,我們已經看到MI250X上面用了類似EMIB的silicon bridge,而且他不用full silicon interposer,而是fan-out package,我很期待未來有更多的fan-out設計,比起interposer的成本更低,更適合用在消費者產品上

    • @kawazoekazuki
      @kawazoekazuki 2 года назад

      @@Tech4AllYall 其實這個技術也不是第一天了,在Vega16/20就已經開始使用,只是那時候是一個GPU加上一個HBM, 目前就是放大成(1+4)*2這樣,我相信GPU間應該還有一個die去做溝通並非兩個GPU分開作業,看到Intel的新封裝Fovores才覺得恐怖,晶片大小差距如此之大,技術層面應該很高

  • @lcc6102
    @lcc6102 2 года назад

    多謝你的影片 , 學到了好多!

  • @jaggerwang1998
    @jaggerwang1998 2 года назад

    口才好好,一镜竟然能坚持那么久才到下一镜

  • @linjianru
    @linjianru Год назад

    讲的很清楚,非常感谢。

  • @sunnyli123
    @sunnyli123 2 года назад

    好想你喔

  • @TickleFurryPawFeet
    @TickleFurryPawFeet 2 года назад

    我知道啊。LTT讲过那款显卡啊。

  • @asakotube
    @asakotube 2 года назад

    影片尾巴離題了

  • @此名稱無法顯示
    @此名稱無法顯示 2 года назад +1

    Bilibili上好像有人到你影片

  • @蒼之月日常
    @蒼之月日常 2 года назад

    活著真好

  • @充气娃娃鱼
    @充气娃娃鱼 2 года назад

    很好奇Intel的集显在运算时会不会让AVX-512过来帮下忙?

  • @woodyliu2242
    @woodyliu2242 2 года назад

    Do you think Intel will rise up again, or will die painfully?

    • @Tech4AllYall
      @Tech4AllYall  2 года назад

      Hard to say, but at least for now, Intel 7 seems to be doing well. It clocks very high and to see them making a separate 6+0 sku means that the top die is yielding well that they don’t even have enough dies with no functioning little cores

  • @ryoushousou8774
    @ryoushousou8774 2 года назад

    AVX512对操作系统开发人员造成了额外负担,Linus喷他也可以理解。有意思的是Linus喷完后转到了AMD,可是AMD接下来也要出AVX512了,Linus现在怎么选?

    • @Tech4AllYall
      @Tech4AllYall  2 года назад

      就看接下來會不會有人再問他這個問題了
      當然他第一次被問的時候只有Intel支援AVX-512

    • @歸虛
      @歸虛 2 года назад

      我個人看法是 Linus畢竟著重還是在個人PC方面
      而AVX-512就以前來看,比較是伺服器會用到的;而個人電腦能運用到的場景少
      現在也要看有多少軟體或遊戲等有支援到AVX-512 或AXV的指令集
      天下之勢 "合久必分 分久必合" 也許也可以用在電腦的發展上

  • @maxyang7919
    @maxyang7919 2 года назад +3

    感谢CPU厂商坚持把AVX做进CPU不然显卡会更难买到!🤣

    • @徐子翔-c9o
      @徐子翔-c9o 2 года назад

      確實,可以使一些小型的類神經網路(或其他應用)直接在CPU上完成而無需顯卡加速

  • @luke1987515
    @luke1987515 2 года назад

    活著真好!👍🏼

  • @user-lu4gp5rk4x
    @user-lu4gp5rk4x 2 года назад

    這個人一萬訂閱了 0...0

  • @robinvonnegut7987
    @robinvonnegut7987 2 года назад

    Heterogeneous computing is king!

  • @antangao4431
    @antangao4431 2 года назад

    真TM的硬核

  • @s901510011
    @s901510011 2 года назад

    Larrabee?

  • @pbs0083
    @pbs0083 2 года назад +1

    然而 512目前還不適合在一般人的PC中使用... 大多數時候用不到... 而且能耗比 不理想

  • @rongziwang8722
    @rongziwang8722 2 года назад

    我一直看成 AV x 512.

    • @luelue666
      @luelue666 2 года назад

      整天想 AV片嗎?

  • @TsingYiTube
    @TsingYiTube 2 года назад

    以為是某AV片的編號🤣

    • @Tech4AllYall
      @Tech4AllYall  2 года назад

      NYKD-54

    • @TsingYiTube
      @TsingYiTube 2 года назад

      @@Tech4AllYall 嘩! 估到不是好東西, 但始終都google了🤣

    • @Tech4AllYall
      @Tech4AllYall  2 года назад

      哈哈哈哈哈 抱歉抱歉

  • @78rx52
    @78rx52 2 года назад +1

    但小核心不支援AVX512 導致大核要關AVX512

    • @TWALBEVA
      @TWALBEVA 2 года назад

      你講到另一個重點了,硬體設計廠商會鼓催異質運算,讓他們針對不同需求提供最佳化的硬體
      但實務上,硬體是服務軟體的。湊足一堆最佳化的硬體,變相得把問題丟給軟體。而且要使用那些硬體,也不是呼之即來。
      所以才會出現Alder Lake上面AVX512使用的難題。
      在混搭的領域之中,要不就硬體妥協,要不就軟體妥協。
      你這問題還需要時間(去開發更成熟的工具)來解決

    • @劉奕彤-q6g
      @劉奕彤-q6g 2 года назад

      民用本來就不需要AVX512

  • @missjohn4889
    @missjohn4889 2 года назад

    Alderlake不支持avx512

  • @sunglan2004
    @sunglan2004 2 года назад +1

    AVX 512 我不是很了解,但聽了網上很多大神的分析都說,AVX 512 對普通大眾用戶來說幾乎用不到,而且會增加CPU 功耗,另外又有說顯卡已可以代替AVX 512,而且效果更理想。。。我都一臉懵了,到底CPU 上的AVX 512 有沒有用。

    • @Tech4AllYall
      @Tech4AllYall  2 года назад +1

      看了就懂了😉

    • @yaus0527
      @yaus0527 2 года назад

      肯定有用 但用不用得好 是另一會事

    • @TNParadise
      @TNParadise 2 года назад +2

      @@Tech4AllYall 請聽、我、解釋 :)

    • @corychan1223
      @corychan1223 2 года назад

      面積還吃很多,變成很有用的散熱片(誤

    • @edmondhung6097
      @edmondhung6097 2 года назад +5

      GPU運算除了開發外,實際運算還要先把數據複製到VRAM上,再運算,再複製回RAM,這一來一回的延時,如果資料量不多的話CPU都算完了。AVX512都有類似的問題,不過是因爲能耗問題而降頻,可是改頻後再加速的時間比算完一次AVX512指令要長,結果普通的指令也因降頻而減慢,所以也有關掉AVX512還是比較快的情況。當然這是指簡中只有一條AVX指令的情況,長時間連續的AVX指令還是會有差。當然這是一段時間前的資料,我亦並非開發者,資料可能有誤,有錯請指正。順帶一提,VRAM跟RAM的延遲亦是甚麼ResizeBAR,Unified memory 想要減輕或解決的問題

  • @luolisave
    @luolisave 2 года назад

    很有道理,感谢分享。更少的大核和更多的小核是未来的趋势, 现有的技术条件下每瓦特的性能表现更加重要了。

  • @cyue8862
    @cyue8862 2 года назад

    當需要多核、低能耗的應用場景時,就會發現x86的架構太笨重,更換成ARM/RISC-V等RISC架構的處理器會是較好的選擇,Linux和Windows也都開始往Arm架構轉移了。對於SIMD向量運算,ARM也提供了消費性應用的128bit的NEON 指令集,而2048bit的ARM SVE指令集目前只有富岳超級計算機(已連續四屆第一名)在使用。對一般用戶的人工智能的應用需求,Apple在CPU晶片上塞入了專用的NPU,或許更有性能/能耗優勢。

  • @ww311721
    @ww311721 2 года назад

    在M1面前, 就能耗和核心數和平行運算來說, X86都是垃圾.
    顯卡也是一樣, 功耗越做越大, 最終將成為瓶頸, A家在製程上較先進每瓦效能優於I家N家, 但什麼時候才有輕便高較能又低功耗的PC出現?
    只有M1能實現也太可悲