為什麼遊戲能吃滿顯卡卻吃不滿多核CPU | 遊戲 | CPU | 顯卡 | 多核 | 多任務 | 單機遊戲 | 3A大作 | 網絡遊戲 | FC遊戲
HTML-код
- Опубликовано: 5 июл 2024
- 画面引用:
[TAS] NES Gradius by adelikat
Afghanistan Red Zone | Ultra Realistic Graphics Gameplay [4K 60FPS UHD] Call of Duty
How Many CPU Cores Do You Really Need For Gaming in 2023
If this is not the correct way to use a 896-Core Processor, I don't know what is.
The NVIDIA RTX 4090 Unboxing - A MASSIVE GPU! (3x)
live演奏:
Bustling Afternoon in Mondstadt
Fallen Down (Reprise)
Sweden - Minecraft (Violin and Marimba Cover)
HENRY ALLISON (小提琴)
NICHADA JIRAWATTANAPHAN (马林巴琴)
@ClassicalCovers
欢迎订阅👉is.gd/p1FPdr
Welcome to subscribe👉is.gd/p1FPdr
喜欢我的视频,请按赞、分享哦~
Like my video welcome hit like and share it~
开启小铃铛第一时间接收最新资讯~
🔔Light up the little bell and receive the latest news first Наука
多核心 體現的是多工
也就是大多數人 會邊玩邊開DC 還有網頁撥音樂
遊戲體驗更多是體現在IPC跟單核頻率的提升
老鐵,你影片字幕特地轉成繁體,太貼心了吧
對滴,在油管現在都會專門出繁體字幕
簡單來說就是編寫多核心程式的難度高於單核心程式
畢竟還是人去寫遊戲,邏輯判斷也是人去想的
不是不能利用超多核,而是要去"思考如何運用很費時間",除非有人專心開發這類的邏輯框架。
不過現在有了AI,感覺思維判斷的部分會更進一步🤔🤔
突然覺得cpu好慘啊!
從以前全部都丟給他算,到現在「只要不要成為拖油瓶就好了」
以前是血汗勞工,現在是被嫌棄是拖油瓶😂
因為現代遊戲把運算跟圖型任務拆分了
不過現在的Windows掌機把輕薄型筆電改來做掌機,加上內顯的性能提升,估計CPU就能重新做他們該做的工作了。
04:03 那個核心數與效能圖是錯誤的
實際上是到一定核心數後,效能增長停滯;
(要寫到CPU核心數較多 整個效能還比較慢 那個會是寫程式的人有問題
程式寫得不好 什麼圖都可以長得出來)
另外假設是完全獨立的運算 也會是到一定核心數後效能增長停滯(會卡在核心溝通效率)
Context Switch Overhead
那个图可能太平滑了,多数情况是有可能下滑的,因为核心越多,内存访问lock开销会越大,整体效能会出现下滑,当然也不是绝对的,比如挖矿这种纯计算的,不会
關於遊戲用CPU,AMD比較理想的做法,是用一個Zen5c的CCD,上面蓋一個3D快取,這樣就是16核心共享一組96MB的L3快取。
@@sutlliao 这种说法让人很容易理解
問就是X3D走起,要打游戲就快取來湊,要做多工、渲染就核心來湊。一魚兩吃香的嘞。
amd的做法對於通道的延遲跟通道大小都會有影響 畢竟家用處理器不需要這麼多核 即便是X3d也只能緩和延遲 因為cpu上的cache 越大成本越高
@@stu9311056 現在L3快取比CPU核心大很多,以同樣32MB快取來說,Zen4c晶片面積只比Zen4大9%(72:66),但核心數就從8加倍到16。
3D結構是蓋一個64MB的L3快取,到原本32MB快取的正上方,除了比較貴之外,散熱效率也比較差,所以R9只敢蓋一個,想說讓另一個CCD跑快一點,結果雙CCD不等效互拖後腿,反而讓7800X3D成為最強遊戲用CPU。
那樣未來3D快取是要在兩個Zen5 CCD上都蓋一塊,來取得性能平衡嗎?
那樣不如在Zen5c上面蓋一塊就好。
@@stu9311056 所以才説戰未來,多核的應用場景逐年攀升、3d v-cache也是實打實在特定類型的游戲有實質提升,成本的問題會因爲產品路綫的基礎在未來開發研發成本是漸漸降低的,都是科技基石。
還有一個重點,那個萬年10nm我是真沒辦法接受。
最近的風格出的片有夠讚的
请问那一般编译多少核心比较合适呢?编译器的优化是不是核心越多越好?我看很多需要编译的都喜欢买昂贵的TR。
-原來是敗家之眼RTX的業配啊-
真不是。。。最后那段是引用的画面
如果是业配,甲方得钱太好赚了吧~
顯卡可以只專心的管繪圖部份。
但是cpu不行。其實一開始GPU也是來分擔CPU的工作。
最简单的一个多核心优化的编程例子就是for loop, 很多时候的循环其实可以用并行却不用,看似很简单很多程序员没这个概念
誠心請教一下...我這2年才知道可以寫程式控制不同核心在任務管理器顯示的狀態(例如用其播放 BAD APPLE 動畫)....
那是否可以在128或甚至256[線程] 的主機中寫個程式把任務管理器當低解析度顯示器來遊玩簡單結構的遊戲?
例如吃豆人(小精靈) 或打磚塊 這類的
理论上没有问题,只是有没有人愿意做
那也是近年的问题,之前可是8个框框神秘加成
大部分都是敗在優化吃不滿效能,另外有一款叫帝國神話,是我最近碰到會同時大量消耗Cpu跟Gpu的遊戲
我的看法是显卡的算力比CPU要高出很多,用显卡处理大量数据反而可以减轻CPU的负担
CPU算是工作調度員
這邊要分成二個維度看
1. 主管辦事效率快不快(取決於CPU時脈)
2. 主管身上的事情有沒有分發給其他人去做(取決於開發人員功力)
能力好的主管會分配好大家工作的任務
能力不好的主管會把事情都攬在身上自己做
至於如何分析工作、分發工作,就是開發人員需要去分析的
我打瓦cpu佔用50趴左右
Gpu 佔用5趴
I5 12400+4060
幀率250-300 該怎麼優化
學習要維持,就玩斯維馳
奇怪我应该关掉了○ 怎么我还听到了蒙德的BGM?
大佬,请问您使用的BGM是要花钱的吗?永久购买还是每个月要付费呢?
征得作者同意的
@@epcdiy 想要找一个免费电子鼓的bgm,还没找到,还再看视频学习剪映,还没做出一个视频呢。
@@kandianying 油管有很多免费bgm可以用
认为多核可以线性增加性能的就是根本不理解计算机,多核想要实现多线程提高性能的前提是任务可以分解后并行执行以减少执行时间,然后现实是绝大多数任务是串行不可分解的,只有上一步执行完了,然后上一步的执行结果作为下一步的输入,也就是只有上一步执行完了下一步才能开始。
沒有真雙核...
說什麼也枉然...
各位只能繼續使用偽雙核...😞
其实瞎说之前,以后顺带打开频率显示,不要只看%, 你会更好看到处理器运用程度。其他理由其他楼已经很多人提出,现在游戏很多优化用了更多核心,甚至十年前老游戏上古卷轴online也通过更新把gpu工作分给处理器,玩家一遍兴起,fps提升不少
容易多工的工作都被GPU搶走了啦
然後瓶頸大部分在GPU,與其去花功夫去拆cpu tasks,不如去優化GPU那邊的邏輯
游戏其实是CPU这边复杂逻辑占比最大,显卡干的事情比较单纯
gpu 只能处理简单逻辑
pc端很看開發者,所以我才認為這時代還是家機高過PC 縱使很多家機遊戲開始慢慢移植到PC端,結論也一樣,注定是無法改變的事實
当年真是多核受害者 08年用4核 打游戏永远卡成狗然后一看任务管理器雷打不动25%
现在126k关ht关e核 夏天5.3冬天5.4g 带4090 gpu还总是先瓶颈。
对玩家来说 cpu核战是秀肌肉跟营销的产物 可惜这条路已经坚定的走下去了。
helldiver2 把cpu 搞到要烧了。。
有一些特別的遊戲 可以搞點活 用CPU模擬GPU跑遊戲 在遊戲設置內的術語通常叫做D3D軟體加速 或類似的
隔壁友台UP主有這樣玩過
根本影片完全無關。
生化危机2 pc版?
群星玩家表示 多核是什么?
時脈高比較有用
這個邏輯關係該如何理解?
例如現在有一個遊戲是我和另一個玩家在走路,我們固然有機會會撞上,撞上之後兩個人都會倒地,然後暫停移動5秒。
判斷是否撞上時這兩個人被簡化作為兩個長方體。那麼這個長方體的內部是怎樣(例如手腳如何擺動)關係不大。那麼可以我和另一個人的動作分配在兩個不同的執行緒,然後碰撞判斷又用另一個執行緒處理?還是這些所有的東西都要用同一個執行緒來處理?
如果這兩個人相距十分遠,短期內完全沒有碰撞的機會(這個遊戲並沒有瞬移的功能),那麼這兩個人又可以分配到不同執行說來處理嗎?
把数据分离出来再切换线程去执行是有开销的,不光包括上下文切换的开销也包括线程间数据同步的开销。所以任务并不是分得越细越好,而是通常通过跑模拟任务去估算。另外为了最大化现代CPU缓存的效率,也通常会把强关联的逻辑放到一个线程里去跑,减少必须访问内存的次数。
逻辑关系的专业术语是数据依赖(data dependency),也就是下一个逻辑步骤的输入依赖于上一个步骤的输出。这种情况下这两个步骤原则上必须先后执行,不可能并行。(此处mark防止有人用分支预测抬杠)
虽然把不同的角色分配到不同核心的做法似乎很符合直觉,但是实操中基于代码易维护的原则不会这么做,游戏的主循环都是单一核心来完成。
這個情況大概還是單核比較好?
單核:依角色A的輸入計算角色A新位置>依角色B輸入計算角色B新位置>碰撞判定>loop……
多核甲:依角色A輸入計算角色A新位置
多核乙:依角色B輸入計算角色B新位置
多核丙:等待甲乙核完成工作>利用甲乙核傳回的數據做碰撞判定>loop……
這一下來多核處理似乎不會變快,而且編起來還更麻煩?
这里需要注意一点,cpu-z几乎是不能代表游戏性能的。因为通过vtune等方式测试cpuz跑分对cpu组件(比如前端解码、FPU、缓存这些)的的负载和实际游戏渲染等场景相差极大,甚至经常出现倒挂。建议还是使用游戏内置的测试工具来判断性能。
你所谓游戏性能指的是什么?CPU在游戏里不是参与通用计算吗?cpuz测试的就是通用计算性能,而你所说的渲染,实际上是显卡干的
同代产品这么比较做参考没问题 其他访存性能差异造成的差距属于整体平台的问题也跟cpu自身无关
@@epcdiy 跑游戏的时候抓取的cpu负载。通用计算和通用计算也是不一样的,就和跑游戏和跑科学计算要求的性能完全不一样差不多。cpuz跑分对分支预测要求极低,前端解码器要求极低,几乎没有dram bound, 反而对L1负载极大并且对L3的需求异常高,在不同cpu架构之间完全没有参考价值。我说的渲染是顺带提一嘴生产力方面而已,因为cpuz和3d渲染性能也毫无关系。
一些数值:在clx架构上,游戏的frontend bound在20-40%样子,cpuz是个位数。fpu 3a一般都有20%占用,cpuz个位数。dram bound游戏在10-30%之间,cpuz直接是0. cpi在1以上,优化好点的游戏0.5-0.7都很多。这玩意不仅负载跑偏,优化也不行。
@@phenomx100_3 同样架构的确可以比比。不过同架构直接比频率就行了。
幻兽帕鲁真的神奇 游戏玩越久内存占用越高,到最后游戏开始卡顿然后闪退😂😂
帕魯會自己啊繁殖啊,挺正常
典型的memory leak的例子,程序员要背锅
@@yao7234 Unreal C++,不意外 lol
ruclips.net/video/HIVBhKj7gQU/видео.html
ND有設計multithreaded架構
可以同時玩多個遊戲囉..... 🤣🤣🤣
沒錯,所以洋垃圾適合多開模擬器😂😂😂
都不是一个游戏了,还说啥子
@@epcdiy 同個網遊多開
背景音樂: Minecraft?
原神
@@psychiatricpatients ?????我無課有很多5星欸
@@psychiatricpatients 沒玩過的才會說都要錢
@@psychiatricpatients😅不願肝就只好課囉,不然白送你白富美長腿?
Undertale
龍族教義:
你个破游戏吃满多核cpu、你算老几呀?来个其它任务咋办?系统卡崩盘了、你也升天了、这点觉悟都没有吗?gpu你吃满又不影响系统整体、cpu还能调节调度运行、cpu是老板、负责全局、gpu是员工、负责单一任务猛干、老板宕机、公司就升天了、员工宕机、老板还能顶半边天。
打的比喻真好 很喜歡你的說法
up主我真的想友善的说,这期槽点有点多,你确实很认真做实验,但是得出的结论可以说90%都是错的。完全不了解现代游戏开发和游戏引擎的执行情况。
几个核心都是要前期开发设计软件架构的时候决定好的。你设计的越多,考虑的因素就越多。很简单一个道理,128核心可以做到,但是你要同时考虑只有127个核心-只有1个核心的case。因此做这种费力不讨好的事情,获得的收益是不成比例的。因此你会发现05年的游戏都是单核心,10年的核心可以跑2个核心左右,13年的游戏可以跑4个核心。这些能跑几个核心,是游戏开发团队前期要考虑的事情,取决于当时主流硬件配置是多少,才值得去做的。而不是你说的什么逻辑判断只能做成几个核心,以及频繁切换会造成负担。你观测到的很大一部分并不是游戏本身设计的,而是操作系统的CPU调度器造成的。现代软件开发不是你说的x个功能设计在x个核心上,比如战场上数以百计的机器人士兵,每个士兵作为object,拥有移动、攻击、防守等逻辑,而作为一个整体object被实例化后。每个实例是自动的随时被new出来并且join到某个线程,随时又被delete。具体分布核心是取决于CPU,游戏开发可以指定偏好,但是没必要强绑定,这样你相当于自己做了一个CPU调度器和系统冲突。而且你要考虑不同核心数量的设备如何解决。开发效率和移植性都很差。总之如果有兴趣可以和一个软件开发up主学习一下或者合作。这么做确实有点误导人了。
我觉得你的观点和我视频中的内容并不冲突啊,但你似乎没有看明白我表达的内容。我后面有提到并不是核心越多速度越快,你说前期规划好,那都没毛病,和我视频观点是一致的。
我所说CPU切换讲的是set cpu affinity这个问题,是另外一个case,不是说游戏故意这样做,而是不绑核CPU就是有损失的(如果你做过嵌入式开发应该能体会到),针对硬件优化过的主机游戏就会绑核,这是一种优化手段。
还有你说数以百计的士兵,比如有移动攻击防御,new出来后,我认为这些逻辑不太适合做多线程,因为假如你new出来4个士兵,在4个不同的线程,如果但凡出现两个士兵需要交互,比如A打B,而是事实,绝不止2个士兵交互,可能存在A打B,B打C,D打AB的情况,这样就会出现频繁lock,效率并不高,而且对开发难度也增加很多,这就是我视频里说的强关联逻辑
Core 2 + 双 RTX3090 就是爽。
低U高显是吧
考慮一下 Raspberry pi 搭DGX系列嗎?
那怎麽挑選跑模擬器的CPU
AMD R5或intel i5都可勝任
多開掛機可以選 R9或i9級別
但如果是PS3模擬器 建議直上I7 I5會顯得很吃力
@@stu9311056 感謝回覆 請問i7 12700可以嗎? 之前有說Inter 12代 煙割了模擬器需要的指令集,有影響嗎?我是希望可以跑vita3k 60幀 感謝
@@user-cx6rg6mr7d 我不知道vita3k反編譯能力進化到哪了 應該是沒問題
那是因為沒有用UE5來做
泰坦陨落6 @4:40
6的剧情其实很好,被渣优化毁了的游戏
簡單來說就是遊戲寫得太濫 不能拆成多個工作運行
時脈高的至強cpu 4核8線程睿頻9Ghz 的就呵呵笑了
SB P社到現在還在用TM的單核遊戲引擎做遊戲
一核有難. 七核圍觀
超好笑,學習機是怎樣啦
沒說學什麼,沒毛病 XD
少了軟體 驅動或是應用程式去分配執行
這就是ps3輸給360的原因吧?
看過文章說過360的整體遊戲效果遠勝ps3
不相关。
360一是gpu架构先进 使用统一渲染管线 比后来pc早了一年半 现在gpu依旧还在用流处理器作为基本计算单元
二是整体架构开发难度相对较低 ps4之前ps家族的cpu跟gpu以及其他拆分出去的相关计算单元对游戏机的上限确实有帮助 但是对开发者也是地狱。ps5其实也又玩起了那套东西 比如那颗集成ssd主控的南桥。
@@phenomx100_3當年主機比桌機遊戲體驗更好的時候真好 哪像現在 想要有頂級遊戲體驗 根本不能要求區區PS5
你肯定沒玩過最後生還者1 PC版,它部分場景能吃好吃滿16線程😂😂😂
沒關係,就算他能用滿一百核,都改變不了最後大便者2的事實
这个游戏很奇葩,需要先编译着色器,这个过程其实并非游戏游玩过程。
@@epcdiy 最奇葩的是,顯卡驅動更新,著色器又要重裝,裝載速度與CPU效能成正比,每次開遊戲都要先等15分鐘
省流 優化問題
打飛機的游戲????
1:12
就是横板卷轴射击游戏,不要想歪了哈
是啊,打遊戲八核就頂了,但只會打遊戲嗎?打遊戲的同時背後十幾個chrome標籤頁會關嗎?寫到一半的碩論(Word)、看到一半的論文(Adobe)、做到一半的簡報(PowerPoint)、跑到一半的模擬(Ansys)、分析到一半的數學工具(MATLAB)還有Line、VScode 、Bluestack等等亂七八糟的東西在後台跑著,有多少人用電腦的習慣會乾淨到把所有背景程序都關閉?
所以看到有人說cpu八核以上都是效能過剩,我只會噴他一句「貧窮限制了你使用電腦的習慣」
@@psychiatricpatients 信我一把,如果你不是只開遊戲一個程序的話,就乖乖的買i7或i9。
那些評測cpu遊戲性能的標準為了公正,都是所謂的「實驗室數據」,普通大眾的電腦是不會這麼乾淨的。
@@psychiatricpatients That's exactly what I said "貧窮限制了你使用電腦的習慣"
你是真的很忙欸
@@harrison_chiu 我這樣算普通,整個實驗室的電腦都差不多忙,坐我對面的天才還一邊打pubg一邊玩楓之谷
雖然Windows問題很多但你也太小看OS做的事了
所以星际争霸这种东西,就是祖传双核,一个管逻辑,一个管图形。
高頻cpu,最近英特爾13跟14都縮缸,官方真好推出更新降頻
我的i5 13600k已經縮兩次了 根本沒超頻 預設跑都會爛掉 英特爾也沒有要表示一下 就默默給更新降電壓 那請問我當時多花錢買新一代的意義何在?