(文章來源:快科技)
這段時間,有關NVIDIA、AMD各自下一代旗艦級GPU核心的曝料不斷,但都是各種傳聞,讓人捉摸不定。現在,我們從GeekBench 5測試數據庫里挖出了NVIDIA的兩個新核心,規模都相當龐大。
其中一個顯示有118個計算單元(NVIDIA的叫法是SM流式多處理器),假如每組延續64個流處理器(CUDA核心)的配置,總數就是7552個,同時核心頻率為1.11GHz,搭配顯存24GB(檢測值23.8GB)。另一個則是108個計算單元,對應6912個流處理器,核心頻率1.01GHz,搭配顯存48GB(檢測值46.8GB)。
很顯然,它們都是NVIDIA的下一代核心,或許就是傳說中的“Ampere”(安培),7nm工藝制造,甚至有可能是更下一代的“Hopper”(赫柏)。NVIDIA也做過雙架構核心并行的事兒,比如Tesla V100系列是Volta(伏特)核心,僅供專業市場,GeForce RTX 20、GTX 16系列則是Turing(圖靈)核心,僅供消費級市場。
由于缺乏其他佐證,目前還無法確認這兩個核心屬于計算專業卡Tesla、圖形專業卡Quadro、半專業卡Titan、游戲卡GeForce之中的哪個序列,按照NVIDIA的產品研發和發布規律來說Tesla的可能性很大,比如Tesla A100,但也不排除GeForce,比如RTX 3080 Ti。
如果118個單元、7552個流處理器的大核心是RTX 3080 Ti,那么規模要比現在68個單元、4352個流處理器的RTX 2080 Ti增大了足有74%。
而且,這極有可能還不是完整版核心,128個單元才是最合理的全部實力,那樣就是8192個流處理器,相比于RTX 2080 Ti大了88%,即便相比72個單元4608個流處理器、完整TU102核心的Titan RTX也大了78%。24GB顯存如果是游戲卡的GDDR6,對比RTX 2080 Ti可就翻了一番還多,而如果是專業卡的HBM2,對比現在Tesla V100 16/32GB也只算是個低配版。
108個單元、6912個流處理器的核心則肯定不是RTX 3080,一來這樣會比RTX 2080的規模增大135%,非常離譜,二來顯存容量高達48GB,絕無可能用于游戲卡,只能是Tesla乃至是Quadro專業卡。
至于1.01GHz、1.11GHz的低頻率,這很容易理解,都是早期的工程樣品而已,分別出現在去年10月底和11月底。核心規模猛增的同時,即便在如此低頻率下的性能也相當兇猛,118單元、108單元的OpenCL計算跑分分別為184096、141654,作為參考Tesla V100 154606、Quadro GV100 142837、Titan RTX 132804。
不管這兩個核心是什么身份,AMD都會面臨巨大考驗,尤其是游戲卡方面,傳說中基于RDNA2架構、Big Navi大核心的下代游戲卡很可能只有80組計算單元、5120個流處理器。代號Arcturus(大角星)的下代計算卡Radeon Instinct MI100倒是據說會在Vega核心基礎上翻番,擁有128個計算單元、8196個流處理器,而且功耗控制在區區200W,完全有實力一戰。
(責任編輯:fqj)
-
amd
+關注
關注
25文章
5499瀏覽量
134640 -
英偉達
+關注
關注
22文章
3847瀏覽量
91972
發布評論請先 登錄
相關推薦
量子處理器的作用_量子處理器的優缺點
量子處理器是什么_量子處理器原理
聯發科與NVIDIA合作 為NVIDIA 個人AI超級計算機設計NVIDIA GB10超級芯片
迅為3A6000_7A2000核心主板龍芯全國產處理器LoongArch架構
摩托羅拉Razr 50折疊屏手機曝光,搭載天璣7300X處理器
進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片
處理器的定義和種類
MathWorks與NVIDIA攜手革新醫療技術工作流
嵌入式微處理器主要組成 嵌入式微處理器的分類和特點
嵌入式微處理器有哪些部分 嵌入式微處理器有哪些區別
主流嵌入式微處理器的結構與原理是什么 常見的嵌入式微處理器類型包括
恩智浦宣布推出全新的S32N系列車輛超級集成處理器

嵌入式微處理器的原理和應用
NVIDIA推出搭載GB200 Grace Blackwell超級芯片的NVIDIA DGX SuperPOD?
NVIDIA 推出 Blackwell 架構 DGX SuperPOD,適用于萬億參數級的生成式 AI 超級計算

評論