Ampere架構(gòu)將為GeForce RTX 3090,GeForce RTX 3080,GeForce RTX 3070和其他即將推出的Nvidia GPU提供動(dòng)力。它代表了Team Green的下一次重大升級(jí),因?yàn)檫@次在性能上它有可能實(shí)現(xiàn)巨大飛躍。該顯卡將于本月晚些時(shí)候上市,而3070要等到10月份。根據(jù)當(dāng)前消息,這些GPU可以輕松遷移至我們的GPU層次結(jié)構(gòu)的頂部,并將一些最好的顯卡淘汰一兩個(gè)。下文將詳細(xì)介紹Ampere架構(gòu),主要內(nèi)容包括規(guī)格,功能和其他性能增強(qiáng)。
Ampere架構(gòu)標(biāo)志著NVIDIA的重要轉(zhuǎn)折點(diǎn)。這是該公司的首款7納米GPU,或用于消費(fèi)類零件的8納米GPU。無論以何種方式,制程減小都能使其在比以前更小的面積內(nèi)封裝更多的晶體管。它也是第二代消費(fèi)者光線追蹤和第三代深度學(xué)習(xí)硬件。較雄昂的制程為Nvidia極大程度上改進(jìn)以前的RTX 20系列硬件和技術(shù)創(chuàng)造了條件。
我們知道Ampere架構(gòu)將在即將到來的GeForce RTX 3090,RTX 3080和RTX 3070顯卡中得到應(yīng)用(預(yù)計(jì)明年RTX 3060和RTX 3050發(fā)布)。它也是Nvidia A100數(shù)據(jù)中心GPUs的一部分,該GPUs是完全獨(dú)立的硬件。在這里,我們將逐步分析Ampere體系結(jié)構(gòu)的消費(fèi)者和數(shù)據(jù)中心的變體,然后深入探討其中的一些差異。
Nvidia的Ampere GPU發(fā)布感覺就像是2016年的Pascal和2018年的Turing GPus的融合。Nvidia首席執(zhí)行官黃仁勛(Jensen Huang)于5月14日發(fā)布了用于數(shù)據(jù)中心的A100,讓我們了解到即將推出的產(chǎn)品的官方消息,但A100不是為GeForce卡設(shè)計(jì)的。A100替代了Volta GV100,而GV100替代了GP100。消費(fèi)類模型具有不同的功能集,并由單獨(dú)的GPU(如GA102,GA103等)提供支持。消費(fèi)類顯卡還使用GDDR6X / GDDR6,而A100使用HBM2。
除了底層的GPU架構(gòu),Nvidia還改進(jìn)了核心圖形卡設(shè)計(jì),重點(diǎn)放在散熱和功耗上。正如Nvidia在視頻中所描述,“每當(dāng)我們談?wù)揋PU性能時(shí),其實(shí)就是在講我們可以賦予和散去的功率,這種功率越大,性能就越好。”經(jīng)過改進(jìn)的散熱解決方案,風(fēng)扇和PCB(印刷電路板)都是改善Nvidia Ampere GPU整體性能計(jì)劃的一部分。當(dāng)然,第三方設(shè)計(jì)可以自由調(diào)整Nvidia的設(shè)計(jì)。
隨著臺(tái)積電從12nm FinFET節(jié)點(diǎn)轉(zhuǎn)移到臺(tái)積電N7和三星N8,許多人期望Ampere在更低的功耗水平下提供更好的性能。與之相反的是,Nvidia以多多益善的方式采取了所有額外的晶體管并且提升功率(至少在產(chǎn)品堆棧的頂部是如此)。例如,GA100擁有540億個(gè)晶體管,其方形芯片尺寸是826mm。與GV100相比,晶體管數(shù)量增加了156%,而die尺寸僅增加了1.3%。我們預(yù)計(jì)消費(fèi)類GPU也會(huì)有類似的變化。
雖然7nm / 8nm在相同性能下確實(shí)可以有更高的功率,但其在相同功率下也可以表現(xiàn)出更好的性能。Nvidia邁出了一步,并在更高的功率水平下提供了更高的性能。V100數(shù)據(jù)中心模型的功率是300W,而新發(fā)布的Nvidia A100則將其提高到400W。我們?cè)谙M(fèi)者模型上得到了相同的結(jié)果。GeForce RTX 2080 Ti的功率為250 / 260W,Titan RTX的功率為280W。有傳言稱RTX 3090超越了它,并配備有歷史最高的TDP,可用于350W功率的單個(gè)GPU(顯然不包括A100)。
這對(duì)終端用戶意味著什么?除了可能需要升級(jí)電源以及在Nvidia自己的型號(hào)上使用12針電源連接器之外,還意味著性能的度量標(biāo)準(zhǔn)會(huì)做出相應(yīng)改變。在我的印象中,這次是Nvidia性能上最大的單代提升。Nvidia表示,結(jié)合即將進(jìn)行的體系結(jié)構(gòu)更新,RTX 3080的性能是RTX 2080的兩倍。如果這些工作負(fù)載包括光線跟蹤和/或DLSS,那么差距可能會(huì)更大。
值得慶幸的是,最終價(jià)格不會(huì)比上一代GPU差很多(這取決于定價(jià)的比較方式)。GeForce RTX 3090的首發(fā)價(jià)為1,499美元,創(chuàng)下了單GPU的 GeForce顯卡的記錄,有效取代了Titan系列。RTX 3080的價(jià)格為699美元,RTX 3070的價(jià)格為499美元,與上一代RTX 2080 Super和RTX 2070 Super保持相同的價(jià)格。Ampere架構(gòu)是否價(jià)格公道?我們需要再作等待才能實(shí)際測(cè)試硬件,但是這些規(guī)格至少看起來非常有吸引力。
Ampere GA100使Nvidia以前的GPU相形見絀,其晶體管的數(shù)量是GV100的2.5倍。
Nvidia Ampere體系結(jié)構(gòu)規(guī)格
除了用于數(shù)據(jù)中心的GA100之外,Nvidia還計(jì)劃在2020年至少再推出三個(gè)Ampere GPU。來年,可能還會(huì)有多達(dá)三個(gè)額外的Ampere解決方案,盡管這些解決方案尚未得到證實(shí)。
規(guī)格最大并且性能最差的GPU是A100。它具有多達(dá)128個(gè)SM和6個(gè)8GB的HBM2堆棧,其中Nvidia A100當(dāng)前僅啟用108個(gè)SM和五個(gè)HBM2堆棧。未來的版本可能具有完整的GPU和RAM配置。但是,GA100不會(huì)像普通的GP100和GV100那樣僅用作數(shù)據(jù)中心和工作站,而是成為消費(fèi)類產(chǎn)品。如果沒有光線追蹤硬件,GA100不會(huì)像GeForce卡那樣遙不可及(因?yàn)闊o需考慮大型裸片,HBM2和硅中介層的成本)。
在把方向下調(diào)至消費(fèi)者模型后,Nvidia進(jìn)行了一些重大更改。我們還沒有完整的外觀,但是Nvidia顯然使每個(gè)SM的CUDA內(nèi)核數(shù)量增加了一倍,從而在著色器性能上取得了巨大的進(jìn)步。有了GA102和RTX 3090,Nvidia可能會(huì)削減相對(duì)于GA100軸上兩個(gè)SM集群,從而保留96個(gè)SM的最大配置。其中,RTX 3090僅啟用了82個(gè)。HBM2和硅中介層也消失了,取而代之的是12個(gè)GDDR6X芯片。
每個(gè)SM的CUDA內(nèi)核增加一倍之后(相當(dāng)于10496個(gè)CUDA內(nèi)核),每個(gè)SM可能有兩個(gè)支持FP64的CUDA內(nèi)核。Nvidia去除了剩余的FP64功能,并在其位置添加了第二代RT內(nèi)核。至于四個(gè)第三代Tensor核心,其中每個(gè)核心的吞吐量是上一代Turing Tensor核心的每時(shí)鐘吞吐量的四倍。1700 MHz的boost頻率可提供FP32計(jì)算性能的35.7 TFLOPS,而19.5 Gbps GDDR6X可提供936 GBps的帶寬。大致來講,RTX 3090的性能可能會(huì)是RTX 2080 Ti的兩倍以上。
值得注意的是,目前有一大批SM被禁用。將來是否會(huì)完全啟用GA102的Titan卡?當(dāng)然如此。也許它還將配備21 Gbps內(nèi)存,并配上相應(yīng)的高價(jià)。(友情提示:即便你壕氣沖天,也不要為了游戲而購買Titan GPU。3-5%的性能提升絕對(duì)不值這個(gè)價(jià)。)
相對(duì)于GA102,GA103做出了進(jìn)一步修整。目前GA103有6個(gè)SM集群,最多72個(gè)SM。RTX 3080使用幾乎完整的GA103,其有68個(gè)SM和8704 CUDA內(nèi)核,而我們認(rèn)為RTX 3070使用僅具有46個(gè)active SM和5888 CUDA內(nèi)核的harvest芯片(可能是GA104,但這并不重要)。3080還具有10GB的GDDR6X內(nèi)存和320位總線,而3070禁用了兩個(gè)通道,最終在256位的總線上具有8GB的GDDR6內(nèi)存。
與前幾代產(chǎn)品不同,所有三個(gè)RTX 30系列GPU的工作頻率都較為相似:1700-1730MHz。從理論性能上講,RTX 3080可以完成29.8 TFLOPS,并具有760 GBps的帶寬,Nvidia表示它的速度是即將發(fā)布的RTX 2080的兩倍。
同時(shí),RTX 3070提供20.4 TFLOPS和512 GBps的帶寬。Nvidia表示RTX 3070的最終運(yùn)行速度也將比RTX 2080 Ti快,盡管在某些情況下11GB與8GB VRAM相比,會(huì)讓前重量級(jí)冠軍略勝一籌。同樣,架構(gòu)上的改進(jìn)肯定會(huì)有所幫助。
現(xiàn)在我們開始討論Ampere架構(gòu)。
A100是Nvidia有史以來規(guī)格最大的GPU,相比之下各種消費(fèi)類芯片要小得多
英偉達(dá)的GA100 Ampere架構(gòu)
隨著GA100和Nvidia A100的發(fā)布以及GeForce RTX 30系列的面世,我們現(xiàn)在對(duì)預(yù)期會(huì)有一個(gè)很好的了解。英偉達(dá)將繼續(xù)擁有兩條獨(dú)立的GPU系列,其中一條專注于數(shù)據(jù)中心和深度學(xué)習(xí),另一條專注于圖形和游戲。數(shù)據(jù)中心GA100所做的一些更改會(huì)延伸至消費(fèi)類產(chǎn)品線,但這并沒有擴(kuò)展到FP64的Tensor核心增強(qiáng)功能。這就是我們對(duì)Ampere架構(gòu)始于GA100的了解。
首先,GA100包含許多新內(nèi)容。從較高的角度來看,GPU已從GV100中的最多80個(gè)SMs / 5120 CUDA內(nèi)核增加到GA100中的128個(gè)SMs / 8192 CUDA內(nèi)核。雖然核心數(shù)量增加了60%,但GA100使用的晶體管數(shù)量是其2.56倍。所有這些額外的晶體管都用于增強(qiáng)架構(gòu)。如果您想深入了解所有細(xì)節(jié),請(qǐng)查看Nvidia的A100 Architecture白皮書,我們只對(duì)其進(jìn)行簡(jiǎn)要總結(jié)。
GA100中的Tensor核心取得了最重要的升級(jí)。上一代GV100 Tensor內(nèi)核在兩個(gè)4x4 FP16矩陣上運(yùn)行,并且可以計(jì)算兩個(gè)矩陣的4x4x4融合乘加(FMA),每個(gè)周期具有第三個(gè)矩陣。每個(gè)Tensor內(nèi)核每個(gè)周期可以進(jìn)行128個(gè)浮點(diǎn)運(yùn)算,而Nvidia將GV100評(píng)為FP16的125 TFLOPS峰值吞吐量。相比之下,GA100 Tensor內(nèi)核每個(gè)工作頻率可以完成8x4x8 FMA矩陣運(yùn)算,每個(gè)Tensor內(nèi)核總共可以進(jìn)行256 FMA或512 FP(吞吐量是其四倍)。即使它每個(gè)SM的Tensor內(nèi)核數(shù)量只有上一代GV100 Tensor內(nèi)核的一半,但它仍然是上一代GV100 Tensor內(nèi)核每個(gè)SM的性能的兩倍。
GA100還增加了對(duì)Tensor內(nèi)核稀疏性的支持。該改進(jìn)考慮到許多深度學(xué)習(xí)操作最終會(huì)產(chǎn)生一堆不再重要的加權(quán)值,因此隨著訓(xùn)練的進(jìn)行,這些值基本上可以忽略。稀疏性將Tensor核心吞吐量提高了一倍。FP16的Nvidia A100的額定值為312 TFLOPS,而有稀疏性支持的Tensor 內(nèi)核則為624 TFLOPS。
除了大幅提高原始吞吐量外,GA100 Tensor內(nèi)核還增加了對(duì)更低精度的INT8,INT4和二進(jìn)制Tensor運(yùn)行的支持。INT8容許具有稀疏性的624 TOPS和 1248 TOPS,而INT4則將其翻倍,達(dá)到了1248/2496 TOPS。二進(jìn)制模式不支持稀疏性,可能用途有限,但是A100可以在該模式下進(jìn)行4992 TOPS。
另一方面,A100中的Tensor內(nèi)核也支持FP64指令。FP64的性能在19.5 TFLOPS時(shí)遠(yuǎn)低于FP16。但是,對(duì)于FP64工作負(fù)載,它仍然比GV100的最大FP64吞吐量快2.5倍。
最后一點(diǎn),A100添加了兩種新的浮點(diǎn)格式。BF16(Bfloat16)已被其他一些深度學(xué)習(xí)加速器(例如Google的TPUv4)使用。就像FP16一樣,BF16使用16位,但是使用8位指數(shù)和7位尾數(shù)進(jìn)行轉(zhuǎn)換,匹配FP32的8位指數(shù)范圍,同時(shí)降低了精度。事實(shí)已經(jīng)證明,這可以提供比普通FP16格式更好的訓(xùn)練和模型精度。第二種格式是Nvidia在Tensor Float 32(TF32)上的格式,該格式保留8位指數(shù),但將尾數(shù)擴(kuò)展到10位,使FP16的精度與FP32的范圍相匹配。TF32的性能也與FP16相同,因此深度學(xué)習(xí)仿真的額外精度基本上是“免費(fèi)”的。
哇,這是一個(gè)具有公制對(duì)接晶體管的大芯片!
Tensor的核心增強(qiáng)功能很多,這也表明了Nvidia在GA100上的重心。深度學(xué)習(xí)和超級(jí)計(jì)算工作負(fù)載的性能大大提高。GA100還具有其他一些體系結(jié)構(gòu)更新,我們將在此處作簡(jiǎn)要介紹。SM晶體管的數(shù)量增加了50-60%,所有這些晶體管都必須放在某個(gè)地方。
多實(shí)例GPU(MIG)是一項(xiàng)新功能。這使得單個(gè)A100可以劃分為多達(dá)七個(gè)獨(dú)立的虛擬GPU。每個(gè)虛擬GPU(使用Tensor操作運(yùn)行推理工作負(fù)載)都可能與單個(gè)GV100的性能相匹配,從而極大地增加了云服務(wù)提供商的橫向擴(kuò)展機(jī)會(huì)。
每個(gè)SM的A100 L1高速緩存大了50%,與V100上的128KB相比為192KB。L2緩存的增加幅度更大,從V100的6MB增加到A100的40MB。它還具有新的分區(qū)交叉開關(guān)結(jié)構(gòu),可提供GV100 L2緩存的讀取帶寬的2.3倍。請(qǐng)注意,總的HBM2內(nèi)存“僅”從GV100的16GB或32GB增加到GA100的40GB,但是增加的L1和L2緩存有助于更好地優(yōu)化內(nèi)存性能。
NVLink性能也幾乎翻了一番,從GV100中的每個(gè)信號(hào)對(duì)25.78 Gbps到GA100中的50 Gbps。A100中的單個(gè)NVLink在每個(gè)方向上提供25 GBps的速率,類似于GV100,但每個(gè)鏈路具有一半的信號(hào)對(duì)。鏈接總數(shù)也增加了一倍,達(dá)到12條,從而使NVLink總帶寬在A100下為600 GBps,而在V100下為300 GBps。此外還提供了PCIe Gen4支持,幾乎使x16連接的帶寬增加了一倍(從15.76 GBps到31.5 GBps)。
最后,A100添加了新的異步副本,異步屏障和任務(wù)圖加速。異步副本可提高內(nèi)存帶寬效率并減少寄存器文件帶寬,并且可以在SM執(zhí)行其他工作時(shí)在后臺(tái)完成。硬件加速障礙為CUDA開發(fā)人員提供了更大的靈活性和性能,并且任務(wù)圖加速有助于優(yōu)化向GPU提交的工作。
還有其他體系結(jié)構(gòu)增強(qiáng),例如NVJPG解碼可加速JPG解碼,以用于基于圖像的算法的深度學(xué)習(xí)訓(xùn)練。A100包含5核硬件JPEG解碼引擎,該引擎可勝過基于CPU的JPEG解碼并減輕PCIe擁塞。同樣,A100添加了五個(gè)NVDEC(Nvidia解碼)單元,以加速常見視頻流格式的解碼,這有助于與視頻一起使用的深度學(xué)習(xí)和推理應(yīng)用的端到端吞吐量。
介紹完了GA100和Nvidia A100架構(gòu)之后,以下將介紹消費(fèi)類GeForce RTX卡的Ampere架構(gòu)變化。
Nvidia GA102 / GA103 Ampere架構(gòu)
與GV100相比,GA100進(jìn)行了大量更改,而在消費(fèi)類方面,更新同樣顯著。以上對(duì)Tensor核心的許多更改都直接帶入了消費(fèi)類模型(自然很可能會(huì)減去FP64)。除了支持Micron的新GDDR6X存儲(chǔ)器(而不是HBM2)之外,其他主要更改還包括光線跟蹤和CUDA內(nèi)核。
Nvidia在2018年使用Turing架構(gòu)和GeForce RTX 20系列GPU在光線追蹤方面引起了很多爭(zhēng)議。兩年過去了……好吧,說實(shí)話:游戲中的光線追蹤并沒有真正發(fā)揮其潛力。《戰(zhàn)地風(fēng)云5》具有更好的反射效果,《古墓麗影》和《使命召喚》的陰影得到了改善,《地鐵出埃及記》使用了RT全局照明,并且在每種情況下,性能的下降都使視覺效果有了相對(duì)較小的提高。迄今為止,關(guān)于光線追蹤可以做什么,最好的例子可以說是“控制游戲”,該游戲使用RT效果進(jìn)行反射,陰影和漫射照明。它看起來相當(dāng)不錯(cuò),盡管您可能抱有期望,但其對(duì)性能的影響仍然很大。
究竟有多大呢?對(duì)于RTX 2080 Ti和Core i9-9900K,在1440p和最高質(zhì)量下運(yùn)行Control且沒有光線追蹤的情況下,其性能為80 fps(這是我們?cè)诒疚闹袆倓偼瓿傻臏y(cè)試)。打開所有光線跟蹤功能之后,七性能降低到43 fps,慢47%,或基本上降低一半。盡管您可以通過啟用DLSS 2.0來緩解問題,但該功能在質(zhì)量模式下可渲染為1707x960,并可以放大到1440p。但這會(huì)帶來一個(gè)痛苦的代價(jià):性能降回72 fps。
還有“全路徑跟蹤”的演示,其中硬件進(jìn)一步推向了更高的位置。以Quake II或Minecraft之類的相對(duì)古老且低保真的游戲?yàn)槔偬砑诱彰鳎幱埃瓷洌凵涞热饩€追蹤效果。而且,結(jié)果可能是60 fps,而不是每秒數(shù)百幀。這還是在以至少1080p的RTX 2070 Super啟用DLSS的情況(這已經(jīng)到達(dá)質(zhì)量水平)。
或許有人認(rèn)為光線跟蹤效果對(duì)性能造成的損失太大, Nvidia應(yīng)該反其道而行之。但是說這類話的人對(duì)Nvida不是很了解。據(jù)Nvidia稱,GeForce 256是第一個(gè)GPU,它還將硬件轉(zhuǎn)換和照明計(jì)算引入了消費(fèi)類硬件。大多數(shù)游戲要幾年后才能正確使用這些功能。第一批帶有著色器的GPU早在數(shù)年之前就已經(jīng)普遍使用該硬件,但是今天幾乎所有發(fā)行的游戲都廣泛使用了著色器技術(shù)。Nvidia認(rèn)為光線追蹤會(huì)有一個(gè)類似的演變過程。
好消息是,采用Ampere架構(gòu)的光線追蹤性能正在迅速崛起。Nvidia表示,與RTX 2080 Ti的34 TFLOPS相比,RTX 3080可以進(jìn)行58 TFLOPS的光線跟蹤計(jì)算。換句話說,光線追蹤的速度快了1.7倍。2080 Ti的光線三角相交計(jì)算速度達(dá)到每秒11千兆字節(jié),因此RTX 3080可以達(dá)到每秒19千兆字節(jié),而與以往的最佳紀(jì)錄相比,RTX 3090將翻倍甚至更躲。
這對(duì)光線追蹤游戲意味著什么?我們會(huì)很快找到答案,但是根據(jù)我們從Nvidia那里聽到的消息,我們將看到更多的游戲開發(fā)人員增加了光線跟蹤效果。賽博朋克2077將具有光線追蹤的反射,陰影,環(huán)境光遮擋等功能。像Control這樣的游戲可能在啟用所有光線跟蹤效果的情況下運(yùn)行,并且一旦啟用DLSS,相對(duì)于傳統(tǒng)渲染而言,其性能不會(huì)顯著下降,甚至有可能會(huì)表現(xiàn)出性能提升。
Nvidia還從其使用完整路徑跟蹤的Marbles技術(shù)演示中提供了上述指標(biāo)。一個(gè)未命名的Turing GPU(RTX 2080 Ti?)那能夠以720p和25 fps的速度運(yùn)行Marbles,沒有景深,只有一個(gè)圓頂燈和一個(gè)間接光。同時(shí),Ampere(RTX 3090?)可以以1440p和30 fps的速度運(yùn)行演示,并啟用了景深和130個(gè)區(qū)域照明燈。結(jié)果是無論使用什么實(shí)際的GPU,都有可能將光線追蹤提升到一個(gè)全新的水平。
當(dāng)然,這不僅與光線追蹤有關(guān)。英偉達(dá)還在DLSS上加倍努力,而且由于擁有更強(qiáng)大的Tensor內(nèi)核,所以質(zhì)量和性能應(yīng)該比以前更好。我們即將實(shí)現(xiàn)質(zhì)量模式下的DLSS 2.0看起來比使用TAA或SMAA的本機(jī)渲染效果更好。不難想象,許多游戲玩家選擇啟用DLSS來獲得健康的性能提升。
由于Ampere對(duì)8K顯示器具有本機(jī)支持,因此得益于HDMI 2.1,DLSS變得更加重要。什么樣的硬件能夠以絕佳的性能水平為8K提供動(dòng)力?這很容易:打開DLSS并使用RTX 3090或RTX 3080以4K渲染。這是8K渲染嗎?當(dāng)然不是。但這是個(gè)無關(guān)緊要的問題。
當(dāng)然,8K顯示器的價(jià)格仍然高得驚人,如果您坐在沙發(fā)上,幾乎不可能看到4K和8K之間的差異。另外,如果您像我一樣視力老化,那這種可能性為零。但是在家庭影院領(lǐng)域,營(yíng)銷力量很強(qiáng)大,因此我們可以肯定將來8K電視會(huì)以更大的推動(dòng)力向前發(fā)展(這正是消費(fèi)電子公司試圖說服所有4K HDR電視所有者做出升級(jí)的方式)。
Nvidia Ampere架構(gòu):第二輪光線追蹤
毫無疑問,現(xiàn)在使用Nvidia的RTX 20系列GPU的人會(huì)有一種受到欺騙的感覺。如果幾個(gè)月前您沒有收到我們所提出的關(guān)于等待購買新GPU直到Ampere發(fā)布的建議,那么看到RTX 30系列規(guī)格和Ampere架構(gòu)可能會(huì)給您帶來更大的損失。問題在于,我們始終知道這一天會(huì)到來。就像Turing取代Pascal,Pascal取代Maxwell,Maxwell又取代Kepler一樣,GPU世界的迭代更新之路也在穩(wěn)定發(fā)展。
另一方面,如果您在過去幾年中一直對(duì)游戲中的光線追蹤持懷疑態(tài)度,Ampere可能最終會(huì)成功說服您嘗試一下。然后您又拖一個(gè)月左右,想看看AMD的Big Navi表現(xiàn)。現(xiàn)實(shí)情況是,我們將看到更多支持某種形式的光線追蹤的游戲,尤其是計(jì)劃于今年秋天推出的下一代PlayStation 5和Xbox Series X控制臺(tái)。我們有望在足夠的硬件實(shí)力的支持下,游戲的光線追蹤效果具有現(xiàn)實(shí)意義。
可以肯定的一件事是:光線追蹤不會(huì)消失。它幾乎已經(jīng)成為每部電影的重要組成部分,雖然目前還不是游戲與2020年好萊塢的電影競(jìng)爭(zhēng)的時(shí)候,但他們也許可以追趕2000年代的好萊塢。目前,實(shí)時(shí)游戲通常希望每個(gè)像素僅使用幾條光線,以更好地貼近現(xiàn)實(shí)光線的表現(xiàn)方式。相比之下,好萊塢每個(gè)像素可能使用數(shù)千條光線(或路徑)。具有光線追蹤硬件的GPU仍處于早期階段,但是如果Nvidia(以及AMD和Intel)可以繼續(xù)升級(jí)我們的GPU,那么游戲和電影之間的差距將只會(huì)縮小。
Nvidia尚未透露所有關(guān)于Ampere架構(gòu)更改的消息,因此我們后續(xù)將在了解更多信息后做出更新。
責(zé)任編輯:tzh
-
印刷電路板
+關(guān)注
關(guān)注
4文章
805瀏覽量
35330 -
gpu
+關(guān)注
關(guān)注
28文章
4777瀏覽量
129360 -
帶寬
+關(guān)注
關(guān)注
3文章
953瀏覽量
41079
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
軟銀接近達(dá)成收購Ampere協(xié)議
簡(jiǎn)述NVIDIA Isaac的重要更新

NVIDIA發(fā)布個(gè)人超算利器project digital,標(biāo)志著ai元年的開啟

MediaTek與NVIDIA攜手打造超級(jí)芯片
MediaTek與NVIDIA攜手打造GB10 Grace Blackwell超級(jí)芯片
蘋果可折疊iPhone或成市場(chǎng)轉(zhuǎn)折點(diǎn)
英偉達(dá)被納入道指,標(biāo)志著AI新時(shí)代的到來
為什么測(cè)試波形與理論波形在轉(zhuǎn)折點(diǎn)電壓值出現(xiàn)偏差?
谷歌將于明年8月25日終止goo.gl短鏈服務(wù)
夏普與小米簽訂通信專利交叉許可協(xié)議并撤訴
進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片
NVIDIA推出兩款基于NVIDIA Ampere架構(gòu)的全新臺(tái)式機(jī)GPU
NVIDIA發(fā)布兩款新的專業(yè)顯卡RTX A1000、RTX A400

全新NVIDIA RTX A400和A1000 GPU全面加強(qiáng)AI設(shè)計(jì)與生產(chǎn)力工作流
傳統(tǒng)PC已過時(shí)?2024年AI PC領(lǐng)航未來!

評(píng)論