顯卡|N卡又出黑科技:光追效率提升20%,這代顯卡就能用上

顯卡|N卡又出黑科技:光追效率提升20%,這代顯卡就能用上

文章圖片

顯卡|N卡又出黑科技:光追效率提升20%,這代顯卡就能用上

文章圖片


盡管從RTX 20開始 , NVIDIA就在GPU中引入了物理光追單元 , 但是即使在性能更好的RTX 30系列顯卡上 , 光線追蹤依然是一個讓人頭疼的游戲技術 。 盡管光線追蹤能提升游戲畫面的真實度 , 但不可否認的是 , 這項技術的確要消耗太多的顯卡資源 , 往往一個游戲開啟光線追蹤效果后 , 整體的幀數下滑甚至能接近50% 。 所以這項技術至今還沒能成為主流 , 也是有其原因的 , 至少AMD和NVIDIA都不敢說自己的顯卡能在4K高畫質游戲中打開光追后 , 還能非常流暢的運行 , 哪怕是發燒級產品 。

所以現在對圖形核心公司以及游戲開發人員來說 , 如何提升光線追蹤的效率是非常關鍵的一環 。 當然從硬件角度而言 , 如果AMD和NVIDIA繼續堆疊物理光追單元 , 以及改善自己的引擎 , 那自然是一個可行的方案 , 但是這就意味著顯卡最終的成本會繼續攀升 , 甚至達到一個用戶無法接受的價格(當然現在顯卡的價格也沒法接受……) , 所以大家更多是想在底層做一些優化和改進 , 這樣更方便性能的提升 , 也不需要花更多的成本 。
NVIDIA的科研人員一直在研究提高GPU 光線追蹤性能的技術 。 最近有人發現NVIDIA發表了一篇論文 , 這其中將GPU Subwarp Interleaving視為一項潛力巨大的技術 , 這項技術可以將實時光線追蹤的性能提升高達20% 。 當然現在我們還不好說這個技術的具體中文名稱 , 如果強行翻譯的話 , 比較合適的是“GPU子曲線交錯” , 不過這個還要等NVIDIA給出一個準確的技術名詞才行 。
【顯卡|N卡又出黑科技:光追效率提升20%,這代顯卡就能用上】
這項技術其實就是更改GPU底層執行模式的一種方法 , 因為現在GPU渲染圖像的時候 , 在設計方法上就受到光線追蹤的各種限制 , GPU現在使用的是SIMD的執行模式 , 相同的渲染會被打包成一組并行執行 , 每組其實就是GPU工作時的最小執行單元 , NVIDIA將其稱為“warp” 。 而GPU通過對warp的調動來隱藏渲染停頓 , 不過在實時的光線追蹤運算中 , 這種可能會出現問題從而導致性能的損失 , 而“GPU Subwarp Interleaving”則是解決當前光線追蹤效率不夠的一個方法 。
GPU Subwarp Interleaving這項技術如何提升光追效率呢?NVIDIA的描述是:“當一個長延遲操作停止一個warp , 并且GPU的warp調度器找不到一個活動的warp來切換時 , 一個subwarp調度器可以將當前的warp切換到另一個不同的subwarp 。 ”這個說法相當拗口 , 估計只有對GPU運行機制比較了解的人 , 才能準確理解這個含義 。 不過簡單來說 , 就是N卡在調動warp的時候 , GPU會更加靈活和快速 , 提升GPU的工作效率以此來提升光線追蹤的性能 。

不過這種底層運作模式的改動 , 勢必要涉及到架構的細微調整 。 在NVIDIA的實驗中 , 更改一些底層架構的圖靈顯卡 , 光追性能有明顯的提升 , 平均達到6.3%的提升 , 最高則能超過20%的提升 。 不過很顯然這只是用圖靈顯卡來做測試 , 而實際上因為NVIDIA的圖靈GPU比較古老 , 所以未來即使這項技術上線的時候 , 也不會支持圖靈顯卡 , 包括GTX 10系列和RTX 20系列實際上都不會支持GPU Subwarp Interleaving這項加強光追性能的技術 。

目前來看 , 這項技術會用在安培架構以及NVIDIA下一代顯卡架構上 , 也就是RTX 30以及RTX 40顯卡 。 雖然這項技術最近才正式披露 , 但按照慣例 , NVIDIA應該是已經研究了很久 , 所以理論上 , 安培的架構改進應該已經可以適應這項技術 , 至于下一代的RTX 40顯卡更是沒有問題 。 或許以后RTX 30顯卡的用戶 , 只需要更新一個驅動 , 就能獲得更強的光追性能 。

相關經驗推薦