NVIDIA 今(21)日宣布推出針對遊戲玩家的 GeForce RTX 40 系列 GPU,此系列旗艦產品 RTX 4090 GPU 的效能為前一代產品的四倍,RTX 4090 將於 10 月 12 日上市。RTX 40 系列將是全球首款採用全新 NVIDIA Ada Lovelace 架構的 GPU 產品,強調運算效能及效率較前一代產品具顯著提升。
-
全新 GPU:GeForce RTX 4090 與 4080
NVIDIA 在直播中介紹 RTX 4090 遊戲 GPU,強調在全光線追蹤遊戲中,搭載 DLSS 3 的 RTX 4090 運算速度比上一代採用 DLSS 2 的 RTX 3090 Ti 快上四倍;在保持同樣的 450W 功耗時,處理當今各款遊戲速度亦提升達兩倍。RTX 4090 具有 760 億個電晶體、16,384 個 CUDA 核心和 24GB 高速美光 (
Micron) GDDR6X 記憶體,可持續以超過每秒 100 畫格的速度執行 4K 解析度的遊戲。RTX 4090 將於 10 月 12 日上市,售價為新台幣 56,990 元起。
NVIDIA 同時宣布推出 RTX 4080,有兩款配置可供選擇。RTX 4080 16GB 擁有 9,728 個 CUDA 核心及 16GB 高速美光 GDDR6X 記憶體,運用 DLSS 3 執行當前的各款遊戲速度是 GeForce RTX 3080 Ti 的兩倍,以更低功率提供比 GeForce RTX 3090 Ti 更好的運算表現。RTX 4080 12GB 有 7,680 個 CUDA 核心和 12GB 美光 GDDR6X 記憶體,運用 DLSS 3 較前一代旗艦級 GPU RTX 3090 Ti 的運算速度更快。
RTX 4080 的兩款配置將於 11 月上市,RTX 4080 16GB 售價為新台幣 42,990 元起,RTX 4080 12GB 則為新台幣 31,990 元起。
NVIDIA 創辦人暨執行長黃仁勳在 GTC 大會的 GeForce Beyond 直播中表示:「RTX 光線追蹤與神經渲染的時代正如火如荼地展開,全新 Ada Lovelace 架構進一步提升光線追蹤與神經渲染的表現。遊戲玩家可以感受到 Ada 架構飛躍性的效能提升,並為創作者奠定打造完全模擬世界的基礎。Ada 架構的效能是前一代產品的四倍,為 GPU 產業樹立全新標準。」
DLSS 3 能產生完整的畫格,加快遊戲執行速度
黃仁勳同時宣布推出 NVIDIA DLSS 3 ── NVIDIA 針對遊戲和創意應用程式推出的深度學習超高取樣神經繪圖技術。這項 AI 技術可產生完整的畫格,大幅加快遊戲的執行速度。DLSS 3 讓 GPU 獨立產生完整畫格,克服 CPU 在遊戲中的效能瓶頸。
NVIDIA 表示,包括 Unity 及 Unreal Engine 等熱門遊戲引擎都將採用這項技術,眾多遊戲開發商亦將支持,有超過 35 款支援 DLSS 3 的遊戲和應用程式即將推出。
NVIDIA 指出,RTX 40 系列 GPU 具多項技術創新,包括:
-
串流多處理器 (Streaming Multiprocessor) 當中的著色器運算效能達 83 teraflops,是前一代產品的兩倍多。
-
第三代 RT 核心的有效光線追蹤運算效能達 191 teraflops,是前一代產品的 2.8 倍。
-
第四代 Tensor 核心運算效能達 1.32 Tensor petaflops,在使用 FP8 加速的情況下為前一代產品的五倍。
-
著色器執行重新排序 (Shader Execution Reordering;SER) 藉重新安排著色作業負載以善加利用 GPU 資源,提高執行效率。SER 是跟 CPU 的非依序執行一樣重要的創新技術,能提升光線追蹤的效能達三倍,遊戲中的畫格率可提高達 25%。
-
Ada 光流加速器 (Ada Optical Flow Accelerator) 具兩倍快的效能,使 DLSS 3 能夠預測場景中的運動,神經網路便能在維持影像畫質的情況下提高畫格率。
-
架構改善與客製化的台積電 4N 製程技術密切配合,提升電源效率達兩倍。
-
雙 NVIDIA 編碼器 (NVENC) 將匯出時間減半並支援 AV1。OBS、Blackmagic Design DaVinci Resolve、Discord 等皆採用 NVENC AV1 編碼。
全新光線追蹤技術讓遊戲更具臨場感
NVIDIA 表示,現今《
電馭叛客 2077 (Cyberpunk 2077)》的現代光線追蹤遊戲,光是判斷打光,每個像素就要進行超過 600 次的光線追蹤運算,較四年前推出的第一批光線追蹤遊戲增加了 16 倍之多。
直播中進一步介紹了全新光線追蹤技術指出,全新第三代 RT 核心在進行光線三角點交點集測試 (ray-triangle intersection) 時,速度將是過去的兩倍,其中加入兩個重要的全新硬體單元。Opacity Micromap Engine 將 alpha 測試幾何的光線追蹤速度提升 2 倍,而 Micro-Mesh Engine 則是動態產生微網格,以產生額外的幾何。Micro-Mesh Engine 提供增加幾何複雜性的優點,而不會有在過去產生複雜幾何形狀所需的傳統效能和儲存成本。
NVIDIA 指出,RTX 40 系列 GPU 與 DLSS 3 為 NVIDIA Studio 的創作者提供發展機會。藉由提升 GPU 效能及加入兩個全新第八代 AV1 編碼器,更有助於影片編輯與直播的表現。NVIDIA Broadcast 軟體開發套件的三項更新內容已供合作夥伴取得,包括臉部表情判斷 (Face Expression Estimation)、眼神接觸 (Eye Contact) 及提升虛擬背景的畫質。
包含在 NVIDIA Studio 套裝軟體中的 NVIDIA Omniverse,即將加入模組製作平台 NVIDIA RTX Remix,以運用 RTX 技術復刻經典遊戲。遊戲模組創作者可使用 RTX Remix 取得遊戲素材,利用 AI 工具自動增強材質,並透過光線追蹤和 DLSS 快速啟用 RTX。
《傳送門》加入 RTX On 陣容
官方表示,NVIDIA Lightspeed Studios 利用 RTX Remix 重新打造 Valve 的遊戲代表作《傳送門 (Portal)》。全光線追蹤和 DLSS 3 等繪圖功能,替《傳送門》加入全新外觀和氛圍。搭載 RTX 的《傳送門》版本屆時將開放讓現已擁有《傳送門》玩家於 11 月免費取得,該時間點恰逢《傳送門》推出 15 週年。
-