顯卡|深度學習的顯卡對比評測:2080ti vs 3090 vs A100

顯卡|深度學習的顯卡對比評測:2080ti vs 3090 vs A100

文章圖片

【顯卡|深度學習的顯卡對比評測:2080ti vs 3090 vs A100】顯卡|深度學習的顯卡對比評測:2080ti vs 3090 vs A100

文章圖片

顯卡|深度學習的顯卡對比評測:2080ti vs 3090 vs A100

文章圖片

顯卡|深度學習的顯卡對比評測:2080ti vs 3090 vs A100

文章圖片

顯卡|深度學習的顯卡對比評測:2080ti vs 3090 vs A100

文章圖片

顯卡|深度學習的顯卡對比評測:2080ti vs 3090 vs A100

顯卡大幅降價了但是還可以再等等 , 新的40系列顯卡也要發售了 , 所以我們先看看目前上市的顯卡的性能對比 , 這樣也可以估算下40顯卡的性能 , 在以后購買時作為參考 。

但是在本文之前一定要說下的是:本文并不推薦現在就買顯卡 , 除非必須 , 現在一定不要買顯卡 , 誰買誰吃虧 , 目前的情況是 , “等” 就對了

回到正題 , 在這篇文章中我整理了幾個在 NVIDIA GeForce RTX 3090 GPU 進行的深度學習性能基準測試 。
一般的情況下我們都會使用 TensorFlow github 中的“tf_cnn_benchmarks.py”腳本來進行深度學習的評測 。因為大多數的測試都是基于這個腳本 , 如果你是pytorch也可以參考 , 顯卡的基準測試與使用的框架無關 , 差別不會超過5% 。
首先使用 1、2 和 4 個 GPU 配置(針對 2x RTX 3090 與 4x 2080Ti 部分)運行了相同的測試 。確定的批量大小是可以容納可用 GPU 內存的最大批量 。
然后還會比較 2022 年最流行的深度學習 GPU 的性能:除NVIDIA 的 RTX 3090以外還包括了、A100、A6000、A5000 和 A4000等產品 。
3090對比其他消費級的產品首先說結果:NVIDIA RTX 3090 在所有型號上均優于所有 GPU(圖像/秒) 。 2x RTX 3090 > 4x RTX 2080 Ti。 對于深度學習 , RTX 3090 是市場上性價比最高的 GPU , 可大幅降低 AI 工作站的成本 。
RTX 3090 ResNet 50 TensorFlow Benchmark

RTX 3090 ResNet 152 TensorFlow Benchmark

RTX 3090 Inception V3 TensorFlow Benchmark

RTX 3090 Inception V4 TensorFlow Benchmark

2x NVIDIA RTX 3090 Vs 4x RTX 2080 Ti

與 RTX 2080 Ti 的 4352 個 CUDA 核心相比 , RTX 3090 的 10496 個 CUDA 核心是其CUDA的兩倍多 ,CUDA 核心是 CPU 核心的 GPU 等價物 , 并針對同時運行大量計算(并行處理)進行了優化 。更多 CUDA 內核通常意味著更好的性能和更快的圖形密集型處理 。 3090 擁有 24GB GDDR6X 內存 , 也是2080 Ti 11G的2倍多 , 所以取得這樣的結果也是情理之中的 。
RTX 3090 vs. RTX 3080 Ti vs A6000 vs A5000 vs A100



RTX 3090 GPU的2.5 插槽設計 , 只能在風冷時在 2-GPU 配置中進行測試 。4-GPU 配置需要水冷 。 所以這也限制了他的測試 , 如果我們需要購買多塊3090一定要注意機箱的大小 。
3090一定要上水冷RTX 3090 可能遇到的一個問題是散熱 , 主要是在多 GPU 配置中 。 4 x RTX 3090 配置需要水冷 。 不僅是散熱問題 , 還因為大小問題 。
過熱導致性能下降高達 60%, 所以水冷是最好的解決方案;提供 24/7 穩定性、低噪音和更長的硬件壽命 。 此外 , 任何水冷式 GPU 都可以保證以最大可能的性能運行 。 水冷 RTX 3090 將保持在 50-60°C 與風冷時 90°C 的安全范圍內(90°C 是 GPU 將停止工作和關閉設定值) 。2x 或 4x 風冷 GPU 噪音非常大 , 尤其是鼓風機式風扇 。 將工作站放在實驗室或辦公室是不可能的——更不用說服務器了 。 水冷解決了臺式機和服務器中的這種噪音問題 。 與風扇相比 , 噪音降低了 20%(水冷卻為 49 dB , 最大負載時風扇為 62 dB) 。

相關經驗推薦