核心性能对比
- 536 个 SM 之下 5090 驱动 170 SM,近 2.2 倍 SM 数量。
- CUDA 核心 21760 对比 9728;Tensor RT、RT 核心亦同*;
- FP32 通过量 104.8 TFLOPS – 214% 以上比 4080。
- 显存:32 GB GDDR7,512 位版,带宽 1.792 TB/s。
- 4080:16 GB GDDR6X,256 位,带宽 0.717 TB/s。
- 5090 采用 4 nm 工艺,晶体管 92.2 亿,密度略高。
基准表现
- Time Spy(2560×1440):5090 37 197 点 vs 25 625 点,提升 45%。
- Cloud Gate Graphics(1280×720):5090 385 092 点 vs 185 431 点,提升 112%。
算力
- Ethash/EtcHash 等算法指数翻倍:5090 约 355 KHS 对比 171 KHS。
能效与功耗
- TDP 5090 575 W,需 950 W PSU;4080 320 W,建议 700 W。
- 5090 受高功耗限制,冷却与机箱空间要求更严苛。
使用场景
- 4K/8K 游戏 – 5090 能在 60 FPS 以上跑 4K HDR+光追;4080 在同设置下约 40–45 FPS。
- VR / 体验 – 5090 提供流畅 80 – 90 Hz VR 体验;4080 仍能满足 72 – 75 Hz。
- 内容创作 / AI 训练 – 32 GB 显存、双倍 Tensor 核心,5090 对大型模型与数据集更友好。
- 日常多屏/1080p – 4080 以更低功耗完成 120 Hz 1080p 屏幕任务,5090 预留更宽裕。
- 基础游戏 (1440p) – 两者均可走高帧率,但 4080 省电,续航更好。
选购要点
- 若工作台需重度渲染、AI、VR 或高分辨率游戏,5090 的显存与算力优势明显。
- 若主要做 1440p 游戏、预算/功耗敏感,可选择 4080;在不需要 32 GB 显存的场景下,它仍领先。
- 5090 的 4 nm 工艺与新指令集适配未来软件,显存 GDDR7 预计带来更低延迟。
综上,RTX 5090 在绝大多数高端负载下提供显著性能提升;RTX 4080 依旧具备极佳的功耗与成本效益,适合中等高分辨率与中等功耗需求。了解自身用途与机箱冷却后,再决定投入更高功耗的全新平台。