GPU性能排行榜

AI训练性能
推理性能
能效比
最新GPU
排行榜基于最新MLPerf v4.0基准测试数据,综合评估了各GPU在常见AI工作负载下的性能表现。TFLOPS 表示每秒浮点运算次数,数值越高代表性能越强。
排名 GPU型号 性能得分 参考价格 性能变化 用户评分
1
NVIDIA H200
NVIDIA · 2024Q4发布
2177 TFLOPS
FP16 Tensor Core
¥85.00
/小时 (云实例)
5.8%
4.8
2
AMD MI350X
AMD · 2025Q2发布
1895 TFLOPS
FP16 Matrix Core
¥72.50
/小时 (云实例)
8.2%
4.3
3
NVIDIA H100
NVIDIA · 2023Q2发布
1979 TFLOPS
FP16 Tensor Core
¥68.50
/小时 (云实例)
1.5%
4.7
4
AMD MI300X
AMD · 2023Q4发布
1634 TFLOPS
FP16 Matrix Core
¥58.20
/小时 (云实例)
2.3%
4.2
5
NVIDIA A100 80GB
NVIDIA · 2021发布
1248 TFLOPS
FP16 Tensor Core
¥42.80
/小时 (云实例)
-
4.9

性价比排行榜

训练性价比
推理性价比
中小企业优选
性价比得分 = 性能得分(TFLOPS) ÷ 每小时价格,得分越高表示单位价格获得的算力越高。数据基于2025年7月云服务商实时价格。
排名 GPU型号 性价比得分 参考价格 性能得分 用户评分
1
NVIDIA RTX 6000 Ada
NVIDIA
37.8 TFLOPS/¥
性价比得分
¥15.40
/小时 (云实例)
582 TFLOPS
4.0
2
NVIDIA L40S
NVIDIA
36.5 TFLOPS/¥
性价比得分
¥25.00
/小时 (云实例)
912 TFLOPS
4.5
3
NVIDIA GeForce RTX 4090
NVIDIA
25.6 TFLOPS/¥
性价比得分
¥3.20
/小时 (云实例)
82 TFLOPS
4.8
4
AMD MI350X
AMD
26.1 TFLOPS/¥
性价比得分
¥72.50
/小时 (云实例)
1895 TFLOPS
4.3
5
NVIDIA A10
NVIDIA
18.5 TFLOPS/¥
性价比得分
¥5.90
/小时 (云实例)
109 TFLOPS
4.6