A100 vs 3090 vs 2080ti just for mmdetection

README

以cascade r50 bs 2 为基准,比一下

mmdet_speed

3090 torch 1.7 cudnn 8.0.4 cuda 11.0

spec Time/iter
no fp16 x16 0.26
no fp16 x8 0.27
fp16 x8 0.32

2080ti torch 1.6 cudnn 7.6.3 cuda 10.1

spec Time
no fp16 x16 0.31
Fp16 0.23

A100 torch 1.7 cuda 11.0

spec Time
no fp16 x16 0.22
Fp16 0.25

118287 / 2600 / 4 * 2.5

conclusion

A100 0.22/iter 最快,但是2080ti+fp16 0.23/iter 也差不多,但是A100单价 65000,2080ti 9000, 3090 16000

感觉下一波还是得冲8卡2080ti, 如果经费很足的话冲8卡3090也勉强,毕竟24G显存可以跑x101-64d-dcn

2万5000 可以凑一个没有显卡的4卡机器 90000 组4卡3090 60000 组四卡2080ti

trouble shooting


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!