A100 vs 3090 vs 2080ti just for mmdetection
README
以cascade r50 bs 2 为基准,比一下
mmdet_speed
3090 torch 1.7 cudnn 8.0.4 cuda 11.0
| spec | Time/iter |
|---|---|
| no fp16 x16 | 0.26 |
| no fp16 x8 | 0.27 |
| fp16 x8 | 0.32 |
2080ti torch 1.6 cudnn 7.6.3 cuda 10.1
| spec | Time |
|---|---|
| no fp16 x16 | 0.31 |
| Fp16 | 0.23 |
A100 torch 1.7 cuda 11.0
| spec | Time |
|---|---|
| no fp16 x16 | 0.22 |
| Fp16 | 0.25 |
118287 / 2600 / 4 * 2.5
conclusion
A100 0.22/iter 最快,但是2080ti+fp16 0.23/iter 也差不多,但是A100单价 65000,2080ti 9000, 3090 16000
感觉下一波还是得冲8卡2080ti, 如果经费很足的话冲8卡3090也勉强,毕竟24G显存可以跑x101-64d-dcn
2万5000 可以凑一个没有显卡的4卡机器 90000 组4卡3090 60000 组四卡2080ti
trouble shooting
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!