按照官网安装好paddle-gpu后,测试会发现只能单卡训练,不支持多卡,说是需要安装NCCL,
查了半天发现不是很容易安装,最后的解决办法如下:
- 首先到这个页面下载:https://developer.nvidia/nccl/nccl-download
我是直接运行的这几步,试过很多下载办法,会遇到密钥的问题,只有下面这种是可以执行sudo dpkg -i
不会报错的。
另外安装libnccl和libnccl-dev时分开安装会更保险。
- 第一步顺利通过后,在/root下输入命令:
find / -name "libnccl.so*"
搜索libnccl.so,把搜索到的这些库都放到你的python访问的系统环境下,这样可以不用修改~/.bashrc配置文件。也可以不移动,直接把它们所在的位置添加到 ~/.bashrc里就可以。 - 再测试paddle就成功了。
更多推荐
为paddle的multi-gpu安装NCCL
发布评论