Atlas800训练服务器(型号:9000)
参数:
ssh方式(从π 2.0登录Ascend 910B计算节点),910B有两个计算节点,节点名分别为“ascend02”及“ascend03”
设置昇腾环境变量
若要进行多卡训练,需要使用新版的CANN软件。目前集群已经安装了7.0.RC1.alpha003版本的CANN,使用时需设置
查看集群使用状况使用如下命令
可以根据集群使用状况,使用以下命令指定使用的NPU卡号
由于测试集群目前暂未配置slurm操作系统,为防止出现资源挤占,每天晚上11点会清理未释放的进程,请注意保存测试结果。
PyTorch配套支持的Python版本是:Python3.7.x(3.7.5 -3.7.11)、Python3.8.x(3.8.0 - 3.8.11)、Python3.9.x(3.9.0 - 3.9.2)。
利用PyTorch迁移分析工具能够分析代码中API的支持情况。
参数说明: - -i: 要进行迁移的原始脚本文件所在文件夹路径 - -o: 脚本迁移结果文件输出路径。 - -v: 脚本迁移结果文件输出路径。
关于迁移工具的高级功能,请见昇腾文档中的”msFmkTransplt”章节。
目前节点仅支持单机多卡(最多8卡)
脚本命名为
到此这篇resnet101(Resnet101运行硬件要求)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!
版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/rfx/32344.html