详情页标题前

腾讯云计算加速套件TACO Kit配置 HARP 分布式训练环境

详情页1

操作场景

本文介绍如何通过云服务器控制台,为实例配置 HARP 分布式训练环境。

操作步骤

绑定弹性网卡

弹性网卡数量等于 GPU 卡的数量,例如8卡训练机器则需要绑定8张弹性网卡(加主网卡共9张网卡)。具体步骤如下:1. 登录 云服务器控制台,选择实例 ID 进入详情页面。2. 在实例详情页中,选择弹性网卡页签,并单击绑定弹性网卡。如下图所示:

腾讯云计算加速套件TACO Kit配置 HARP 分布式训练环境

3. 在弹出的绑定弹性网卡窗口中,选择弹性网卡,单击确认即可。

配置并验证环境

1. 参见 使用标准登录方式登录 Linux 实例,登录实例。2. 执行以下命令,执行配置脚本。

curl -s -L http://mirrors.tencent.com/install/GPU/taco/taco_setup.sh | sudo bash

返回结果如下图所示:

腾讯云计算加速套件TACO Kit配置 HARP 分布式训练环境


3. 执行以下命令,重启实例。

sudo reboot

4. 依次执行以下命令,检查是否配置成功。检查大页内存是否配置成功:

cat /proc/meminfo | grep HugePages_Total

返回如下结果,表示配置成功。

HugePages_Total:      50

检查是否产生了配置文件:

ls -l /usr/local/tfabric/tools/config/ztcp*.conf

返回结果如下图所示,表示已产生配置文件。

腾讯云计算加速套件TACO Kit配置 HARP 分布式训练环境


官网1折活动,限时活动,即将结束,速速收藏
同尘科技腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利。同意关联立享优惠

转转请注明出处:https://www.yunxiaoer.com/146413.html

(0)
上一篇 2023年12月9日
下一篇 2023年12月9日
详情页2

相关推荐

  • 腾讯云云函数(SCF)Web 函数计费说明-云淘科技

    对于 Web 函数,提供两种触发器创建方式:默认创建与自定义创建,不同创建方式下,计费逻辑有所不同。 默认创建 选择“默认创建”,云函数将自动为您创建一个基础型 API 网关服务触发器(属于共享型实例),该类型触发器只为您提供一个 URL 访问链接,在 API 网关控制台不可见。在该场景下,Web 函数计费方案统计如下: 触发器侧: 调用不再计费,出流量…

    2023年12月9日
  • 阿里云负载均衡查看用量明细-云淘科技

    当您想获取负载均衡的用量明细时,可以在阿里云费用中心导出查看。 操作步骤 登录用户中心的账单详情页面。 在账单详情页面,单击用量明细页签,选择产品为负载均衡,配置需要查看的负载均衡用量的计量规格、使用时间和计量粒度,输入验证码,然后单击导出CSV。 计量规格支持选择负载均衡子产品。 选择负载均衡:表示导出CLB的用量明细。 选择应用型负载均衡ALB:表示导出…

    2023年12月10日
  • 云效-流水线”“漏洞扫描”问题,帮忙看下是什么情况?是编译有问题么?本地的是好的。 -云小二-阿里云

    云效-流水线”“漏洞扫描”问题,帮忙看下是什么情况?是编译有问题么?本地的是好的。前面构建都是正常的、耗时也基本差不多。扫描 实际失败了,整体还显示为“成功”。日志如下:[executionStep begins at 2023-12-15 13:25:56][92m[13:25:56] [SUCCESS] 鑾峰彇 Credential 鎴愬姛[1m[13:…

    2023年12月20日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 腾讯云内容分发网络CDN使用限制

    域名备案 接入腾讯云 CDN 进行加速的域名,加速区域选择为中国境内或全球时,需要先完成 ICP 备案,若您的域名尚未完成 ICP 备案,您可以使用 腾讯云 ICP 备案。 信用度检查 1. 腾讯云 CDN 在开通 CDN 服务时,会进行账号信用度检查。若您的账号在腾讯云上曾产生过多条违规记录,导致账号信用度较低,被列入黑名单,腾讯云 CDN 会禁止该账号开…

    腾讯云 2023年12月9日
  • 腾讯云容器服务关于 Service Ingress 组件管理模式升级的通知同尘科技

    Service 组件生命周期管理模式升级 主要变更点:禁止某些修改场景的变更。具体表现为:为防止 Service 在切换不同的 CLB 时发生资源异常问题,例如:CLB 可能会脱离 TKE 的管控导致资源泄漏,或无法创建出对应的 CLB 导致服务中断,TKE 对 Service 的生命周期的变更做了如下限制:1. 禁止服务访问方式中的公网 LB 访问与内网 …

    腾讯云 2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。