详情页标题前

腾讯云高性能计算集群GPU 型实例安装 nvidia-fabricmanager 服务

详情页1

操作背景

HCCPNV4h 实例搭载了 A100 GPU 并支持 NvLink & NvSwitch,需额外安装与驱动版本对应的 nvidia-fabricmanager 服务使 GPU 卡间能够互联。若您使用该实例,请参考本文安装 nvidia-fabricmanager 服务,否则可能无法正常使用 GPU 实例。

操作步骤

本文以驱动版本 470.103.01 为例,您可参考以下步骤进行安装,可根据实际情况需要替换 version 后的驱动版本

安装 nvidia-fabricmanager 服务

1. 登录实例,详情请参见 使用标准登录方式登录 Linux 实例。2. 不同操作系统版本安装方法不同,请您参考以下方式,执行对应命令进行安装。CentOS 7.x 镜像Ubuntu 18.04 镜像TencentOS 2.4 镜像

version=470.103.01yum -y install yum-utilsyum-config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-rhel7.repoyum install -y nvidia-fabric-manager-${version}-1
version=470.103.01main_version=$(echo $version | awk -F '.' '{print $1}')apt-get updateaptget -y install nvidia-fabricmanager-${main_version}=${version}-*
version=470.103.01yum -y install yum-utilsyum-config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-rhel7.repoyum install -y nvidia-fabric-manager-${version}-1

启动 nvidia-fabricmanager 服务

依次执行以下命令,启动服务。

systemctl enable nvidia-fabricmanager
systemctl start nvidia-fabricmanager

查看 nvidia-fabricmanager 服务状态

执行以下命令,查看服务状态。

systemctl status nvidia-fabricmanager

若输出信息如下,则表示服务安装成功。

腾讯云高性能计算集群GPU 型实例安装 nvidia-fabricmanager 服务



官网1折活动,限时活动,即将结束,速速收藏
同尘科技腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利。同意关联立享优惠

转转请注明出处:https://www.yunxiaoer.com/146561.html

(0)
上一篇 2023年12月9日 上午11:47
下一篇 2023年12月9日 上午11:47
详情页2

相关推荐

  • 腾讯云CVM服务器CentOS 迁移 TencentOS Server 指引

    操作场景 CentOS 官方计划停止维护 CentOS Linux 项目,CentOS 8及 CentOS 7维护情况如下表格。如需了解更多信息,请参见 CentOS 官方公告。 操作系统版本 停止维护时间 使用者影响 CentOS 8 2022年01月01日 停止维护后将无法获得包括问题修复和功能更新在内的任何软件维护和支持。  CentOS 7 202…

    2023年12月9日
  • 腾讯云云函数(SCF)使用博睿数据 APM-云淘科技

    本文将为您介绍云函数如何接入和使用博睿数据 APM。 前提条件 已注册 博睿 Server 账号。已 创建云函数 并开启公网访问。说明博睿探针目前支持 Python 和 Node.js 的多数主流框架,且仅在使用支持的框架时,博睿 smartAgent 才可自动捕获。详情请参见 博睿探针支持列表。 操作步骤 使用云函数控制台接入 您可以使用云函数控制台接入博…

    2023年12月9日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云RDS数据库空间管理-云淘科技

    自治服务的空间管理功能提供分层的监控与分析,从实例深入到数据库,再从数据库深入到表,帮助用户发现和定位数据库空间相关问题。 空间管理提供您查看实例基本信息、空间总览、空间数据图表信息、空间变化趋势等等,帮助您从各个维度了解实例的空间情况,便于您发现空间异常。 前提条件 实例不能是RDS SQL Server 2008 R2云盘版。 操作步骤 访问RDS实例列…

    阿里云数据库 2023年12月9日
  • DataWorks数据服务中 api的参数pageNum如果超过200 会出现如下错误信息? -云小二-阿里云

    DataWorks数据服务中 api的参数pageNum如果超过200 会出现如下错误信息?An I/O error occurred while sending to the backend 以下为热心网友提供的参考意见 这个错误信息表示在向后端发送请求时发生了I/O错误。可能的原因是请求的参数pageNum超过了200,导致后端无法处理该请求。为了解决这…

    阿里云 2023年12月17日
  • 腾讯云对象存储快速体验

    背景 移动互联网时代,App 作为移动互联网服务的基础设施,往往需要上传和下载大量的数据,数据的安全性和可靠性尤为重要。现在开发者可以将数据存储相关的问题交给 腾讯云对象存储(Cloud Object Storage,COS)服务,而只需要关心自己应用的业务逻辑即可,可减少很多工作量,提升开发效率。本文主要介绍如何快速搭建一个基于 COS 的应用传输服务,在…

    2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。