详情页标题前

阿里云人工智能平台PAI在自建的训练集群中使用数据集加速器-云淘科技

详情页1

您可以在训练集群中使用数据集加速器来读取挂载的文件,提高数据集访问效率。本文为您介绍如何使用数据集加速器。

前提条件

在开始执行操作之前,请确认您已完成以下准备工作。

  • 已创建Kubernetes 1.20及以上版本集群,具体操作,请参见创建Kubernetes托管版集群。

  • 已通过kubectl连接到Kubernetes集群,具体操作,请参见获取集群KubeConfig并通过kubectl工具连接集群

  • 已安装Kubernetes的包管理器Helm,具体操作,请参见安装Helm。

  • 已创建数据集加速槽,具体操作,请参见创建及管理数据集加速槽。

注意事项

训练集群和挂载点需要在同一个VPC内,否则挂载数据会读取失败。

部署数据集加速器客户端

  1. 下载安装包。

    wget http://dlc-release.oss-cn-zhangjiakou.aliyuncs.com/datasetacc/datasetacc-0.1.0.tgz
  2. 安装客户端。

    helm install datasetacc ./datasetacc-0.1.0.tgz
  3. 验证客户端安装是否成功。

    kubectl get pods -n datasetacc-system

    类似如下输出结果,说明客户端已安装成功。阿里云人工智能平台PAI在自建的训练集群中使用数据集加速器-云淘科技其中CSI Pod数量应与集群内Node数量一致。

在集群中创建YAML文件

  1. 登录PAI控制台。

  2. 按照下图操作指引,下载YAML文件。

    阿里云人工智能平台PAI在自建的训练集群中使用数据集加速器-云淘科技

  3. 在Kubernetes集群中创建YAML文件。

    kubectl create -f /XXXX/dataset-accelerator.yaml

    重要

    dataset-accelerator.yaml文件中需要包含步骤2中下载的YAML内容。

创建应用容器来使用数据集加速器

准备好数据集加速器客户端和YAML文件之后,您可以参考以下操作步骤使用数据集加速器来读取文件。

  1. 在Kubernetes集群中创建demo.yaml文件,文件内容如下。

    apiVersion: v1
    kind: Pod
    metadata:
      name: demo-datasetacc-test
    spec:
      containers:
        - name: demo
          image: nginx
          volumeMounts:
            - mountPath: /data
              name: datasetacctest
      volumes:
        - name: datasetacctest
          persistentVolumeClaim:
            claimName: rel-1fmcg74oq6dxwdpjup

    其中:

    • claimName:应与您创建的数据集加速器客户端名称保持一致。

    • mountPath:数据集挂载的位置。在集群Pod中,您可以通过该位置来访问您需要加速的文件。

  2. 使用demo.yaml文件创建Pod。

    kubectl create -f demo.yaml
  3. 进入Pod内,验证是否能正常读取数据。

    kubectl exec -it demo-datasetacc-test -- /bin/bash

    进入容器后,使用ls data/命令查看挂载目录下的文件与数据集一致,说明数据读取正常。

您可以按照以上方法,将persistentVolumeClaim挂载到您训练任务的Pod上,即可在该Pod内通过挂载的文件夹来访问您需要的文件。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/164755.html

(0)
上一篇 2023年12月10日 上午6:45
下一篇 2023年12月10日 上午6:47
详情页2

相关推荐

  • 阿里云容器服务ACK通过Ambassador暴露应用API-云淘科技

    Ambassador Edge Stack(AES)是一个基于Envoy Proxy实现的高性能的Ingress Controller和API网关。 AES通过Custom Resource Definitions(CRD)使用Envoy提供的功能,集成了速率限制、身份认证、负载均衡和可观测性等功能。本文介绍如何通过Ambassador Edge Stack…

    阿里云容器服务 2023年12月10日
  • 阿里云RDS数据库Terraform概述-云淘科技

    Terraform是一种开源工具,用于安全高效地预览、配置和管理云基础架构和资源。 什么是Terraform HashiCorp Terraform是一个IT基础架构自动化编排工具,可以用代码来管理维护IT资源。它编写了描述云资源拓扑的配置文件中的基础结构,例如虚拟机、存储账户和网络接口。Terraform的命令行接口(Command Line Interf…

    阿里云数据库 2023年12月9日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云负载均衡应用场景-云淘科技

    传统型负载均衡CLB(Classic Load Balancer)的应用场景为高访问量的业务,提高应用程序的可用性和可靠性。 应用于高访问量的业务 如果您的应用访问量很高,您可以通过配置监听规则将流量分发到不同的云服务器ECS(Elastic Compute Service)实例上。此外,您可以使用会话保持功能将同一客户端的请求转发到同一台后端ECS,提高访…

    阿里云负载均衡 2023年12月10日
  • 阿里云人工智能平台PAI模型预测概述-云淘科技

    本文为您介绍在Designer训练得到模型后,如何做生产化部署对新数据进行预测。 部署模型主要是为了使用模型来进行新数据的预测。按照新数据预测时效要求,预测任务分为两类:在线预测和离线预测。对于两类需求,在Designer中都提供了对应的操作流程支持。 在线预测 单模型部署在线服务 Designer工作流运行成功后,您可以将训练获得的PMML、AlinkMo…

    阿里云人工智能平台PAI 2023年12月10日
  • 阿里云ECS云服务器CreateDeploymentSet-云淘科技

    调用CreateDeploymentSet在指定的地域内创建一个部署集。 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。 请求参数 名称 类型 是否必选 示例值 描述 Action String 是 CreateDeploymentSet 系统规定…

    阿里云服务器 2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。