详情页标题前

阿里云人工智能平台PAI准备工作-云淘科技

详情页1

为了方便您快速提交训练任务,您在创建训练任务前需准备好训练任务所需的通用计算资源或灵骏智算资源,并配置好训练任务可能需要使用的数据集和代码集,PAI支持添加文件系统NAS或对象存储OSS的数据集以及Git代码集。本文介绍提交训练任务前所需的准备工作。

前提条件

如果您使用OSS作为存储系统,请确保已经根据业务需求为服务关联角色授予了OSS访问权限。否则挂载OSS后,进行数据访问时,可能产生I/O错误。关于如何为服务关联角色授予OSS访问权限,请参见云产品依赖与授权:DLC。

使用限制

由于OSS与NAS不同,并非一个真正的文件系统,而是一个分布式对象存储。因此使用OSS作为存储系统时,不支持文件系统的部分功能。例如,挂载OSS后,不支持对已经存在的文件追加写和覆盖写。

准备资源组

  • 准备通用计算资源组

    提交训练任务前,您需准备好训练任务所需的通用计算资源,通用计算资源包括公共资源组、自运维资源组和专有资源组。阿里云人工智能平台PAI准备工作-云淘科技

    • 公共资源组:授权完成DLC后,即为您准备好公共资源组,无需您手动添加资源组等操作。在工作空间的新建任务页面提交训练任务时,支持选择公共资源组。

    • 专有资源组:您可以预先创建专有资源组并购买计算资源,用于在工作空间的新建任务页面提交训练任务。

    • 自运维资源组:创建了符合要求的ACK集群后,您可以将ACK集群添加为自运维资源组,用于在DLC Dashboard页面提交训练任务。

    通用计算资源的介绍详情请参见新增通用计算资源的资源配额,资源组的准备操作请参见新建及管理通用计算资源。

  • 准备灵骏智算资源组

    如果您想高性能完成AI训练任务,提交训练任务前,您需要准备好训练任务所需的灵骏智算资源,并关联到工作空间,详情请参见灵骏智算资源概述。

(可选)准备数据集

提交训练任务前,您需将训练任务所需的数据上传至OSS或NAS后,创建为训练任务可直接使用的数据集。准备提交训练任务所需的数据集时,有以下注意事项。

  • 创建用于训练任务的数据集时,仅支持创建从阿里云存储这种类型的数据集,且属性必须为文件夹

    重要

    如果需要开启数据集加速,则加速挂载点挂载点类型需选择为VPC,且选择灵骏智算资源绑定的VPC与交换机。

    阿里云人工智能平台PAI准备工作-云淘科技操作入口及其他参数的配置详情请参见创建及管理数据集。

  • 由于OSS与NAS不同,并非一个真正的文件系统,而是一个分布式对象存储。因此使用OSS作为存储系统时,不支持文件系统的部分功能。例如,挂载OSS后,不支持对已经存在的文件追加写和覆盖写。

(可选)准备代码集

提交训练任务前,您需将训练任务可能需要使用的代码添加为代码集。操作详情请参见代码配置。阿里云人工智能平台PAI准备工作-云淘科技

(可选)准备镜像

提交训练任务前,您需准备训练环境需要安装的镜像。您可以直接使用公开的社区标准镜像,PAI也为您提供了公共的阿里云官方镜像,同时您也可以使用自定义镜像。

  • 社区镜像:由社区提供的标准镜像,不同镜像的详情请参见社区镜像版本详情。

  • PAI平台镜像:由阿里云PAI产品提供的多种官方镜像,支持不同的资源类型、Python版本及深度学习框架TensorFlow和PyTorch,镜像列表请参见公共镜像列表。

  • 用户自定义镜像:可选择使用您添加到PAI的自定义的镜像,选择前,您需要先将自定义镜像添加到PAI中,操作详情请参见查看并添加镜像。

  • 镜像地址:使用您自定义的镜像时,也可以直接在相关训练任务的配置框中配置公网环境下可访问的Docker Registry Image URL。

如果您使用自定义镜像,建议您在工作空的AI资产管理 > 镜像页面中,将镜像添加为PAI的AI资产,便于多个训练任务直接选择使用,操作详情请参见查看并添加镜像。阿里云人工智能平台PAI准备工作-云淘科技

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/160774.html

(0)
上一篇 2023年12月10日 上午2:46
下一篇 2023年12月10日 上午2:47
详情页2

相关推荐

  • 阿里云对象存储OSSJava数据复制-云淘科技

    数据复制是以异步(近实时)方式将源Bucket中的文件(Object)以及对Object的创建、更新和删除等操作自动复制到目标Bucket。OSS支持跨区域复制(Cross-Region Replication)和同区域复制(Same-Region Replication)。 注意事项 本文以华东1(杭州)外网Endpoint为例。如果您希望通过与OSS同地…

    阿里云对象存储 2023年12月10日
  • 阿里云对象存储OSS从Amazon S3上的应用无缝切换至OSS-云淘科技

    OSS提供了S3 API的兼容性,可以将您的数据从Amazon S3无缝迁移至阿里云OSS。 注意事项 使用限制 OSS兼容S3协议。您可以通过S3 SDK或者支持S3协议的工具执行创建Bucket、上传Object等相关操作。执行相关操作过程中其带宽、QPS等限制遵循OSS性能指标,详情请参见使用限制。 客户端配置 从Amazon S3迁移到OSS后,您仍…

    阿里云对象存储 2023年12月10日
  • 阿里云对象存储OSSPython图片处理-云淘科技

    图片处理是OSS提供的海量、安全、低成本、高可靠的图片处理服务。原始图片上传到OSS后,您可以通过简单的RESTful接口,在任何时间、任何地点、任何互联网设备上对图片进行处理。 关于图片处理支持的参数,请参见处理参数。 注意事项 本文以华东1(杭州)外网Endpoint为例。如果您希望通过与OSS同地域的其他阿里云产品访问OSS,请使用内网Endpoint…

    阿里云对象存储 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云对象存储OSSUserGroupsMapping-云淘科技

    本文介绍OSS-HDFS服务(JindoFS服务)UserGroupsMapping命令的常见用法。 前提条件 已创建Hadoop环境、Hadoop集群或者Hadoop客户端。具体操作,请参见创建Hadoop运行环境。 已开通OSS-HDFS服务。具体操作,请参见开通并授权访问OSS-HDFS服务。 已配置4.5.0及以上版本JindoSDK 。具体操作,请…

    阿里云对象存储 2023年12月10日
  • 阿里云对象存储OSS跨区域复制概述-云淘科技

    跨区域复制(Cross-Region Replication)是指将相同或者不同账号某个地域下源存储空间(Bucket)中Object的创建、更新和删除等操作自动、异步(近实时)地复制到另一个地域下的目标Bucket。 使用场景 跨区域复制功能满足Bucket跨区域容灾或用户数据复制的需求。目标Bucket中的Object是源Bucket中Object的精确…

    阿里云对象存储 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。