详情页标题前

阿里云人工智能平台PAI图像自监督训练-云淘科技

详情页1

对于相似图像匹配场景或图像检索场景,您可以使用图像自监督训练算法组件将原始的尚未标注的图像直接进行训练,从而获得用于图像特征提取的模型。本文介绍图像自监督训练算法组件的配置方法及使用示例。

前提条件

已开通OSS并完成授权,详情请参见开通OSS服务和为PAI-Studio授予OSS访问权限。

使用限制

仅PAI-Designer提供该算法组件。

算法简介

图像自监督算法提供主流自监督算法,包括MoCo v2、SwAV及MoBY。在无需标注的情况下对图像进行模型训练,从而获得模型用于图像特征提取。该特征广泛应用于图像匹配(去重)、图像检索、推荐系统等场景。
此外,上述算法还可以搭配不同的网络结构使用,例如ResNet50、 ViT及Swin-Transformer。

图像自监督训练算法组件位于组件库音视觉算法文件夹下的离线训练模型子文件夹,最大支持千万规模的图像自监督训练。

可视化配置组件

  • 输入桩
    输入桩(从左到右) 限制数据类型 建议上游组件 必选
    训练数据 OSS 数据转tfrecord 否。如果没有通过该输入桩传入训练数据,则需要在字段设置页签中的训练数据oss路径参数配置训练数据。
  • 组件参数
    页签 参数 是否必选 描述 默认值
    字段设置 训练模型类型 模型训练的类型,支持以下取值:

    • MOCO_R50
    • MOBY_TIMM
    • MOCO_TIMM
    • SWAV_R50
    MOCO_R50
    训练所用oss目录 存储训练模型的OSS目录,例如oss://pai-online-hangzhou.oss-cn-hangzhou-internal.aliyuncs.com/demo_image_match/train/moby_0902/
    训练数据oss路径 如果没有通过输入桩配置算法组件的训练数据,则需要配置该参数,表示tfrecord格式的训练数据文件所在的OSS路径,支持通配符,例如oss://a/train*.tfrecord

    如果同时通过输入桩和该参数配置了算法组件的训练数据,则优先使用输入桩配置的输入。

    是否使用预训练的模型 建议使用预训练模型,以提高训练模型的精度。
    预训练模型oss路径 如果有自己的预训练模型,则将该参数配置为自己预训练模型的OSS路径。如果没有配置该参数,则使用PAI提供的默认预训练模型。
    参数设置 自监督模型使用的backbone 识别模型的网络名称,系统支持主流的识别模型resnet_50。 resnet_50
    优化方法 模型训练的优化方法,仅支持SGD。 SGD
    初始学习率 网络训练初始的学习率。 0.03
    训练batch_size 训练的批大小,即单次模型迭代或训练过程中使用的样本数量。
    总的训练迭代epoch轮数 总的训练迭代轮数。 200
    保存checkpoint的频率 保存模型文件的频率。取值1表示对所有训练数据都进行一次迭代。 10
    执行调优 读取训练数据线程数 读取训练数据的线程数。 4
    evtorch model 开启半精度 开启半精度会使模型的推理速度显著提升,同时准确率略有降低。
    单机或分布式(MaxCompute/DLC) 模型训练使用的计算资源,支持以下取值:

    • 单机DLC
    • 分布式DLC
    单机DLC
    worker个数 使用分布式DLC计算时,您需要配置用于计算的Worker数量。


    说明 您需要尽可能选择少的Worker,否则会拖慢训练速度。在一百万图片规模下,1台八卡V100机器通常需要20小时才能完成训练。

    1
    gpu机型选择 计算资源的GPU机型。 8vCPU+60GB Mem+1xp100-ecs.gn5-c8g1.2xlarge
  • 输出桩
    输出桩(从左到右) 数据类型 下游组件
    输出模型 OSS路径。该路径是您在字段设置页签的训练所用oss目录参数配置的OSS路径,训练生成的模型存储在该路径下。 通用图像预测

计算引擎

图像自监督训练算法组件仅支持DLC引擎。

示例

您可以使用图像自监督训练算法组件构建如下工作流。阿里云人工智能平台PAI图像自监督训练-云淘科技本示例中,您需要按照以下流程配置组件:

  1. 使用读OSS数据组件读取尚未标注的图像,即配置读OSS数据组件的OSS数据路径参数为准备的图像目标索引TXT文件的OSS目录。例如oss://demo-zhoulou.oss-cn-hangzhou.aliyuncs.com/demo_image_match/df2_data/meta/train_crop_label_lt_10k_nolabel.txt
  2. 通过数据转tfrecord组件将初始数据集转换为图像自监督训练组件所需的训练集,详情请参见数据转tfrecord。
  3. 将训练数据接入图像自监督训练算法组件,并配置具体参数,详情请参见上文的可视化配置组件。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/163409.html

(0)
上一篇 2023年12月10日 上午5:17
下一篇 2023年12月10日 上午5:19
详情页2

相关推荐

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。