详情页标题前

阿里云人工智能平台PAIEasyASR离线预测(MaxCompute)-云淘科技

详情页1

EasyASR离线预测(MaxCompute)算法组件可以调用SavedModel模型进行语音识别预测或语音分类预测。本文介绍EasyASR离线预测(MaxCompute)算法组件的配置方法及使用示例。

前提条件

已开通OSS并完成授权,详情请参见开通OSS服务和为PAI-Studio授予OSS访问权限。

使用限制

仅PAI-Studio 2.0提供该算法组件。

算法简介

EasyASR离线预测(MaxCompute)算法组件支持语音识别和语音分类离线预测功能,您可以通过该组件调用TensorFlow SavedModel进行预测,建议在多机单卡环境下运行该组件。

EasyASR离线预测(MaxCompute)算法组件位于组件库音视觉算法文件夹下的离线模型预测子文件夹。

可视化配置组件

  • 输入
    EasyASR离线预测(MaxCompute)算法组件需要如下两个输入:

    • 存储输入音频URL的MaxCompute表

      在EasyASR离线预测(MaxCompute)算法组件前面接一个读数据表组件,并将读数据表组件的输出接入EasyASR离线预测(MaxCompute)组件的左侧输入桩。同时,您需要配置读数据表组件的表名参数为存储输入音频URL的MaxCompute表名。

    • SavedModel格式的模型
      您可以通过以下两种方式配置输入的SavedModel模型:

      • 方法一:通过输入桩配置
        在EasyASR离线预测(MaxCompute)算法组件前面接一个EasyASR语音识别训练组件或EasyASR语音分类训练组件,并将该组件的输出接入EasyASR离线预测(MaxCompute)组件的右侧输入桩,即将训练获得的SavedModel直接用于离线预测,如下图所示。阿里云人工智能平台PAIEasyASR离线预测(MaxCompute)-云淘科技
      • 方法二:通过组件参数配置

        直接在配置参数中填写SavedModel的OSS路径,即配置模型路径参数,此时您还需要搭配使用自定义模型参数一起使用,详情请参见下文的组件参数。

  • 组件参数
    页签 参数 必选 描述 默认值
    参数设置 Buckets 存放待预测音频文件的OSS Bucket,选择Bucket根目录即可。
    使用模型名称 EasyASR离线预测(MaxCompute)算法组件支持使用以下类型的模型进行离线预测:

    • Wav2Letter ASRwav2Letter类型的语音识别模型。
    • Transformer ASRtransformer类型的语音识别模型。
    • 音频分类:语音分类模型。
    Wav2Letter ASR
    使用自定义模型 是否使用自定义模型,支持以下取值:

    • 否:此时您需要通过输入桩为EasyASR离线预测(MaxCompute)算法组件配置输入的SavedModel模型,详情请参见上文的通过输入桩配置。
    • 是:此时您需要通过模型路径参数为EasyASR离线预测(MaxCompute)算法组件配置输入的SavedModel模型。
    模型路径 仅使用自定义模型为是时,配置该参数为SavedModel的OSS路径,例如oss://my_bucket/my_checkpoint_dir/
    ASR词汇表 当使用模型名称为Wav2Letter ASR或Transformer ASR时,需要配置该参数,表示语音识别词汇表的OSS路径。例如oss://my_bucket/w2lplus-small/alphabet4k.txt,其中alphabet4k.txt为词汇表。
    URL列ID 在存储待预测音频URL路径的MaxCompute表中,URL所在列的编号,且从零开始编号。例如在第二列,则该参数取值为1。 0
    音频特征维度 音频LogFBank特征的维度,用于音频信号处理。该参数的取值为正整数。 80
    自定义音频分类模型类别集合 仅使用模型名称为音频分类时,配置音频分类模型的类别集合,各类别之间使用半角逗号(,)分隔。例如男声,女声,表示音频分为男声和女声两类。
    音频分类或回归模型预测片段秒数 仅使用模型名称为音频分类时,配置该参数。默认值10表示把音频每10秒切割一次,对其进行预测。 10
    执行调优 Worker数量 用于计算的Worker数量。 1
    计算线程数 单个Worker的计算线程数量。 6
    下载线程数 单个Worker中下载音频的线程数量。 7
    内存数 单个Worker的内存,单位为MB。 10000
  • 输出

    EasyASR离线预测(MaxCompute)算法组件的预测结果存储在临时的MaxCompute表中,其中prediction列表示预测结果。您可以右键单击画布中的EasyASR离线预测(MaxCompute)算法组件,在弹出的快捷菜单中选择查看数据,以查看预测结果。此外,您也可以将EasyASR离线预测(MaxCompute)组件的输出桩接入写数据表组件,将预测结果写入MaxCompute表。

示例

本文以语言分类为例,展示EasyASR离线预测(MaxCompute)算法的使用方法。

  1. 将音频的URL存储在MaxCompute表中。
    在进行语音分类(或语音识别)的离线预测时,您需要将待预测的音频URL存储在MaxCompute中,示例如下图所示。阿里云人工智能平台PAIEasyASR离线预测(MaxCompute)-云淘科技
  2. 构建如下实验。阿里云人工智能平台PAIEasyASR离线预测(MaxCompute)-云淘科技配置EasyASR离线预测(MaxCompute)算法组件的使用模型名称参数为音频分类,其他参数使用默认值即可,详情请参见上文的组件参数。
  3. 查看输出的预测结果。
    实验运行结束后,语音分类(或语音识别)的预测结果会输出在新的MaxCompute表中。该表在第一步准备的输入表基础上增加了一列prediction,表示预测结果。您可以右键单击画布中的EasyASR离线预测(MaxCompute)算法组件,在弹出的快捷菜单中选择查看数据,以查看预测结果。下图为语音分类的预测结果,每10秒音频片段进行一次预测。阿里云人工智能平台PAIEasyASR离线预测(MaxCompute)-云淘科技

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/163550.html

(0)
上一篇 2023年12月10日 上午5:27
下一篇 2023年12月10日 上午5:29
详情页2

相关推荐

  • 阿里云对象存储OSSEMR Flink写入OSS-HDFS服务-云淘科技

    可恢复性写入功能支持将数据以EXACTLY_ONCE语义写入存储介质。本文介绍Flink如何通过EMR集群的方式可恢复性写入OSS-HDFS服务。 前提条件 已创建EMR-3.42.0及以上版本或EMR-5.8.0及以上版本的集群。具体步骤,请参见创建集群。 已开通并授权访问OSS-HDFS服务。具体操作,请参见开通并授权访问OSS-HDFS服务。 在Fli…

    阿里云对象存储 2023年12月10日
  • 阿里云大数据开发治理平台 DataWorksGetOptionValueForProject-云淘科技

    获取扩展程序选项配置在项目空间下的配置 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。 请求参数 名称 类型 是否必选 示例值 描述 Action String 是 GetOptionValueForProject 系统规定参数。取值:GetOpt…

  • 阿里云日志服务SLS通过PHP SDK使用SQL独享版-云淘科技

    本文介绍通过PHP SDK使用SQL独享版的代码示例。 前提条件 已创建RAM用户并完成授权。具体操作,请参见创建RAM用户并完成授权。 已配置环境变量ALIBABA_CLOUD_ACCESS_KEY_ID和ALIBABA_CLOUD_ACCESS_KEY_SECRET。具体操作,请参见配置环境变量。 重要 阿里云账号的AccessKey拥有所有API的访问…

    阿里云日志服务SLS 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云大数据开发治理平台 DataWorks概述-云淘科技

    阿里云DataWorks联合建模工具DDM(Datablau Data Modeler)为您提供一体化的数据建模解决方案(DATABLAU),将数据模型设计管控、引标落标等能力融入DataWorks规范化开发流程,助力用户实现数据资产价值化输出,在数据全生命周期上夯实数据基础,为客户的数据价值化提供有力支撑。 使用流程 使用阿里云DataWorks的数据建模…

  • 阿里云ECS云服务器DescribeLaunchTemplates-云淘科技

    调用DescribeLaunchTemplates查询一个或多个可用的实例启动模板。 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。 请求参数 名称 类型 是否必选 示例值 描述 Action String 是 DescribeLaunchTemp…

    阿里云服务器 2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。