详情页标题前

腾讯云云点播音视频内容识别

详情页1

腾讯云点播(VOD)服务于2022年08月01日新增音视频内容识别计费项并对用户发起的音视频内容识别任务将进行正式计费,具体详情请参见 关于音视频内容识别正式商业计费的公告音视频内容识别,即借助 AI 对音视频内容进行智能识别,是一种离线任务。使用音视频内容识别,可以识别出视频画面中的人脸、文字、片头片尾以及语音中的文字。根据音视频内容识别的结果,您可以准确高效地管理视频。音视频内容识别包括以下功能:

功能名称 功能说明 用途举例
人脸识别 识别画面中出现的人脸 标注明星在画面中出现的位置。排查画面中出现的相关人物。
语音全文识别 识别语音中出现的全部文字 为演讲内容生成字幕。对视频的语音内容做数据分析。
文本全文识别 识别画面中出现的全部文字 对画面中的文字做数据分析。
语音关键词识别 识别语音中存在的关键词 排查语音中的敏感词。检索语音中提到的特定关键词。
文本关键词识别 识别画面中存在的关键词 排查画面中的敏感词。检索画面中出现的特定关键词。
视频片头片尾识别 识别视频的片头和片尾 进度条中标注片头、片尾和正片的位置。批量对视频掐头去尾。

部分内容识别功能需要依赖素材库,有公共库和自定义库两种:公共库:点播预置好的素材库。自定义库:用户自行创建和管理的素材库。

识别类型 公共库 自定义库
人脸识别 支持,素材人物主要涉及娱乐明星、体育明星和相关人物。 支持,调用 服务端 API 管理自定义人脸库。
语音单词识别 暂不支持。 支持,调用 服务端 API 管理关键词库。
文字单词识别 暂不支持。 支持,调用 服务端 API 管理关键词库。

音视频内容识别模板

音视频内容识别集成了多项识别功能,需要通过参数进行精细化控制,控制的目标如:启用的识别类型:启用内容识别中的哪几项功能。使用的素材库:对于人脸识别,使用公共库还是自定义库。指定过滤分数:人脸识别的置信度达到多少分的结果才返回。指定过滤标签:人脸的标签在什么范围内的结果才返回。针对常见的操作组合,云点播提供了 预置音视频内容识别模板。另外,您还可以调用 服务端 API 创建和管理自定义音视频内容识别模板。

任务发起

发起音视频内识别任务,有“通过服务端 API 直接发起”、“通过控制台直接发起”和“上传时指定要执行的任务”三种方式。具体请参照视频处理的 任务发起以下是各种方式发起音视频内容识别任务的说明:调用服务端 API ProcessMedia 发起任务:在请求中的AiRecognitionTask参数指定 音视频内容识别模板 的模板 ID。通过控制台对视频发起任务:调用 服务端 API 创建任务流,任务流中配置音视频内容识别任务(MediaProcessTask.AiRecognitionTask中指定);在控制台使用该任务流 发起视频处理服务端上传时指定任务:调用 服务端 API 创建任务流,任务流中配置音视频内容识别任务(MediaProcessTask.AiRecognitionTask中指定); 申请上传 中的procedure参数指定为该任务流。客户端上传时指定任务:调用 服务端 API 创建任务流,任务流中配置音视频内容识别任务(MediaProcessTask.AiRecognitionTask中指定);在 客户端上传签名 中的procedure指定该任务流。控制台上传:调用 服务端 API 创建任务流,任务流中配置音视频内容识别任务(MediaProcessTask.AiRecognitionTask中指定);通过控制台上传视频,选择 上传的同时对视频进行处理操作 并指定视频上传后执行该任务流。

结果获取

发起音视频内容识别任务后,您可以通过异步等待 结果通知 和同步进行 任务查询 两种方式获取视频内识别任务的执行结果。下面是发起内容识别任务后,普通回调方式下结果通知的示例(省略了值为 null 的字段):

{    "EventType":"ProcedureStateChanged",    "ProcedureStateChangeEvent":{        "TaskId":"1400155958-Procedure-2e1af2456351812be963e309cc133403t0",        "Status":"FINISH",        "FileId":"5285890784363430543",        "FileName":"集锦",        "FileUrl":"http://1400155958.vod2.myqcloud.com/xxx/xxx/aHjWUx5Xo1EA.mp4",        "MetaData":{            "AudioDuration":243,            "AudioStreamSet":[                {                    "Bitrate":125599,                    "Codec":"aac",                    "SamplingRate":48000                }            ],            "Bitrate":1459299,            "Container":"mov,mp4,m4a,3gp,3g2,mj2",            "Duration":243,            "Height":1080,            "Rotate":0,            "Size":44583593,            "VideoDuration":243,            "VideoStreamSet":[                {                    "Bitrate":1333700,                    "Codec":"h264",                    "Fps":29,                    "Height":1080,                    "Width":1920                }            ],            "Width":1920        },        "AiRecognitionResultSet":[            {                "Type":"FaceRecognition",                "FaceRecognitionTask":{                    "Status":"SUCCESS",                    "ErrCode":0,                    "Message":"",                    "Input":{                        "Definition":10                    },                    "Output":{                        "ResultSet":[                            {                                "Id":183213,                                "Type":"Default",                                "Name":"张三",                                "SegmentSet":[                                    {                                        "StartTimeOffset":10,                                        "EndTimeOffset":12,                                        "Confidence":97,                                        "AreaCoordSet":[                                            830,                                            783,                                            1030,                                            599                                        ]                                    },                                    {                                        "StartTimeOffset":12,                                        "EndTimeOffset":14,                                        "Confidence":97,                                        "AreaCoordSet":[                                            844,                                            791,                                            1040,                                            614                                        ]                                    }                                ]                            },                            {                                "Id":236099,                                "Type":"Default",                                "Name":"李四",                                "SegmentSet":[                                    {                                        "StartTimeOffset":120,                                        "EndTimeOffset":122,                                        "Confidence":96,                                        "AreaCoordSet":[                                            579,                                            903,                                            812,                                            730                                        ]                                    }                                ]                            }                        ]                    }                }            }        ],        "TasksPriority":0,        "TasksNotifyMode":""    }}

回调结果中,ProcedureStateChangeEvent.AiRecognitionResultSetTypeFaceRecognition的识别结果,代表人脸识别。TypeFaceRecognition的结果显示,Output.ResultSet中包含了两个识别出的人物,分别是张三李四SegmentSet表示人脸出现在视频中的时间段(由StartTimeOffsetEndTimeOffset确定)和在画面中的坐标(由AreaCoordSet确定)。
云点播官网1折活动,限时活动,即将结束,速速收藏
同尘科技为腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利。同意关联立享优惠

转转请注明出处:https://www.yunxiaoer.com/143439.html

(0)
上一篇 2023年12月9日
下一篇 2023年12月9日
详情页2

相关推荐

  • 阿里云负载均衡计费概述-云淘科技

    传统型负载均衡CLB(Classic Load Balancer)支持包年包月和按量付费两种付费模式。本文为您介绍CLB计费方式总览、计费组成等信息。 计费方式总览 CLB支持包年包月和按量付费两种付费模式。 按量付费包含两种实例计费方式:按使用量计费和按规格计费。 公网计费方式包括按固定带宽计费和按使用流量计费,包年包月仅支持按固定带宽计费。 付费模式 实…

    2023年12月10日
  • 腾讯云云函数(SCF)概述-云淘科技

    简介 Serverless Cloud Framework 是业界非常受欢迎的无服务器应用框架,开发者无需关心底层资源即可部署完整可用的 Serverless 应用架构。Serverless Cloud Framework 具有资源编排、自动伸缩、事件驱动等能力,覆盖编码、调试、测试、部署等全生命周期,帮助开发者通过联动云资源,迅速构建 Serverless…

    腾讯云 2023年12月9日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 腾讯云云直播录制状态事件通知

    直播录制是根据推流域名已绑定好的录制模板实时录制直播流画面,并生成对应的录制文件存储到云点播中。而录制状态回调则用于推送录制状态信息,主要包括录制启动成功、录制启动失败、录制暂停、录制续录成功、录制异常、录制结束。您需在回调模板中配置录制事件回调消息接收服务器地址,并将该模板与推流域名进行关联。当直播流触发录制事件后,腾讯云直播后台会将录制事件信息回调到您设…

    2023年12月9日
  • 腾讯云云函数(SCF)前后台对接-云淘科技

    操作场景 本文档指导您修改文字识别小工具的 HTML 文件,体验文字识别小工具前后台对接的效果。 前提条件 已 下载文字识别小工具的 HTML 文件。已在 函数部署 中生成的域名。已准备一张带有文字的图片。 操作步骤 修改 URL 地址 1. 使用编辑器打开已下载的 HTML 文件。说明如果没有专业的编辑器,可以通过文本方式打开。2. 将下图中的 url 参…

    2023年12月9日
  • 腾讯云云函数(SCF)开发方法-云淘科技

    函数形态 Golang 函数形态一般如下所示: package mainimport ( “context” “fmt” “github.com/tencentyun/scf-go-lib/cloudfunction”)type DefineEvent struct { // test event define Key1 string `json:”ke…

    腾讯云 2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。