详情页标题前

腾讯云对象存储图片文字识别(OCR)

详情页1

简介

文档提供关于通用文字识别的 API 概览以及 SDK 示例代码。

API 说明
通用文字识别 通用文字识别功能(Optical Character Recognition,OCR)基于行业前沿的深度学习技术,将图片上的文字内容,智能识别为可编辑的文本,可应用于随手拍扫描、纸质文档电子化、电商广告审核等多种场景,大幅提升信息处理效率。

通用文字识别

功能说明

通用文字识别。

方法原型

func (s *CIService) OcrRecognition(ctx context.Context, key string, opt *OcrRecognitionOptions) (*OcrRecognitionResult, *Response, error)

请求示例

obj := "pic/ocr.png"opt := &cos.OcrRecognitionOptions{    Type:              "general",    LanguageType:      "zh",    Isword:            true,    EnableWordPolygon: true,}res, _, err := c.CI.OcrRecognition(context.Background(), obj, opt)

参数说明

type OcrRecognitionOptions struct {    Type              string `url:"type,omitempty"`    LanguageType      string `url:"language-type,omitempty"`    Ispdf             bool   `url:"ispdf,omitempty"`    PdfPageNumber     int    `url:"pdf-pagenumber,omitempty"`    Isword            bool   `url:"isword,omitempty"`    EnableWordPolygon bool   `url:"enable-word-polygon,omitempty"`}
参数名称 参数描述 是否必填
key 对象键(Key)是对象在存储桶中的唯一标识。例如,在对象的访问域名examplebucket-1250000000.cos.ap-guangzhou.myqcloud.com/pic/pic.jpg中,对象键为 pic/pic.jpg。
Type OCR 的识别类型,有效值为 general,accurate,efficient,fast,handwriting。general 表示通用印刷体识别;accurate 表示印刷体高精度版;efficient 表示印刷体精简版;fast 表示印刷体高速版;handwriting 表示手写体识别。默认值为 general。
LanguageType       type 值为 general 时有效,表示识别语言类型。支持自动识别语言类型,同时支持自选语言种类,默认中英文混合(zh),各种语言均支持与英文混合的文字识别。可选值请参见 可识别的语言类型
Ispdf             type 值为 general、fast 时有效,表示是否开启 PDF 识别,有效值为 true 和 false,默认值为 false,开启后可同时支持图片和 PDF 的识别。
PdfPageNumber type 值为 general、fast 时有效,表示需要识别的 PDF 页面的对应页码,仅支持 PDF 单页识别,当上传文件为 PDF 且 ispdf 参数值为 true 时有效,默认值为1。
Isword             type 值为 general、accurate 时有效,表示识别后是否需要返回单字信息,有效值为 true 和 false,默认为 false。
EnableWordPolygon type 值为 handwriting 时有效,表示是否开启单字的四点定位坐标输出,有效值为 true 和 false,默认值为 false。

结果说明

type OcrRecognitionResult struct {    XMLName        xml.Name         `xml:"Response"`    TextDetections []TextDetections `xml:"TextDetections,omitempty"`    Language       string           `xml:"Language,omitempty"`    Angel          float64          `xml:"Angel,omitempty"`    PdfPageSize    int              `xml:"PdfPageSize,omitempty"`    RequestId      string           `xml:"RequestId,omitempty"`}
type TextDetections struct { DetectedText string `xml:"DetectedText,omitempty"` Confidence int `xml:"Confidence,omitempty"` Polygon []Polygon `xml:"Polygon,omitempty"` ItemPolygon []ItemPolygon `xml:"ItemPolygon,omitempty"` Words []Words `xml:"Words,omitempty"` WordPolygon []WordPolygon `xml:"WordPolygon,omitempty"`}
type Polygon struct { X int `xml:"X,omitempty"` Y int `xml:"Y,omitempty"`}
type ItemPolygon struct { X int `xml:"X,omitempty"` Y int `xml:"Y,omitempty"` Width int `xml:"Width,omitempty"` Height int `xml:"Height,omitempty"`}
type Words struct { Confidence int `xml:"Confidence,omitempty"` Character string `xml:"Character,omitempty"` WordCoordPoint *WordCoordPoint `xml:"WordCoordPoint,omitempty"`}
type WordCoordPoint struct { WordCoordinate []Polygon `xml:"WordCoordinate,omitempty"`}
type WordPolygon struct { LeftTop *Polygon `xml:"LeftTop,omitempty"` RightTop *Polygon `xml:"RightTop,omitempty"` RightBottom *Polygon `xml:"RightBottom,omitempty"` LeftBottom *Polygon `xml:"LeftBottom,omitempty"`}
参数名称 参数描述
TextDetections 检测到的文本信息,包括文本行内容、置信度、文本行坐标以及文本行旋转纠正后的坐标。
Language 检测到的语言类型,目前支持的语言类型可参考入参 language-type 说明。
Angel 图片旋转角度(角度制),文本的水平方向为0°;顺时针为正,逆时针为负。
PdfPageSize 图片为 PDF 时,返回 PDF 的总页数,默认为0。
RequestId 唯一请求 ID,每次请求都会返回。定位问题时需要提供该次请求的 RequestId。
DetectedText 识别出的文本行内容。
Confidence 置信度 0 – 100。
Polygon 文本行坐标,以顶点坐标表示 注意:此字段可能返回 null,表示取不到有效值。
ItemPolygon 文本行在旋转纠正之后的图像中的像素坐标,表示为(左上角 x, 左上角 y,宽 width,高 height)。
Words 识别出来的单字信息包括单字(包括单字 Character 和单字置信度 confidence),支持识别的接口:general、accurate。
WordPolygon 字的坐标数组,以四个顶点坐标表示。注意:此字段可能返回 null,表示取不到有效值。支持识别的类型:handwriting。
X 横坐标。
Y 纵坐标。
Width 宽 width。
Height 高 height。
Confidence 置信度 0 – 100。
Character 识别出来的单词信息。
WordCoordPoint 单字在原图中的四点坐标,支持识别的接口:general、accurate。
WordCoordinate 单字在原图中的坐标,以四个顶点坐标表示,以左上角为起点,顺时针返回。
LeftTop 左上顶点坐标。
RightTop 右上顶点坐标。
RightBottom 右下顶点坐标。
LeftBottom 左下顶点坐标。



对象存储官网1折活动,限时活动,即将结束,速速收藏
同尘科技腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利。同意关联立享优惠

转转请注明出处:https://www.yunxiaoer.com/145634.html

(0)
上一篇 2023年12月9日
下一篇 2023年12月9日
详情页2

相关推荐

  • 腾讯云云函数(SCF)SCF + COS 实现文件自动解压缩-云淘科技

    操作场景 本文介绍如何使用腾讯云云函数 SCF 实现对象存储 COS 中的文件自动解压缩。其中 COS 用于存储上传后需要解压的 .zip 文件及解压后的文件,SCF 实现对 .zip 文件上传至 COS 后的自动解压缩。 操作步骤 创建存储桶 1. 登录 对象存储控制台。2. 在左侧导航中,单击存储桶列表,进入存储桶列表页面。3. 单击创建存储桶。4. 在…

    2023年12月9日
  • 数据传输DTS这个DTS的控制面板操作是不是特别卡啊?-云小二-阿里云

    数据传输DTS这个DTS的控制面板操作是不是特别卡啊?为什么选择源数据库后,总是要刷新好几次才可以连上源数据库,连上以后每一步操作还得看运气,经常报错:Connect timeout after 20 seconds 以下为热心网友提供的参考意见 数据传输DTS的控制面板操作可能会因为网络连接不稳定或者源数据库负载过高等原因导致卡顿或连接超时的情况发生。以下…

    2023年12月14日
  • 腾讯云轻量应用服务器快速使用 Lightwings 构建应用云小二

    本文以 golang-http 为例,快速构建一个属于自己的应用吧。 1、购买Lightwings镜像 我们在 Lightwings 控制台上购买我们 Lightwings 应用镜像,创建一台实例。 2、下载代码模板 点击新增应用,选择下载 golang-http 模板下载。   3、编写业务代码 下载完 golang-http 模板后,解压下载…

    2023年12月9日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 腾讯 Kona(Tencent Kona)购买指南

    腾讯 Kona 提供社区版和企业版,购买说明如下: 社区版 企业版 腾讯 Kona 完全对外开源,用户可自行下载使用。 腾讯 Kona 提供付费的维保服务,适用于客户大型应用系统在高吞吐、高并发场景下,由于应用 JDK 应用不合理带来的系统性能和稳定性问题。需要从 JDK 应用规范、性能优化、应急救援、维护迁移等方面进行持续性保障护航,满足业务系统长期稳定需…

    腾讯云 2023年12月9日
  • 腾讯云云函数(SCF)腾讯在线教育-云淘科技

    本文分享了腾讯在线教育使用云函数的真实案例。腾讯在线教育团队是:IMWeb 团队隶属腾讯公司,是国内领先的专业前端团队之一。专注前端领域多年,负责过 QQ 资料、QQ 注册、QQ 群等亿级业务。目前聚焦于在线教育领域,精心打磨腾讯课堂、腾讯企鹅辅导及 ABCmouse 三大产品。 技术方案的尝试 腾讯在线教育团队在传统的 Web 应用方向其实有众多技术方面的…

    2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。