您当前的位置:创新研究网资讯正文

腾讯云OCR评测研究报告获AIIA同意并正式立项

放大字体  缩小字体 2020-01-18 01:39:16  阅读:3553+ 作者:责任编辑NO。邓安翔0215

1月13日,我国人工智能工业开展联盟2019年第四次整体大会在北京举行,会上,腾讯云AI视觉团队安排编撰的《OCR工业使用及评测需求研究陈述》取得与会专家的认可,并顺畅经过立项。该陈述是腾讯公司联合我国信息通讯研究院、我国人工智能工业开展联盟一起树立的“智能产品安全与评测联合实验室”的首个研究成果。

OCR(Optical Charater Recongnition)全称“光学字符辨认”,即使用光学技术和计算机技术将印制或书写与纸张上的文字读取出来,并转换成计算机可读取、人可以了解的格局。作为完成文字高速录入的要害技术,OCR现在已大范围的使用于政府、金融、交通、教育、泛互联网等多个范畴。但是,不同使用场景中OCR数据类型差异化很大,每个使用场景都对OCR引擎有不同的要求。例如,金融和交通范畴的OCR数据多是结构化的卡证类数据,如身份证、银行卡、驾驶证等,而卡证数据简略、场景安全性要求高,因而对OCR引擎的辨认准确率要求会比较高;在教育、泛互联网范畴中,多为算式、表格、广告图片、游戏图片等非结构化数据,对OCR引擎的辨认准确率要求会相对较低。

现在,业界没有有一致的、规范化的OCR引擎评测办法,导致OCR使用商场鱼龙混杂,阻止了OCR技术在不同范畴的良性开展。

根据腾讯优图供给的腾讯云OCR文字辨认技术,以及在多个职业里的AI使用实践经验,腾讯云AI视觉团队启动了《OCR工业使用及评测需求研究陈述》(以下简称“研究陈述”)的编纂作业,剖析OCR在使用中的评测场景、样本分类及评测的要害目标。

依照不同的使用场景,《研究陈述》将OCR引擎划分为“卡证类文字辨认”、“收据单据辨认”、“轿车相关辨认”、“职业文档辨认”和“通用文字辨认”,根本掩盖干流的OCR使用场景。针对不同的OCR引擎,《研究陈述》也树立了不同的规范评测样本集。

关于评测的要害目标,《研究陈述》将其划分为“作用目标”和“性能目标”两类。例如,针对身份证、行驶证等字段准确率要求高的场景,主要看字段级的作用目标,针对通用文字、职业文档等场景,主要看字符级的作用目标。

与会专家以为,根据OCR使用范畴的广泛性,无法用单一的规范和评测样本集来衡量OCR在不同范畴的体现,因而,分场景树立威望的评测规范,将有助于更快速地推动OCR技术的工业化落地。

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!