ICS 35. 240 CCS L70 国 体标 准 T/CESA1199-2022 人工智能智能字符识别技术规范 Artificialintelligence-Technicalspecificationforintelligent characterrecognition 2022-06-30发布 2022-06-30实施 中国电子工业标准化技术协会 发布
T/CESA1199-2022 保护文件 归属于该标准的发布机构,除非有其他规定,否则未经许可,此发行物及其章节不得以其 他形式或任何手段进行复制、再版或使用,包括电子版,影印件,或发布在互联网及内部网络等。
使用 许可可于发布机构获取。
T/CESA 1199-2022 目次 前言.. 1范围... 2规范性引用文件.. 3术语和定义、缩略语.. 3.1术语和定义. 3.2缩略语.. 2 4智能字符识别系统框架... 2 5功能要求.. 3 5.1图像采集. 3 5.2图像预处理. 3 5.3文本检测. 3 5.4文本识别.. 4 5.5信息提取.. 4 6性能要求.. 4 6.1文本检测性能要求. 6.2文本识别性能要求... 7测试方法.. 7.1测试流程. 7 7.2确定系统质量目标. .8 7.3构建测试数据集. 7.4搭建测试环境. 7.5选择测试指标. 6 7.6执行测试步骤.. 7.7评价测试结果. 6′ II
T/CESA 1199-2022 前言 本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。
本文件由中国电子技术标准化研究院提出。
本文件由中国电子技术标准化研究院、中国电子工业标准化技术协会归口。
本文件起草单位:中国电子技术标准化研究院、腾讯云计算(北京)有限责任公司、华为技术有限 公司、深圳云天励飞技术股份有限公司、四川云从天府人工智能科技有限公司、西安深信科创信息技术 有限公司、美的集团(上海)有限公司、阿里云计算有限公司、北京百度网讯科技有限公司、浙江大华 技术股份有限公司、北京旷视科技有限公司、杭州海康威视数字技术股份有限公司、华为云计算技术有 限公司、上海计算机软件技术开发中心、上海依图网络科技有限公司、上海商汤智能科技有限公司、深 圳市矽赫科技有限公司、马上消费金融股份有限公司、北京九章云极科技有限公司、西北工业大学、上 海人工智能研究院有限公司。
本文件主要起草人:董建、马珊珊、刘海涛、杨晓光、刘皓、张小宝、徐洋、杨雨泽、王小叶、 王彭、郑文先、代翔、李军、李继伟、田福康、胡蓉、脱立恒、郭嘉、姚聪、杨志博、章成全、杨烨华、 李笑如、陈媛媛、熊剑平、程淼、梅敬青、付英波、程战战、钮毅、谢泽澄、符海芳、郝阳阳、陈敏刚、 马泽宇、赵春昊、梁鼎、武焕、洪鹏达、洪宝璇、李云峰、刘志强、方磊、毛玉婷、王鹏、王冀、宋海 涛、王资凯。
III
T/CESA 1199-2022 人工智能智能字符识别技术规范 1范围 本文件确立了智能字符识别技术参考框架,规定了功能要求和性能要求,描述了对应的测试方法。
本文件适用于智能字符识别产品和服务的设计、开发、应用和测试评价。
2规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。
其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括的修改单)适用于本 文件。
GB/T5271.12一2000信息技术词汇第12部分:外围设备 3术语和定义、缩略语 3.1术语和定义 GB/T5271.12一2000界定的以及下列术语和定义适用于本文件。
3.1. 1 光学字符识别opticalcharacterrecognition 一种字符识别,它使用光学手段鉴别图形字符。
[来源:GB/T 5271.12-2000,12.01.53] 3.1.2 智能字符识别intelligentcharacterrecognition 一种基于深度学习的光学字符识别技术。
对印刷文字、手写文字、表格、公式符号以及文档结构要 素进行识别和编码。
3.1.3 文本检测text detection 对图像上字符(串)、文本行(列)位置进行定位的过程。
注:字符(串)包括数字,符号,英文,中文或其他语言文本。
3.1.4 文本识别textrecognition 对图像上字符(串)、文本行位置进行识别的过程。
注:字符(串)包括数字,符号,英文,中文或其他语言文本。
3.1.5...