DB14/T 2465-2022 人工智能 数据标注通用工作规程
附件大小:0.18MB附件格式:1个直链文件,格式为pdf
所属分类:其他规范
分享会员:冰淇淋123
分享时间:2022-11-22
最后更新:
资源简介/截图:
ICS 33.160.40
CCS A 91 0814
山西省地方标准
DB14/T2465-2022
人工智能数据标注通用工作规程
2022-06-14发布 2022-09-15实施
山西省市场监督管理局 发布
目次
前言II
1范围1
2规范性引用文件1
3术语和定义1
4原则1
5工作流程1
6规划要求2
7实施要求3
8监控要求3
9交付要求3
10归档4
参考文献5
前言
本文件按照GBT1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
本文件由山西省工业和信息化厅提出、组织实施和监督检查。
山西省市场监督管理局对标准的组织实施情况进行监督检查。
本文件由山西省物联网和人工智能标准化技术委员会归口。
本文件起草单位:百度云计算技术(山西)有限公司、山西省大众科技评估中心、山西灵波微步科技有限公司、山西物联网行业技术中心(有限公司)、山西集智数据服务有限公司、山西省科技评估学会。
本文件主要起草人:司文、施佳樑、王洋、闵楠、胡驰、尉赤、张辰妹、吴泽衔、查晓丹、郭瑞鹏、李先军、赵波、李鹃、李鹏飞。
内容摘要:
人工智能数据标注通用工作规程
1范围
本文件规定了人工智能机器学习中数据标注生产所需要的通用工作要求,包括原则、流程、规划、实施、监控与交付。
本文件适用于人工智能机器学习中数据标注的企业、高校、研究机构、政府机关,其他行业和机构可参照执行。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款,其中,注日期的引用文件,仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
DB14/T 2463 人工智能 数据标注总体框架
3术语和定义
DB14/T 2463 界定的以及下列术语和定义适用于本文件.
3.1 数据标注合格率 qualified rate of data annotation
一个标注任务中,符合标注规则要求的已标注数据总量与已标注数据总量的比值。
3.2 数据标注质量控制员 data annotation quality control ler
数据标注工作中,按照标注规则从事数据审核等质量控制工作的人员。
3.3 数据标注任务 data annotation task
数据标注机构按照需方要求或合同约定,在特定的时间、成本、质量要求下完成指定数据标注的工作。
4原则
4.1数据标注机构对待标注数据应遵循数据安全、保密的原则。
4.2制定数据标注计划制定时应遵循合理性、可量化性、及时性和可调整性的原则。
4.3数据标注生产过程应遵循全过程质量控制原则,确保生产过程质量可控。
5工作流程
数据标注工作流程见图1。
1范围
本文件规定了人工智能机器学习中数据标注生产所需要的通用工作要求,包括原则、流程、规划、实施、监控与交付。
本文件适用于人工智能机器学习中数据标注的企业、高校、研究机构、政府机关,其他行业和机构可参照执行。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款,其中,注日期的引用文件,仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
DB14/T 2463 人工智能 数据标注总体框架
3术语和定义
DB14/T 2463 界定的以及下列术语和定义适用于本文件.
3.1 数据标注合格率 qualified rate of data annotation
一个标注任务中,符合标注规则要求的已标注数据总量与已标注数据总量的比值。
3.2 数据标注质量控制员 data annotation quality control ler
数据标注工作中,按照标注规则从事数据审核等质量控制工作的人员。
3.3 数据标注任务 data annotation task
数据标注机构按照需方要求或合同约定,在特定的时间、成本、质量要求下完成指定数据标注的工作。
4原则
4.1数据标注机构对待标注数据应遵循数据安全、保密的原则。
4.2制定数据标注计划制定时应遵循合理性、可量化性、及时性和可调整性的原则。
4.3数据标注生产过程应遵循全过程质量控制原则,确保生产过程质量可控。
5工作流程
数据标注工作流程见图1。
(略)
6规划要求
6.1明确需求
数据标注生产开始前,数据标注项目负责人应及时获取数据需求方数据标注的需求说明书,并应包括以下内容:
a)明确数据标注需求完成的时间节点;
b)明确数据标注的内容;
c)明确数据标注的方法;
d)明确数据验收规则;
e)其他要求。
6.2获取数据
数据标注项目负责人应及时从数据需求方处获取待标注数据,数据获取方式包括:
a)平台接口对接的方式:
b)存储介质复制的方式。
6.3规则验证与细化
数据标注项目负责人应按照标注规划进行标注规则验证与细化,并完成以下内容:
a)确定数据试标数量:应遵循数据标注内容覆盖全面性及数据标注成本最小化要求,抽取需求方
指定数量作为试标数量;
b)进行试标:应选择中等以上技能的数据标注员,按照标注规则对抽样数据进行标注,以验证标
注规则的合理性;
c)细化数据标注规则:应遵循易理解、易操作的原则,且与数据需求方要求一致的原则,对数据
试标中发现的不合理规则进行修改细化。
6.4明确计划
数据标注项目负责人应根据标注需求、数据试标效率确定标注计划。计划内容包括:进度计划、人员计划、资金计划、工具计划、质量控制计划、验收计划。
6.5专项培训
6.1明确需求
数据标注生产开始前,数据标注项目负责人应及时获取数据需求方数据标注的需求说明书,并应包括以下内容:
a)明确数据标注需求完成的时间节点;
b)明确数据标注的内容;
c)明确数据标注的方法;
d)明确数据验收规则;
e)其他要求。
6.2获取数据
数据标注项目负责人应及时从数据需求方处获取待标注数据,数据获取方式包括:
a)平台接口对接的方式:
b)存储介质复制的方式。
6.3规则验证与细化
数据标注项目负责人应按照标注规划进行标注规则验证与细化,并完成以下内容:
a)确定数据试标数量:应遵循数据标注内容覆盖全面性及数据标注成本最小化要求,抽取需求方
指定数量作为试标数量;
b)进行试标:应选择中等以上技能的数据标注员,按照标注规则对抽样数据进行标注,以验证标
注规则的合理性;
c)细化数据标注规则:应遵循易理解、易操作的原则,且与数据需求方要求一致的原则,对数据
试标中发现的不合理规则进行修改细化。
6.4明确计划
数据标注项目负责人应根据标注需求、数据试标效率确定标注计划。计划内容包括:进度计划、人员计划、资金计划、工具计划、质量控制计划、验收计划。
6.5专项培训
(略)