ICS 35.240.01 CCS L 70 体 标 准 T/CPRA 200.32025 文化资源数据标注系统 Culturalresources data annotationsystem 2025-01-09发布 2025-01-09实施 中国公共关系协会文化大数据产业委员会 发布
T/CPRA 200.3-2025 目次 前言.. 1范围.. 2规范性引用文件, 3术语和定义. 3.1术语和定义 4系统总体操作流程 5技术要求. 5.1登录注册模块技术要求 5.2图片输入模块技术要求 5.3多标签标注模块技术要求, 5.4大众打标模块技术要求. 5.5专家资料库模块技术要求 5.6数据校验模块技术要求. 6系统性能指标 7网络接口与通信协议.
T/CPRA 200.3-2025 前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的 规定起草.
请注意本文件的某些内容可能涉及专利.
本文件的发布机构不承担识别专利的责任.
本文件由中国公共关系协会文化大数据产业委员会提出并归口.
本文件起草单位:北京邮电大学、北京玖扬科技有限公司、伏羲云(北京)文化科技有限公 司.
本文件主要起草人:徐坤、高凯、赵海英、侯小刚、薛晓鹏、周月、徐鹏举、尹晖、张炼、 曹明炜、崔义娜、王琰、徐娜、陈磊、许培、李媛媛.
T/CPRA 200.3-2025 文化资源数据标注系统 1范圈 本文件规定了文化资源数据标注系统的总体操作流程、技术要求、系统性能指标和网络接口与通信 协议.
本文件适用于国家文化大数据体系文化遗产标本库中文化资源数据标注系统的设计、开发及运行.
2规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款.
其中,注日期的引用文件, 仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括的修改单)适用于本 文件.
T/CPRA1国家文化大数据标准体系 T/CPRA300文化数字内容分类与代码 T/CPRA301文化资源数据分类与代码 3术语和定义 3.1术语和定义 下列术语和定义适用于本文件.
3.1.1文化数字内容culturaldigitalcontent 以数字形式存在的文化产品,一般以文字、图片、音频、视频、多媒体和其他形式表现.
通常包括 传统文化产品的数字化以及以数字形式存在的文化产品.
国家文化大数据体系下文化数字内容主要涵盖 中华优秀传统文化、革命文化和社会主义先进文化等.
文化数字内容作为数字化文化生产线的产出,由文化大数据服务平台管理与分发,并通过文化体验 设施和设备消费.
通常情况下,文化数字内容又称为文化数字产品、文化数字内容产品等.
[来源:T/CPRA300 定义3.1.1] 3.1.2文化资源数据culturalresources data 对人类文化中传承下来并可以传播利用的文化(包括物质的和非物质的)进行数字化采集后,所得 到的用于识别和展现文化的图像、文字、声音、动画、影片、三维全景、三维模型等数据.
国家文化大 数据体系下文化资源数据主要包括中国文化遗产标本库、中华民族文化基因库、中华文化素材库中的数 据.
[来源:T/CPRA301定义3.1.1] 中国文化遗产标本库是基于历次全国性文化资源普查的数据(包括古籍、文物、美术馆藏品、地方
T/CPRA 200.3-2025 戏曲、非物质文化遗产等普查已经获得的数据),按照国家文化大数据标准,结构化存储于服务器,并 通过国家文化专网实现共享的数据.
[来源:T/CPRA301定义3.1.2] 4 系统总体操作流程 文化资源数据标注系统主要由登录注册模块、图片输入模块、多标签标注模块、大众打标模块、专 家资料库模块以及数据校验模块组成,各模块间通过有序的流程进行数据交互与协同,系统操作流程图 如图1所示.
登录注册模块 图片输入模块 专家 资料 大众打标 库模 更新 块 多标签标注模块 补充 V 输出标签 N 专家 是否满意 大众打标模块 资料 库模 块 数据校验模块 结束 图1系统操作流程图 内部模块间关系如下: a)用户通过登录注册模块验证身份后进入图片输入模块,上传的图像文件进入标注任务流程: b)上传的图像文件通过图片输入模块传递至多标签标注模块,多标签标注模块对图像文件进行智 能化处理,生成初步标注结果: c)多标签标注模块生成的初步结果将传递至大众打标模块,供用户进一步标注优化.
大众用户通 过直观的界面对标注结果进行补充或校正: d)标注任务完成后,大众打标模块将不确定或需要校验的标注结果提交至专家资料库,由专家进 行深度审核与最终确认: 2