ICS 35. 240. 01 CCS L 70 国 体 标 准 T/CPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:基因数据质量要求 Technical requirements of gene database of Chinese culture Part 2:Gene data quality requirements 2024-12-13发布 2024-12-13实施 中国公共关系协会文化大数据产业委员会发布
T/CPRA 2101.2-2024 目次 前言.... II 1范围. 2规范性引用文件 3术语和定义 3.1中华民族文化基因库 4总体要求.. 4.1原则.. 4.2数据范围 4.3数据格式. 4.4数据文件命名原则 4.5逻辑一致性要求 4.6实时性要求. 5数据质量要求. 5.1核心元数据要求, 5.2数据文件质量要求 5.3数据质量保真要求
T/CPRA 2101.2-2024 前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的 规定起草.
请注意本文件的某些内容可能涉及专利.
本文件的发布机构不承担识别专利的责任.
本文件由中国公共关系协会文化大数据产业委员会提出并归口.
本文件起草单位:北京邮电大学、北京玖扬科技有限公司、伏羲云(北京)文化科技有限公 司.
本文件主要起草人:徐坤、高凯、赵海英、薛晓鹏、尹晖、侯小刚、周月、徐鹏举、李伟、 崔义娜、陈磊、刘志军、李媛媛.
T/CPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:数据质量要求 1范围 本文件规定了国家文化大数据体系中中华民族文化基因库数据的质量要求,包括总体要求和 数据质量要求等.
本文件适用于国家文化大数据体系中中华民族文化基因库设计、研发等.
2规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款.
其中,注日期的引 用文件,仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括的修 改单)适用于本文件.
GB/T1.1-2020标准化工作导则第1部分:标准化文件的结构和起草规则 T/CPRA1-2021国家文化大数据标准体系 T/CPRA300-2023文化数字内容分类与代码 T/CPRA301-2023文化资源数据分类与代码 3术语和定义 下列术语和定义适用于本文件.
3.1中华民族文化基因库 gene database of Chinese culture 中华民族文化基因库的数据主要来自革命文物大数据库和博物馆大数据体系,通常经过高精 度数据采集,导入国家文化大数据体系底层关联集成系统,完成数据标注、关联,并提取中华民 族文化元素、符号和标识,最终形成中华民族文化基因库.
相关数据通过国家文化专网实现共享.
[来源:T/CPRA301-2023 定义3.1.3] 4总体要求 4.1原则 数据质量原则要求应满足: a)准确性,数据记录来源可靠,数据记录准确: b)守正性,数据应以事实为依据,符合社会主义核心价值观: c)完整性,数据记录完整,不遗留: d)及时性,数据出现变化应及时修正更新.
4.2数据范围 中华民族文化基因库数据对象是: 1
T/CPRA 2101.2-2024 a)公共文化服务机构高清数字化采集形成的数据: b)从文化遗产中提取的中华民族文化元素、符号和标识数据.
4.3数据格式 中华民族文化基因库数据格式主要包括图片、视频、文字、音频、三维模型,具体格式要求 如下: a)图片格式:BITMAP、JPEG、TIFF、PDF、PNG、PSD、RAW、SVG.
b)视频格式:MPEG、AVI、MOV、FLV/F4V. c)文字格式:TXT. d)音频格式:WAVE、AIFF、MP3、MIDI、WMA、APE、FLAC.
e)三维模型格式:OSGB、OBJ、FBX、STL、3DS. 4.4数据文件命名原则 4.4.1数据集(目录)命名原则 数据集命名原则要求如下: a)数据集命名应按照存储格式进行分类,如图片、视频、音频、文字等: b)数据集命名宜采取多级目录结构: c)数据集命名不宜使用特殊字符,如@,#,S,%,&*,¥,等字符.
4.4.2单一数据命名原则 单一数据命名原则要求如下: a)单一数据文件命名规则宜按照文件数据名-{序号}.{文件格式}进行命名: b)单一数据命名中的文件数据名部分宜采用英文字母进行命名: c)单一数据命名中不宜出现@,#,S.%&,¥,等特殊字符.
4.5逻辑一致性要求 逻辑一致性应满足以下要求: a)概念一致性:文化基因分类与代码、数据结构、属性、文化基因间关系在同一尺度上应保 持一致,在不同尺度上应符合统一的体系规则: b)值域一致性:数据项的取值应在值域的界定范围内: c)格式一致性:数据存储应与数据集物理结构及规定格式保持一致.
4.6实时性要求 可按需求定期或及时对数据进行更新,保持数据的实时性.
元数据属性中应包含时间标识.
5数据质量要求 5.1核心元数据要求 表1图片元数据 元数据 字段CODE 必填 类型 长度 名称 titleName 是 字符串 00 文化数据标识符 identifiers 是 字符串 001