ICS 33.020 CCS M07 YD 中华人民共和国通信行业标准 YD/TxxxX-XXxx 基于电话信道的数据智能分析和处理技术 要求 Technical requirements for data intelligent analysis and processing on telephonechannel 行业标准信息服务 xxxx-xx-xx发布 xxxx-xx-xx实施 中华人民共和国工业和信息化部发布
目次 前言 III 1范围 2规范性引用文件 3术语、定义和缩略语.
3.1术语和定义.
3.2缩略语... 4基于电话信道的数据智能分析和处理技术框架 4.1系统技术框架.
4.2数据处理概述.
5电话信道数据采集要求 5.1采集数据要求.
5.2采集技术要求 6电话信道的数据处理分析技术要求.
6.1数据的语音分析及处理, 6.2数据的语义分析和处理 6.3结合元数据的分析及处理, 7数据安全要求 7.1通用要求, 7.2数据交互和保存.
7.3隐私保护要求 8数据开放服务要求.. 行业标准信息服务平台
前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草.
请注意本文件的某些内容可能涉及专利.
本文件的发布机构不承担识别专利的责任.
本文件由中国通信标准化协会提出并归口.
本文件起草单位中国电信集团有限公司、中国信息通信研究院、南京新一代人工智能研究院有限 公司.
本文件主要起草人:林悦、赵德欣、曾然然、刘晴、李荪.
行业标准信息服务平台
基于电话信道的数据智能分析和处理技术要求 1范围 本文件规定了基于电话信道的数据分析技术框架,给出了数据采集要求、数据处理分析技术要求、 数据安全要求和开放服务要求.
本文件适用于指导具备话务系统或语音业务的企业用于面向语音数据分析产品的设计、开发等技术 参考.
2规范性引用文件 下列文件对于本文件的应用是必不可少的.
凡是注日期的引用文件,仅所注日期的版本适用于本文 件.
凡是不注日期的引用文件,其最新版本(包括的修改单)适用于本文件.
GB/T35273-2017信息安全技术个人信息安全规范 GB/T35295-2017信息技术大数据术语 3术语、定义和缩略语 3.1术语和定义 GB/T35295-2017界定的以及下列术语和定义适用于本文件.
3.1. 1 结构化数据 structured data 一种数据表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的并且可以使用 关系模型予以有效描述.
[来源:GB/T 35295-2017 2.2.13] 3.1. 2 非结构化数据unstructureddata 不具有预定义模型或未以定义方式组织的数据.
息服务 [来源:GB/T 35295-2017 2.1.25] 3.1.3 元数据metadata 通常指描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能.
本标准特指企业数据结构化后的基础数据集合.
3.2缩略语 下列缩略语适用于本文件.
FTP 文件传输协议 File Transfer Protocol HTTP 超文本传输协议 Hyper Text Transfer Protocol HTTPS 超文本传输安全协议 Hyper Text Transfer Protocol over Secure Socket Layer MD5 消息摘要算法第五版 Message Digest Algorithm 5 4基于电话信道的数据智能分析和处理技术框架 4.1系统技术框架 系统技术框架如图1所示: 业务数据 数据采集模块 数据关联与存储 能力开放模块 数据提联(业务数据、语音数据) 关系库 数据中台 数据青洗(数据质量等有效性核检) 一业务元数据 关联数据 数据转换(格式转换,角色分离,音频抽取) 语音文件 分布式存健、 文本文件 数据安全 声纹库、 数据存储 关联检索 语音数据 数据分折模块 语音库 服务中台 特征提取 文本数据- 特证向量 应用服务、 情感分析 语义分析 特证数据 BV存储 资康管理 实时计算、 联合识别 数据整合 标准 图1系统技术框架 4.2数据处理概述 4.2.1数据来源 话务业务系统产生的数据包括基础数据、报表、日志、文本、语音等不同类别和来源的结构化和非 结构化数据.
数据经处理后可以服务的方式为应用提供数据资源支檬.
数据处理包括数据的采集和分析 两方面.
4.2.2数据采集 数据采集的要求: a)可包括对数据的审核、提取、清洗和转换等环节.
采集的方法应支持系统中不同业务来源或子 系统的业务数据和语音文件,并遵循预定的采集策略执行: b) 处理后的数据应满足格式、质量等技术要求.
此过程中可设计整理业务元数据并归类,同时应 考虑原始数据的安全性和完整性.