ICS 35. 240. 99 CCS L67 YD 中华人民共和国通信行业标准 YD/TXXXX-XXXX 基于联邦学习的数据流通产品 技术要求与测试方法 Technical requirements and testing methods of data circulation products based on federated learning 行业标准 (报批稿) 意服务平台 [××××]-[××]-[××]发布 [××××]-[××]-[××]实施 中华人民共和国工业和信息化部 发布
前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起 草.
请注意本文件的某些内容可能涉及专利.
本文件的发布机构不承担识别专利的责任.
本文件由中国通信标准化协会提出并归口, 本文件起草单位中国信息通信研究院、上海光之树科技有限公司、深圳前海微众银行股份有限公 司、华控清交信息科技(北京)有限公司、杭州諾崴信息科技有限公司、北京数读科技有限公司、上海 富数科技有限公司、武汉大学、北京百度网讯科技有限公司、腾讯云计算(北京)有限责任公司、深圳 市洞见智慧科技有限公司、杭州趣链科技有限公司、科大讯飞股份有限公司、普元信息技术股份有限公 司、北京京东尚科信息技术有限公司、中国工商银行股份有限公司、蚂蚊科技集团股份有限公司.
本文件主要起草人闫树、袁博、魏凯、姜春宇、吕艾临、王卓、李雨罪、王思源、贾轩、白玉真、 杨靖世、鲁颖、沈敏均、范力欣、张天豫、刘友智、林冰琅、李斌、王云河、陈琅、王爽、李帜、郑灏、 蔡超超、单进勇、王昊昱、李晓林、李宏宇、孟丹、汪宏、彭宇翔、卞阳、黄翠婷、何德彪、季石磊、 王建奎、洪爵、刘洋、王礼斌、张雄、陶阳宇、程勇、何浩、王湾湾、李博、李伟、陈晓丰、徐静、汪 小益、陈敏军、王慧敏、倪修峰、康明、赵志峰、刘洋、倪壮、刘登涛、任江哲、孟庆余、刘庆会、彭 南博、王虎、张德、袁睿、华志超、强锋、张闯、相妹、彭晋、王磊、李漓春、昌文婷.
行业标准信息服务平台
YD/T XXXX-XXXX 目次 前 1范围. 2规范性引用文件. 3术语、定义和缩略语 3.1术语和定义 3.2缩略语 4参考架构 4.1概述. 4.2联邦学习分类 4.3架构视图. 4.4联邦学习产品分类 5技术要求.. 5.1调度管理能力. 5.2数据处理能力 5.3算法实现. 5.4效果及性能, 5.5安全性、稳定性、可扩展性能力 6参考测试方法. 6.1调度管理能力, 6.2数据处理能力 6.3算法实现, 6.4效果及性能. P 6.5安全性、稳定性、可扩展性测试 附录A(资料性)算法安全性测试要求. 标准信息服务平台
YD/T XXXX-XXXX 基于联邦学习的数据流通产品技术要求与测试方法 1范围 本文件规定了基于联邦学习的数据流通产品在调度管理、数据处理、算法实现、效果及性能、安全 性、稳定性、可扩展性方面必要的技术要求和相应的测试方法.
本文件适用于基于联邦学习的数据流通产品的研发、测试、评估和验收等.
2规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款.
其中,注日期的引用文件, 仅该日期对应的版本适用于本文件不注日期的引用文件,其最新版本(包括的修改单)适用于本 文件.
GB/T35295-2017信息技术大数据术语 3术语、定义和缩略语 GB/T35295-2017界定的以及下列术语和定义适用于本文件.
3.1术语和定义 3.1.1 联邦学习federated leaming 一种多个参与方在保证各自原始私有数据不出数据方定义的私有边界的前提下,以保护隐私数据的 方式交换中间计算结果,从而协作完成某项机器学习任务的模式.
3.1.2 联邦学习产品federatedleamingproduci 供联邦学习各参与方使用,提供联邦学习所需的计算和通信等功能,并满足联邦学习任务需求的软 件系统或软硬件一体化系统.
3.1.3 联邦学习任务federated learning task 指定参与方根据指定数据使用联邦学习完成特定机器学习任务的完整过程 3.1.4 联邦学习节点federatedlearming node 计算方执行联邦学习协议或算法逻辑的软件、计算机、虚拟计算机或集群.
3.1.5
YD/T XXXX-XXXX 数据集data set 数据记录汇聚的数据形式.
注:它可以具有大数据的体量、速度、多样性和易变性特征.
数据集的特征表征的是数据本身或静态数据,而数据 的特征,当其在网络上传输时或暂时驻留于计算机存储器中以备读出或更新时,表征的是动态数据.
[来源:GB/T 35295-2017.2.1.46] 3.1.6 参与方party 协作完成联邦学习任务的一组设备、数据中心或机构.
注:联邦学习任务的参与方可分为如下几类,同一参与方可以同时担任不同角色: a)数据方(dataprovider):提供联邦学习所需的私有数据的参与方; b)算法方(algorithmprovider):提供联邦学习的算法的参与方; c)协调方(coordinator):管理和协调其他参与方,并参与执行联邦学习任务; d)计算方(putingprovider):为执行联邦学习任务提供计算能力(算力)的参与方,通常每个数据方 也是计算方; e)结果方(resultobtainer):接收联邦学习任务结果的参与方: f)任务发起方(taskinitiator):触发联邦学习任务的参与方,通常是数据方或者结果方.
3.1.7 样本对齐 sample alignment 符对齐交集内样本数据的过程.
3.1.8 贡献评估contribution mcasurement 联邦学习任务执行成功后对各参与方提供的数据进行评价,评估每个参与方单特征或各参与方所持 有的数据对该次联邦建模任务的贡献作用.
3.1.9 中间因子intermedia factor 计算过程中各方所交换的中间数据,该数据不能泄露原始数据.
3.1.10 热升级hot update 程序/服务不停止的前提下,通过增加、修改或删除相关功能模块达到功能升级目的.
3.2缩略语 下列缩略语适用于本文件.
Adadelta:自适应delta(Adaptive delta) AdaGrad:自适应梯度(Adaptive Gradient) Adam:自适应动量(Adaptive momentum) ASIC:特殊应用集成电路(Application SpecificIntegrated Circuit) AUC:接受者操作特征曲线下的面积(Area UnderCurve)