ICS 33. 040 CCS L 78 YD 中华人民共和国通信行业标准 YD/TxxXx-xXxx 电信网和互联网联邦学习 技术要求与测试方法 Technical requirements and evaluationmethods for federated learning in telemunications and Internet [点击此处添加与国际标准一致性程度的标识] 行业标准信息服务平台 (报批稿) [××××]-[××]-[××]发布 [××××]-[××]-[××]实施 中华人民共和国工业和信息化部发布
YD/T x××xxxxx 目次 前 言 .I 1范围.. 2规范性引用文件 3术语和定义.. 4技术架构.. 5技术要求... 5.1功能性要求. 3 5.1.1任务发起 .3 5.1.2数据输入. 5.1.3算法输入 .4 5.1.4任务执行 .4 5.1.5结果输出 4 5.1.6模型管理. .4 5.2安全性要求 .5 5.2.1通用数据安全, 5.2.2数据管理安全 .5 5.2.3联邦对齐安全. 5.2.4联邦特征处理安全.
.6 5.2.5联邦模型训练安全. .6 5.2.6联邦模型评估安全.
.6 5.2.7联邦模型预测安全.. 6测试方法. 6.1功能性要求. 6.1.1任务发起. 6.1.2数据输入 7 6.1.3算法输入.. .. 6.1.4任务执行. .8 6.1.5结果输出.. .9 6.1.6模型管理. .9 6.2安全性要求. 10 6.2.1通用安全要求 10 6.2.2数据管理安全. .12 6.2.3联邦对齐安全 .12 6.2.4联邦特征处理安全 ..13 6.2.5联邦模型训练安全. .14 6.2.6联邦模型评估安全, .14 6.2.7联邦模型预测安全. .14
YD/Txx×xxx×x 前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分标准化文件的结构和起草规则》 的规定起草.
请注意本文件的某些内容可能涉及专利.
本文件的发布机构不承担识别专利的责任.
本文件由中国通信标准化协会提出并归口.
本文件起草单位:中国信息通信研究院、中国移动通信集团有限公司、蚂蚁科技集团股 份有限公司、天翼电子商务有限公司、同盾科技有限公司、上海富数科技有限公司、京东科 技信息技术有限公司、北京天融信网络安全技术有限公司、北京百度网讯科技有限公司、北 京数读科技有限公司、深圳市腾讯计算机系统有限公司、OPPO广东移动通信有限公司、华控 清交信息科技(北京)有限公司、奇安信科技集团股份有限公司、深圳市洞见智慧科技有限 公司、北京安华金和科技有限公司、杭州金智塔科技有限公司、北京神州绿盟科技有限公司、 北京快手科技有限公司、哈尔滨工业大学(深圳)、杭州安恒信息技术股份有限公司、北京 恒安嘉新安全技术有限公司、郑州信大捷安信息技术股份有限公司、北京三快在线科技有限 公司、上海光之树科技有限公司、鹏城实验室、上海观安信息技术股份有限公司、北京京东 尚科信息技术有限公司等.
本文件主要起草人:戚琳、刘明辉、秦博阳、陈活、江为强、彭宇翔、黄翠婷、杨天雅、 喻博、孙中伟、张静、周吉文、裴超、张晓蒙、李克鹏、付艳艳、郭蕴哲、姜峰、杨海峰、 靳晨、陈超超、聂桂兵、高翔、落红卫、韩培义、蔡国庆、李鹏超、刘为华、李海全、黄坤、 张佳辰、刘川意、谢江、包勇军、李然等.
行业标准信息服务平台 ⅡI
YD/Txx×xx×xx 电信网和互联网联邦学习技术要求与测试方法 1范围 本文件规定了电信网与互联网联邦学习的技术要求与对应的测试方法.
本文件适用于电信网与互联网行业的联邦学习方案、工程、产品等的设计、研发、测试、 评估.
2规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款.
其中,注日期 的文件,仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括 的修改单)适用于本文件.
GB/T 25069-2010 信息安全技术术语 GB/T 29246-2017 信息技术安全技术信息安全管理体系概述和词汇 3术语和定义 GB/T25069-2010和GB/T29246-2017界定的以及下列术语和定义适用于本文件.
3. 1 联邦学习federatedlearning 一种多个参与方在保证各自原始私有数据不出数据方定义的私有边界的前提下,协作完 成某项机器学习任务的机器学习模式.
3. 2 计算因子putatlonfactor 基于联邦学习输入数据产生的中间数据.
准信息服务平台 3.3 私有边界privateboundary 参与方实体的存储和使用自身数据的物理范目 3.4 原始数据rawdata 各参与方在其私有边界内的私有明文数据.
3.5 敏感数据sensitive data 对个人或企业敏感的数据,泄露带来危害,不适合对外公开的数据.
3.6
YD/Txx×xxxxx 安全参数securityparameter 密码学中用以衡量一个加解密机制的安全强度或破解难度的一组参数.
注:安全参数包括计算安全参数和统计安全参数:计算安全参数K,关联计算复杂度 ,若计算安全参数为K,则对应需要进行O(2“)次计算,越大的k所需计算的次数越多, 此种密码协议的安全性建立在攻击方算力有限的情况下:统计安全参数入,衡量统计距离 的大小(如2),表示攻击方拥有无限算力的情况下,攻击方以一定概率破解加密机制 3. 7 推导deduce 在有限计算资源和有限计算时间的实际条件下,对联邦学习的计算因子进行演算或还原 处理,以获得目标数据的过程.
4技术架构 联邦学习在逻辑上的角色包括任务发起方、调度方、算法提供方、数据提供方、计算 方和结果使用方.
各参与方协同完成一个联邦学习任务的基本工作逻辑流程如图1所示.
-任务发起方:发起计算任务请求,并在任务执行前核实资源.
-调度方:配置计算任务所需资源,管理和协调各参与方协同完成任务.
-算法提供方:提供计算逻辑和算法参数.
可将算法参数作为隐私数据进行保护,此时 该算法提供方也可视为数据提供方.
-数据提供方:提供完成计算任务所需的原始数据,通过加密等手段将原始数据转化为 计算因子后,输入到计算方.
一计算方:提供完成计算任务所需的算力.
计算方利用数据提供方输入的计算因子进 行计算,并将结果计算因子输出到结果使用方.
-结果使用方:接收计算任务的结果.
可能存在多个结果使用方.
-辅助计算方:为联邦学习任务辅助服务的联邦学习参与方,辅助计算方的部署应独立 行业标准信息服务平台 于计算方.
Z