ICS 35.020 CCS L70 YD 中华人民共和国通信行业标准 YD/TXXXX-XXXX 隐私计算联邦学习产品性能要求 和测试方法 Privacy-preserving puting performance requirements and testing methods of federated learning products 行业标准信息服务平台 (报批稿) xxxx-xx-xx发布 XXXX-XX-x×实施 中华人民共和国工业和信息化部发布
YD/T XXXXXXXX 目次 前言 1范围.. 2规范性引用文件 3术语和定义. 4缩略语.. 5安全要求.. 5.1技术架构.. 5.2通用安全 5.3算法安全. 6性能测试负载要求. 6.1安全求交.. 6.2特征工程.. 6.3联合建模. 6.4联合预测. 7测试方法 7.1技术架构.. 7.2通用安全.. 7.3算法安全.. 7.4安全求交.. .9 7.5特征工程.. 7.6联合建模.. 13 7.7联合预测. 16 附录A(资料性)密码学算法的安全强度 20 参考文献. 标准信息服务平台 22
YD/T XXXX-XXXX 前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》 给出的规定起草.
本文件是隐私计算系列标准之一,该系列标准结构和名称如下: 一隐私计算联邦学习产品性能要求和测试方法 -隐私计算联邦学习产品安全要求和测试方法 一隐私计算可信执行环境产品性能要求 一一隐私计算可信执行环境产品安全要求 一隐私计算多方安全计算产品性能要求和测试方法 一隐私计算多方安全计算产品安全要求和测试方法 请注意本文件的某些内容可能涉及专利.
本文件的发布机构不承担识别这些专利的责任.
本文件由中国通信标准化协会提出并归口.
本文件起草单位中国信息通信研究院、深圳市腾讯计算机系统有限公司、华控清交信 息科技(北京)有限公司、上海富数科技有限公司、蚂蚁科技集团股份有限公司、北京数读 科技有限公司、北京百度网讯科技有限公司、京东科技信息技术有限公司、深圳市洞见智慧 科技有限公司、阿里巴巴(中国)有限公司、杭州趣链科技有限公司、上海阵方科技有限公 司、同盾科技有限公司.
本文件主要起草人:闫树、袁博、白玉真、王思源、吕艾临、魏凯、姜春字、李雪妮、 姣姣、程勇、王礼斌、陶阳宇、李克鹏、宋巍、任维赫、王云河、卞阳、黄翠婷、陈立峰、 李漓春、赵原、昌文婷、蔡超超、单进勇、周吉文、彭胜波、季石磊、郭建领、唐家伟、宋 红花、孙中伟、彭南博、范昊、姚明、何浩、王湾湾、白晓媛、刘巍然、彭力强、李伟、徐 静、汪小益、徐茂桐、苏冠通、祝文伟、黄程韦、刘杰、李升林、谢翔、夏付彪、李宏宇、 孟丹、汪宏.
行业标准信息服务平台 II
YD/T XXXXXXXX 隐私计算联邦学习产品性能要求和测试方法 1范围 本文件规定了基于联邦学习的隐私计算产品的性能要求和相应的测试方法,包括技术架 构、通用安全、算法安全、安全求交、特征工程、联合建模、联合预测等内容.
本文件适用于基于联邦学习的隐私计算产品的研发、测试、评估和验收等.
2规范性引用文件 下列文件中的内容通过文中的规范性引用面构成本文件必不可少的条款.
其中,注日期的 引用文件,仅该日期对应的版本适用于本文件不注日期的引用文件,其最新版本(包括所 有的修改单)适用于本文件.
YD/TAAAA-AAAA基于联邦学习的数据流通产品技术要求与测试方法 3术语和定义 YD/TAAAA-AAAA界定的以及下列术语和定义适用于本文件.
3. 1 联邦学习federatedlearning 一种多个参与方在保证各自原始私有数据不出数据方定义的可信域的前提下,以保护 隐私数据的方式交换中间计算结果,从面协作完成某项机器学习任务的模式.
注:隐私数据包括原始私有数据、计算结果以及算法参数和模型参数中需要被保护的数据.
算法参数 和模型参数中需要被保护的数据根据实际应用场景确定,包括但不限于模型参数、梯度、样本分布等.
隐 私计算中的联邦学习不包含明文交换中间计算结果且未保护隐私数据的方案.
[来源:YD/TAAAA-AAAA.3.1.1,有修改] 3.2 参与方parties [来源:YD/T AAAA-AAAA,3. 1. 6] 3. 3 安全参数securityparameter 描述联邦学习协议的安全程度的比特位宽.
注:联邦学习协议由多密码算法模块组成,协议层安全参数直接约束密码算法的算法参数.
安全参数 主要包括统计安全参数、计算安全参数等.
统计安全参数是一个整数1,根据输入数据产生的计算因子的概 率分布,与不知道输入数据随机模拟的计算因子的概率分布,两者统计上不可区分(统计距离不高于2-1); 计算安全参数是一个整数k,表示多项式时间攻击者破解协议的计算复杂度为0(2”k).
1
YD/T XXXXXXXX [来源:YD/T BBBB-BBBB,3.4,有修改] 3. 4 数据集data set 联邦学习中数据方的一条或多条数据的集合.
3.5 融合数据集joint data set 联邦学习中各方数据集的并集.
注:该“融合”是虚拟的,各参与方的原始数据集并未汇聚到一个节点进行融合,只是各方交换了数 据集的描述信息(如数据的字段列表、数据数量).
虚拟的融合数据集便于各方了解参与当前联邦学习任 务的各方数据的标识、字段、数量等信息.
3.6 精度accuracy 联邦学习的计算结果与明文计算结果连续相同的有效位数,位数越大精度越高.
对于 一个数值后再计算精度.
4缩略语 下列缩略语适用于本文件.
受试者工作特征曲线下面积 Area Under Curve IV 信息值 Information Value KS 柯尔莫可洛夫-斯米洛夫检验 Kolmogorov-Smirmov TLCP 传输层密码协议 Transport layer cryptography protocol TLS 传输层安全协议 标准信息服 Transport Layer Security WOE 证据权重 Weight of Evidence 5安全要求 5.1技术架构 联邦学习产品应提供技术构架图,证明计算流程的安全性,证明过程包括: 一无第三方,应提供结构图等相关证明: 一第三方如果参与数据交互,应保证原始数据和中间数据安全; 一一第三方不应留存原始数据和中间数据或其加密状态: 一有汇聚加密数据,并同时拥有密钥的第三方,应有措施保证其安全性,不会解密 并泄露或留存数据.
联邦学习产品的技术架构包括以下类型: 2