ICS35.080 CCS L77 T/SAITA 团体标准 T/SAITA001—2023 自然语言处理系统测评规范 Specification for natural language processing system test and evaluation 2023-12-18发布 2023-12-20实施 上海市人工智能技术协会发布 T/SAITA001—2023 目 次 前言 III 引言 1范围.... 1 2规范性引用文件. 3术语和定义 1 4符号和缩略语..... 5自然语言处理系统的基本框架 6自然语言处理系统测评指标 3 6.1概述.. 3 6.2功能有效性........ 4 6.3性能. 6 6.4兼容性.... 6 6.5可维护性...... 6 6.6可迁移性.......... 6 6.7数据集的质量.. 2 6.8对抗性样本的影响..... 7 6.9鲁棒性.. 7 6.10可解释性.. 7 6.11安全性.... 8 7自然语言处理系统测评流程 8 7.1确定系统质量目标. 8 7.2构建测试数据集. 9 7.3构建测试环境. 9 7.4选择测试指标..... 9 7.5开展测试活动.... 9 7.6统计、汇总并分析测试结果, 9 8自然语言处理系统测试方法 9 8.1准备测试数据集.... 9 8.2功能有效性. 9 8.3性能. ..10 8.4兼容性....... ...10 8.5可维护性.... 8.6可迁移性. ..........11 8.7数据集的质量....... ..11 8.8对抗性样本的影响... ....12 8.9鲁棒性.. ..12 8.10可解释性.. ..13 8.11安全性. ......13 附录A(规范性)自然语言处理系统功能有效性评估指标计算方法.............15 I T/SA1TA001—2023 A.1自然语言理解功能有效性评估指标计算方法15 A.2自然语言生成功能有效性评估指标计算方法 ..16 附录B(资料性)数据集 附录C(资料性)自然语言处理系统评价指南22 参考文献23 II ...
推荐内容/By 图集吧
- LY/T 3418-2024 林草电子公文处理流程及系统运行管理规范.pdf
- LY/T 3419-2024 自然教育评估规范.pdf
- NB/SH/T 0843-2023 石化行业测试系统的评价 统计技术法.pdf
- NB/T 20560.8-2023 压水堆核电厂应急堆芯冷却系统过滤器设计和性能评价 第8部分:下游效应(堆芯外)分析技术要求.pdf
- NB/T 20560.4-2021 压水堆核电厂应急堆芯冷却系统过滤器设计和性能评价 第4部分:设备设计技术要求.pdf
- QX/T 148-2011 气象领域高性能计算机系统测试与评估规范.pdf
- RB/T 182-2023 移动智能终端应用软件个人信息安全评价规范.pdf
- RB/T 106-2023 能源管理体系 水泥企业认证要求.pdf
- SY/T 7667-2022 石油和液体石油产品 自动计量系统技术要求.pdf
- GB/T 33009.3-2016 工业自动化和控制系统网络安全 集散控制系统(DCS) 第3部分 评估指南.pdf
- YD/T 4394.4-2023 自然语言处理技术及产品评估方法 第4部分:机器同传系统(备案版).pdf
- YD/T 4394.5-2023 自然语言处理技术及产品评估方法 第5部分:智能客服系统(备案版).pdf