ICS 11.040.99 CCS C 30 中华人民共和国医药行业标准 YY/T1833.5-2024 人工智能医疗器械 质量要求和评价 第5部分:预训练模型 Artificial intelligence medical device-Qualityrequirements and evaluation- Part 5:Pre-trainedmodels 2024-09-29发布 2025-10-15实施 国家药品监督管理局 发布
YY/T 1833.5-2024 目次 前言 引言 1范围 2规范性引用文件 3术语和定义 ..... 4预训练模型说明要求 5预训练模型质量特性 6预训练模型质量符合性评价方法 附录A(资料性)预训练相关要素的扩展说明 附录B(资料性)模型说明描述示例 13 参考文献
YY/T 1833.5-2024 前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草.
本文件是YY/T1833《人工智能医疗器械质量要求和评价3的第5部分.YY/T1833已经发布 了以下部分: 第1部分:术语; 第2部分:数据集通用要求; 第3部分:数据标注通用要求: 第4部分:可追溯性: 第5部分:预训练模型. 请注意本文件的某些内容可能涉及专利,本文件的发布机构不承担识别专利的责任.
本文件由国家药品监督管理局提出.
本文件由全国人工智能医疗器械标准化技术归口单位归口.
本文件起草单位:浙江柏视医疗科技有限公司、中国食品药品检定研究院、国家药品监督管理局医 疗器械技术审评中心、国家卫生健康委卫生发展研究中心、中国医学科学院医学信息研究所、中国科学 技术大学苏州高等研究院、浙江大学、哈尔滨工业大学、北京邮电大学、北京理工大学、清华大学、北京京 津冀国家技术创新中心、上海市医疗器械检验研究院、中国人民解放军总医院、飞利浦(中国)投资有限 公司、华为技术有限公司、北京元影科技有限公司.
本文件主要起草人:颜子夜、李静莉、毛殊凡、游茂、刘枭寅、高东平、周少华、吴健、黄剑华、周修庄、 李建武、王雪霞、罗琳、陆遥、王浩、孟祥峰、刘重生、何昆仑、葛鑫、符海芳、田孟秋、甄浩、李浏.
YY/T 1833.5-2024 引言 预训练模型已经成为人工智能领域的重要念和人工智能医疗器械研发的常用资源,基于预训练 模型和迁移学习的深度学习算法在人工智能医疗器械领域得到了广泛采用.
由于预训练模型存在黑箱 特性,质量参差不齐,基于预训练模型研发的人工智能医疗器械存在不可预知的风险,影响产品的安全 性和有效性,业内重需提出预训练模型的质量要求和评价方法,为人工智能医疗器械的产品质量控制 提供基础保障.
按照我国已初步建立的人工智能医疗器械标准体系,YY/T1833(人工智能医疗器械质量要求和 评价》系列基础通用标准拟由八个部分构成.
一第1部分:术语,目的在于为人工智能医疗器械的质量评价活动提供术语.
一第2部分:数据集通用要求.
目的在于提出数据集的通用质量要求与评价方法.
-一第3部分:数据标注通用要求.
目的在于提出数据标注环节的质量要求与评价方法.
一第4部分:可追溯性,目的在于明确人工智能医疗器械的可追溯性通用要求与评价方法.
-一第5部分:预训练模型.
目的在于规范人工智能医疗器械采用的预训练模型质量.
一第6部分:环境要求,目的在于规范人工智能医疗器械的运行环境条件要求与评价方法.
一第7部分:隐私保护要求,目的在于加强人工智能医疗器械保护受试者隐私的能力.
一第8部分:伦理要求,目的在于从技术层面实现人工智能伦理的要求,保护人的权益.
本文件为人工智能医疗器械使用的预训练模型质量评价的相关工作提供了思路,也为后续制定细 分算法模型专用质量要求提供了依据.
人工智能医疗器械使用的预训练模型来源广泛,包括医疗器械厂家、第三方供应商、第三方服务平 台、网络开源等,受技术、商业和政策等因素限制,预训练模型的技术细节、研发过程和质量控制等全套 记录一般较难获取.
为了有效地控制和追溯人工智能医疗器械终产品的质量,本文件对人工智能医疗 器械使用的预训练模型本身和相应说明文档提出质量要求和评价方法以引导人工智能医疗器械厂家 从内部加强质量控制.
由于预训练模型本身不属于医疗器械且技术路线处于快速发展阶段,本文件不对预训练模型本身 的研发过程进行约束,避免限制创新.
对于预训练模型的版本变更、采用动态更新的第三方服务、具备 自学习能力等情形,本文件基于具体时间和具体版本进行质量评价,版本变更和更新参照医疗器械变更 规定和标准进行管理.
对于研发企业,本文件为预训练模型的遵选、质量控制提供了依据,对于第三方检测机构,本文件 为预训练模型的测试活动提供了依据.
YY/T 1833.5-2024 人工智能医疗器械质量要求和评价 第5部分:预训练模型 1范围 本文件规定了人工智能医疗器械使用的预训练模型的通用质量要求,描述了相应的评价方法.
本文件适用于人工智能医疗器械使用的预训练模型.
本文件不适用于预训练模型的研发过程评价.
2规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款.
其中,注日期的引用文 件,仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括的修改单)适用于 本文件.
YY/T1833.1人工智能医疗器械质量要求和评价第1部分:术语 YY/T1833.2一2022人工智能医疗器械质量要求和评价第2部分:数据集通用要求 3术语和定义 YY/T1833.1界定的以及下列术语和定义适用于本文件.
3.1 预训练模型pre-trainedmodel 已在数据集上经过训练的计算模型,可用作新任务的基础.
注:预训练模型狭义上通常用于迁移学习,其中模型在一个源任务上进行预训练,然后在下游任务上进行微调;在 广义上,预训练模型可能作为机器学习模型的初始值,供下游任务进行微调.
附录A中A.1对预训练模型的 来源和类别进行扩展性说明.
3.2 陈述预训练模型各种性质的文档.
3.3 任务域taskdomain 机器学习模型需要解决的特定问题或任务的领域.
注:在人工智能医疗器械的应用中任务城的示例有:影像病灶检测、影像学征象分类、影像R(OI(感兴趣区域)分 割、超声视频分割、影像报告生成、心电信号检测、图像生成、流程优化等.
3.4 源任务source task 用于训练机器学习模型的初始任务.
注:A.2对源任务、下游任务和预训练模型的关系进行说明.