湖北省软件企业协会 团体标准 T/HBSEA013-2024 医疗大模型构建与应用标准 Standards for Medical Large Language Models Construction and Application 2024-10-25发布 2024-10-26实施 湖北省软件企业协会发布
T/HBSEA 013-2024 目录 1范围.. 2规范性引用文件 3术语和定义.. 3.1大模型, 3.2医疗数据, 3.3隐私保护, 3.4深度学习. 3.5生成式AI.. 3.6数据标注. 4伦理与合规要求 4.1伦理管理. 4.2数据合规要求. 5模型构建与评估.. 5.1数据采集与预处理, 5.2模型构建与训练. 5.3模型性能评估.. 5.4安全与隐私.. 6模型部署与应用. 2 6.1模型开发与部署 2 6.2模型应用场景 14
T/HBSEA 013-2024 前言 本标准按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草.
本标准由湖北省软件企业协会提出并归口.
本标准起草单位:武汉大学中南医院、湖北福鑫科创信息技术有限公司、武汉大学人民医院(湖北 省人民医院)、湖北省妇幼保健院、襄阳市中心医院、十堰市太和医院、湖北省第三人民医院(湖北省 中山医院)、咸宁市第一人民医院、孝感市第一人民医院、嘉鱼县人民医院.
本标准主要起草人:张帧、肖辉、冯辉、李成伟、张方、余莎莎、肖飞、刘晓东、王明举、宋莉莉、 张伟、陈艳林、温阳、吴笛、伍熙、刘学宾、向晋标、何玉玉.
请注意本文件的某些内容可能涉及专利.
本文件的发布机构不承担识别专利的责任.
本标准于2024年10月首次发布.
T/HBSEA 013-2024 医疗大模型构建及应用标准 1范围 本标准旨在为医疗大模型的构建、评估、开发、部署、应用等提供系统化、科学 化指导,确保医疗大模型在实际应用中可靠、安全、有效.
本标准适用于医疗大模型从数据采集到场景应用的全生命周期管理,包括数据采 集与预处理、模型构建与训练、模型性能评估、安全与隐私、模型开发部署及应用等 环节.
2规范性引用文件 下列文件对于本文件的应用是必不可少的.
凡是注日期的引用文件,仅注日期的 版本适用于本文件.
凡是不注日期的引用文件,其最新版本(包括的修改单)适 用于本文件.
GB/T41867-2022信息技术人工智能术语 GB/T42131-2022人工智能知识图谱技术框架 GB/T42018-2022信息技术人工智能平台计算资源规范 GB/T42755-2023人工智能面向机器学习的数据标注规程 GB/T19000-2016质量管理体系基础和术语 3术语和定义 3.1大模型 大模型是指基于大规模数据集和深度学习技术训练的人工智能模型,具有复杂的 模型结构和大量的参数,能够处理复杂的任务和大规模数据.
大模型具有数据量大、 参数多、计算资源需求高等特征.
在医疗领域,大模型可以用于疾病预测与诊断、医 学影像分析、生成式电子病历等.
3.2医疗数据 医疗数据是指在医疗服务过程中产生和收集的与患者健康状况、诊疗过程和结果 相关的数据.
这些数据包括但不限于病历数据、影像数据、实验室检查结果和基因数 据等.
医疗数据分为结构化数据和非结构化数据,来源于医院、诊所、实验室、体检 中心等医疗机构,是训练医疗大模型的核心资源,其质量和数量直接影响模型的性能 和应用效果.
3.3隐私保护 隐私保护是指在收集、存储、使用和共享个人数据时,采取技术和管理措施,防 止数据泄露、滥用和未经授权的访问,确保数据主体的隐私权和信息安全得到保障.
隐私保护的主要措施有数据加密、数据匿名化与去标识化、访问控制等.
3.4深度学习 深度学习是一种基于人工神经网络的机器学习技术,通过多层网络结构从大规模 数据中自动学习特征表示和复杂模式,用于解决各类复杂任务.
深度学习的模型类型 主要有卷积神经网络(CNN)、循环神经网络(RNN)、生成式对抗网络(GAN)等.
T/HBSEA 013-2024 3.5生成式A1 生成式AI是一类人工智能技术,通过从训练数据中学习其分布,生成新的、与原 始数据相似的数据.
例如,生成式对抗网络(GAN)和变分自编码器(VAE)是常见的 生成式AI模型.
生成式AI主要类型有生成式对抗网络(GAN)、变分自编码器(VAE) 等.
3.6数据标注 数据标注是指对原始数据进行人工或自动的标记和分类,提供用于模型训练的监 督信息,帮助模型学习和理解数据中的模式和特征.
数据标注类型主要有图像标注、 文本标注、序列标注.
图像标注主要是对医学影像数据中的区域进行标记,如标注病 变区域.
文本标注主要是对文本数据进行标记,如标注病历中的诊断信息、治疗方案.
序列标注主要是对序列数据进行标注,如标注时间序列中的重要事件.
4伦理与合规要求 4.1伦理管理 4.1.1伦理委员会 伦理委员会应作为独立的监督机构,确保医疗大模型的开发和应用符合伦理规范 和法律要求,不受开发团队和管理层影响.
伦理委员会应在数据收集、处理和使用过 程中提供决策和伦理指导,确保项目的伦理合规性.
伦理委员会职能如下: (1)伦理审查:对医疗大模型项目的各个阶段进行伦理审查,确保其在数据隐私 保护、知情同意、数据使用等方面符合法律法规和伦理要求.
(2)风险评估:评估医疗大模型可能带来的伦理和社会风险,并提出相应的风险 控制措施.
(3)监督执行:对医疗大模型开发和应用的执行过程进行监督,确保各项伦理规 范和法律法规得以落实.
(4)教育与培训:向开发团队和相关人员提供伦理教育和培训,提高其伦理意识 和合规能力.
4.1.2伦理评估 (1)项目申请:开发团队在启动项目前应提交伦理评估申请,包括项目目的、数 据处理方案、隐私保护措施等详细信息.
(2)初步审查:伦理委员会对申请材料进行初步审查,评估项目的伦理风险和合 规性.
(3)详细审查:如初步审查通过,进入详细审查阶段,伦理委员会进行全面评估, 包括深入讨论与项目审查会议.
(4)审批与:评估完成后,伦理委员会出具审核意见.
如项目通过审核,给 予伦理批复:若未通过,提供修改建议.
(5)项目监控:在项目实施过程中,伦理委员会定期检查其合规情况,确保项目 始终符合法律和伦理规范.
(6)变更申请:若项目计划发生重大变更,需立即提交伦理委员会进行重新评估 和审批.
(7)终审评估:项目结束后进行终审评估,总结项目的伦理执行情况,记录项目 经验和教训.