T/HBSEA 013-2024 医疗大模型构建与应用标准.pdf

013,2024,HBSEA,pdf,构建,团体标准
文档页数:23
文档大小:1.44MB
文档格式:pdf
文档分类:团体标准
上传会员:
上传日期:
最后更新:

湖北省软件企业协会 团体标准 T/HBSEA013-2024 医疗大模型构建与应用标准 Standards for Medical Large Language Models Construction and Application 2024-10-25发布 2024-10-26实施 湖北省软件企业协会发布
T/HBSEA 013-2024 目录 1范围.. 2规范性引用文件 3术语和定义.. 3.1大模型, 3.2医疗数据, 3.3隐私保护, 3.4深度学习. 3.5生成式AI.. 3.6数据标注. 4伦理与合规要求 4.1伦理管理. 4.2数据合规要求. 5模型构建与评估.. 5.1数据采集与预处理, 5.2模型构建与训练. 5.3模型性能评估.. 5.4安全与隐私.. 6模型部署与应用. 2 6.1模型开发与部署 2 6.2模型应用场景 14
T/HBSEA 013-2024 前言 本标准按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草.

本标准由湖北省软件企业协会提出并归口.

本标准起草单位:武汉大学中南医院、湖北福鑫科创信息技术有限公司、武汉大学人民医院(湖北 省人民医院)、湖北省妇幼保健院、襄阳市中心医院、十堰市太和医院、湖北省第三人民医院(湖北省 中山医院)、咸宁市第一人民医院、孝感市第一人民医院、嘉鱼县人民医院.

本标准主要起草人:张帧、肖辉、冯辉、李成伟、张方、余莎莎、肖飞、刘晓东、王明举、宋莉莉、 张伟、陈艳林、温阳、吴笛、伍熙、刘学宾、向晋标、何玉玉.

请注意本文件的某些内容可能涉及专利.

本文件的发布机构不承担识别专利的责任.

本标准于2024年10月首次发布.

T/HBSEA 013-2024 医疗大模型构建及应用标准 1范围 本标准旨在为医疗大模型的构建、评估、开发、部署、应用等提供系统化、科学 化指导,确保医疗大模型在实际应用中可靠、安全、有效.

本标准适用于医疗大模型从数据采集到场景应用的全生命周期管理,包括数据采 集与预处理、模型构建与训练、模型性能评估、安全与隐私、模型开发部署及应用等 环节.

2规范性引用文件 下列文件对于本文件的应用是必不可少的.

凡是注日期的引用文件,仅注日期的 版本适用于本文件.

凡是不注日期的引用文件,其最新版本(包括的修改单)适 用于本文件.

GB/T41867-2022信息技术人工智能术语 GB/T42131-2022人工智能知识图谱技术框架 GB/T42018-2022信息技术人工智能平台计算资源规范 GB/T42755-2023人工智能面向机器学习的数据标注规程 GB/T19000-2016质量管理体系基础和术语 3术语和定义 3.1大模型 大模型是指基于大规模数据集和深度学习技术训练的人工智能模型,具有复杂的 模型结构和大量的参数,能够处理复杂的任务和大规模数据.

大模型具有数据量大、 参数多、计算资源需求高等特征.

在医疗领域,大模型可以用于疾病预测与诊断、医 学影像分析、生成式电子病历等.

3.2医疗数据 医疗数据是指在医疗服务过程中产生和收集的与患者健康状况、诊疗过程和结果 相关的数据.

这些数据包括但不限于病历数据、影像数据、实验室检查结果和基因数 据等.

医疗数据分为结构化数据和非结构化数据,来源于医院、诊所、实验室、体检 中心等医疗机构,是训练医疗大模型的核心资源,其质量和数量直接影响模型的性能 和应用效果.

3.3隐私保护 隐私保护是指在收集、存储、使用和共享个人数据时,采取技术和管理措施,防 止数据泄露、滥用和未经授权的访问,确保数据主体的隐私权和信息安全得到保障.

隐私保护的主要措施有数据加密、数据匿名化与去标识化、访问控制等.

3.4深度学习 深度学习是一种基于人工神经网络的机器学习技术,通过多层网络结构从大规模 数据中自动学习特征表示和复杂模式,用于解决各类复杂任务.

深度学习的模型类型 主要有卷积神经网络(CNN)、循环神经网络(RNN)、生成式对抗网络(GAN)等.

T/HBSEA 013-2024 3.5生成式A1 生成式AI是一类人工智能技术,通过从训练数据中学习其分布,生成新的、与原 始数据相似的数据.

例如,生成式对抗网络(GAN)和变分自编码器(VAE)是常见的 生成式AI模型.

生成式AI主要类型有生成式对抗网络(GAN)、变分自编码器(VAE) 等.

3.6数据标注 数据标注是指对原始数据进行人工或自动的标记和分类,提供用于模型训练的监 督信息,帮助模型学习和理解数据中的模式和特征.

数据标注类型主要有图像标注、 文本标注、序列标注.

图像标注主要是对医学影像数据中的区域进行标记,如标注病 变区域.

文本标注主要是对文本数据进行标记,如标注病历中的诊断信息、治疗方案.

序列标注主要是对序列数据进行标注,如标注时间序列中的重要事件.

4伦理与合规要求 4.1伦理管理 4.1.1伦理委员会 伦理委员会应作为独立的监督机构,确保医疗大模型的开发和应用符合伦理规范 和法律要求,不受开发团队和管理层影响.

伦理委员会应在数据收集、处理和使用过 程中提供决策和伦理指导,确保项目的伦理合规性.

伦理委员会职能如下: (1)伦理审查:对医疗大模型项目的各个阶段进行伦理审查,确保其在数据隐私 保护、知情同意、数据使用等方面符合法律法规和伦理要求.

(2)风险评估:评估医疗大模型可能带来的伦理和社会风险,并提出相应的风险 控制措施.

(3)监督执行:对医疗大模型开发和应用的执行过程进行监督,确保各项伦理规 范和法律法规得以落实.

(4)教育与培训:向开发团队和相关人员提供伦理教育和培训,提高其伦理意识 和合规能力.

4.1.2伦理评估 (1)项目申请:开发团队在启动项目前应提交伦理评估申请,包括项目目的、数 据处理方案、隐私保护措施等详细信息.

(2)初步审查:伦理委员会对申请材料进行初步审查,评估项目的伦理风险和合 规性.

(3)详细审查:如初步审查通过,进入详细审查阶段,伦理委员会进行全面评估, 包括深入讨论与项目审查会议.

(4)审批与:评估完成后,伦理委员会出具审核意见.

如项目通过审核,给 予伦理批复:若未通过,提供修改建议.

(5)项目监控:在项目实施过程中,伦理委员会定期检查其合规情况,确保项目 始终符合法律和伦理规范.

(6)变更申请:若项目计划发生重大变更,需立即提交伦理委员会进行重新评估 和审批.

(7)终审评估:项目结束后进行终审评估,总结项目的伦理执行情况,记录项目 经验和教训.

资源链接请先登录(扫码可直接登录、免注册)
①本文档内容版权归属内容提供方。如果您对本资料有版权申诉,请及时联系我方进行处理(联系方式详见页脚)。
②由于网络或浏览器兼容性等问题导致下载失败,请加客服微信处理(详见下载弹窗提示),感谢理解。
③本资料由其他用户上传,本站不保证质量、数量等令人满意,若存在资料虚假不完整,请及时联系客服投诉处理。

投稿会员:匿名用户
我的头像

您必须才能评论!

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)