T/CIATCM 098-2023 中医药文本数据命名实体信息分类与代码.pdf

098,2023,CIATCM,pdf,中医药,团体标准
文档页数:10
文档大小:758.16KB
文档格式:pdf
文档分类:团体标准
上传会员:
上传日期:
最后更新:

ICS 35.240.80 团 体 标 准 T/C1ATCM098-2023 中医药文本数据命名实体信息分类与代码 Named entity information classification and codes of Traditional Chinese Medicine text data 2023-07-15发布 2023-08-01实施 中国中医药信息学会 发布
T/CIATCM 098-2023 目次 前言. I 1范围 2规范性引用文件 3术语和定义 4分类方法和编码原则. 4.1分类方法. 4.2编码规则 2 5中医药文本数据命名实体信息分类与代码 2 5.1表型实体. 3 5.2治疗实体. 5.3基础实体. 4 5.4辅助实体. 6 5.5风险因素 6 5.6操作方法 6 5.7其他实体.
T/CIATCM 前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的机构和起草规则》的规定起 草.

请注意本文件的某些内容可能涉及专利.

本文件的发布机构不承担识别专利的责任.

本文件由中国中医药信息学会提出并归口.

本文件起草单位:北京交通大学、中国中医科学院中医药数据中心、湖北中医药大学、中国中医科 学院广安门医院、湖北省中医院、河南中医药大学、天士力医药集团股份有限公司.

本文件主要起草人:周雪忠、刘保延、常凯、郵灯莹、夏佳楠、杨扩、肖勇、舒梓心、张润顺、周 霞继、田昊宇、李晓东、周亚娜、余海滨、王文佳、魏宇、孙海龙.

T/CIATCM 098-2023 中医药文本数据命名实体信息分类与代码 1范围 本文件规定了中医药临床病历、古籍、文献等文本数据命名实体的信息分类与代码.

本文件适用于中医医疗、科研、教学、信息化建设等领域数据处理、交换与共享.

2规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款.

其中,注明日期的引 用文件,仅该日期对应的版本适用于本文件:未注明日期的引用文件,其最新版本(包括的修 改单)适用于本文件.

GB/T20000.1-2014标准化工作指南第1部分:标准化和相关活动的通用术语 GB/T20348-2006中医基础理论术语 GB/T40665.3-2021中医四诊操作规范第3部分:间诊 T/CIATCM020-2019中医临床基本症状信息分类与代码 T/CIATCM058-2019中医药信息标准编制通则 3术语和定义 GB/T20000.1、T/CIATCM020-2019界定的以及下列术语和定义适用于本文件.

3. 1 命名实体namedentity 非结构化文本中主要以短语等形式表达的具有特定意义的信息元素(如城市名称、机构名称和 人名等),适用于文本挖掘、信息抽取、自动问答等自然语言处理领域.

3. 2 信息分类information classification 信息分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立 起一定的分类体系和排列顺序.

[来源:T/CIATCM 020-2019 3.1.8] 3. 3 信息编码information coding 信息编码是将事物或概念(编码对象)赋予具有一定规律、易于计算机和人识别处理的符号, 形成代码元素集合.

[来源:T/CIATCM020-2019 3.1.9] 4分类方法和编码原则 4.1分类方法
T/CIATCM 本文件中医药文本数据命名实体分类采用线分类法.

线分类法是将分类对象(即被划分的事物 或概念)按照选定的若干个属性或特征逐次地分成相应的若干个层级的类目,并排列成一个有层次 的,逐渐展开的分类体系.

在这个分类体系中,被划分的类目称为上位类,划分出的下一级类目称 为下位类,由一个类目直接划分出来的下一级各类目,彼此称为同位类.

同位类之间存在着并列关 系,下位类与上位类类目之间存在着隶属关系.

4.2编码规则 本文件中医药文本数据命名实体分类采用字母和数字符号混合编码方式,代码结构如图1所示.

第三层子类目位 第二层类日位 第一层标识位 图1中医药文本数据命名实体分类代码结构图 标识位:以“ZE”作为中医药文本数据命名实体的标识,2位码长.

类目位:根据中医药文本数据命名实体不同类别,分为表型实体类、治疗实体类、基础实体类、 辅助实体类、风险因素类、操作方法类和其他实体类,共计7个类目,采用字母编码,1位码长.

子类目位:将中医药文本数据命名实体7个类目进行细分,形成不同类目下的子类目,采用数字 编码,2位码长,从“01”开始顺序编码.

5中医药文本数据命名实体信息分类与代码 中医药文本数据命名实体类目层次结构图及代码表分别如表1、图2所示.

表1中医药文本数据命名实体类目名称与代码表 类目名称 代码 表型实体 P 治疗实体 T 基确实体 B 辅助实体 A 风险因素 R 操作方法 0 其他实体

资源链接请先登录(扫码可直接登录、免注册)
①本文档内容版权归属内容提供方。如果您对本资料有版权申诉,请及时联系我方进行处理(联系方式详见页脚)。
②由于网络或浏览器兼容性等问题导致下载失败,请加客服微信处理(详见下载弹窗提示),感谢理解。
③本资料由其他用户上传,本站不保证质量、数量等令人满意,若存在资料虚假不完整,请及时联系客服投诉处理。

投稿会员:匿名用户
我的头像

您必须才能评论!

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)