期刊文章详细信息
基于CRF与RUTA规则相结合的卒中入院记录医学实体识别及应用
Medical Name Entity Recognition and Application in Chinese Admission Record of Stroke Patients Based on CRF and RUTA rule
文献类型:期刊文章
XU Yuan;GE Yan-Qiu;WANG Qiang;XIONG Gang;YI Ying-Ping(Clinical Big Data Research Center, The Second Affiliated Hospital, Nanehang University, Nanchang 330006, China;Depai'tment of Public Health, School of Medicine, Nanchang University, Nanchang 330006, China;HBT Medical Information Company, Suzhou 215000, China;Department of Science and Education, The Second Affiliated Hospital of Nanchang University, Nanchang 330006, China)
机构地区:[1]南昌大学附属第二医院临床医疗大数据研究中心,江西南昌330006 [2]南昌大学医学部公共卫生学院,江西南昌330006 [3]赫博特医疗信息科技有限公司,江苏苏州215000 [4]南昌大学第二附属医院科教处,江西南昌330006
基 金:江西省科技厅科技创新平台(20171BCD40024);江西省科技厅一般项目(20171BBH80025)
年 份:2018
卷 号:39
期 号:3
起止页码:455-462
语 种:中文
收录情况:BDHX、BDHX2017、CAS、CSA、CSCD、CSCD2017_2018、JST、RCCSE、ZGKJHX、核心刊
摘 要:【目的】研究针对非结构化临床电子病历的自然语言处理模型的构建和优化,并利用该模型对江西省医疗大数据平台中卒中病人的病历进行结构化数据提取。【方法】从江西省医疗大数据平台中随机筛选500份2011-2016年的卒中病人入院记录,根据临床科研的实际需求构建了脑卒中专科病人的命名实体标注体系和命名实体标注语料库,利用该语料库构建基于CRF以及RUTA规则的命名实体抽取模型,并通过调整RUTA规则以及参数提升识别准确率。【结果】经五折交叉验证,该模型的医学命名实体的抽取准确率0.960,召回率0.916,Fscore 0.939,利用该抽取模型对大数据平台中10 295份脑卒中患者入院记录进行抽取,共抽取命名实体264 580条,命名实体修饰1 161 077条。【结论】构建的自然语言抽取模型识别准确率较高,通过该模型能够准确地从大量非结构化病历中获取病人的既往史、生活史、临床表现等有价值的科研数据,有效提升心脑血管疾病的临床科研效率和科研水平。
关 键 词:中文电子病历 命名实体识别 条件随机场CRF 脑卒中
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...