文章摘要
王国睿,张亚飞,尚有为,刘格良,王思源,贺培凤,于琦.基于LDA主题模型的电子病历热点主题发现[J].中华医学图书情报杂志,2021,30(2):33-39.
基于LDA主题模型的电子病历热点主题发现
LDA topic model-based discovery of hotspot topics in electronic medical records
投稿时间:2020-11-09  
DOI:10.3969/j.issn.1671-3982.2021.02.006
中文关键词: LDA主题模型  热点识别  电子病历  主题研究
英文关键词: LDA topic model  Hotspot identification  Electronic medical records  Study on topics
基金项目:山西省重点研发计划(社发领域)重点项目“山西省健康医疗大数据智能平台关键技术研究”(201903D311011);山西省高等学校人文社会科学重点研究基地项目“健康医疗大数据与医学政策信息系统”(20190117);山西省研究生教育创新项目“卫生信息管理在突发公共卫生事件中的应用”(2020SY242)
作者单位
王国睿 1.山西医科大学管理学院山西 太原 030001 
张亚飞 2.山西医科大学人文社会科学学院山西 太原 030001 
尚有为 1.山西医科大学管理学院山西 太原 030001 
刘格良 1.山西医科大学管理学院山西 太原 030001 
王思源 1.山西医科大学管理学院山西 太原 030001 
贺培凤 1.山西医科大学管理学院山西 太原 0300012.山西医科大学人文社会科学学院山西 太原 030001 
于琦 1.山西医科大学管理学院山西 太原 030001 
摘要点击次数: 63
全文下载次数: 25
中文摘要:
      目的:探究2010-2019年国际上电子病历研究领域的热点。方法:以2010-2019年Web of Science 中有关电子病历研究的12 217篇文献作为研究对象,以作者关键词、扩展关键词和摘要为文档语料,通过各主题的困惑度确定最佳主题个数,采用LDA主题模型实现主题聚类。通过主题强度和阈值确定电子病历研究领域2010-2019年来的研究热点,通过后离散时间窗口的方式对主题演化趋势进行了分析。结果:基于LDA主题模型研究发现2010-2019年电子病历的研究主题有20个,“药物不良反应的发现”“用药调整”“药物研发”“患者死亡预测”“患病风险研究”“电子病历的文本挖掘”“患者二次入院研究”等7个主题为2010-2019年来的热门研究主题。结论:在不同时间窗口下对各个主题的强度进行计算发现,热度上升的主题为“药物不良反应的发现”,“药物研发”主题热度呈下降趋势,其他主题热度变化幅度小,个别年份有波动。
英文摘要:
      Objective To study the hotspots in international studies on electronic medical records (EMR) in recent 10 years. Methods The optimal number of topics was identified according to the perplexity of topics and the topics were clustered according to the LDA topic model with the Web of Science-covered 12 217 papers on EMR in 2010-2019 as the study object, and the key words provided by authors, expanded key words and abstracts as the language corpus. The hotspots in studies on EMR in recent 10 years were detected according to the topic strength and threshold value, and the topic evolution trend was analyzed according to the post-discrete window. Results The LDA topic model-based studies on discovery of hotspot topics in EMR showed that there were 20 topics on EMR in 2010-2019 and that discovery of adverse drug reactions, adjustment of medications, R & D of drugs, death prediction of patients, studies on risk of diseases, text mining of EMR, studies on readmission of patients were the hotspots in recent 10 years. Conclusion Calculation of the strength in different topics on EMR under the different time windows showed that the topic with increased hotspots is the discovery of adverse drug reactions while the topic with decreased hotspots is the R & D of drugs. The changing amplitude of hot spots is small in other topics with fluctuation in a certain year.
HTML    查看全文   查看/发表评论  下载PDF阅读器
手机扫一扫看