中文病历文本中的时间表达分类与识别
【摘要】:时间表达式识别是时序语义标注的关键技术之一,其结果的好坏直接影响时间信息后续利用的效果。国外相关领域研究成果不能直接应用于中文,国内此领域的研究大多针对新闻语料,无法满足医学领域的时间表示识别要求,因此专门针对医学病历语料的时间表达识别研究是进行中文病历文本中时间信息利用的必经阶段。本文对涵盖30多个科室的147份实际病历中的时间表达进行统计并分类,进而分析中文病历中时间信息表达的特点。根据分析结果,本文提供了针对中文病历中时间信息的识别方法,实验表明本文采用的正则匹配方法以及相邻原则匹配复合时间的方法能基本覆盖时间表达信息,以上工作对后续中文病历中时间信息的利用工作具有重要意义和参考价值。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|