规则与统计相结合的案件名称识别
【摘要】:在公安领域信息中,案件名称有着举足轻重的作用。因此,如何准确的识别出文本中的案件名称是一个非常重要的研究课题。在对公安领域文本进行了深入地分析和研究的基础上,总结出了案件名称的结构特征及其上下文信息,建立了用于识别案件名称的知识库。在知识库的基础上,首先对案件名称进行模板识别,然后进行结构分析和上下文分析, 并利用禁用词库对案件名称进行排歧,从而识别出候选案件名称。我们再使用统计方法对识别出的候选案件名称计算权值, 过滤权值比较低的实体,这样能大大提高系统的准确率。初步实验结果表明,在封闭测试中犯罪案件名称抽耿的精确率可以达到95.26%,召回率可达89.14%;在开放测试中精确率可以达到84.47%,召回率可达75.56%。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|