基于网页中深度并列结构的实例提取算法
【摘要】:本文发现了网页文件中一种普遍存在的描述性结构—深度并列结构,并使用它来进行概念实例提取。首先提取网页文件中的深度并列结构,用种子实例对其进行过滤和提取候选实例;在候选实例评价阶段,构造种子、网页文件、并列结构和候选实例之间的关系图,并使用PageRank算法评价候选实例。在提取的8个概念中平均准确率达到98.25%,平均召回率达到77.26%。比R.C.Wang的提取结果有较为明显的提升。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|