Web表格信息抽取技术的研究
【摘要】:互联网上有大量信息采用 HTML 表格表示,由于 HTML 不描述数据的内容,机器不能理解和查询。论文利用 HTML 表格属性,定位表格,提取出识别真假表格的特征信息,结合应用本体形成启发式规则,在此基础上对表格结构识别进行了分析,最后实现基于应用本体对表格数据进行抽取。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||
|
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||
|