基于模型驱动的表格识别
【摘要】:表格数据现在已经越来越普遍,表格数据的处理已经严重限制了表格信息数字化的速度,表格信息数字化的自动处理越来越成为一个关注的问题。在图像预处理过程中,首先用迭代法对对象进行二值化,为了简化特征线提取,对表格线就行了细化。表格线提取采用了hough变换,有效地避免了斜线和文字对识别过程的干扰,然后根据表格线提取出了所有单元格。最后提出了一个基于单元格之间几何信息的逻辑规则,通过该规则提取出嵌套表格,并用定义好的描述模板将表格信息描述出来。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|