基于启发式规则的多媒体主题信息挖掘
【摘要】:随着Internet的发展,Web上信息呈爆炸式增长趋势,呈现方式也愈发多种多样,这就给多媒体内容的检索,信息提取等计算机处理带来了巨大困难。针对信息提取后,网页的多媒体内容的不一致性,该文提出了一种web网页多媒体信息提取的融合算法。该算法通过对图像和文本的语义的融合,判断通过信息提取后的网页中的各种形态的内容是否一致。对来自30个网站的307个网页进行测试后的实验表明,本文提出的方法是可行的。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|