收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

结合属性分布特征的模式匹配算法

王宇  方滨兴  吴博  宋林海  郭岩  
【摘要】:本文提出了一种结合属性分布特征的Web模式匹配算法,属性分布特征包括属性对互斥特征和属性对共现特征。属性对互斥特征由属性对的互斥性和出现次数计算得出,这个特征隐含了属性对的语义相似程度。为了充分利用传统的属性名、属性值相似性特征,本文通过机器学习方法结合属性对互斥特征与相似性特征进行属性匹配。并以潜在的匹配属性对为基础,引入有约束的属性聚类方法进行Web模式匹配,聚类方法的约束条件来自属性对共现特征。实验结果表明,相对于仅使用相似性特征的方法,结合属性分布特征的Web模式匹配算法取得了更好的结果,解决了单独使用属性名相似性能处理的属性较少,而属性值相似性需要针对特定领域优化的问题。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 丁春荣;杨宝华;;基于SOFM网络的改进K-均值聚类算法[J];科技导报;2009年10期
2 郭建军;梁敬东;牛又奇;;约束聚类算法研究[J];南京师范大学学报(工程技术版);2008年04期
3 许剑峰,林嘉宜,黎绍发;一种基于中心对称性的聚类算法[J];计算机工程与设计;2003年05期
4 李存华,孙志挥,陈耿,胡云;核密度估计及其在聚类算法构造中的应用[J];计算机研究与发展;2004年10期
5 张彩虹,王春才,颜雁;医保决策支持系统中的聚类算法[J];长春理工大学学报;2004年04期
6 周如旗;个性化数据聚类的属性坐标分析法[J];电脑与信息技术;2005年03期
7 潘磊,吴小俊,尤媛媛;基于聚类的视频镜头分割和关键帧提取[J];红外与激光工程;2005年03期
8 张永梅,韩焱,张建华;一种有效聚类算法的研究和实现[J];计算机应用;2005年07期
9 严馨,周丽华,陈克平,徐广义;一种改进的带障碍的基于密度和网格的聚类算法[J];计算机应用;2005年08期
10 吕昱;程代杰;;基于SOM的市场细分研究[J];计算机科学;2005年12期
11 李向伟;仇德成;;数据挖掘技术在Web中的应用研究[J];电脑知识与技术(学术交流);2006年02期
12 刘大任;孙焕良;牛志成;朱叶丽;;一种新的基于密度的聚类与孤立点检测算法[J];沈阳建筑大学学报(自然科学版);2006年01期
13 谷淑化;吕维先;;基于消息传递的并行聚类算法[J];现代计算机;2006年01期
14 刘蓉;;基于多维立方体的聚类算子模型及其应用[J];长沙理工大学学报(自然科学版);2006年01期
15 陈荣元;蒋加伏;;基于聚类算法和层次支持向量机的人脸识别方法[J];计算技术与自动化;2006年01期
16 周宇;覃征;;聚类分析中特征选择的研究[J];计算机应用研究;2006年05期
17 黄少年;赵跃龙;邱建雄;;一种基于镜头的视频场景检测方法[J];计算机工程与应用;2006年19期
18 周晓云;孙志挥;张柏礼;;一种大规模高维数据集的高效聚类算法[J];应用科学学报;2006年04期
19 刘建晔;李芳;;一种基于密度的高性能增量聚类算法[J];计算机工程;2006年21期
20 吕宗磊;王建东;;一种基于多维空间超球体的快速聚类算法[J];南京航空航天大学学报;2006年06期
中国重要会议论文全文数据库 前10条
1 王宇;方滨兴;吴博;宋林海;郭岩;;结合属性分布特征的模式匹配算法[A];第五届全国信息检索学术会议论文集[C];2009年
2 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
4 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
5 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
6 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
7 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 逯波;王国仁;;一种有效的半监督视频镜头聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 刘强;林世平;;基于蚁群聚类算法的中文本体学习[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 余琳;邓玲;;常见聚类算法的比较以及DSS系统中的应用[A];湖北省通信学会、武汉通信学会2009年学术年会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
2 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
3 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
4 潘鸿飞;形状特征描述及聚类算法研究[D];安徽大学;2011年
5 李强;动点聚类算法及其量子化研究[D];浙江大学;2009年
6 余卫宇;几种图像结构语义模型和图像[D];华南理工大学;2005年
7 胡建军;中药药理知识发现系统中关键技术的研究[D];四川大学;2006年
8 郑永斌;物体检测技术和半定规划松弛的聚类算法研究[D];国防科学技术大学;2011年
9 董红斌;基于混合策略的协同演化算法研究[D];北京交通大学;2006年
10 钮建伟;面向适配设计的三维人体数据多分辨率描述与聚类分析[D];清华大学;2009年
中国硕士学位论文全文数据库 前10条
1 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
2 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
3 李长进;基于蚁群算法的混合聚类算法研究[D];中国石油大学;2010年
4 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
5 刘赏;结合密度思想的蚂蚁聚类算法[D];河北工业大学;2003年
6 刘方;数据挖掘中半监督K-均值聚类算法的研究与改进[D];吉林大学;2010年
7 杜晨阳;分布式聚类算法研究与应用[D];浙江大学;2011年
8 徐丽娜;数据流中基于区间划分的高维聚类算法研究[D];燕山大学;2010年
9 邹颖;聚类算法在图书馆馆际互借系统中的应用[D];大连理工大学;2010年
10 庄怡雯;基于聚类算法的Web日志挖掘应用研究[D];东华大学;2011年
中国重要报纸全文数据库 前2条
1 苏选良;业务逻辑应与软件逻辑相统一[N];中国计算机报;2007年
2 ;视频数据中挖“宝”[N];计算机世界;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978