收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于LDA的潜在语义区划分及Web文档聚类算法

刘振鹿  王大玲  冯时  张一飞  方东昊  
【摘要】:本文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义互作用机制对聚类结果进行修正。与相关工作比较,本文不仅应用LDA模型表示文档,而且进行了深入的语义分布区域划分,并将分析结果应用于Web文档聚类。实验表明,本文提出的基于LDA的文档类别与语义互作用聚类算法获得了更好的聚类结果。

知网文化
【相似文献】
中国重要会议论文全文数据库 前10条
1 刘振鹿;王大玲;冯时;张一飞;方东昊;;一种基于LDA的潜在语义区划分及Web文档聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
2 刁宇峰;林鸿飞;;基于LDA模型的博客垃圾评论发现[A];第六届全国信息检索学术会议论文集[C];2010年
3 翁伟;王厚峰;;基于LDA的关键词抽取方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 董婧灵;李芳;何婷婷;涂新辉;万剑;;基于LDA模型的文本聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 谢华;刘建华;田于逵;;湍流积分长度的HWA与LDA联合测试分析方法研究[A];第十三届船舶水下噪声学术讨论会论文集[C];2011年
6 张明慧;王红玲;周国栋;;LDA主题驱动的中文多文档自动文摘方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 王秀娟;郑康锋;杨星海;;线性鉴别分析在中文文本分类中的应用[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
8 邱慧宁;黄剑;陈羽;赖剑煌;;基于UDP的半监督学习及其在人脸识别的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年
9 盛俊;王明文;余俊英;;一种基于潜在语义的Markov网络信息检索模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
10 陆寒冰;刘春江;刘辉;袁希钢;;立交盘静态混合器的流场研究[A];第三届全国化学工程与生物化工年会论文摘要集(上)[C];2006年
中国博士学位论文全文数据库 前10条
1 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
2 李博;基于LDA和LSA的医学文本和影像分析模型及应用研究[D];吉林大学;2012年
3 谷芳;规整填料局部流动与传质的计算流体力学研究[D];天津大学;2004年
4 武志超;LDA抽运高频Nd:YAG陶瓷激光器研究[D];长春理工大学;2010年
5 姜嘉言;用于人脸识别的产生式模型和判别式模型中若干问题的研究[D];复旦大学;2009年
6 曾璞;面向语义提取的图像分类关键技术研究[D];国防科学技术大学;2009年
7 江悦;场景图像内容表述和分类研究[D];国防科学技术大学;2010年
8 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年
9 张春梅;SK型静态混合器流动特性研究[D];天津大学;2009年
10 付志新;奶牛真胃左方变位的病因与临床病理学研究[D];扬州大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘振鹿;基于LDA的潜在语义空间分析及Web文档聚类的研究与实现[D];东北大学;2010年
2 方东昊;基于LDA的微博短文本分类技术的研究与实现[D];东北大学;2011年
3 刘静;基于CORBA/IIOP的MIME邮件过滤器的研究与设计[D];华北电力大学(河北);2004年
4 曾雪强;潜在语义分类模型的研究[D];江西师范大学;2005年
5 熊超;基于潜在语义对偶空间的跨语言文本分类研究[D];江西师范大学;2010年
6 黄波;基于向量空间模型和LDA模型相结合的微博客话题发现算法研究[D];西南交通大学;2012年
7 董婧灵;基于LDA模型的文本聚类研究[D];华中师范大学;2012年
8 补嘉;基于LDA的社交网络链接预测模型研究[D];西南大学;2012年
9 刘泽奇;基于BoW模型与稀疏表示的乳腺肿块良恶性分类算法研究[D];西安电子科技大学;2012年
10 李春晓;基于LDA的人脸识别[D];西安电子科技大学;2011年
中国重要报纸全文数据库 前2条
1 王鹏;求职小技巧[N];中国人事报;2000年
2 驻几内亚比绍使馆经商处;几内亚比绍建材市场蕴商机[N];国际商报;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978