收藏本站
《第六届全国信息检索学术会议论文集》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

标签特征和正文特征融合的SVM博客文本分类算法研究

刘秉权  李博  孙林  王宝勋  刘远超  
【摘要】:博客飞速发展,博客文本检索和分类的研究价值日渐凸显。博客文本的内容、风格缺乏规范性,为自动文本分类带来难度。博客作者通常为文章指定一个或多个标签,标签在很大程度上概括了文章涉及的内容,对博客文本分类有重要的作用。本文根据博客文本标签这一特点,提出了两种标签信息和正文信息融合的博客文本分类算法。实验结果表明,标签信息能够有效提高博客文本分类的性能。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 霍东云;聂峰光;郭力;;利用Medline文摘数据库研究文本分类[J];计算机与应用化学;2007年09期
2 崔爱国;;文本分类中特征提取方法的比较与研究[J];电脑知识与技术;2009年20期
3 张美虎;张建明;;基于粗糙集和遗传算法的文本分类研究[J];微计算机信息;2009年33期
4 张春红;谢卫;;基于SVM-KNN算法的特色数据库分类体系初探[J];情报科学;2009年11期
5 刘秀松;;带有云化核函数的SVM文本分类方法[J];科技情报开发与经济;2007年30期
6 陈莲娜;姚伏天;;用于文本分类的多核SVM算法研究[J];计算机工程;2007年09期
7 郑伟;王锐;;文本分类中特征提取方法的比较与研究[J];河北北方学院学报(自然科学版);2007年06期
8 王清翔;仲婷;潘金贵;;基于SVM的日文网页分类[J];广西师范大学学报(自然科学版);2007年02期
9 孙登林;李生红;荆涛;刘功申;;一种针对不良主题的文本过滤方法[J];信息安全与通信保密;2008年02期
10 刘晓;莫倩;张政;;网络评论观点分类研究[J];北京工商大学学报(自然科学版);2008年03期
11 何蔓微;袁锐;刘建胜;王贵新;;垃圾短信的智能识别和实时处理[J];电信科学;2008年08期
12 许增福,梁静国,田晓宇;基于FVSM和自组织映射网络的Web文本自动分类方法[J];哈尔滨工业大学学报;2004年09期
13 郑海,林鸿飞;基于段落匹配的文本分类机制[J];计算机工程与应用;2004年28期
14 王丁,运海红,张辉;文本自动分类系统的研究与实现[J];信息技术;2005年03期
15 杜志文;曾文华;;网格计算在文本分类中的应用[J];微电子学与计算机;2006年S1期
16 崔彩霞;王素格;;基于粗集的支持向量机文本分类方法研究[J];科技广场;2006年08期
17 马忠宝;刘冠蓉;;基于支持向量机的中文文本分类模型研究[J];计算机技术与发展;2006年11期
18 张燕;寒枫;楚红涛;;文本挖掘简述[J];中国电力教育;2006年S3期
19 祝晓鲁;白振兴;贾海燕;;自动文本分类技术研究[J];现代电子技术;2007年03期
20 张桂芸;刘洋;王元元;;基于模糊认知图的文本分类推理算法[J];计算机工程与应用;2007年12期
中国重要会议论文全文数据库 前10条
1 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 刘秉权;李博;孙林;王宝勋;刘远超;;标签特征和正文特征融合的SVM博客文本分类算法研究[A];第六届全国信息检索学术会议论文集[C];2010年
3 宋鑫颖;周志逵;;一种基于SVM的主动学习文本分类方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 ;A Tool Wear Predictive Model Based on SVM[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
5 ;A CDMA Signal Receiver Based on LS-SVM[A];第二十六届中国控制会议论文集[C];2007年
6 司爱威;冯辅周;江鹏程;饶国强;王建;;基于可变风险SVM模型的故障识别方法研究[A];第十届全国振动理论及应用学术会议论文集(2011)上册[C];2011年
7 王红伟;董慧;;一种提高SVM分类精度的调制信号识别方法[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
8 ;Improved Particle Swarm Optimized SVM for Short-term Traffic Flow Predication[A];第二十六届中国控制会议论文集[C];2007年
9 邵杰;叶宁;容亦夏;;基于SVM的多波束测深数据滤波[A];第二十九届中国控制会议论文集[C];2010年
10 于湘涛;周峰;张兰;魏超;;基于SVM和田口方法的石英挠性加速度计健壮性设计[A];质量——持续发展的源动力:中国质量学术与创新论坛论文集(下)[C];2010年
中国博士学位论文全文数据库 前10条
1 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
2 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
3 申丰山;样例权重估计及在此基础上的SVM[D];西安电子科技大学;2011年
4 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
5 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
6 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
7 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
8 张婧;基于SVM的肺结节自动识别方法研究[D];华南理工大学;2011年
9 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
10 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 段江丽;基于SVM的文本分类系统中特征选择与权重计算算法的研究[D];太原理工大学;2011年
2 姜鹤;SVM文本分类中基于法向量的特征选择算法研究[D];上海交通大学;2010年
3 陈伟萍;基于语义概念的中文文本分类研究[D];燕山大学;2006年
4 曹勇;中文Web文本分类技术研究[D];厦门大学;2007年
5 宋志理;基于LDA模型的文本分类研究[D];西安理工大学;2010年
6 张彪;文本分类中特征选择算法的分析与研究[D];中国科学技术大学;2010年
7 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
8 蒋健;文本分类中特征提取和特征加权方法研究[D];重庆大学;2010年
9 闫晨;KNN文本分类研究[D];燕山大学;2010年
10 苏小康;基于维基百科构建语义知识库及其在文本分类领域的应用研究[D];华中师范大学;2010年
中国重要报纸全文数据库 前10条
1 郭涛;利用SVM虚拟化技术实现容灾[N];中国计算机报;2008年
2 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
3 高利华;传承陆游风骨 推进国际交流[N];人民日报海外版;2005年
4 本报记者 韩露;乱军之中智者胜[N];证券时报;2000年
5 林木树;反垃圾邮件有待新突破[N];人民邮电;2004年
6 ;基于网络层的存储虚拟化是主流[N];中国计算机报;2008年
7 希安;微软试水信息检索[N];经济日报;2004年
8 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
9 本报记者 郭平;LSI发布新存储虚拟化管理器[N];计算机世界;2008年
10 应晓敏 窦文华;技术架构[N];计算机世界;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978