收藏本站
《第六届全国信息检索学术会议论文集》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

标签特征和正文特征融合的SVM博客文本分类算法研究

刘秉权  李博  孙林  王宝勋  刘远超  
【摘要】:博客飞速发展,博客文本检索和分类的研究价值日渐凸显。博客文本的内容、风格缺乏规范性,为自动文本分类带来难度。博客作者通常为文章指定一个或多个标签,标签在很大程度上概括了文章涉及的内容,对博客文本分类有重要的作用。本文根据博客文本标签这一特点,提出了两种标签信息和正文信息融合的博客文本分类算法。实验结果表明,标签信息能够有效提高博客文本分类的性能。

【参考文献】
中国期刊全文数据库 前1条
1 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
【共引文献】
中国期刊全文数据库 前10条
1 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
2 代劲;胡峰;王国胤;;基于不完备信息系统的文本分类研究与应用[J];重庆邮电学院学报(自然科学版);2006年03期
3 李粤;安捷;李星;;排序融合算法在校园网搜索引擎中的应用[J];大连理工大学学报;2005年S1期
4 谷峰;吴扬扬;;文本分类关键技术[J];福建电脑;2006年09期
5 贺卫红;曹毅;;基于向量空间模型文本过滤算法[J];系统工程;2005年10期
6 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期
7 谢科;张辉;陈鹏;庞斌;;文本分类系统关键技术[J];广西师范大学学报(自然科学版);2007年02期
8 朱培毅,黄敏;基于Boosting算法的文本自动分类器模型设计[J];高校图书馆工作;2004年05期
9 何峰;;一种基于粗糙集理论的文本分类方法[J];自动化与信息工程;2006年03期
10 吴志峰,田学东;人名、机构名在基于概念的文本分类中的应用研究[J];河北大学学报(自然科学版);2004年06期
中国重要会议论文全文数据库 前10条
1 Zhao Shuanzhu Chen Junjie Guo Xin College of Computer and Software Taiyuan University of Technology,Taiyuan,Shanxi,Chnia,030024;Research on the Frame Structure and Its Implement of a Special Field-based Content Information Mining System on Web[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 8)[C];2005年
2 张娟;王慧锋;;文本分类技术在海量金融信息处理中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年
3 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
4 王秀娟;郭军;郑康锋;;基于互信息可信度的特征选择方法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
5 王丹;蔡红柳;王斌;;基于混沌序列的数字水印算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
6 石艳荣;孙丹宁;贺永强;;一种基于内容的邮件过滤模型的研究与性能分析[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
7 陈庆轩;郑德权;赵铁军;;多分类器融合的文本分类技术研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
8 程新荣;杨仁刚;;网页自动分类在搜索引擎上的应用研究[A];2007'中国仪器仪表与测控技术交流大会论文集(二)[C];2007年
9 王秀娟;郑康锋;杨星海;;线性鉴别分析在中文文本分类中的应用[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
10 薛春香;夏祖奇;侯汉清;;基于语料和基于标引经验的自动分类模式比较[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 杨震;个性化信息获取方法的研究[D];大连理工大学;2004年
2 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
3 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
4 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
5 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
6 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
7 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年
8 王永恒;海量短语信息挖掘技术的研究与实现[D];国防科学技术大学;2006年
9 李鑫;问题回答系统中的问题分类研究[D];复旦大学;2007年
10 贺文锐;面向网络协同制造的资源优化配置技术研究[D];西北工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 杨盛;电子邮件过滤系统的研究与设计[D];中南大学;2005年
2 邱宇红;向量空间模型在医学文献相关性研究中的应用[D];中国医科大学;2006年
3 马安香;基于分类语义的Web信息抽取机制的研究与实现[D];东北大学;2005年
4 周钦强;基于人工智能技术Naive Bayes文本自动分类系统研究[D];广东工业大学;2005年
5 胡卓颖;专题型网页搜集器关键算法的研究及实现[D];江西师范大学;2005年
6 廖海波;基于投影寻踪回归的文本分类研究[D];江西师范大学;2005年
7 付雪峰;基于模糊—粗糙集的文本分类模型[D];江西师范大学;2005年
8 李威;基于向量空间的文本自动分类系统的研究和实现[D];兰州理工大学;2005年
9 陈乐;基于智能文本分类技术的素材管理软件的设计与开发[D];南京师范大学;2003年
10 王家锋;分布式智能搜索引擎技术[D];北京工业大学;2003年
【相似文献】
中国期刊全文数据库 前10条
1 霍东云;聂峰光;郭力;;利用Medline文摘数据库研究文本分类[J];计算机与应用化学;2007年09期
2 崔爱国;;文本分类中特征提取方法的比较与研究[J];电脑知识与技术;2009年20期
3 张美虎;张建明;;基于粗糙集和遗传算法的文本分类研究[J];微计算机信息;2009年33期
4 张春红;谢卫;;基于SVM-KNN算法的特色数据库分类体系初探[J];情报科学;2009年11期
5 刘秀松;;带有云化核函数的SVM文本分类方法[J];科技情报开发与经济;2007年30期
6 陈莲娜;姚伏天;;用于文本分类的多核SVM算法研究[J];计算机工程;2007年09期
7 郑伟;王锐;;文本分类中特征提取方法的比较与研究[J];河北北方学院学报(自然科学版);2007年06期
8 王清翔;仲婷;潘金贵;;基于SVM的日文网页分类[J];广西师范大学学报(自然科学版);2007年02期
9 孙登林;李生红;荆涛;刘功申;;一种针对不良主题的文本过滤方法[J];信息安全与通信保密;2008年02期
10 刘晓;莫倩;张政;;网络评论观点分类研究[J];北京工商大学学报(自然科学版);2008年03期
中国重要会议论文全文数据库 前10条
1 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 刘秉权;李博;孙林;王宝勋;刘远超;;标签特征和正文特征融合的SVM博客文本分类算法研究[A];第六届全国信息检索学术会议论文集[C];2010年
3 宋鑫颖;周志逵;;一种基于SVM的主动学习文本分类方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 ;A Tool Wear Predictive Model Based on SVM[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
5 ;A CDMA Signal Receiver Based on LS-SVM[A];第二十六届中国控制会议论文集[C];2007年
6 司爱威;冯辅周;江鹏程;饶国强;王建;;基于可变风险SVM模型的故障识别方法研究[A];第十届全国振动理论及应用学术会议论文集(2011)上册[C];2011年
7 王红伟;董慧;;一种提高SVM分类精度的调制信号识别方法[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
8 ;Improved Particle Swarm Optimized SVM for Short-term Traffic Flow Predication[A];第二十六届中国控制会议论文集[C];2007年
9 邵杰;叶宁;容亦夏;;基于SVM的多波束测深数据滤波[A];第二十九届中国控制会议论文集[C];2010年
10 于湘涛;周峰;张兰;魏超;;基于SVM和田口方法的石英挠性加速度计健壮性设计[A];质量——持续发展的源动力:中国质量学术与创新论坛论文集(下)[C];2010年
中国重要报纸全文数据库 前10条
1 郭涛;利用SVM虚拟化技术实现容灾[N];中国计算机报;2008年
2 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
3 高利华;传承陆游风骨 推进国际交流[N];人民日报海外版;2005年
4 本报记者 韩露;乱军之中智者胜[N];证券时报;2000年
5 林木树;反垃圾邮件有待新突破[N];人民邮电;2004年
6 ;基于网络层的存储虚拟化是主流[N];中国计算机报;2008年
7 希安;微软试水信息检索[N];经济日报;2004年
8 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
9 本报记者 郭平;LSI发布新存储虚拟化管理器[N];计算机世界;2008年
10 应晓敏 窦文华;技术架构[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
2 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
3 申丰山;样例权重估计及在此基础上的SVM[D];西安电子科技大学;2011年
4 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
5 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
6 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
7 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
8 张婧;基于SVM的肺结节自动识别方法研究[D];华南理工大学;2011年
9 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
10 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 段江丽;基于SVM的文本分类系统中特征选择与权重计算算法的研究[D];太原理工大学;2011年
2 姜鹤;SVM文本分类中基于法向量的特征选择算法研究[D];上海交通大学;2010年
3 陈伟萍;基于语义概念的中文文本分类研究[D];燕山大学;2006年
4 曹勇;中文Web文本分类技术研究[D];厦门大学;2007年
5 宋志理;基于LDA模型的文本分类研究[D];西安理工大学;2010年
6 张彪;文本分类中特征选择算法的分析与研究[D];中国科学技术大学;2010年
7 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
8 蒋健;文本分类中特征提取和特征加权方法研究[D];重庆大学;2010年
9 闫晨;KNN文本分类研究[D];燕山大学;2010年
10 苏小康;基于维基百科构建语义知识库及其在文本分类领域的应用研究[D];华中师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026