收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于互信息可信度的特征选择方法

王秀娟  郭军  郑康锋  
【摘要】:在自动文本分类系统中,特征选择是有效降低文本向量维数的一种方法。本文在分析了常用的一些特征选择的评价函数的基础上,引入可信度的概念,提出了基于互信息可信度的特征选择方法。实验证明这一方法简单可行,有助于以提高所选特征子集的有效性。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张国梁;肖超锋;;基于SVM新闻文本分类的研究[J];电子技术;2011年08期
2 冯霞;刘志辉;田继存;;基于假设检验的文本分类特征选择[J];信息与控制;2011年03期
3 潘正高;侯传宇;谈成访;;基于命名实体的Web新闻文本分类方法[J];合肥工业大学学报(自然科学版);2011年08期
4 奉国和;郑伟;;文本分类特征降维研究综述[J];图书情报工作;2011年09期
5 孟佳娜;林鸿飞;李彦鹏;;基于特征贡献度的特征选择方法在文本分类中应用[J];大连理工大学学报;2011年04期
6 汪正中;张洪渊;;基于英文博客文本的情感分析研究[J];计算机技术与发展;2011年08期
7 霍亚格;黄广君;;基于最大熵的汉语短语结构识别方法[J];计算机工程;2011年16期
8 方志龙;;文本特征选择算法MI的改进[J];计算机与现代化;2011年07期
9 周国强;崔荣一;;基于朴素贝叶斯分类器的朝鲜语文本分类的研究[J];中文信息学报;2011年04期
10 高金勇;徐朝军;冯奕竸;;基于迭代的TFIDF在短文本分类中的应用[J];情报理论与实践;2011年06期
11 刘新生;厉锟;;基于BP神经网络的旅游突发事件文本分类系统的设计与实现[J];计算机与现代化;2011年07期
12 张春元;;基于条件随机场的文本分类模型[J];计算机技术与发展;2011年07期
13 赖英旭;许昕;杨震;;基于尾项加权的自适应文本分类方法研究[J];中国科学技术大学学报;2011年07期
14 胡泽文;王效岳;白如江;;国内外文本分类研究计量分析与综述[J];图书情报工作;2011年06期
15 陈叶旺;余金山;;一种改进的朴素贝叶斯文本分类方法[J];华侨大学学报(自然科学版);2011年04期
16 许明英;尉永清;赵静;;一种结合反馈信息的贝叶斯分类增量学习方法[J];计算机应用;2011年09期
17 吴谋硕;;基于遗传算法的文本分类技术[J];电脑知识与技术;2011年22期
18 夏火松;刘建;朱慧毅;;中文情感分类挖掘预处理关键技术比较研究[J];情报杂志;2011年09期
19 黎超;吴义国;魏星;;基于主成分分析的SMO文本分类[J];现代计算机(专业版);2011年10期
20 王玲;陈兵林;刘善军;姬长英;;基于图像特征选择识别田间籽棉品级[J];农业工程学报;2011年07期
中国重要会议论文全文数据库 前10条
1 王秀娟;郭军;郑康锋;;基于互信息可信度的特征选择方法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
2 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 伍建军;康耀红;;关于文本分类中特征降维方式的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
5 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年
6 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
7 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 王秀娟;郑康锋;杨星海;;线性鉴别分析在中文文本分类中的应用[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
10 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
2 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
3 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
4 刘华文;基于信息熵的特征选择算法研究[D];吉林大学;2010年
5 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
6 裴志利;数据挖掘技术在文本分类和生物信息学中的应用[D];吉林大学;2008年
7 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
8 韦娜;基于内容图像检索关键技术研究[D];西北大学;2006年
9 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
10 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
中国硕士学位论文全文数据库 前10条
1 王新丽;中文文本分类系统的研究与实现[D];天津大学;2007年
2 黄启虎;基于仿生模式识别的文本分类技术研究[D];哈尔滨工业大学;2008年
3 杨打生;特征选择的信息论算法研究[D];东南大学;2005年
4 董梅;文本内容的信息过滤技术研究[D];合肥工业大学;2006年
5 赵小华;KNN文本分类中特征词权重算法的研究[D];太原理工大学;2010年
6 孟杰;基于构造性覆盖算法的中文文本分类[D];安徽大学;2007年
7 马宏伟;基于SVM的中文文本分类系统的建模与实现[D];大连理工大学;2006年
8 王小燕;文本分类相关技术与应用研究[D];西北大学;2007年
9 陈超;基于支持向量机的中文文本分类的系统研究[D];武汉理工大学;2007年
10 张俊丽;文本分类中的关键技术研究[D];华中师范大学;2008年
中国重要报纸全文数据库 前2条
1 希安;微软试水信息检索[N];经济日报;2004年
2 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978