收藏本站
《2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于互信息可信度的特征选择方法

王秀娟  郭军  郑康锋  
【摘要】:在自动文本分类系统中,特征选择是有效降低文本向量维数的一种方法。本文在分析了常用的一些特征选择的评价函数的基础上,引入可信度的概念,提出了基于互信息可信度的特征选择方法。实验证明这一方法简单可行,有助于以提高所选特征子集的有效性。

【参考文献】
中国期刊全文数据库 前1条
1 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
【共引文献】
中国期刊全文数据库 前10条
1 洪颖;;基于改进VSM算法的智能个性化信息检索系统研究[J];北京服装学院学报(自然科学版);2010年01期
2 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
3 何元娇;张国英;;基于本体语义的简单向量距离分类方法[J];北京石油化工学院学报;2007年03期
4 代劲;胡峰;王国胤;;基于不完备信息系统的文本分类研究与应用[J];重庆邮电学院学报(自然科学版);2006年03期
5 马建斌;李滢;滕桂法;王芳;赵洋;;KNN和SVM算法在中文文本自动分类技术上的比较研究[J];河北农业大学学报;2008年03期
6 王俊伟;吴纬;;基于支持向量机的装备维修保障专业优化[J];四川兵工学报;2010年09期
7 陈子昕;;基于SVM的文本分类系统设计与实现[J];东莞理工学院学报;2008年03期
8 李粤;安捷;李星;;排序融合算法在校园网搜索引擎中的应用[J];大连理工大学学报;2005年S1期
9 邵乐;于红;刘溪婧;綦孝姬;梁晓娜;;基于朴素贝叶斯的渔业文本分类器研究[J];大连水产学院学报;2010年01期
10 赵俊杰;盛剑锋;陶新民;;一种基于特征加权的KNN文本分类算法[J];电脑学习;2010年02期
中国重要会议论文全文数据库 前10条
1 ;Research on the Frame Structure and Its Implement of a Special Field-based Content Information Mining System on Web[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 8)[C];2005年
2 张娟;王慧锋;;文本分类技术在海量金融信息处理中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年
3 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
4 杜鲁燕;苗振江;;基于语言模型的中文文本分类系统[A];第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集[C];2009年
5 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
6 王丹;蔡红柳;王斌;;基于混沌序列的数字水印算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
7 石艳荣;孙丹宁;贺永强;;一种基于内容的邮件过滤模型的研究与性能分析[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
8 张璐;王景中;;基于HNC语境框架的文本相似度计算[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
9 陈庆轩;郑德权;赵铁军;;多分类器融合的文本分类技术研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
10 程新荣;杨仁刚;;网页自动分类在搜索引擎上的应用研究[A];2007'中国仪器仪表与测控技术交流大会论文集(二)[C];2007年
中国博士学位论文全文数据库 前10条
1 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
2 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
3 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
4 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
5 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
6 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
7 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年
8 王永恒;海量短语信息挖掘技术的研究与实现[D];国防科学技术大学;2006年
9 李鑫;问题回答系统中的问题分类研究[D];复旦大学;2007年
10 贺文锐;面向网络协同制造的资源优化配置技术研究[D];西北工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
3 刘辉;基于KNN算法的中文Web文本分类技术研究[D];辽宁工程技术大学;2010年
4 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
5 于飞;基于搜索引擎的个性化推荐研究[D];哈尔滨理工大学;2010年
6 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
7 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
8 沈杰;基于蚁群算法的中文文本聚类研究[D];杭州电子科技大学;2009年
9 管瑞霞;基于基因表达式编程的中文文本关键词提取算法研究[D];杭州电子科技大学;2009年
10 张炼;基于图模型的Web文档分类方法研究[D];内蒙古科技大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 张国梁;肖超锋;;基于SVM新闻文本分类的研究[J];电子技术;2011年08期
2 冯霞;刘志辉;田继存;;基于假设检验的文本分类特征选择[J];信息与控制;2011年03期
3 潘正高;侯传宇;谈成访;;基于命名实体的Web新闻文本分类方法[J];合肥工业大学学报(自然科学版);2011年08期
4 奉国和;郑伟;;文本分类特征降维研究综述[J];图书情报工作;2011年09期
5 孟佳娜;林鸿飞;李彦鹏;;基于特征贡献度的特征选择方法在文本分类中应用[J];大连理工大学学报;2011年04期
6 汪正中;张洪渊;;基于英文博客文本的情感分析研究[J];计算机技术与发展;2011年08期
7 霍亚格;黄广君;;基于最大熵的汉语短语结构识别方法[J];计算机工程;2011年16期
8 方志龙;;文本特征选择算法MI的改进[J];计算机与现代化;2011年07期
9 周国强;崔荣一;;基于朴素贝叶斯分类器的朝鲜语文本分类的研究[J];中文信息学报;2011年04期
10 高金勇;徐朝军;冯奕竸;;基于迭代的TFIDF在短文本分类中的应用[J];情报理论与实践;2011年06期
中国重要会议论文全文数据库 前10条
1 王秀娟;郭军;郑康锋;;基于互信息可信度的特征选择方法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
2 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 伍建军;康耀红;;关于文本分类中特征降维方式的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
5 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年
6 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
7 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 王秀娟;郑康锋;杨星海;;线性鉴别分析在中文文本分类中的应用[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
10 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国重要报纸全文数据库 前2条
1 希安;微软试水信息检索[N];经济日报;2004年
2 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
2 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
3 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
4 刘华文;基于信息熵的特征选择算法研究[D];吉林大学;2010年
5 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
6 裴志利;数据挖掘技术在文本分类和生物信息学中的应用[D];吉林大学;2008年
7 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
8 韦娜;基于内容图像检索关键技术研究[D];西北大学;2006年
9 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
10 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
中国硕士学位论文全文数据库 前10条
1 王新丽;中文文本分类系统的研究与实现[D];天津大学;2007年
2 黄启虎;基于仿生模式识别的文本分类技术研究[D];哈尔滨工业大学;2008年
3 杨打生;特征选择的信息论算法研究[D];东南大学;2005年
4 董梅;文本内容的信息过滤技术研究[D];合肥工业大学;2006年
5 赵小华;KNN文本分类中特征词权重算法的研究[D];太原理工大学;2010年
6 孟杰;基于构造性覆盖算法的中文文本分类[D];安徽大学;2007年
7 马宏伟;基于SVM的中文文本分类系统的建模与实现[D];大连理工大学;2006年
8 王小燕;文本分类相关技术与应用研究[D];西北大学;2007年
9 陈超;基于支持向量机的中文文本分类的系统研究[D];武汉理工大学;2007年
10 张俊丽;文本分类中的关键技术研究[D];华中师范大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026