收藏本站
《黑龙江省计算机学会2009年学术交流年会论文集》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

中文文本分类中基于文档频度分布的特征选择方法

陈庆轩  郑德权  郑博文  赵铁军  李生  
【摘要】:随着互联网信息及电子资源的急剧膨胀,文本分类技术成为信息组织与管理的有效手段。基于Fisher判别分析理论,通过分析词条类间分布的不均匀性与类内分布的相对均匀性,提出了基于文档频度分布的文本特征选择方法,应用于文本分类中,实验表明,该方法能够充分地表达文本的特征信息,获得了良好的效果。

【参考文献】
中国期刊全文数据库 前3条
1 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
2 周水庚,关佶红,胡运发,周傲英;一个无需词典支持和切词处理的中文文档分类系统[J];计算机研究与发展;2001年07期
3 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
【共引文献】
中国期刊全文数据库 前10条
1 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
2 代劲;胡峰;王国胤;;基于不完备信息系统的文本分类研究与应用[J];重庆邮电学院学报(自然科学版);2006年03期
3 李粤;安捷;李星;;排序融合算法在校园网搜索引擎中的应用[J];大连理工大学学报;2005年S1期
4 谷峰;吴扬扬;;文本分类关键技术[J];福建电脑;2006年09期
5 贺卫红;曹毅;;基于向量空间模型文本过滤算法[J];系统工程;2005年10期
6 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期
7 谢科;张辉;陈鹏;庞斌;;文本分类系统关键技术[J];广西师范大学学报(自然科学版);2007年02期
8 朱培毅,黄敏;基于Boosting算法的文本自动分类器模型设计[J];高校图书馆工作;2004年05期
9 何峰;;一种基于粗糙集理论的文本分类方法[J];自动化与信息工程;2006年03期
10 吴志峰,田学东;人名、机构名在基于概念的文本分类中的应用研究[J];河北大学学报(自然科学版);2004年06期
中国重要会议论文全文数据库 前10条
1 Zhao Shuanzhu Chen Junjie Guo Xin College of Computer and Software Taiyuan University of Technology,Taiyuan,Shanxi,Chnia,030024;Research on the Frame Structure and Its Implement of a Special Field-based Content Information Mining System on Web[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 8)[C];2005年
2 张娟;王慧锋;;文本分类技术在海量金融信息处理中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年
3 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
4 王秀娟;郭军;郑康锋;;基于互信息可信度的特征选择方法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
5 王丹;蔡红柳;王斌;;基于混沌序列的数字水印算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
6 石艳荣;孙丹宁;贺永强;;一种基于内容的邮件过滤模型的研究与性能分析[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
7 陈庆轩;郑德权;赵铁军;;多分类器融合的文本分类技术研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
8 程新荣;杨仁刚;;网页自动分类在搜索引擎上的应用研究[A];2007'中国仪器仪表与测控技术交流大会论文集(二)[C];2007年
9 王秀娟;郑康锋;杨星海;;线性鉴别分析在中文文本分类中的应用[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
10 薛春香;夏祖奇;侯汉清;;基于语料和基于标引经验的自动分类模式比较[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
2 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
3 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
4 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
5 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
6 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
7 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
8 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
9 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
10 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 苏伟峰;基于概念的文本自动分类研究[D];厦门大学;2002年
2 陈乐;基于智能文本分类技术的素材管理软件的设计与开发[D];南京师范大学;2003年
3 王家锋;分布式智能搜索引擎技术[D];北京工业大学;2003年
4 代学武;基于神经网络的用户建模和Web信息过滤研究[D];西南师范大学;2003年
5 王汉萍;粗糙集理论在文本挖掘的分类算法中的应用研究[D];中国海洋大学;2003年
6 程捷;辅助视频内容分析的音频技术研究与实现[D];中国人民解放军国防科学技术大学;2003年
7 胡蓉;中文Web文档倾向性自动分类研究[D];四川大学;2003年
8 刘钢;基于神经网络的文本分类系统NNTCS的设计和实现[D];中国科学院研究生院(软件研究所);2003年
9 刘岚;Web News Hunter智能代理[D];中国科学院研究生院(软件研究所);2003年
10 樊建聪;使用贝叶斯方法的数据挖掘及应用研究[D];山东科技大学;2003年
【二级参考文献】
中国期刊全文数据库 前4条
1 张宁,贾自艳,史忠植;使用KNN算法的文本分类[J];计算机工程;2005年08期
2 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
3 邹涛,王继成,黄源,张福炎;中文文档自动分类系统的设计与实现[J];中文信息学报;1999年03期
4 孙丽华,张积东,李静梅;一种改进的kNN方法及其在文本分类中的应用[J];应用科技;2002年02期
【相似文献】
中国期刊全文数据库 前10条
1 洪智勇;王天擎;刘灿涛;;一种新的互信息特征子集评价函数[J];计算机工程与应用;2011年22期
2 李正;倪远平;刘迪;王海鹏;;实蝇图像识别中的形态特征提取研究[J];计算机仿真;2011年07期
3 陶慧;祁佩棉;;基于遗传算法的煤与瓦斯突出影响因素研究[J];河南理工大学学报(自然科学版);2011年03期
4 李正;倪远平;刘迪;王海鹏;;实蝇图像识别中的形态特征提取研究[J];机械与电子;2010年S1期
5 靳旭玲;余桂贤;徐亚飞;李光平;薛阳;;基于免疫算法和反向传播神经元网络的无线网络入侵检测研究[J];计算机应用与软件;2011年08期
6 吴萍;姜懿庭;;基于粗糙集和信息熵的入侵检测特征选择方法研究[J];云南民族大学学报(自然科学版);2011年04期
7 吴克寿;陈玉明;谢荣生;王晓栋;;基于粗糙集与蚁群优化算法的特征选择方法研究[J];计算机应用研究;2011年07期
8 冯霞;刘志辉;田继存;;基于假设检验的文本分类特征选择[J];信息与控制;2011年03期
9 张国梁;肖超锋;;基于SVM新闻文本分类的研究[J];电子技术;2011年08期
10 郑娅峰;张巧荣;肖会敏;;自动特征选择和加权的图像显著区域检测[J];计算机工程与应用;2011年24期
中国重要会议论文全文数据库 前10条
1 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
2 李娜;曾向阳;;目标识别中的样本选择和特征选择联合算法研究[A];2009年西安-上海声学学术会议论文集[C];2009年
3 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
4 王强;曾向阳;王曙光;李娜;;主元分析在水下目标特征选择中的应用[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
5 高砚军;徐华平;;基于窗口自适应灰度共生矩阵的SAR图像分类[A];第六届全国信息获取与处理学术会议论文集(1)[C];2008年
6 李晓丽;王彤;杜振龙;;基于粗糙集理论的流数据最优特征选择[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
7 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 李爱新;孙铁;郭炎峰;;基于人工神经网络的脑电信号模式分类[A];自动化技术与冶金流程节能减排——全国冶金自动化信息网2008年会论文集[C];2008年
9 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 周志红;周新聪;严新平;袁成清;;磨粒特征参数的评价与优化方法研究[A];2006全国摩擦学学术会议论文集(一)[C];2006年
中国重要报纸全文数据库 前10条
1 周晓娟;TD已过分水岭[N];通信产业报;2008年
2 天相投顾 闻群王聃聃;选基金需考虑风险承受力[N];中国证券报;2007年
3 孙志伟;刘刚检查城防林建设[N];齐齐哈尔日报;2008年
4 郑卫东;高产鹅选种方法和标准[N];中国畜牧兽医报;2007年
5 海通证券 娄静吴先兴;把握风险收益特征选择最适合自己的基金[N];上海证券报;2007年
6 张小东;促销之十大常见误区(一)[N];黑龙江经济报;2006年
7 华泰证券 吴璟;权证投资:只买对的,不买便宜的[N];上海证券报;2008年
8 广西钦州灵山县灵城二小 纪雪林;小场地训练途中跑的方法[N];中国体育报;2008年
9 ;现代军队与智能战争[N];中国计算机报;2005年
10 张小明;如何选择供应链[N];现代物流报;2005年
中国博士学位论文全文数据库 前10条
1 韦娜;基于内容图像检索关键技术研究[D];西北大学;2006年
2 张颖;基于群集智能模式识别方法的研究[D];大连理工大学;2008年
3 吕铁军;通信信号调制识别研究[D];电子科技大学;2000年
4 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
5 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
6 李勇明;尿沉渣图像自动识别算法的研究[D];重庆大学;2007年
7 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
8 杨水山;冷轧带钢表面缺陷机器视觉自动检测技术研究[D];哈尔滨工业大学;2009年
9 黄东山;特征选择及半监督分类方法研究[D];华中科技大学;2011年
10 熊文;基于群智的特征选择、分类与聚类挖掘的研究[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 房一鸣;用分类树算法进行上市公司评级的实证研究[D];对外经济贸易大学;2006年
2 刘何秀;神经网络集成算法的研究[D];中国海洋大学;2009年
3 张隆;基于信息论的特征选择和分类算法研究[D];西南农业大学;2005年
4 侯小静;贝叶斯分类器研究及其在Web文档分类中的应用[D];郑州大学;2005年
5 秦永;遥感影像特征提取与选择及在影像分类中的应用[D];辽宁工程技术大学;2005年
6 刘宜萍;基于特征选择的多因素时间序列预测模型研究[D];合肥工业大学;2006年
7 杨打生;特征选择的信息论算法研究[D];东南大学;2005年
8 庞宵;信息熵蚁群算法在特征提取和图像识别中的应用[D];辽宁科技大学;2008年
9 王玉晶;基于禁忌搜索算法的生理信号情感识别研究[D];西南大学;2008年
10 杨瑞请;基于BPSO的生理信号的情感状态识别[D];西南大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026