收藏本站
《第三届全国信息检索与内容安全学术会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

一种含有负项的关联文本分类

王孟  白清源  谢丽聪  谢伙生  张莹  
【摘要】:关联文本分类中,如果特征词分布不均衡,特征词出现频率低的类别的规则集常被特征词出现频率高的类别的规则集所掩盖,分类器的预测能力变弱,因此提出了一种新奇的挖掘含有负项的分类规则的方法,一定程度上增强了被掩盖类别的规则集的分辨能力。从大量的实验结果看出该方法是行之有效的,能够提高分类器的预测能力。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 陈晓云;陈袆;王雷;李荣陆;胡运发;;基于分类规则树的频繁模式文本分类[J];软件学报;2006年05期
【共引文献】
中国期刊全文数据库 前10条
1 朱颢东;李红婵;;关于Top-N最频繁项集挖掘的研究[J];电子科技大学学报;2010年05期
2 郭玉琴;袁方;刘海博;;基于模糊分类规则树的文本分类(英文)[J];Journal of Southeast University(English Edition);2008年03期
3 李艳燕;廖剑;王晶;黄荣怀;;协作学习交互分析工具及其案例研究[J];开放教育研究;2007年04期
4 邱江涛;唐常杰;曾涛;刘胤田;;关联文本分类的规则修正策略[J];计算机研究与发展;2009年04期
5 陈绯;郑华;;一种免疫克隆特征选择算法在文本分类中的应用[J];计算机工程与科学;2009年09期
6 许朝阳;;KNN系数修正迭代求精算法[J];计算机与现代化;2010年10期
7 商炳章;白清源;;基于互信息规则剪枝的关联文本分类[J];南京师范大学学报(工程技术版);2008年04期
8 肖可;奉国和;;1999~2008年国内文本分类研究文献计量分析[J];情报学报;2010年04期
9 邱江涛;唐常杰;乔少杰;段磊;刘齐宏;;基于加权频繁项集的文本分类规则挖掘[J];四川大学学报(工程科学版);2008年06期
10 施化吉;王贤川;李星毅;;基于规则重构的关联文本分类[J];计算机工程与设计;2009年03期
中国重要会议论文全文数据库 前3条
1 王孟;白清源;谢丽聪;谢伙生;张莹;;基于信息增益规则排序的关联文本分类[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 沈志斌;白清源;;基于加权修正的KNN文本分类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
3 商炳章;白清源;;基于特征项权重改进的关联文本分类[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
中国博士学位论文全文数据库 前3条
1 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
2 刘赫;文本分类中若干问题研究[D];吉林大学;2009年
3 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘利峰;概念格理论在数据挖掘中的若干问题研究[D];国防科学技术大学;2007年
2 王贤川;基于知网的文本分类算法研究及应用[D];江苏大学;2009年
3 王晶;面向通信管理的电子政务系统及其网页分类的研究与实现[D];上海交通大学;2009年
4 郭玉琴;基于模糊关联规则的中文文本分类[D];河北大学;2007年
5 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
6 史仲昆;若干中文文本分类技术的研究及在知识抽取中的应用[D];吉林大学;2010年
7 宋晓旭;基于语义网的文本分类研究[D];沈阳工业大学;2011年
8 许世明;中文网页分类技术研究及预分类算法实现[D];西安电子科技大学;2009年
9 李原;中文文本分类中分词和特征选择方法研究[D];吉林大学;2011年
10 杨森;民生信息多分类系统研究与设计[D];山东科技大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 陈晓云,胡运发;规则加权的文本关联分类[J];中文信息学报;2005年04期
2 施化吉;王贤川;李星毅;;基于规则重构的关联文本分类[J];计算机工程与设计;2009年03期
3 张清军,朱才连;基于统计的中文文本主题自动提取研究[J];四川大学学报(工程科学版);2004年03期
4 马光志,李专;基于特征词的自动分词研究[J];华中科技大学学报(自然科学版);2003年03期
5 唐晓文;基于本体论的文本特征提取[J];电脑与信息技术;2005年01期
6 李国臣;文本分类中基于对数似然比测试的特征词选择方法[J];中文信息学报;1999年04期
7 张建莉;;基于特征词驱动的带“的”字名词短语的识别[J];福建电脑;2006年05期
8 官礼和,杨刚,李永礼;基于词典的法律案例自动归类系统的开发[J];重庆交通学院学报;2004年01期
9 王珏,刘三阳,张杰;基于广义粗糙近似的信息检索方法研究[J];系统工程与电子技术;2004年12期
10 胡军华;;关联分类和1-近邻法在数据挖掘系统中的应用[J];企业技术开发;2006年09期
中国重要会议论文全文数据库 前10条
1 王孟;白清源;谢丽聪;谢伙生;张莹;;一种含有负项的关联文本分类[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 陈晓云;胡运发;;利用规则权重改进文本关联分类[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 叶娜;吴雪军;朱靖波;陈文亮;;基于相似计算的信息抽取模板自动获取方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 彭渊;赵铁军;郑德权;于浩;;基于特征句抽取的网页去重研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 唐云廷;;基于TSBT(Text Structure Binary Tree)的文本结构的自动分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 叶娜;罗海涛;朱靖波;张斌;;基于归纳逻辑编程的多槽信息抽取规则自动学习方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 王萌;王晓荣;李春贵;唐培和;;基于局部与全局信息的自动文摘算法[A];广西计算机学会2007年年会论文集[C];2007年
9 谷波;刘开瑛;;决策树模型和最大熵模型在文本分类中的比较研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 周永健;郑玉明;廖湖声;;基于模糊聚类的文本分类器[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
中国重要报纸全文数据库 前4条
1 吴萍;新软件百强出炉规模仍是软肋[N];计算机世界;2008年
2 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
3 金石;金沙实现远程教育村级站点全覆盖[N];经济信息时报;2008年
4 肖浩;用网格化实现精细管理[N];中国计算机报;2007年
中国博士学位论文全文数据库 前10条
1 董杰;基于位表的关联规则挖掘及关联分类研究[D];大连理工大学;2009年
2 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年
3 易高翔;粗糙集在Web挖掘中的应用研究[D];华中科技大学;2006年
4 邹晓红;用于图分类的频繁子结构挖掘算法研究[D];燕山大学;2011年
5 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
6 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
7 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
8 周皓峰;关联规则挖掘的拓展性研究[D];复旦大学;2003年
9 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
10 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前10条
1 邱培超;基于特征的观点挖掘中的若干关键问题研究[D];复旦大学;2011年
2 蒋磊;面向产品评论的意见挖掘关键技术研究[D];哈尔滨工业大学;2010年
3 王金花;一种利用本体关联度改进的TF-IDF特征词提取方法[D];河北大学;2011年
4 董慧;基于多元权重特征加权的中文文本分类算法[D];中北大学;2011年
5 李存青;中文意见挖掘中的特征词提取以及情感倾向分析[D];重庆大学;2010年
6 宋进征;直接挖掘无冗余规则的关联分类[D];兰州大学;2011年
7 刘卓;基于KNN算法的中文文本自动分类[D];吉林大学;2004年
8 杨永刚;云计算下关联分类技术的研究与实现[D];电子科技大学;2011年
9 朱倩;属性不确定数据关联分类算法研究[D];大连理工大学;2011年
10 黄菲菲;半监督层次协同文本聚类研究[D];西南交通大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026