收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种含有负项的关联文本分类

王孟  白清源  谢丽聪  谢伙生  张莹  
【摘要】:关联文本分类中,如果特征词分布不均衡,特征词出现频率低的类别的规则集常被特征词出现频率高的类别的规则集所掩盖,分类器的预测能力变弱,因此提出了一种新奇的挖掘含有负项的分类规则的方法,一定程度上增强了被掩盖类别的规则集的分辨能力。从大量的实验结果看出该方法是行之有效的,能够提高分类器的预测能力。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈晓云,胡运发;规则加权的文本关联分类[J];中文信息学报;2005年04期
2 施化吉;王贤川;李星毅;;基于规则重构的关联文本分类[J];计算机工程与设计;2009年03期
3 张清军,朱才连;基于统计的中文文本主题自动提取研究[J];四川大学学报(工程科学版);2004年03期
4 马光志,李专;基于特征词的自动分词研究[J];华中科技大学学报(自然科学版);2003年03期
5 唐晓文;基于本体论的文本特征提取[J];电脑与信息技术;2005年01期
6 李国臣;文本分类中基于对数似然比测试的特征词选择方法[J];中文信息学报;1999年04期
7 张建莉;;基于特征词驱动的带“的”字名词短语的识别[J];福建电脑;2006年05期
8 官礼和,杨刚,李永礼;基于词典的法律案例自动归类系统的开发[J];重庆交通学院学报;2004年01期
9 王珏,刘三阳,张杰;基于广义粗糙近似的信息检索方法研究[J];系统工程与电子技术;2004年12期
10 胡军华;;关联分类和1-近邻法在数据挖掘系统中的应用[J];企业技术开发;2006年09期
11 王宏生;张琳;;基于本体的文本自动分类[J];科技信息(学术研究);2008年29期
12 武建华;沈均毅;王元元;;一种改进的关联分类算法[J];计算机工程;2009年09期
13 刘茵;;一种基于词组的用户建模技术[J];信息与电脑(理论版);2010年07期
14 王天江,张永俊;一种快速基于约束的医疗图像关联分类算法[J];华中科技大学学报(自然科学版);2005年05期
15 胡小春;;一种基于压缩规则的关联分类方法[J];信息系统工程;2010年09期
16 唐凯;;基于内容和分层结构的XML文件自动分类方法[J];计算机工程与应用;2007年03期
17 胡蓉;基于用户兴趣文本的个性化信息服务研究[J];湘潭师范学院学报(社会科学版);2005年06期
18 赵传申,孙志挥;多分类-关联规则分类的一种改进算法[J];应用科学学报;2005年06期
19 尹辉;李振军;尹政;;基于CMAR算法的水平加权多分类关联规则挖掘[J];山东师范大学学报(自然科学版);2008年02期
20 杨勇涛;;文本自动摘要提取算法[J];成都大学学报(自然科学版);2009年02期
中国重要会议论文全文数据库 前10条
1 王孟;白清源;谢丽聪;谢伙生;张莹;;一种含有负项的关联文本分类[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 陈晓云;胡运发;;利用规则权重改进文本关联分类[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 叶娜;吴雪军;朱靖波;陈文亮;;基于相似计算的信息抽取模板自动获取方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 彭渊;赵铁军;郑德权;于浩;;基于特征句抽取的网页去重研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 唐云廷;;基于TSBT(Text Structure Binary Tree)的文本结构的自动分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 叶娜;罗海涛;朱靖波;张斌;;基于归纳逻辑编程的多槽信息抽取规则自动学习方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 王萌;王晓荣;李春贵;唐培和;;基于局部与全局信息的自动文摘算法[A];广西计算机学会2007年年会论文集[C];2007年
9 谷波;刘开瑛;;决策树模型和最大熵模型在文本分类中的比较研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 周永健;郑玉明;廖湖声;;基于模糊聚类的文本分类器[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
中国博士学位论文全文数据库 前10条
1 董杰;基于位表的关联规则挖掘及关联分类研究[D];大连理工大学;2009年
2 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年
3 易高翔;粗糙集在Web挖掘中的应用研究[D];华中科技大学;2006年
4 邹晓红;用于图分类的频繁子结构挖掘算法研究[D];燕山大学;2011年
5 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
6 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
7 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
8 周皓峰;关联规则挖掘的拓展性研究[D];复旦大学;2003年
9 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
10 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前10条
1 邱培超;基于特征的观点挖掘中的若干关键问题研究[D];复旦大学;2011年
2 蒋磊;面向产品评论的意见挖掘关键技术研究[D];哈尔滨工业大学;2010年
3 王金花;一种利用本体关联度改进的TF-IDF特征词提取方法[D];河北大学;2011年
4 董慧;基于多元权重特征加权的中文文本分类算法[D];中北大学;2011年
5 李存青;中文意见挖掘中的特征词提取以及情感倾向分析[D];重庆大学;2010年
6 宋进征;直接挖掘无冗余规则的关联分类[D];兰州大学;2011年
7 刘卓;基于KNN算法的中文文本自动分类[D];吉林大学;2004年
8 杨永刚;云计算下关联分类技术的研究与实现[D];电子科技大学;2011年
9 朱倩;属性不确定数据关联分类算法研究[D];大连理工大学;2011年
10 黄菲菲;半监督层次协同文本聚类研究[D];西南交通大学;2012年
中国重要报纸全文数据库 前4条
1 吴萍;新软件百强出炉规模仍是软肋[N];计算机世界;2008年
2 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
3 金石;金沙实现远程教育村级站点全覆盖[N];经济信息时报;2008年
4 肖浩;用网格化实现精细管理[N];中国计算机报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978