收藏本站
《2006年全国开放式分布与并行计算机学术会议论文集(三)》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于模糊聚类的文本分类器

周永健  郑玉明  廖湖声  
【摘要】:文章提出了一种基于模糊聚类的文本分类器构造方法,介绍了文本中特征词之间模糊相似度的度量方法,给出了利用“编网法”思想实现模糊聚类的算法。通过比较文本中特征词之间的模糊相似度,实现特征词的聚类,最终获取能够识别文本主题类别的特征词集合,并给出了分类器性能的测试结果。

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 刘贵龙,宋柔,王慧玲;模糊聚类分析在文本分类中的应用[J];计算机工程与应用;2003年09期
2 刘丽珍,宋瀚涛;文本分类中的特征选取[J];计算机工程;2004年04期
3 胡军军,李成刚,周济;改进编网法聚类及其实现[J];计算机应用研究;1999年05期
【共引文献】
中国期刊全文数据库 前10条
1 韩海峰,吕伟民,尚建丽;高性能混凝土质量多级模糊综合评估体系的试验研究[J];四川建筑科学研究;2001年03期
2 张晓杰,王巍巍;基于C—均值模糊聚类的工程结构构件自动归并方法研究[J];四川建筑科学研究;2005年04期
3 张欣;住宅建筑功能的模糊综合评价方法[J];四川建筑科学研究;2005年04期
4 张欣;;建筑装饰工程的模糊快速报价方法[J];四川建筑科学研究;2006年04期
5 杜文正;丁刚乐;;基于风险矩阵法的封闭空间空气安全风险评估模型[J];兵工自动化;2011年10期
6 白云超;田大增;;河北省城镇面貌三年大变样满意度模糊统计分析[J];中国城市经济;2010年08期
7 尹海龙;徐祖信;;河流综合水质评价方法比较研究[J];长江流域资源与环境;2008年05期
8 张目;周宗放;;基于熵权—模糊综合评判法的高技术企业信用评价[J];财会月刊;2010年30期
9 张昌福;陈光冬;殷志明;江志林;;小批量产品生产过程统计质量控制方法研究[J];四川兵工学报;2009年07期
10 申燕飞;;不确定性因素评价值的可靠性分析在房地产投资项目中的应用[J];产业与科技论坛;2009年02期
中国重要会议论文全文数据库 前2条
1 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
2 李瑞;席晓博;;建筑施工安全评价研究[A];建设工程安全理论与应用——首届中国中西部地区土木建筑学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 任家福;服务商选择与备件备品库存管理研究[D];电子科技大学;2010年
2 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
3 郑立斌;联合式制造资源发现与集成方法的研究[D];江苏大学;2011年
4 尚建丽;传统夯土民居生态建筑材料体系的优化研究[D];西安建筑科技大学;2005年
5 高辉;基于风险分析的房地产项目决策与对策研究[D];西安建筑科技大学;2005年
6 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
7 蒋红妍;高速公路路面养护管理系统研究[D];长安大学;2006年
8 刘强;复合式膜生物反应器的EPS分布特性及膜污染控制原理[D];西安建筑科技大学;2009年
9 巩航军;高速公路隧道运营安全综合评价研究[D];长安大学;2009年
10 苏永强;建筑工程设计文件质量评价理论与方法研究[D];中国矿业大学(北京);2009年
中国硕士学位论文全文数据库 前10条
1 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
2 刘帅男;机织物规格要素与其光泽性能的关系研究[D];浙江理工大学;2010年
3 解冬青;网络学习的个性化评价系统的研究与设计[D];华东师范大学;2011年
4 周登;基于N-Gram模型的藏文文本分类技术研究[D];西北民族大学;2010年
5 张丽珍;基于中介逻辑的模糊信息处理的研究[D];江南大学;2010年
6 孙海虹;基于模糊粗糙集的Web文本分类研究[D];哈尔滨理工大学;2010年
7 杨星;盱眙县各类中小房地产企业的战略选择研究[D];江西理工大学;2010年
8 秦海瑞;我国原油进口运输路径优化及中转调配研究[D];华东理工大学;2011年
9 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年
10 程建明;FQFD方法在126kV GIS设备开发中的应用研究[D];昆明理工大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 郑海,林鸿飞;基于段落匹配的文本分类机制[J];计算机工程与应用;2004年28期
2 王丁,运海红,张辉;文本自动分类系统的研究与实现[J];信息技术;2005年03期
3 杜志文;曾文华;;网格计算在文本分类中的应用[J];微电子学与计算机;2006年S1期
4 崔彩霞;王素格;;基于粗集的支持向量机文本分类方法研究[J];科技广场;2006年08期
5 祝晓鲁;白振兴;贾海燕;;自动文本分类技术研究[J];现代电子技术;2007年03期
6 张桂芸;刘洋;王元元;;基于模糊认知图的文本分类推理算法[J];计算机工程与应用;2007年12期
7 陈莲娜;姚伏天;;用于文本分类的多核SVM算法研究[J];计算机工程;2007年09期
8 王倩倩;段震;张燕平;;基于交叉覆盖算法的文本分类[J];计算机技术与发展;2007年06期
9 董梅;胡学钢;;基于多特征选择的中文文本分类[J];计算机技术与发展;2007年07期
10 巩知乐;张德贤;;文本挖掘理论概述[J];福建电脑;2008年09期
中国重要会议论文全文数据库 前10条
1 周永健;郑玉明;廖湖声;;基于模糊聚类的文本分类器[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
2 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
4 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
8 房一飞;张冬茉;;基于boosting的文本分类在股市领域信息抽取系统中的应用[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
9 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年
10 赵修湘;石勇;刘莹;张玲玲;;文本分类在软件缺陷管理中的应用[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年
中国重要报纸全文数据库 前2条
1 希安;微软试水信息检索[N];经济日报;2004年
2 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
2 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
3 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
4 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
5 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
6 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年
7 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
8 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
9 王占一;Web文本挖掘中若干问题的研究[D];北京邮电大学;2012年
10 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 张彪;文本分类中特征选择算法的分析与研究[D];中国科学技术大学;2010年
2 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
3 蒋健;文本分类中特征提取和特征加权方法研究[D];重庆大学;2010年
4 闫晨;KNN文本分类研究[D];燕山大学;2010年
5 苏小康;基于维基百科构建语义知识库及其在文本分类领域的应用研究[D];华中师范大学;2010年
6 李璇;基于坐标下降法的半监督学习算法及其在文本分类中的应用[D];华南理工大学;2010年
7 宋志理;基于LDA模型的文本分类研究[D];西安理工大学;2010年
8 郭志毅;基于EM算法的半监督文本分类方法研究[D];重庆邮电大学;2010年
9 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
10 段江丽;基于SVM的文本分类系统中特征选择与权重计算算法的研究[D];太原理工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026