收藏本站
《第一届建立和谐人机环境联合学术会议(HHME2005)论文集》2005年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于语义概念的中文文本分类方法

陈伟萍  王琳  封化民  杨鼎才  方勇  
【摘要】:本文从Web文本自动分类的需求出发,针对基于VSM(VectorSpaceModel)模型的分类处理中词的无关性假设及词的维数过高等问题,结合Hownet,提出一种基于语义概念的中文文本分类方法。通过语义概念分析可以达到对传统词特征向量的排歧和降维,并在此基础上对文本进行分类处理。本文提出并实现一个基于SVM(SupportVectorMachines)中文文本分类的原型系统,对中等规模的文本语料库的实验表明,本系统是有效的。

【相似文献】
中国期刊全文数据库 前10条
1 黎超;吴义国;魏星;;基于主成分分析的SMO文本分类[J];现代计算机(专业版);2011年10期
2 张春涛;郭皎;徐家良;;基于稀疏表示的半监督降维方法[J];计算机工程与应用;2011年20期
3 瞿师;于荣欢;吴玲达;魏迎梅;冯晓萌;;基于隐空间的运动捕获数据自动分割[J];计算机应用研究;2011年08期
4 汤勃;孔建益;王兴东;侯宇;;基于遗传算法的带钢表面缺陷特征降维优化选择[J];钢铁研究学报;2011年09期
5 王瀛;郭雷;梁楠;;基于优选样本的KPCA高光谱图像降维方法[J];光子学报;2011年06期
6 谢波;余永权;;一种求解数值优化问题的进化规划算法[J];计算机工程;2011年13期
7 王开军;;基于降维的聚类可视化技术[J];福建师范大学学报(自然科学版);2011年04期
8 何新鹏;黄英;刘奇;刘云峰;潘琦;;基于投影的快速模板匹配算法[J];自动化技术与应用;2011年07期
9 李京;姜卫;张跟鹏;宋世延;;基于电子商务的个性化推荐系统研究[J];计算机与数字工程;2011年07期
10 黄天羽;李立杰;胡希胜;;基于样本的等距特征映射的行为分析方法[J];北京理工大学学报;2011年05期
中国重要会议论文全文数据库 前10条
1 陈伟萍;王琳;封化民;杨鼎才;方勇;;一种基于语义概念的中文文本分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
2 刘广艳;孙莹;黄保海;林培光;;基于本体方法的改进VSM语义检索模型[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
3 刘正一;姜志国;孟钢;赵丹培;;基于谱回归降维的全视点卫星目标识别[A];第九届全国光电技术学术交流会论文集(下册)[C];2010年
4 苏保伟;王永良;周良柱;;辅助天线不同排列形式及位置变化对SLC影响[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
5 熊伟;万忠宏;张红英;幸华刚;;基于聚类的核主成分分析方法在地震属性降维中的应用[A];中国地球物理学会第二十七届年会论文集[C];2011年
6 柏桂荣;章勇;;基于RSS的用户兴趣模型研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
7 王晋麟;曹登庆;黄文虎;;后处理Galerkin方法在转子-轴承系统降维中的应用[A];第十二届全国非线性振动暨第九届全国非线性动力学和运动稳定性学术会议论文集[C];2009年
8 刘严;谭忠富;韩勇;乞建勋;;机组组合优化问题的一种改进的动态规划方法[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年
9 习雅思;刘晓平;;一种快速立体图生成算法[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(上册)[C];2008年
10 李卫东;杨炳儒;李龙星;曲文龙;;基于中心词位置的VSM文本分类算法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
中国重要报纸全文数据库 前5条
1 德商;全球造船业形势不错[N];国际经贸消息;2000年
2 本报记者 母晓洁;索尼投资168万元设“接机店”[N];中国电子报;2002年
3 李海雁 孙淼;稳固的后盾[N];国际经贸消息;2001年
4 任越;精益生产活动助力企业原线生产[N];国际经贸消息;2002年
5 Andi Mann 编译 刘琦;提高虚拟化系统的可管理性[N];中国计算机报;2009年
中国博士学位论文全文数据库 前10条
1 於州;充分降维理论和方法的拓展研究[D];华东师范大学;2010年
2 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
3 沈道义;基于最小化训练误差的子空间分类算法研究[D];中国科学技术大学;2008年
4 肖军;面向对象的多媒体信息系统控制和安全机制的关键技术研究[D];吉林大学;2005年
5 曲刚;环境不确定条件下企业组织间协作关系研究[D];大连理工大学;2007年
6 张蕾;奇异值分解技术在卫星资料反演和同化中的应用研究[D];兰州大学;2008年
7 郭艺;GPS接收机空时抗干扰理论与实现关键技术研究[D];国防科学技术大学;2007年
8 张桦;场景图像拼接关键技术研究[D];天津大学;2008年
9 黄东;基于流形的降维方法及其在计算机视觉中的应用[D];电子科技大学;2009年
10 朱真峰;快速增量式分类算法研究[D];复旦大学;2010年
中国硕士学位论文全文数据库 前10条
1 朱坤红;基于VSM模型和特征选择算法的中文文本自动分类研究[D];江西师范大学;2011年
2 周帆;基于VSM的中文网页分类特征选择技术研究与实现[D];武汉理工大学;2012年
3 汪前秀;基于改进的VSM的不良文本过滤模型研究[D];东北财经大学;2010年
4 井志强;基于扩展的VSM中文文本分类方法[D];哈尔滨工程大学;2010年
5 陈诗国;半监督降维及其在超光谱图像分类中的应用研究[D];南京航空航天大学;2011年
6 邓平;基于三维的机械系统Top-down设计关键技术[D];国防科学技术大学;2011年
7 李慧玲;电力系统割集功率空间静态电压稳定域[D];天津大学;2005年
8 高丽丽;倒立摆T-S模糊控制系统降维问题研究[D];内蒙古大学;2005年
9 符燕华;Web文本数据挖掘研究[D];同济大学;2006年
10 吴遐;基于约束的图核方法的研究[D];南京航空航天大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026