收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

结合词相关特征与流行学习的中文问句分类

刘立  余正涛  王蒙  毛存礼  郭剑毅  
【摘要】:针对问句分类过程中词袋方式特征选取所面临的数据稀疏以及特征空间维数过高的问题,提出了一种结合词语相关性与流形学习的分类方法,该方法通过统计选取训练语料库中高频词作为分类特征,以词汇语义相似度方法构建问句特征空间特征值,通过流行学习中的局部线性嵌入算法对特征空间进行非线性降维,从而获得问句分类特征向量,并采用支持向量机算法训练分类器。在旅游领域2万多问句上进行了问句分类实验,结果表明提出的方法取得了较好的效果,分类准确率达到了87.44%,比采用TFIDF进行特征提取训练得到的分类器的准确率提高了16个百分点;比采用语义相似度进行特征提取,并对特征空间进行PCA降维后训练得到的分类器的分类准确率提高了4个百分点。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 聂卉;龙朝晖;;结合语义相似度与相关度的概念扩展[J];情报学报;2007年05期
2 王惠敏;聂规划;付魁;;领域本体中基于多维特征的语义相似度算法研究[J];情报杂志;2008年10期
3 申改英;李建华;;基于语义的Web服务自动组合算法[J];计算机工程;2009年16期
4 黄宏斌;刘志忠;张维明;邓苏;马丽丽;;基于层次本体模型(HOM)的语义相似度计算方法[J];系统工程与电子技术;2009年07期
5 吴飞珍;马文丽;王旺迪;陈启龙;郑文岭;;一种新的基因注释语义相似度计算方法[J];生物信息学;2010年01期
6 骆正华,樊孝忠,夏天;基于结构化问句实例的自动问答系统[J];微电子学与计算机;2005年07期
7 张承立;陈剑波;齐开悦;;基于语义网的语义相似度算法改进[J];计算机工程与应用;2006年17期
8 徐德智;C.Onyango;王怀民;;上位本体中语义相似度的计算及其实现[J];计算技术与自动化;2007年02期
9 张晓孪;王西锋;;FCA中的概念语义相似度计算[J];现代图书情报技术;2007年03期
10 路松峰;冯玲;刘芳;胡和平;;SSW:一种语义相关的P2P网络资源检索机制[J];小型微型计算机系统;2008年08期
11 周粉;夏幼明;;一种改进的基于知网的语义相似度计算方法[J];云南大学学报(自然科学版);2008年S2期
12 史斌;闫健卓;王普;方丽英;;基于本体的概念语义相似度度量[J];计算机工程;2009年19期
13 刘卫;刘金岭;;基于《知网》的词语语义相似度改进及应用[J];福建电脑;2010年05期
14 刘景方;邹平;张朋柱;齐峰;;一种改进的本体概念语义相似度算法研究[J];武汉理工大学学报;2010年20期
15 刘紫玉;黄磊;;基于领域本体模型的概念语义相似度计算研究[J];铁道学报;2011年01期
16 陈琨;张蕾;;基于知识图的领域本体构建方法[J];计算机应用;2011年06期
17 柳巧玲;尚艳艳;;基于领域本体的语义知识检索研究[J];图书情报工作;2011年06期
18 徐德智;郑春卉;K. Passi;;基于SUMO的概念语义相似度研究[J];计算机应用;2006年01期
19 郑丽萍;李光耀;梁永全;沙静;;本体中概念相似度的计算[J];计算机工程与应用;2006年30期
20 徐德智;王怀民;;基于本体的概念间语义相似度计算方法研究[J];计算机工程与应用;2007年08期
中国重要会议论文全文数据库 前10条
1 刘立;余正涛;王蒙;毛存礼;郭剑毅;;结合词相关特征与流行学习的中文问句分类[A];第六届全国信息检索学术会议论文集[C];2010年
2 薛薇;李力;;非线性时滞系统的M-FPID控制研究[A];第12届全国电气自动化与电控系统学术年会论文集[C];2004年
3 黎蔚;杨凯鹏;陈家新;冀治航;;一种基于二维直方图的跟踪算法[A];第十届中国科协年会论文集(一)[C];2008年
4 李夕海;赵克;慕晓冬;刘代志;;目标识别中的特征相空间吸引子分析[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 游伟;周先敏;;基于特征空间的自适应波束形成算法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
6 李坤;杨华;;利用MODIS数据重庆伏旱动态监测研究[A];中国地理学会百年庆典学术论文摘要集[C];2009年
7 熊凌;;计算机视觉中的图像匹配综述[A];12省区市机械工程学会2006年学术年会湖北省论文集[C];2006年
8 李婧;;改进的特征空间波束形成算法[A];中国通信学会第五届学术年会论文集[C];2008年
9 刘怡光;游健;张建伟;;基于支持向量的多类分类器设计[A];第十三届全国图象图形学学术会议论文集[C];2006年
10 张召;业宁;业巧林;;基于配对约束的核半监督非线性降维算法[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 刘宏哲;文本语义相似度计算方法研究[D];北京交通大学;2012年
2 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
3 马儒宁;神经网络与支持向量机相关问题研究[D];复旦大学;2005年
4 周子力;基于WordNet的本体构建及其在安全领域应用关键技术研究[D];华东师范大学;2009年
5 潘建国;基于语义的用户建模技术与应用研究[D];上海大学;2009年
6 杨哲海;高光谱影像分类若干关键技术的研究[D];解放军信息工程大学;2006年
7 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
8 段大鹏;基于UHF方法的GIS局部放电检测与仿生模式识别[D];上海交通大学;2009年
9 刘铭;大规模文档聚类中若干关键问题的研究[D];哈尔滨工业大学;2010年
10 胡晓;支持机械产品概念设计的功能知识聚类方法研究[D];上海交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 郑丽萍;本体映射的研究[D];山东科技大学;2005年
2 张红宇;数据集成中本体映射的研究[D];中南大学;2005年
3 常晓环;基于概念图的语义检索方法研究[D];吉林大学;2009年
4 任波;基于语义的Web服务发现研究[D];浙江工业大学;2005年
5 秦鹏;基于WordNet的本体匹配关键技术研究与实现[D];华东师范大学;2010年
6 郭嘉琦;领域本体的构建及其在信息检索中的应用研究[D];北京邮电大学;2007年
7 陈爱明;本体复合映射发现技术研究[D];中南大学;2008年
8 赵大明;基于本体的专业搜索引擎的研究与设计[D];西北大学;2009年
9 关淞元;本体匹配算法的研究[D];吉林大学;2009年
10 尹睿;基于语义相似度的论文文本聚类算法研究[D];大连理工大学;2009年
中国重要报纸全文数据库 前2条
1 清华大学 李迎春;多姿态人脸图像的估计及合成[N];计算机世界;2006年
2 演讲人 季理真;对称之美[N];光明日报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978