收藏本站
《第二届全国学生计算语言学研讨会论文集》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于向量空间模型的无导词义消歧

陈浩  何婷婷  代玲  
【摘要】:词义消歧一直是自然语言理解中的一个关键问题,该问题解决的好坏直接影响到自然语言处理中诸多问题的解决。现在大部分的词义消歧方法都是在分词的基础上做的。借鉴前人的向量空间模型运用统计的方法,本文提出了不用直接分词而在术语抽取的基础上做消歧工作。在义项矩阵的计算中,采用改进了的tf.idf.ig方法。在8个汉语高频多义次的测试中取得了平均准确率为84.52%的较好的效果,验证了该方法的有效性。

【共引文献】
中国期刊全文数据库 前10条
1 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期
2 卢志茂,刘挺,张刚,李生;基于依存分析改进贝叶斯模型的词义消歧[J];高技术通讯;2003年05期
3 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期
4 任美睿;郭龙江;李金宝;;基于改进的向量空间模型的自动文本分类[J];哈尔滨商业大学学报(自然科学版);2006年01期
5 徐凤亚,罗振声;文本自动分类中特征权重算法的改进研究[J];计算机工程与应用;2005年01期
6 谢芳;胡泉;;基于BP神经网络的词义消歧模型[J];计算机工程与应用;2006年12期
7 罗三定,冯元勇,沈德耀,贾维嘉;基于概念的文档评价模型[J];计算机工程;2002年08期
8 李国臣,段建勇;基于语法语义信息量化模型的语素字再分类[J];计算机工程;2004年11期
9 姜丽华,黄敏,马永光,佟振声;基于Multi-agent技术的Web文本挖掘模型及应用[J];计算机工程;2005年01期
10 余正涛,宋丽哲,樊孝忠;基于本体的个性化领域信息服务[J];计算机工程;2005年05期
中国重要会议论文全文数据库 前9条
1 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 张琼;陈群秀;;基于最大熵模型的语句自动分类研究[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
3 全昌勤;何婷婷;姬东鸿;;基于义类的无导词义消歧方法的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 刘冬明;杨尔弘;;基于汉英双语平行语料库的词义排歧[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 王萌;何婷婷;王晓荣;;基于hownet概念获取的中文自动文摘系统[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 曲维光;董宇;陈钟;陈小荷;;基于语境计算模型的词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 任函;何婷婷;;大规模在线文本的自动分类研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 张仰森;俞士汶;段惠明;吴云芳;;汉语词义自动标注研究软件平台的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
中国博士学位论文全文数据库 前6条
1 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
2 万国根;面向内容的网络安全监控模型及其关键技术研究[D];电子科技大学;2005年
3 刘少辉;知识发现中粗糙集理论的研究[D];中国科学院研究生院(计算技术研究所);2003年
4 谭建龙;串匹配算法及其在网络内容分析中的应用[D];中国科学院研究生院(计算技术研究所);2003年
5 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
6 夏天;研究性学习支持系统[D];华东师范大学;2007年
中国硕士学位论文全文数据库 前10条
1 刘向辉;专题性智能搜索引擎的研究与实现[D];昆明理工大学;2001年
2 冯元勇;智能搜索器的概念库设计及其文档评价策略[D];中南大学;2002年
3 马丽娜;基于Web的数据挖掘技术研究[D];山东师范大学;2002年
4 宗士强;潜在语义索引在飞机故障案例检索的中应用[D];南京航空航天大学;2003年
5 高雷;网络智能过滤系统的设计与实现[D];广东工业大学;2003年
6 王汉萍;粗糙集理论在文本挖掘的分类算法中的应用研究[D];中国海洋大学;2003年
7 李钝;基于粗糙集理论的文本挖掘技术研究[D];山西大学;2003年
8 于波;中文全文检索技术研究[D];华中师范大学;2003年
9 刘冬明;汉英双语平行语料库中对齐方法的研究[D];山西大学;2004年
10 段建勇;现代汉语词性细分类标注研究[D];山西大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 王凤玲;;基于缩略语分析的中文报道关系识别研究[J];计算机工程;2011年18期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 陈浩;何婷婷;代玲;;基于向量空间模型的无导词义消歧[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 王桐;刘大昕;田迪;孙伟;张万松;;一种改进的XML向量空间模型及其近似匹配算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
3 高勇;荀恩东;宋柔;;构造自然语言问答系统平台[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 喻飞;夏晓燕;吴蓉晖;徐成;;基于向量空间模型的信息安全审计系统[A];第二十六届中国控制会议论文集[C];2007年
5 黄萱菁;夏迎炬;吴立德;;基于向量空间模型的文本过滤系统[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 苏贵洋;王永成;马颖华;;信息自动获取的结构模型[A];第一届学生计算语言学研讨会论文集[C];2002年
7 原福永;杨治秋;王海霞;;一种基于向量空间模型的文档聚类算法研究[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
8 林游龙;余智华;程学旗;刘悦;;虚点:一种减少特征值鸿沟的方法[A];第六届全国信息检索学术会议论文集[C];2010年
9 全昌勤;何婷婷;姬东鸿;;基于义类的无导词义消歧方法的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 廖祝华;刘建勋;易爱平;;基于用户兴趣的Web服务发现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
中国重要报纸全文数据库 前2条
1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
2 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
中国博士学位论文全文数据库 前10条
1 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
2 邢军;领域本体构造中数据源选取及构造方法的研究[D];大连理工大学;2008年
3 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
4 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年
5 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
6 徐婕;基于对等网络的资源搜索策略的研究[D];华中科技大学;2007年
7 王修力;基于描述复杂性的信息检索理论与若干模型研究[D];北京语言大学;2006年
8 王菁;P2P系统中资源管理机制的研究[D];中国科学技术大学;2007年
9 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
10 王小芳;文本主题域划分与无监督特征提取[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 褚金正;面向特定领域的文本识别和分类[D];湖南大学;2005年
2 张波;个性化Web搜索系统研究[D];燕山大学;2006年
3 郭妍;基于市长公开电话文本为背景的两种自动分类算法的比较[D];东北师范大学;2006年
4 董梅;文本内容的信息过滤技术研究[D];合肥工业大学;2006年
5 李洋;企业注册登记文件聚类软件设计与实现[D];大连理工大学;2007年
6 吴新涛;基于向量空间模型的网页信息过滤方法研究[D];大连理工大学;2008年
7 赵博;一种基于关键向量的文本分类模型的研究[D];哈尔滨理工大学;2008年
8 赵文鹏;基于自组织特征映射的海洋文献聚类分析的研究与实现[D];中国海洋大学;2009年
9 赵治军;OAI-PMH中元数据相似度计算的研究与实现[D];太原科技大学;2009年
10 段建勇;现代汉语词性细分类标注研究[D];山西大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026