收藏本站
《第三届学生计算语言学研讨会论文集》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于特征选择和语义扩展的词序列核函数研究

刘克彬  李芳  刘磊  韩颖  
【摘要】:词序列核函数是Convolution核的一种,它处理的对象是离散的词序列。词序列核函数的计算过程不需要显式地构造特征向量,而且具有良好的复合特性,在自然语言处理领域有广泛的应用。传统的词序列核函数没有考虑到语义信息,本文对传统的词序列核函数加入了特征选择和语义扩展,得到一种新的核函数。本文使用该新函数进行实体关系自动抽取的实验, 并与基于特征向量的方法和传统的词序列核函数作了比较。结果证明新函数的效果好于传统的方法,特别是在小规模训练集合上面具有较大的优势。

【共引文献】
中国期刊全文数据库 前3条
1 戴新宇;田宝明;周俊生;陈家骏;;一种基于潜在语义分析和直推式谱图算法的文本分类方法LSASGT[J];电子学报;2008年08期
2 徐超;周一民;沈磊;;一种面向隐含主题的上下文树核[J];电子与信息学报;2010年11期
3 万海平;何华灿;周延泉;;局部核方法及其应用[J];山东大学学报(理学版);2006年03期
中国博士学位论文全文数据库 前10条
1 王颖;乳腺X线图像中肿块的计算机辅助检测与分析[D];西安电子科技大学;2010年
2 赵晖;支持向量机分类方法及其在文本分类中的应用研究[D];大连理工大学;2006年
3 田永鸿;基于上下文的统计关系学习研究[D];中国科学院研究生院(计算技术研究所);2005年
4 王永恒;海量短语信息挖掘技术的研究与实现[D];国防科学技术大学;2006年
5 张博锋;面向内容安全的文本分类研究[D];国防科学技术大学;2007年
6 秦玉平;基于支持向量机的文本分类算法研究[D];大连理工大学;2008年
7 李志圣;单类中心学习及其在二元关系抽取中的应用[D];天津大学;2008年
8 陈海林;基于判别学习的图像目标分类研究[D];中国科学技术大学;2009年
9 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
10 高常鑫;基于上下文的目标检测与识别方法研究[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前9条
1 杨帆;基于前景/背景分割和特征包算法的目标跟踪[D];大连理工大学;2010年
2 张文玲;基于特征联合和多核学习的运动目标跟踪[D];大连理工大学;2010年
3 李阳;最小二乘支持向量机稀疏化算法的改进研究[D];重庆师范大学;2011年
4 张红春;中文维基百科的结构化信息抽取及词语相关度计算[D];华中师范大学;2011年
5 陈琳;基于ML_pLSA模型和特征包算法的目标识别方法[D];大连理工大学;2011年
6 王军;垃圾彩信检索与拦截软件系统的研究与实现[D];电子科技大学;2011年
7 钱升华;基于支持向量机的手机垃圾短信过滤器的研究[D];河北工业大学;2006年
8 田卫辉;基于J2ME的手机垃圾短信过滤器的研究与实现[D];河北工业大学;2007年
9 邢丽莉;基于Web的中文文本分类技术的研究[D];河北工程大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 张榕;;术语定义的聚类研究[J];中国科技术语;2011年01期
2 王东波;;基于规则的单层单标记联合结构自动识别[J];文教资料;2008年09期
3 康恒;梁永强;;面向语义相似度的语义距离计算方法介绍及分析[J];才智;2010年23期
4 陈春明;徐义峰;;一种基于语义度量的知识本体映射方法[J];商场现代化;2008年15期
5 回江月;;特征驱动下的二语习得研究——2009年西方二语习得研究热点述评[J];现代语文(语言研究版);2010年12期
6 艾山·吾买尔;吐尔根·依步拉音;;基于最大熵的维吾尔语句子边界识别模型[J];计算机工程;2010年06期
7 文学志;宣恒农;彭胜;;基于语义相似度的SCORM学习资源整合[J];计算机工程与应用;2006年17期
8 荀恩东;颜伟;;基于语义网计算英语词语相似度[J];情报学报;2006年01期
9 戴曼纯;刘艾娟;;特征理论与二语习得研究——《形式特征在二语习得中的作用》评介[J];外国语(上海外国语大学学报);2009年05期
10 刘华;;基于文本分类中特征提取的领域词语聚类[J];语言文字应用;2007年01期
中国重要会议论文全文数据库 前10条
1 刘克彬;李芳;刘磊;韩颖;;基于特征选择和语义扩展的词序列核函数研究[A];第三届学生计算语言学研讨会论文集[C];2006年
2 郎君;忻舟;秦兵;刘挺;李生;;集成多种背景语义知识的共指消解[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
3 章成志;章成敏;王萍;;基于语义的同义词识别算法研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 章成志;;词语的语义相似度计算及其应用研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
5 朱虹;贾玉祥;刘扬;;基于混合特征的汉语形容词词义区分研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
6 俞士汶;王治敏;朱学锋;;文学语言与自然语言理解研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 余超;蔡东风;张桂平;;词汇语义相似度计算中相关技术的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
8 颜伟;荀恩东;;基于WordNet的英语词语相似度计算[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 刘华;张普;;面向词典编纂的词汇聚类研究[A];2004年辞书与数字化研讨会论文集[C];2004年
10 刘华;周凌燕;张普;;面向词典编撰的词汇聚类研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前1条
1 赵娜;基于知识地图的多领域本体语义互联研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前3条
1 王东波;有标记联合结构的自动识别[D];南京师范大学;2008年
2 刘立;统计中文问句分类研究[D];昆明理工大学;2012年
3 范继花;汉语方位隐喻的认知研究[D];湖南大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026