收藏本站
《第四届全国学生计算语言学研讨会会议论文集》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于双语平行语料的分层次命名实体抽取

庞薇  徐波  
【摘要】:本文设计实现了一种基于多模型分层次的从双语语料库中抽取命名实体对的方法。我们首先对命名实体识别。然后分层次抽取命名实体。第一层通过双语识别信息和对齐技术,利用意译模型和音译模型打分得到短命名实体。第二层用规则的方法合并短命名实体生成长命名实体对。实验显示,双语识别信息和对齐技术对于短命名实体的抽取效果很好,针对长命名实体抽取问题的合并规则也能在一定程度上抽取出长命名实体。

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 葛金虎;;基于条件随机场的中文命名实体识别的研究[J];科技信息;2010年16期
2 阳爱民,彭富春;无词典的中文文档集特征词抽取方法[J];中国包装工业;2002年06期
3 李中言,李普跃;信息抽取方法综述[J];廊坊师范学院学报;2005年03期
4 李斌;;基于DTS组件编程实现对文本数据的灵活抽取[J];计算机时代;2007年06期
5 刘海鹏;王小捷;;基于条件随机场和知识库的手机短信命名实体识别[J];广西师范大学学报(自然科学版);2009年01期
6 李桂兰;余正涛;毛存礼;郭剑毅;侯波;线岩团;;旅游领域实体答案的抽取[J];广西师范大学学报(自然科学版);2009年01期
7 佘俊;张学清;;音乐命名实体识别方法[J];计算机应用;2010年11期
8 金明;杨欢欢;单广荣;;藏语命名实体识别研究[J];西北民族大学学报(自然科学版);2010年03期
9 邱莎;;几种基于机器学习的生物命名实体识别模型比较[J];电脑知识与技术(学术交流);2007年05期
10 陈艾东;张路桥;甘刚;;RSS元数据的信息抽取集成技术[J];微处理机;2007年03期
中国重要会议论文全文数据库 前10条
1 庞薇;徐波;;基于双语平行语料的分层次命名实体抽取[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
3 李渝勤;孙丽华;;面向互联网舆情的热词分析技术[A];第六届全国信息检索学术会议论文集[C];2010年
4 张佳宝;周斌;吴泉源;;基于Hadoop的并行化命名实体识别技术研究与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
5 齐振宇;赵军;杨帆;;一种开放式中文命名实体识别的新方法[A];第五届全国信息检索学术会议论文集[C];2009年
6 翟海军;郭嘉丰;王小磊;许洪波;;基于用户查询日志的命名实体挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
9 李彦鹏;杨志豪;林鸿飞;;基于条件随机域的生物医学命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
10 徐薇;付滨;刘柳;苑春法;李文捷;;中文命名实体识别系统的领域扩展[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 江会星;汉语命名实体识别研究[D];北京邮电大学;2012年
2 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
3 李彦鹏;特征耦合泛化及其在文体挖掘中的应用[D];大连理工大学;2011年
4 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
5 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
6 杨志豪;面向生物医学领域的文本挖掘技术研究[D];大连理工大学;2008年
7 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
8 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年
9 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
10 刘玉玲;自然语言信息隐藏研究[D];湖南大学;2008年
中国硕士学位论文全文数据库 前10条
1 周昆;基于规则的命名实体识别研究[D];合肥工业大学;2010年
2 陈扬;基于命名实体识别的学科智能答疑模型研究[D];东北师范大学;2010年
3 王江伟;基于最大熵模型的中文命名实体识别[D];南京理工大学;2005年
4 张晓艳;基于混合统计模型的汉语命名实体识别方法的研究与实现[D];国防科学技术大学;2004年
5 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
6 陈禹;基于语篇的中文命名实体识别研究[D];厦门大学;2008年
7 俞鸿魁;基于层次隐马尔可夫模型的汉语词法分析和命名实体识别技术[D];北京化工大学;2004年
8 任登君;面向机器学习方法的命名实体识别[D];东北大学;2005年
9 郭家清;基于条件随机场的命名实体识别研究[D];沈阳航空工业学院;2007年
10 赵琳瑛;基于隐马尔科夫模型的中文命名实体识别研究[D];西安电子科技大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026