收藏本站
《语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

双语语料库段落重组对齐方法研究

李维刚  刘挺  王震  李生  
【摘要】:网络上存在的大量双语资源,给构建大规模双语语料库提供了可能。双语对齐作为语料库加工过程中的关键技术,已经引起研究者的高度重视。针对目前可收集到的双语资源大都没有做到段落对齐,本文结合基于句子长度和基于词典的两种经典对齐算法思想,充分利用双语文本中的句子在整个文本中的位置信息,在(1:1)型句珠里选取锚点,并根据双语文本特征引入一部双语词典进行校验,从而获得分段的锚点,实现通用的段落重组对齐。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李维刚;刘挺;张宇;李生;;基于长度和位置信息的双语句子对齐方法[J];哈尔滨工业大学学报;2006年05期
2 刘昕,周明,朱胜火,黄昌宁;基于自动抽取词汇信息的双语句子对齐[J];计算机学报;1998年S1期
3 李文刚;周杰;杨保群;;基于词典和句长及位置的双语对齐方法的改进[J];现代电子技术;2011年14期
4 庆明;禁止图片随段落移动[J];中国会计电算化;2004年02期
5 魏君;中文字表编辑软件CCED 5.O[J];电脑知识与技术;1996年04期
6 汤淡宁;Word捷径精选[J];电脑爱好者;1998年13期
7 徐文荣;格式、样式与模板[J];中国金融电脑;1997年07期
8 王长胜,刘群;双语语料库的检索和管理[J];计算机工程与应用;2002年07期
9 常宝宝,詹卫东,张华瑞;面向汉英机器翻译的双语语料库的建设及其管理[J];术语标准化与信息技术;2003年01期
10 宋冰;李锡祚;安纪霞;;双语对齐技术在双语教学词典自动编纂中的应用[J];计算机与数字工程;2007年11期
11 田生伟;吐尔根·依布拉音;禹龙;加米拉·吾守尔;杨飞宇;;多策略汉维句子对齐[J];计算机科学;2010年04期
12 赵芳婷;余正涛;线岩团;郭剑毅;毛存礼;候波;;纳-汉双语语料库构建及双语语料对齐[J];广西师范大学学报(自然科学版);2009年01期
13 黄新艳,姚文琳,徐建良;基于汉英双语语料库的汉英Ontology的建立与管理[J];仪器仪表学报;2005年S2期
14 热西旦木·塔依;吐尔根·依布拉音;;汉文-维吾尔文句子对齐模型的XML标记规范[J];伊犁师范学院学报(自然科学版);2007年02期
15 李英;吐尔根·依布拉音;;双语句子对齐算法分析[J];现代计算机(专业版);2008年12期
16 王占军;姚卫东;;一种汉英双语句子自动对齐算法[J];计算机仿真;2009年02期
17 王丽;韩习武;;双语词典在统计机器翻译中的应用[J];计算机工程与应用;2010年16期
18 吕雅娟,李生,赵铁军;基于双语模型的汉语句法分析知识自动获取[J];计算机学报;2003年01期
19 谭勋;吐尔根·依布拉音;艾山·吾买尔;艾山·毛力尼亚孜;;汉维哈柯双语语料库加工系统句子对齐技术的研究[J];电脑知识与技术;2011年28期
20 田生伟;吐尔根·依布拉音;禹龙;;混合策略的汉维句子对齐[J];计算机工程与应用;2010年34期
中国重要会议论文全文数据库 前10条
1 李维刚;刘挺;王震;李生;;双语语料库段落重组对齐方法研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 刘非凡;赵军;徐波;;大规模非限定领域汉英双语语料库建设及句子对齐研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 揭春雨;刘晓月;冼景炬;卫真道;;从网络获取香港法律双语语料库[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 黄新艳;姚文琳;徐建良;;基于汉英双语语料库的汉英Ontology的建立与管理[A];第七届青年学术会议论文集[C];2005年
5 热西旦·塔依;加米拉·吾守尔;吐尔根·依布拉音;;汉文-维吾尔文双语对齐语料库的实验性研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
6 张孝飞;代六玲;黄河燕;陈肇雄;;跨语言信息检索中查询关键词翻译转换算法[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
7 谭咏梅;王枞;王小捷;钟义信;;基于实例的机器辅助写作翻译系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
8 周威;万康;刘志杰;;英汉双语自动对齐混合算法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 乌达巴拉;敖其尔;;蒙英翻译片段对的自动抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 李怡平;吴飞;;多语言环境下的分布式互联网分词平台[A];第十六届全国数据库学术会议论文集[C];1999年
中国重要报纸全文数据库 前10条
1 小渔;WPS中如何快速消除硬回车[N];中国电脑教育报;2004年
2 舍利子;网页制作中的段落缩进[N];电脑报;2002年
3 向德海;技巧回音壁[N];电脑报;2004年
4 胡涌;PHOTOSHOP6.0路径的应用技巧[N];中国包装报;2002年
5 舒洁;规范写公文[N];中国电脑教育报;2003年
6 北京 李健民;学用Word的格式[N];电脑报;2002年
7 千千;就是玩“虚”的[N];中国电脑教育报;2004年
8 王琳;巧用“样式”编辑Word文档[N];中国电脑教育报;2004年
9 北京西客站100055信箱1009分箱(100055) 王英红;WPS 2000中的目录提取技巧[N];计算机世界;2001年
10 阿馨娜尔;绘制个性化脸谱[N];中国电脑教育报;2003年
中国博士学位论文全文数据库 前10条
1 刘东飞;智能双语搜索方法及搜索引擎的研究[D];武汉理工大学;2009年
2 黎新;面向问答系统的段落检索技术研究[D];中国科学技术大学;2010年
3 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
4 刘鹏远;基于知识自动获取的无指导译文消歧方法研究[D];哈尔滨工业大学;2008年
5 方淼;语义单元自动获取研究[D];大连理工大学;2008年
6 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
7 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
8 王斌;汉英双语语料库自动对齐研究[D];中国科学院研究生院(计算技术研究所);1999年
9 于瑞国;维数约减算法研究及其在大规模文本数据挖掘中的应用[D];天津大学;2008年
10 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 林巍;段落检索系统及其应用的研究[D];哈尔滨工业大学;2010年
2 牛洪梅;服务于汉维机器翻译系统的双语句子对齐的研究[D];新疆大学;2007年
3 庞珊娜;基于Web的双语资源信息抽取研究[D];天津大学;2008年
4 周蓝海;多策略英汉词对齐技术的研究[D];沈阳航空工业学院;2009年
5 王飞;多语种双语对齐平台的设计与实现[D];南京理工大学;2004年
6 毕雪华;汉维双语语料库中句子对齐技术的研究[D];新疆大学;2006年
7 热西旦;汉文—维吾尔文双语语料库构建的实验性研究[D];新疆大学;2007年
8 周星;双语辅助翻译搜索引擎若干问题研究[D];武汉理工大学;2009年
9 祝志杰;IHSMTS中汉英双语句子对齐机制的设计与实现[D];南京理工大学;2002年
10 陈相;面向生物医学领域的双语对齐技术研究[D];大连理工大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978