【摘要】:网络上存在的大量双语资源,给构建大规模双语语料库提供了可能。双语对齐作为语料库加工过程中的关键技术,已经引起研究者的高度重视。针对目前可收集到的双语资源大都没有做到段落对齐,本文结合基于句子长度和基于词典的两种经典对齐算法思想,充分利用双语文本中的句子在整个文本中的位置信息,在(1:1)型句珠里选取锚点,并根据双语文本特征引入一部双语词典进行校验,从而获得分段的锚点,实现通用的段落重组对齐。
|
|
|
|
1 |
李维刚;刘挺;张宇;李生;;基于长度和位置信息的双语句子对齐方法[J];哈尔滨工业大学学报;2006年05期 |
2 |
刘昕,周明,朱胜火,黄昌宁;基于自动抽取词汇信息的双语句子对齐[J];计算机学报;1998年S1期 |
3 |
李文刚;周杰;杨保群;;基于词典和句长及位置的双语对齐方法的改进[J];现代电子技术;2011年14期 |
4 |
庆明;禁止图片随段落移动[J];中国会计电算化;2004年02期 |
5 |
魏君;中文字表编辑软件CCED 5.O[J];电脑知识与技术;1996年04期 |
6 |
汤淡宁;Word捷径精选[J];电脑爱好者;1998年13期 |
7 |
徐文荣;格式、样式与模板[J];中国金融电脑;1997年07期 |
8 |
王长胜,刘群;双语语料库的检索和管理[J];计算机工程与应用;2002年07期 |
9 |
常宝宝,詹卫东,张华瑞;面向汉英机器翻译的双语语料库的建设及其管理[J];术语标准化与信息技术;2003年01期 |
10 |
宋冰;李锡祚;安纪霞;;双语对齐技术在双语教学词典自动编纂中的应用[J];计算机与数字工程;2007年11期 |
11 |
田生伟;吐尔根·依布拉音;禹龙;加米拉·吾守尔;杨飞宇;;多策略汉维句子对齐[J];计算机科学;2010年04期 |
12 |
赵芳婷;余正涛;线岩团;郭剑毅;毛存礼;候波;;纳-汉双语语料库构建及双语语料对齐[J];广西师范大学学报(自然科学版);2009年01期 |
13 |
黄新艳,姚文琳,徐建良;基于汉英双语语料库的汉英Ontology的建立与管理[J];仪器仪表学报;2005年S2期 |
14 |
热西旦木·塔依;吐尔根·依布拉音;;汉文-维吾尔文句子对齐模型的XML标记规范[J];伊犁师范学院学报(自然科学版);2007年02期 |
15 |
李英;吐尔根·依布拉音;;双语句子对齐算法分析[J];现代计算机(专业版);2008年12期 |
16 |
王占军;姚卫东;;一种汉英双语句子自动对齐算法[J];计算机仿真;2009年02期 |
17 |
王丽;韩习武;;双语词典在统计机器翻译中的应用[J];计算机工程与应用;2010年16期 |
18 |
吕雅娟,李生,赵铁军;基于双语模型的汉语句法分析知识自动获取[J];计算机学报;2003年01期 |
19 |
谭勋;吐尔根·依布拉音;艾山·吾买尔;艾山·毛力尼亚孜;;汉维哈柯双语语料库加工系统句子对齐技术的研究[J];电脑知识与技术;2011年28期 |
20 |
田生伟;吐尔根·依布拉音;禹龙;;混合策略的汉维句子对齐[J];计算机工程与应用;2010年34期 |
|