大规模非限定领域汉英双语语料库建设及句子对齐研究
【摘要】:双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。目前国内外已有的双语语料库尤其是汉英双语语料库规模不大,加工规范不统一,没有形成能够公开使用的通用双语语料库。本文工作在国家973子课题支持下,遵循中文语言资源联盟(ChineseLDC)资源共享的宗旨,参照都柏林核元数据元素集制定了双语语料文本标注规范,并对非限定领域双语句子自动对齐技术进行了研究,为大规模建立具有统一标准和规范的、多领域、多体裁、句子级对齐的双语语言信息和知识库奠定了坚实的基础。
【作者单位】:中国科学院自动化研究所模式识别国家重点实验室 中国科学院自动化研究所模式识别国家重点实验室 中国科学院自动化研究所模式识别国家重点实验室
【关键词】:双语语料库 对齐 中文语言资源联盟
【基金】:国家973项目子课题(G1998030501A-06) 国家自然科学基金项目(60272041)资助
【分类号】:TP391.1
【正文快照】:
【关键词】:双语语料库 对齐 中文语言资源联盟
【基金】:国家973项目子课题(G1998030501A-06) 国家自然科学基金项目(60272041)资助
【分类号】:TP391.1
【正文快照】:
1引言 国内外很多研究机构都致力于双语语料库的建设,并利用这些语料库进行广泛的研究。加拿大的议会会议录(Canadian Hansards)是非常著名的英法双语语料库,许多最初的基于双语语料库的研究都是在该语料库基础上进行的‘’1121。有关汉外双语语料库建设及其研究,香港科技大
CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式
| 【引证文献】 | ||
|
|||||||
|
|||||||
|
|||
|
|||
| 【共引文献】 | ||
|
|||||
|
|||||
|
|||||
|
|||||
|
|||
|
|||
|
|||
|
|||
| 【同被引文献】 | ||
|
|||
|
|||
|
|||
|
|||
| 【二级引证文献】 | ||
|
|||
|
|||
|
|||
|
|||
| 【相似文献】 | ||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||
|
|||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
| 相关机构 | ||||||||||||||||||||
|
||||||||||||||||||||
| 相关作者 | ||||||||||||||||||||
|
||||||||||||||||||||



