基于《知网》的中文语块抽取器
【摘要】:我们根据“中文信息结构”的理论,以《知网》和《知网-中文信息结构库》为主要资源,开发了中文语块抽取器。本文简要的介绍了中文信息结构的理论,重点说明了中文语块抽取器的工作原理、过程、实现方法及其独有的特征。重点包括以下几个方面:切分、组词、消歧和中文语块抽取以及本系统重要的组成部分—信息结构解析器。中文语块抽取器将可用于中文文本的部分分析,计算机辅助的中文语块库的建设,结构和语义消歧,以及将可成为信息抽取(如实体、事件等)的工具。
|
|
|
|
| 1 |
周强;詹卫东;任海波;;构建大规模的汉语语块库[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年 |
| 2 |
郑旭玲;李堂秋;杨晓峰;陈毅东;;基于语义规则的汉语短语结构分析排歧初探[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年 |
| 3 |
杨晓峰;李堂秋;洪青阳;;汉英机器翻译系统中的一种词义排歧方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年 |
| 4 |
杨尔弘;米丽萍;郝秀兰;;基于《知网》的词义排岐方法[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年 |
| 5 |
鲁川;;信息处理用汉语句子语序的认知研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年 |
| 6 |
赵晨光;蔡东风;;利用语义特征生成搭配[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年 |
| 7 |
董强;郝长伶;董振东;;基于《知网》的中文语块抽取器[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年 |
| 8 |
董强;董振东;;基于知网的相关概念场的构建[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年 |
| 9 |
郝长伶;董强;;知网知识库描述语言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年 |
| 10 |
岑国桢;;青少年网络交友及其心理健康状况的调查[A];中国心理卫生协会第四届学术大会论文汇编[C];2003年 |
|