收藏本站
《语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集》2003年
收藏 | 手机打开
二维码
手机客户端打开本文

基于《知网》的中文语块抽取器

董强  郝长伶  董振东  
【摘要】:我们根据“中文信息结构”的理论,以《知网》和《知网-中文信息结构库》为主要资源,开发了中文语块抽取器。本文简要的介绍了中文信息结构的理论,重点说明了中文语块抽取器的工作原理、过程、实现方法及其独有的特征。重点包括以下几个方面:切分、组词、消歧和中文语块抽取以及本系统重要的组成部分—信息结构解析器。中文语块抽取器将可用于中文文本的部分分析,计算机辅助的中文语块库的建设,结构和语义消歧,以及将可成为信息抽取(如实体、事件等)的工具。

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 梁南元;书面汉语自动分词系统—CDWS[J];中文信息学报;1987年02期
2 周强,张伟,俞士汶;汉语树库的构建[J];中文信息学报;1997年04期
3 刘开瑛;歧义切分与专有名词识别软件[J];语言文字应用;2001年03期
【共引文献】
中国期刊全文数据库 前10条
1 胡锡衡;;正向最大匹配法在中文分词技术中的应用[J];鞍山师范学院学报;2008年02期
2 李国和;刘光胜;吴卫江;孙红军;唐先明;韩宝东;;基于最大匹配和歧义检测的中文分词粗分方法[J];北京信息科技大学学报(自然科学版);2010年S2期
3 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
4 高东平;;基于类型论的汉语分词系统TTCS[J];重庆理工大学学报(社会科学);2011年08期
5 胡正微;;人脑输入汉语文本识别分词时的假象分析[J];长沙理工大学学报(社会科学版);2006年03期
6 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
7 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
8 王跃龙;姬东鸿;;汉语树库综述[J];当代语言学;2009年01期
9 金博,滕弘飞,史彦军,王丹虹;机辅写作:样本库中写作材料检索方法[J];大连理工大学学报;2002年05期
10 梁晓弘;杨文安;;分词技术在信息处理中的研究综述[J];电脑知识与技术(学术交流);2007年22期
中国重要会议论文全文数据库 前7条
1 李艳娇;杨尔弘;;树库中的歧义组合考察[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
3 李斌;陈小荷;方芳;徐艳华;;高频最大交集型歧义字段问题研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 孙承杰;黄昌宁;关毅;;基于标注语料库的组合歧义检测与消解[A];第三届学生计算语言学研讨会论文集[C];2006年
5 张霄军;董宇;陈小荷;;基于语料考察的“组合型歧义”与“切分变异”辨析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 高松;赵怿怡;刘海涛;;汉语特殊结构的句法标注策略[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 阿布都热依木·热合曼;艾山·吾买尔;吐尔根·依布拉音;帕里旦·吐尔逊;哈里旦木·阿布都克里木;;维吾尔语句法树库标注体系[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 WANG Jiayue;[D];广东外语外贸大学;2003年
2 何婷婷;语料库研究[D];华中师范大学;2003年
3 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
4 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
5 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
6 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
7 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
8 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
9 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
10 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
中国硕士学位论文全文数据库 前10条
1 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
2 王有权;基于Web的智能答疑技术研究与实现[D];南京财经大学;2010年
3 巫昌凯;企业知识库系统中复杂查询系统的设计与实现[D];华南理工大学;2010年
4 李丹;基于规则与统计的汉语自动分词研究[D];长春工业大学;2010年
5 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年
6 杨伟;基于数据库的自然语言查询技术研究与实现[D];西安电子科技大学;2010年
7 兰冲;基于统计规则的中文分词研究[D];西安电子科技大学;2011年
8 王荔;统计全切分中文分词系统的研究与实现[D];西安电子科技大学;2009年
9 宋贵哲;汉语介词短语识别研究[D];大连理工大学;2011年
10 王询;面向航运领域的文本分类系统[D];大连海事大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 程葳,赵军,徐波,刘非凡;一种面向汉英口语翻译的双语语块处理方法[J];中文信息学报;2003年02期
2 刘冬明,杨尔弘;一种新的双语语块对应算法[J];电脑开发与应用;2004年03期
3 刘建舟;刘晓华;;主观题自动批改技术的研究[J];湖北工业大学学报;2006年04期
4 姜吉发;一种跨语句汉语事件信息抽取方法[J];计算机工程;2005年02期
5 唐歆瑜;乐文忠;李志成;李军义;;基于知网语义相似度计算的特征降维方法研究[J];科学技术与工程;2006年21期
6 周粉;夏幼明;;一种改进的基于知网的语义相似度计算方法[J];云南大学学报(自然科学版);2008年S2期
7 柴晓丽;张丽伟;管玉玲;;基于HowNet自动文摘的研究[J];电脑编程技巧与维护;2009年S1期
8 周俏丽;蔡东风;吕德新;朱江涛;吴英泽;;基于语义相似度的句法歧义结构消解[J];沈阳航空工业学院学报;2006年01期
9 姜东洋;;中文问答系统中问题理解的研究[J];电脑知识与技术;2008年05期
10 杨喜权;代书;;基于知网的概念匹配细粒度化研究[J];计算机应用;2008年11期
中国重要会议论文全文数据库 前10条
1 董强;郝长伶;董振东;;基于《知网》的中文语块抽取器[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 郝长伶;董强;;知网知识库描述语言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 骆正华;;基于E-Chunk问句实例库问答系统的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 董强;董振东;;基于知网的相关概念场的构建[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 杨尔弘;米丽萍;郝秀兰;;基于《知网》的词义排岐方法[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 白宇;蔡东风;赵环宇;季铎;;基于语义计算的中文相似问句抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 陈慧清;林世平;;基于知网和模式自举的概念间分类关系获取方法[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
8 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 乔林;黄维通;孟威;;一种改进的知网系统词语相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 廖光忠;黄泽鑫;;基于HowNet语义算法的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
中国重要报纸全文数据库 前10条
1 高向东;千家数字图书馆对接“中国知网”数字出版平台[N];山西日报;2007年
2 陈磊;“中国知网”数字出版平台及数字图书馆建馆系统启动[N];科技日报;2007年
3 李蒙生;数据管理年会落下帷幕 同方知网软件喜获殊荣[N];中国电脑教育报;2007年
4 张驰;发改委启动金宏工程清华同方知网担负研发重任[N];中国高新技术产业导报;2007年
5 记者 陈香;清华同方将推个人“知识超市”服务[N];中华读书报;2007年
6 冯文礼;创新业态 加快向数字出版转型[N];中国新闻出版报;2008年
7 张翠侠;优化教学模式 改变学习方式[N];中国图书商报;2006年
8 ;革历史数据的命[N];计算机世界;2004年
9 早报记者 陈斯斯 实习生 周雅涵;毕业临近论文检测软件热卖[N];东方早报;2011年
10 本报记者;山西科普惠农数字图书馆开通[N];山西日报;2011年
中国博士学位论文全文数据库 前6条
1 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
2 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
3 景东升;基于本体的地理空间信息语义表达和服务研究[D];中国科学院研究生院(遥感应用研究所);2005年
4 郭鸿志;多源语义知识库融合方法研究[D];哈尔滨工业大学;2011年
5 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
6 张韬政;结构学习中的辅助问题研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 王呈艳;基于规则抽取的汉语语块识别[D];河北大学;2011年
2 石凯华;基于领域词典的汉语语块分析的研究[D];南京邮电大学;2011年
3 王萌;基于概念向量空间模型的中文自动文摘研究[D];华中师范大学;2005年
4 张静静;基于知网文本相似度的文摘自动评测方法研究[D];中国石油大学;2011年
5 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
6 孟静;面向句法分析的语块划分体系的研究[D];山西大学;2005年
7 柴晓丽;自动文摘技术的研究与应用[D];长春理工大学;2007年
8 苗雪雷;基于条件随机场的汉语词义消歧方法研究[D];沈阳航空工业学院;2007年
9 周美希;汉语语句组块及消歧的研究与实现[D];电子科技大学;2005年
10 卢冶;基于概念扩充和综合评价的中文自动文摘研究[D];大连理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026