期刊库|学位论文库|会议论文库|飞度BOOK|站内搜索注册|充值中心|购买知网卡|送卡上门|帮助中心|
全文文献: “飞度BOOK”首届期刊庙会开幕啦!
做个飞度客,万千杂志,想看就看!
《语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集》 2003年
加入收藏 获取最新

基于《知网》的中文语块抽取器

董强  郝长伶  董振东  
【摘要】:我们根据“中文信息结构”的理论,以《知网》和《知网-中文信息结构库》为主要资源,开发了中文语块抽取器。本文简要的介绍了中文信息结构的理论,重点说明了中文语块抽取器的工作原理、过程、实现方法及其独有的特征。重点包括以下几个方面:切分、组词、消歧和中文语块抽取以及本系统重要的组成部分—信息结构解析器。中文语块抽取器将可用于中文文本的部分分析,计算机辅助的中文语块库的建设,结构和语义消歧,以及将可成为信息抽取(如实体、事件等)的工具。
【作者单位】:中国科学院计算机语言信息工程研究中心 中国科学院计算机语言信息工程研究中心 中国科学院计算机语言信息工程研究中心
【关键词】:语块 语块库 中文语块抽取 知网 知网-中文信息结构库
【分类号】:TP391.1
【正文快照】:
引言语块的辨识、分析、捆绑(chunking)是当前语言技术研究的热点之一。事实证明,不同的语言,有着不同的特点,应该采取不同的技术策略。与印欧语言相比较,中文没有那么丰富的形态变化,中文的词类与句法功能不是一一对应的,中文的词、短语、句子之间的界线是模糊的。鉴于这样
全文下载: CAJ格式 (推荐) PDF格式
不支持迅雷等加速下载工具,请取消加速工具后下载
CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式

【引证文献】
中国期刊全文数据库 前1条
1 冯晋,李春平;基于统计学和语义信息的中文文本主题识别技术[J];清华大学学报(自然科学版);2005年S1期
【共引文献】
中国期刊全文数据库 前10条
1 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
2 胡正微;;人脑输入汉语文本识别分词时的假象分析[J];长沙理工大学学报(社会科学版);2006年03期
3 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
4 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
5 金博,滕弘飞,史彦军,王丹虹;机辅写作:样本库中写作材料检索方法[J];大连理工大学学报;2002年05期
6 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
7 涂云杰;基于规则的汉语短语标注探讨[J];呼伦贝尔学院学报;2002年02期
8 王锡江;王启祥;陈家骏;;基于邻接知识的汉语自动分词系统[J];计算机研究与发展;1992年11期
9 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
10 殷峰,何克抗;语句级拼音┐汉字转换系统的设计与实现[J];计算机研究与发展;1997年05期
中国重要会议论文全文数据库 前7条
1 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 Chunyu Kit;;An Example-based Study on Chinese Word Segmentation Using Critical Fragments[A];Proceedings of the Conference First International Joint Conference on Natural Language Processing[C];2004年
3 李斌;陈小荷;方芳;徐艳华;;高频最大交集型歧义字段问题研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 孙承杰;黄昌宁;关毅;;基于标注语料库的组合歧义检测与消解[A];第三届学生计算语言学研讨会论文集[C];2006年
5 Luning Ji, Qin Lu, Wenjie Li, YiRong Chen The Department of Computing, The Hong Kong Polytechnic University, Hong Kong, China;A Comparative Study of the Effect of Word Segmentation On Chinese Terminology Extraction[A];第20届亚太地区语言、信息和计算国际会议论文集[C];2006年
6 张霄军;董宇;陈小荷;;基于语料考察的“组合型歧义”与“切分变异”辨析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 王跃龙;姬东鸿;;汉语依存图库建设研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 WANG Jiayue;[D];广东外语外贸大学;2003年
2 何婷婷;语料库研究[D];华中师范大学;2003年
3 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
4 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
5 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
6 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
7 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
8 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
9 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
10 黄魏;植物营养诊断自动应答网络专家系统研究[D];华中农业大学;2007年
中国硕士学位论文全文数据库 前10条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
3 黄艳;面向数字化产品的自然语言查询技术的研究与开发[D];浙江大学;2002年
4 缪晓阳;WebCM:一种基于搜索引擎的网络内容监控系统的研究[D];浙江大学;2002年
5 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
6 马东坡;Internet中文智能搜索引擎汉语自动分词系统设计[D];广西师范大学;2002年
7 许林杰;中文文本分词研究[D];山东师范大学;2003年
8 吕继兴;嵌入式系统中汉字的数字输入技术研究[D];河北农业大学;2003年
9 胡蓉;中文Web文档倾向性自动分类研究[D];四川大学;2003年
10 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
【二级引证文献】
中国期刊全文数据库 前1条
1 胡彧;苏雪峰;;特定主题的相关概念挖掘研究与实现[J];电脑开发与应用;2007年02期
中国硕士学位论文全文数据库 前1条
1 李海笃;知识流的价值增值模式研究[D];北京交通大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 姚仲敏;特定网络变量的固定频率[J];齐齐哈尔大学学报;1985年03期
2 R.V.COX;J.M.TRIBOLET;彼呜;;使用TFSP置乱的模拟话音保密系统——全双工和半双工[J];信息安全与通信保密;1985年01期
3 鲁川,梁镇韩;信息处理用规则汉语[J];中文信息学报;1987年04期
4 费奇,蓝红兵;一个用于决策认知过程模拟的专家系统[J];华中科技大学学报(自然科学版);1989年S1期
5 ;微机辅助网络计划分析软件系统CANA-1简介[J];系统工程理论与实践;1989年05期
6 ;《中国科技信息》栏目介绍[J];中国科技信息;1990年14期
7 王慧云,苏文钧;行半不定与互补网络统一的研究[J];电子学报;1992年05期
8 李辰;创建免费个人主页五步曲[J];中国计算机用户;1997年32期
9 ;培训网络插班生[J];每周电脑报;1997年33期
10 ;网路神——免费宣传您的网址[J];网络与信息;1998年12期
中国重要会议论文全文数据库 前10条
1 周强;詹卫东;任海波;;构建大规模的汉语语块库[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 郑旭玲;李堂秋;杨晓峰;陈毅东;;基于语义规则的汉语短语结构分析排歧初探[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 杨晓峰;李堂秋;洪青阳;;汉英机器翻译系统中的一种词义排歧方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 杨尔弘;米丽萍;郝秀兰;;基于《知网》的词义排岐方法[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 鲁川;;信息处理用汉语句子语序的认知研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 赵晨光;蔡东风;;利用语义特征生成搭配[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 董强;郝长伶;董振东;;基于《知网》的中文语块抽取器[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 董强;董振东;;基于知网的相关概念场的构建[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 郝长伶;董强;;知网知识库描述语言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 岑国桢;;青少年网络交友及其心理健康状况的调查[A];中国心理卫生协会第四届学术大会论文汇编[C];2003年
中国重要报纸全文数据库 前10条
1 路华;中华行知网(www.sotrip.com)文化与旅游的契合[N];中国旅游报;2000年
2 记者 徐晋;文化网站又出一批“领头羊”[N];中国文化报;2001年
3 中国软件评测中心 韩龙;企业安全巡警[N];中国计算机报;2001年
4 罗祝顺 特约记者 刘瑛;军民携手守边关[N];战士报;2002年
5 青菁;网络“病”缠住新新人类[N];中国妇女报;2003年
6 黄忠金;关于应对突发事件准备的思考[N];中国国防报;2003年
7 本报记者 征帆;“三一重工”违规销售卧铺客车[N];中国汽车报;2003年
8 重庆 袁华;慎开时间同步服务[N];电脑报;2003年
9 楚杰;“五·一”假期信息网上查[N];中国电脑教育报;2003年
10 王俊;四川旅游步入电子商务时代[N];经理日报;2003年
中国博士学位论文全文数据库 前1条
1 景东升;基于本体的地理空间信息语义表达和服务研究[D];中国科学院研究生院(遥感应用研究所);2005年
中国硕士学位论文全文数据库 前10条
1 陈毅东;汉英机器翻译系统英文生成中的一种选词模型研究[D];厦门大学;2002年
2 何旭良;非英语专业本科生英语作文选词策略分析[D];陕西师范大学;2002年
3 郭萍;哈代小说的戏剧特征[D];华中师范大学;2002年
4 王萍;词汇短语在英语阅读教学中的应用[D];西北师范大学;2003年
5 刘斌;关于言语交际的话语标记分析[D];上海师范大学;2004年
6 刘冬明;汉英双语平行语料库中对齐方法的研究[D];山西大学;2004年
7 刘沛富;预制语言与语言教学[D];吉林大学;2004年
8 于继明;MOTE无线感知网络的研究与实现[D];南京理工大学;2004年
9 张滨;中文文档分类技术研究[D];武汉大学;2004年
10 耿春霞;基于机械设计领域的汉语句法分析研究[D];西安电子科技大学;2004年
关于知网|版权声明|学术会议服务|广告服务|在线咨询
京ICP证040431号互联网出版许可证新出网证(京)字008号北京市公安局海淀分局备案号:110 1081725
订购咨询热线:800-810-6613、010-62985026免费送卡上门
主办:清华大学
数字出版:中国学术期刊电子杂志社
在线发行:同方知网(北京)技术有限公司
关 闭
关 闭
关 闭