收藏本站
《第一届学生计算语言学研讨会论文集》2002年
收藏 | 手机打开
二维码
手机客户端打开本文

中文信息处理开放平台的设计

刘群  张浩  白硕  
【摘要】:我国的自然语言处理研究,在很大程度上处于一种低水平重复状态,由于缺乏一些公共的基础设施,很多研究工作都要花费大量的精力从底层模块做起,造成研究工作难以深入。本文提出,可以将开放式的开发模式应用于自然语言处理领域,并给出了一个面向中文的自然语言处理开放平台的设计。这个平台能够共享代码、语料、语言知识库等资源,并支持协作开发。这个平台的上层管理采用项目方式,实现了资源的重复利用。随着参与者的增多,和项目的发展,这个平台一定会为中文信息处理提供大量的资源。

手机知网App
【引证文献】
中国重要会议论文全文数据库 前1条
1 胡凤国;;基于Web检索的语料库资源共享—现状和展望[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前1条
1 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
中国硕士学位论文全文数据库 前1条
1 秦健;N-gram技术在中文词法分析中的应用研究[D];中国海洋大学;2009年
【参考文献】
中国期刊全文数据库 前2条
1 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
2 白硕,张浩;角色反演算法[J];软件学报;2003年03期
【共引文献】
中国期刊全文数据库 前10条
1 耿增民;刘万春;朱玉文;;受限领域的自动文摘方法研究[J];北京理工大学学报;2006年08期
2 李六杏;区凤霞;;基于最优属性约简的中文邮件过滤系统[J];电脑知识与技术(学术交流);2007年05期
3 魏晓宁;;基于隐马尔科夫模型的中文分词研究[J];电脑知识与技术(学术交流);2007年21期
4 张磊;张代远;;中文分词算法解析[J];电脑知识与技术;2009年01期
5 陈文君;於文雪;;汉英跨语言检索系统中关键词提取方法的研究[J];电脑知识与技术;2009年28期
6 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
7 冯永;贺迅;唐黎;陈显勇;陈贞;;面向文本知识管理的自适应中文分词算法[J];重庆大学学报;2010年10期
8 王坚,赵恒永;专业搜索引擎中文分词算法的实现与研究[J];福建电脑;2005年07期
9 刘延华;林嘉雯;;基于贝叶斯算法的中文邮件过滤系统设计[J];福建电脑;2009年11期
10 岑咏华;;一种基于多重哈希词典和K-最短路径算法的中文粗分词方案研究[J];情报理论与实践;2009年03期
中国重要会议论文全文数据库 前10条
1 沈焕生;朱磊;;基于信息内容的关键词抽取研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
2 朱春江;陆宇旻;李陶深;杜衡斌;唐晟;;分布式网络监控系统中网页安全挖掘的研究[A];广西计算机学会2008年年会论文集[C];2008年
3 邓攀;刘功申;;基于标引信息的网络新概念发现算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
4 张浩;刘群;白硕;;结构上下文相关的概率句法分析[A];第一届学生计算语言学研讨会论文集[C];2002年
5 白硕;程学旗;郭莉;王斌;余智华;刘群;;大规模内容计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 李斌;;中文单字国名简称的自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 林小俊;田浩;王馨浩;杜蕴璇;许敏;吴玺宏;迟惠生;;语言模型训练语料处理方法及解码词典的设计[A];第八届全国人机语音通讯学术会议论文集[C];2005年
8 何中军;刘群;林守勋;;统计机器翻译中短语切分的新方法[A];第三届学生计算语言学研讨会论文集[C];2006年
9 陈晓苏;邹园斌;张文珂;;全切分图与路径表达式在分词算法中的应用[A];第三届学生计算语言学研讨会论文集[C];2006年
10 朱鉴;张建;李淼;强静;杨攀;;面向民族语言信息处理的汉语分词方法[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 刘运通;产品设计过程知识配送服务关键技术研究[D];浙江大学;2011年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
4 王燚;基于场景化知识表示的自然语言处理及其在自动文本校对中的应用[D];西南交通大学;2005年
5 赵章界;短语结构制导的范畴表达式演算[D];中国科学院研究生院(计算技术研究所);2006年
6 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
7 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
8 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
9 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
10 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
2 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年
3 陈旭;地理编码引擎的设计与实现[D];辽宁工程技术大学;2009年
4 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
5 常富国;高技术虚拟企业谈判支持问题处理系统研究[D];哈尔滨理工大学;2010年
6 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
7 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年
8 兰冲;基于统计规则的中文分词研究[D];西安电子科技大学;2011年
9 李长进;基于中文带权关键词树的受限领域问答系统研究[D];山东经济学院;2011年
10 林冬盛;中文分词算法的研究与实现[D];西北大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;文本内容主题的识别方法[J];东北大学学报;2002年05期
2 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
3 王建新;索引软件:语料库语言学的有力工具[J];当代语言学;1998年01期
4 侯汉清,薛鹏军;基于知识库的网页自动标引和自动分类系统的设计[J];大学图书馆学报;2004年01期
5 王显芳,杜利民;利用覆盖歧义检测法和统计语言模型进行汉语自动分词[J];电子与信息学报;2003年09期
6 史磊,王永成;英文文献自动摘要系统的研制与开发[J];高技术通讯;1999年11期
7 卢志茂,刘挺,张刚,李生;基于依存分析改进贝叶斯模型的词义消歧[J];高技术通讯;2003年05期
8 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
9 靳从,樊春丽,杨静宇;主题词自动标引中的知识处理方法[J];情报理论与实践;1996年02期
10 韩客松,王永成;中文全文标引的主题词标引和主题概念标引方法[J];情报学报;2001年02期
中国重要报纸全文数据库 前1条
1 江苏 曹春华;[N];电脑报;2003年
中国博士学位论文全文数据库 前1条
1 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
【二级引证文献】
中国期刊全文数据库 前2条
1 王圆;孙铁利;李杨;;Web文本挖掘中的特征表示和特征提取[J];电脑知识与技术;2006年14期
2 刘博;杨柳;袁方;;改进的KNN方法及其在中文文本分类中的应用[J];西华大学学报(自然科学版);2008年02期
中国重要会议论文全文数据库 前2条
1 胡凤国;邹煜;;传媒语音语料库系统的设计与开发[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 章红英;刘宁;李文刚;马赟;张宝文;陈婷;史青;王于英;;对古代医学文献评价方法的思考[A];全国第十一届中医医史文献学术研讨会论文集[C];2008年
中国博士学位论文全文数据库 前4条
1 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
2 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
3 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
4 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
中国硕士学位论文全文数据库 前10条
1 尹丽玲;基于人工免疫算法的Web文本挖掘研究[D];哈尔滨工程大学;2010年
2 付红艳;Web多文档自动文摘研究[D];哈尔滨工程大学;2010年
3 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
4 刘海涛;基于自然语言理解的中文搜索引擎[D];河北科技大学;2011年
5 陈飞;聚类搜索引擎关键技术的研究[D];北京邮电大学;2011年
6 许芳芳;基于DBSCAN优化算法的Web文本聚类研究[D];华东师范大学;2011年
7 高明;基于支持向量机的Web文本分类研究[D];华中师范大学;2011年
8 许婷;面向中文信息处理的复句特征分析器的研究与实现[D];华中师范大学;2011年
9 裴运亮;基于切词和语义的中文相似度研究与应用[D];电子科技大学;2011年
10 奚婷;搜索引擎结果的聚类系统研究[D];西南交通大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 王红;;数字图书馆中开放源码应用的商业模式[J];山西科技;2010年01期
2 ;Red Hat投资Mozilla[J];每周电脑报;1999年49期
3 赵振勇;宗长荣;;开放源码在电子政务安全中的应用[J];电脑知识与技术;2008年22期
4 杨学卿;;利用Moodle平台构建网上在线考试系统[J];考试周刊;2007年41期
5 ;Apache走上“正路”——软件基金会使Apache进入正规化开发轨道[J];每周电脑报;1999年26期
6 孙玉芳;开放源码运动与中国系统软件发展的机遇[J];科技和产业;2002年02期
7 侯捷;;上穷碧落下黄泉 源码追踪经验谈(上)[J];程序员;2002年04期
8 赵双萍;丁源明;何辉;;开源技术在专科层次开放式网络教学中的应用研究[J];中国远程教育;2007年03期
9 ;微软也“开放”?[J];每周电脑报;1999年15期
10 陈定权;莫秀娟;;OpenAPI及其在数字图书馆中的应用[J];图书馆论坛;2009年01期
中国重要会议论文全文数据库 前10条
1 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
2 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年
6 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
8 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
9 张玥杰;徐智婷;钱晶;张涛;;自然语言处理中专名识别方法的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
10 冯元勇;孙乐;张大鲲;李文波;;基于单字提示特征的中文命名实体识别快速算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 ;开放源码项目Bug重重[N];网络世界;2008年
2 EnterpriseDB亚太区总裁 Roger Durn;开源数据库:兼容是关键[N];中国计算机报;2007年
3 周游 编译;开源“力”大无穷[N];计算机世界;2006年
4 《计算机世界》方案评析实验室 邓健;“开源”挺进主流应用[N];计算机世界;2006年
5 信息产业部软件与集成电路促进中心 陈伟博士;走出开放源码的误区[N];中国计算机报;2005年
6 本报记者 贾婧;开源创新扬帆国产电子政务软件[N];科技日报;2006年
7 义川;Linux无级增速[N];网络世界;2006年
8 本报记者  贾婧;开源社区让软件价低好使[N];科技日报;2007年
9 ;2007年Linux之进程[N];网络世界;2007年
10 本报记者  贾婧;“一站式”开源门户:传播信息成果的金桥[N];科技日报;2007年
中国博士学位论文全文数据库 前10条
1 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
2 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
3 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
4 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
5 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
6 方宁;基于认知的文本语境生成和度量研究[D];上海大学;2009年
7 王燚;基于场景化知识表示的自然语言处理及其在自动文本校对中的应用[D];西南交通大学;2005年
8 赵林;面向查询的多文档自动文摘关键技术研究[D];复旦大学;2008年
9 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
10 杜永萍;基于模式知识库的问题回答关键技术研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
2 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
3 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
4 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
5 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
6 张学;EBMT系统中翻译模板的抽取与匹配[D];大连理工大学;2006年
7 巩晓婷;基于文本的信息隐藏技术研究[D];福州大学;2006年
8 陈频;中文科技论文文本分类研究[D];厦门大学;2006年
9 李江;自然语言编程研究[D];北京邮电大学;2008年
10 张磊;基于最大熵模型的汉语词性标注研究[D];大连理工大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026