收藏本站
《第三届全国信息检索与内容安全学术会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

自然语言中的对象及其处理

钟茂生  
【摘要】:自然语言处理(Natural Language Processing,简称 NLP)研究的核心问题就是为机器构造自然语言的语言模型,由于自然语言的非结构化和开放性的特点,传统的规则型语言模型和基于统计的语言模型很难单独解决 NLP 中面临的问题。本文从对象的视角为自然语言建立语言模型,主要思想是:对自然语言中的字、词、句、篇章和文档等看成是粒度不同的对象类, 并根据基本的语法规则总结得到这些对象类的基本属性特征,而每个特定对象则基于语料库用统计方法统计其在上下文中特定的使用方法并作为该对象的扩展特征,这样可以将规则方法和统计方法较好的结合起来,并用统一的方法对各类对象进行分析处理,试图为 NLP 提供一种新的解决方案。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 冯志伟;自然语言处理的学科定位[J];解放军外国语学院学报;2005年03期
【共引文献】
中国期刊全文数据库 前10条
1 王挺;麦范金;刘忠;;自然语言处理及其应用前景的研究[J];桂林航天工业高等专科学校学报;2006年04期
2 冯志伟;;当前自然语言处理发展的几个特点[J];暨南大学华文学院学报;2006年01期
3 钟彬彬,刘远超,徐志明;基于GA的文本子主题切分中的参数优化研究[J];计算机工程与应用;2005年21期
4 陈天莹;陈蓉;潘璐璐;李红军;于中华;;基于前后文n-gram模型的古汉语句子切分[J];计算机工程;2007年03期
5 谈文蓉;符红光;刘莉;杨宪泽;;一种基于贝叶斯分类与机读词典的多义词排歧方法[J];计算机应用;2006年06期
6 张映海;何中市;陈永锋;;搜索引擎结果中Web文档的排序研究[J];计算机与数字工程;2007年02期
7 谷波;李济洪;刘开瑛;;基于COSA算法的中文文本聚类[J];中文信息学报;2007年06期
8 娜步青;;基于统计的蒙汉机器翻译系统研究[J];内蒙古农业大学学报(社会科学版);2006年02期
9 刘传汉;王永成;刘德荣;王志琪;;利用分割技术提高对话文本自动摘要的一致性[J];上海交通大学学报;2007年08期
10 谈文蓉;;汉英机器翻译系统中统计消歧的多步策略[J];西南民族大学学报(自然科学版);2006年01期
中国重要会议论文全文数据库 前8条
1 Na YE Jingbo ZHU Haitao LUO Huizhen WANG Bin ZHANG Natural Language Processing Laboratory, Institute of Computer Software and Theory Institute of Computer Applications;Improvement of the Dotplotting Method for Linear Text Segmentation[A];Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering[C];2005年
2 罗海涛;叶娜;朱靖波;;Dotplotting文本分割技术的分析与改进[A];第三届学生计算语言学研讨会论文集[C];2006年
3 邹红建;杨尔弘;;面向对外汉语报刊教学的文本难易度分类[A];第三届学生计算语言学研讨会论文集[C];2006年
4 金东日;;在朝汉机器翻译上出现转换的难点[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 陈毅恒;秦兵;刘挺;林建国;李生;;基于错误预测的文本分类方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 朱海军;张桂平;蔡东风;王炜华;;科技论文的标题识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 钟茂生;;文本主题分割技术的研究进展[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 王智超;季铎;蔡东风;张桂平;;文本聚类中基于知网的特征抽取方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 郑义;多媒体信息自动摘要及其相关技术研究[D];复旦大学;2003年
2 陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;2003年
3 秦莉娟;基于内容的自动视频监控研究[D];浙江大学;2006年
4 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
5 雷震;基于事件的新闻报道分析技术研究[D];国防科学技术大学;2006年
6 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
7 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
8 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
9 何琳;古农学本体的半自动构建及检索研究[D];南京农业大学;2007年
10 孙凌云;面向产品概念设计的专利地图技术研究[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
2 刘江;大规模汉语语料库分词一致性检验技术研究[D];山西大学;2005年
3 常兴治;基于全局评价的文本分割技术研究[D];东北大学;2005年
4 顾平;一种智能型数码输入技术的研究与设计[D];苏州大学;2005年
5 李春亮;广告视频探测技术研究[D];国防科学技术大学;2004年
6 赵城利;基于Web的信息智能感知技术及应用[D];国防科学技术大学;2004年
7 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
8 郭妍;基于市长公开电话文本为背景的两种自动分类算法的比较[D];东北师范大学;2006年
9 杨军玲;汉语动词词语搭配自动获取方法研究[D];山西大学;2006年
10 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 丁华福,李毅,尚福华;机器翻译质量自动评价的实践[J];黑龙江工程学院学报;2002年03期
2 曲卫民,张俊林,孙乐,孙玉芳;基于记忆的自适应汉语语言模型的研究[J];中文信息学报;2003年05期
3 黎志升;王煦法;;基于Language Model的地理信息检索模型(英文)[J];中国科学技术大学学报;2010年02期
4 张建平;语音识别与理解的语言统计模型和搜索算法[J];电子商务;1999年09期
5 黄顺珍,方棣棠;利用语言模型实现音字转换的高效解码算法[J];深圳大学学报(理工版);2000年04期
6 申广忠;;蒙古语语音识别系统语言模型的设计[J];微计算机信息;2007年12期
7 侯宏旭;刘群;刘志文;张国强;;Skip-N蒙古文统计语言模型[J];内蒙古大学学报(自然科学版);2008年02期
8 刘加,潘胜昔,江金涛,胡凯军,王作英;用 TMS320C31 实时实现电话语音识别系统[J];清华大学学报(自然科学版);1998年09期
9 刘建成;蒋新华;吴今培;;应用改进型微粒群算法优化语言模型[J];小型微型计算机系统;2006年12期
10 韩中元;李生;齐浩亮;杨沐昀;;面向信息检索的近邻语言模型[J];中文信息学报;2011年01期
中国重要会议论文全文数据库 前10条
1 钟茂生;;自然语言中的对象及其处理[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 陈振标;徐波;;限定领域的语言模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
3 付晓寅;魏玮;徐波;;一种基于状态转移的N元语言模型快速查询方法[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
4 韩中元;李生;杨沐昀;齐浩亮;;面向信息检索的近邻语言模型[A];第六届全国信息检索学术会议论文集[C];2010年
5 奚宁;赵迎功;汤光超;李斌;罗春勇;戴新宇;陈家骏;;统计机器翻译中多种语言模型的融合[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
6 努尔艾力·喀迪尔;彭良瑞;;基于SRILM的阿拉伯和维吾尔文语言模型建立方法[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 林红;胡欣;;最大熵模型的应用[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“地球气候和环境系统的探测与研究”分会论文集[C];2003年
8 苏韬;汪俊杰;孙甲松;王作英;;基于最大似然估计的语言模型自适应[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 任纪生;王作英;赵敏;;基于潜在语义信息的汉语语音识别方法[A];中文信息处理技术研讨会论文集[C];2004年
10 张建平;庹凌云;孙宝海;汪俊杰;刘建;颜永红;;LVCSR系统中语言模型的参数选择与性能评测[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
中国重要报纸全文数据库 前10条
1 清华大学 刘加;识别语音的几种依据[N];计算机世界;2006年
2 闫宏志;全文翻译技术发展脉络[N];中国计算机报;2003年
3 清华大学 刘加;语音识别应用促进技术发展[N];计算机世界;2006年
4 何中军米海涛 刘群;统计机器翻译系统中的开源软件[N];计算机世界;2007年
5 本报记者 刘洪宇;当机器听懂了我们的声音[N];辽宁日报;2008年
6 郝亭;软件是怎样“炼”成的[N];工人日报;2000年
7 中科院计算技术研究所 吕雅娟付雷 黄瑾 何中军 刘群;化繁为简的统计机器翻译技术[N];中国计算机报;2007年
8 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
9 北京清华大学电子工程系副教授 刘加 教授 刘润生;让机器听懂我的话[N];科技日报;2001年
10 石天强;“凡客体”中的资本欲望[N];中国教育报;2010年
中国博士学位论文全文数据库 前10条
1 张俊林;基于语言模型的信息检索系统研究[D];中国科学院研究生院(软件研究所);2004年
2 包铁;网络数据采集处理方法及形式化研究[D];吉林大学;2007年
3 肖镜辉;非时齐语言建模技术研究及实践[D];哈尔滨工业大学;2007年
4 刘鹏远;基于知识自动获取的无指导译文消歧方法研究[D];哈尔滨工业大学;2008年
5 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
6 王欢良;基于混淆网络和辅助信息的语音识别技术研究[D];哈尔滨工业大学;2007年
7 胡熠;面向信息检索的文本内容分析[D];上海交通大学;2007年
8 蒲强;基于独立分量分析的语义聚类技术在信息检索中的应用研究[D];电子科技大学;2010年
9 方淼;语义单元自动获取研究[D];大连理工大学;2008年
10 欧阳继红;时空推理中一些问题的研究[D];吉林大学;2005年
中国硕士学位论文全文数据库 前10条
1 张润延;海量语言模型的研究及其在机器翻译中的应用[D];厦门大学;2009年
2 李新生;基于改进语言模型的相关反馈方法的检索系统设计[D];北京邮电大学;2011年
3 刘盈;大词表连续语音识别系统的研究与实现[D];清华大学;2005年
4 汤小娜;词义消歧在统计机器翻译中的应用研究[D];厦门大学;2007年
5 沈默;平板电脑上语言模型的开发与测试[D];清华大学;2005年
6 梁奇;语言模型自适应方法在嵌入式系统中应用的研究[D];清华大学;2006年
7 唐永明;基于关联词的复句语言模型[D];北京邮电大学;2009年
8 刘春泳;中文问答系统中信息检索模型的研究[D];重庆大学;2007年
9 康恺;定题信息检索关键技术研究[D];厦门大学;2007年
10 王银丽;限定领域内智能问答系统的研究与实现[D];内蒙古大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026