收藏本站
《第四届全国语言文字应用学术研讨会论文集》2005年
收藏 | 手机打开
二维码
手机客户端打开本文

中文文本自动分词研究述要

陈晓  
【摘要】:正中文信息处理是指:“用计算机对汉语的音、形、义等信息进行处理,包括对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作与加工。”作为中文信息处理对象的汉语本身是一种颇具特色的语言,汉语缺乏形态变化,词本身不能显示与其他词的语法关系;同时汉语对词序要求十分严格,相同
【作者单位】:中国社会科学院研究生院语言文字应用系
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前5条
1 陈小荷;自动分词中未登录词问题的一揽子解决方案[J];语言文字应用;1999年03期
2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
3 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
4 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
5 孙茂松,左正平,邹嘉彦;高频最大交集型歧义切分字段在汉语自动分词中的作用[J];中文信息学报;1999年01期
【共引文献】
中国期刊全文数据库 前10条
1 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
2 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
3 陆俭明;;要重视特征的研究与描写[J];长江学术;2006年01期
4 周蕾;;基于碎片分词的未登录词识别方法[J];常熟理工学院学报;2007年02期
5 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
6 张利;张立勇;张晓淼;耿铁锁;岳宗阁;;基于改进BP网络的中文歧义字段分词方法研究[J];大连理工大学学报;2007年01期
7 于源,衣袭;中文全切分快速分词方法[J];大连铁道学院学报;2005年02期
8 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
9 马颖华,王永成,苏贵洋;一种在汉语文本中抽取重复字串的快速算法[J];电子学报;2002年S1期
10 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
中国重要会议论文全文数据库 前10条
1 周蕾;李培峰;朱巧明;杨季文;;碎片分词与词结合提取的未登录词识别方法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 王慧慧;杨国纬;;基于事例的问答系统研究[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
3 何伟;侯敏;;利用词汇时间分布信息提取未登录词[A];第九届全国人机语音通讯学术会议论文集[C];2007年
4 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 侯敏;;汉语自动分析中的若干问题与对策[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 许超;陈小荷;;试评两种商用机译软件的汉语分析能力[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
8 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 郭志立;;使用互信息辅助在篇章范围内识别命名实体[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 雷静;;汉语机构名的构成模式[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
2 何婷婷;语料库研究[D];华中师范大学;2003年
3 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
4 张蕾;概念结构及其应用[D];西北工业大学;2001年
5 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
6 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
7 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
8 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
9 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
10 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 邹加棋;中文网页自动分类关键技术研究[D];福州大学;2006年
2 陈宣荣;[D];电子科技大学;2003年
3 俞鸿魁;基于层次隐马尔可夫模型的汉语词法分析和命名实体识别技术[D];北京化工大学;2004年
4 肖丹;早期句法发展:儿童早期把字句的个案研究[D];清华大学;2004年
5 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
6 张晗;日文文节切分中的姓名识别[D];大连理工大学;2000年
7 王省;基地统计和规则的中文姓名识别系统的研制[D];大连理工大学;2000年
8 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
9 许勇;基于百科词典的知识获取系统的研究与实现[D];北京工业大学;2001年
10 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
【同被引文献】
中国期刊全文数据库 前4条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 申厚坤;语料库语言学及其应用[J];哈尔滨学院学报;2005年04期
3 殷建平;汉语自动分词方法[J];计算机工程与科学;1998年03期
4 吴中兴,赵克,胡钢伟,许威;概念从属树——一种新的树模型设计[J];计算机应用;2004年S1期
中国重要会议论文全文数据库 前2条
1 颜伟;亢世勇;;基于语料库的现代汉语新词语动词语法特征的研究[A];第一届学生计算语言学研讨会论文集[C];2002年
2 冀铁亮;孙薇薇;穗志方;;语言学与统计方法结合建立汉语动词子类框架类型集[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
2 李国臣,刘开瑛,张永奎;汉语自动分词及歧义组合结构的处理[J];中文信息学报;1988年03期
3 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
4 梁南元;汉语计算机自动分词知识[J];中文信息学报;1990年02期
5 何克抗,徐辉,孙波;书面汉语自动分词专家系统设计原理[J];中文信息学报;1991年02期
6 梁南元,刘源,沈旭昆,谭强,杨铁鹰;制订《信息处理用现代汉语常用词词表》的原则与问题的讨论[J];中文信息学报;1991年03期
7 韩世欣,王开铸;基于短语结构文法的分词研究[J];中文信息学报;1992年03期
8 曹焕光,郑家恒;自动分词软件质量的评价模型[J];中文信息学报;1992年04期
9 徐秉铮,詹剑,贺前华;基于神经网络的分词方法[J];中文信息学报;1993年02期
10 沈达阳,孙茂松,黄昌宁;汉语分词系统中的信息集成和最佳路径搜索方法[J];中文信息学报;1997年02期
【相似文献】
中国期刊全文数据库 前10条
1 高红;黄德根;杨元生;;中文文本中外国人名与中国人名同步识别方法[J];小型微型计算机系统;2006年04期
2 王锡江;王启祥;陈家骏;;基于邻接知识的汉语自动分词系统[J];计算机研究与发展;1992年11期
3 蒋斌;杨超;赵欢;;基于二字词位图表的汉语自动分词词典机制[J];湖南大学学报(自然科学版);2006年01期
4 吴东峥;;基于统计的开放式汉语自动分词[J];福建电脑;2009年03期
5 王希杰;赵晓凡;;浅谈汉语自动分词的几种方法[J];价值工程;2011年13期
6 殷建平;汉语自动分词方法[J];计算机工程与科学;1998年03期
7 陈湘柳;;汉语自动分词理论对英语教学的启示[J];榆林学院学报;2010年01期
8 梁南元;书面汉语自动分词综述[J];计算机应用与软件;1987年03期
9 文庭孝,邱均平,侯经川;汉语自动分词研究展望[J];现代图书情报技术;2004年07期
10 邱均平,文庭孝,周黎明;汉语自动分词与内容分析法研究[J];情报学报;2005年03期
中国重要会议论文全文数据库 前2条
1 费文斌;唐向宏;张宁;王丽娜;;一种基于多音字的中文文本篡改检测水印算法[A];浙江省电子学会2011学术年会论文集[C];2011年
2 文芳;申永军;;基于词语相关度语句信息熵的中文文本零水印设计[A];2011国际信息技术与应用论坛论文集(《计算机科学》2011.7)[C];2011年
中国重要报纸全文数据库 前10条
1 中国社科院法学所研究员 刘仁文;国际公约中文文本的纠错与重译[N];法制日报;2008年
2 吴子桐;整理英文国故,说明真实中国[N];中华读书报;2010年
3 赛迪评测计算机外围设备实验室;支持无线打印[N];中国计算机报;2003年
4 ;健康、成本兼顾[N];中国计算机报;2004年
5 赛迪评测硬件评测事业部计算机外设实验室;“精”工出“细”活[N];中国计算机报;2003年
6 记者 齐泽萍;我省科技之花含苞待放[N];山西经济日报;2002年
7 赛迪评测外设测试实验室;Canonxnu i320喷墨打印机[N];中国计算机报;2002年
8 赛迪评测计算机外围设备实验室;Epson Stylus Photo 915彩色喷墨打印机[N];中国计算机报;2003年
9 ;为专业打印提供更高扩展性[N];中国计算机报;2004年
10 詹亦文;签英文合同谨防陷阱[N];中国改革报;2003年
中国博士学位论文全文数据库 前10条
1 李南希;非特定人的自然书写脱机中文文本行识别[D];华南理工大学;2010年
2 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
3 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
4 徐迎晖;文本载体信息隐藏技术研究[D];北京邮电大学;2006年
5 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
6 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年
7 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
8 徐永东;多文档自动文摘关键技术研究[D];哈尔滨工业大学;2007年
9 赵鹏;复杂网络与互联网个性化信息服务的研究[D];中国科学技术大学;2006年
10 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
中国硕士学位论文全文数据库 前10条
1 党蕾;中文文本多粒度情感分类计算的研究[D];西北大学;2010年
2 孙丽华;中文文本自动分类的研究[D];哈尔滨工程大学;2002年
3 黄文江;中文文本聚类算法分析与研究[D];上海交通大学;2010年
4 许荣荣;中文文本自动分词技术与算法研究[D];郑州大学;2010年
5 许林杰;中文文本分词研究[D];山东师范大学;2003年
6 陈思;中文文本投诉信息自动分类系统研究[D];东北师范大学;2010年
7 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
8 刘卓;基于KNN算法的中文文本自动分类[D];吉林大学;2004年
9 马国俊;潜在语义索引在中文文本聚类中的应用研究[D];西安建筑科技大学;2004年
10 朱红灿;基于SOM的两阶段中文文本聚类算法的研究[D];湘潭大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026