收藏本站
《中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

一种结合分类模型的中文输入法

张玮  孙乐  冯元勇  吕元华  
【摘要】:中文输入法是中文信息处理的基础软件。本文针对现有输入法很少考虑利用候选词语本身特性来进行排序的情况,给出了将输入法词库进行类别标注以及在输入法系统中集成分类引擎的方法,提高和当前输入内容相关的候选词权重。首先给出了语言模型在拼音输入法的基本应用;然后详细的给出了最大熵分类模型的原理及其和拼音输入法的结合;最后通过对比使用分类属性词库系统和不使用分类属性词库系统的实验, 给出了分类对输入法系统的影响,实验结果表明类别划分和分类对提高输入法的效率有积极的作用。

【参考文献】
中国期刊全文数据库 前3条
1 徐志明,王晓龙,姜守旭;一种语句级汉字输入技术的研究[J];高技术通讯;2000年01期
2 黄昌宁;统计语言模型能做什么?[J];语言文字应用;2002年01期
3 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
【共引文献】
中国期刊全文数据库 前10条
1 李良炎,何中市,易勇;基于词联接的语义表示方法和知识库建设[J];重庆大学学报(自然科学版);2004年04期
2 尚文倩;黄厚宽;刘玉玲;林永民;瞿有利;董红斌;;文本分类中基于基尼指数的特征选择算法研究[J];计算机研究与发展;2006年10期
3 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期
4 赵正文;康耀红;;统计语言模型在信息检索中的应用[J];计算机工程与应用;2006年36期
5 贾宁;;使用概念基元特征进行自动文本分类[J];计算机工程与应用;2007年01期
6 王源媛;何中市;;基于词性探测的中文姓名识别算法[J];计算机科学;2005年04期
7 曾华琳,李堂秋,史晓东;一种基于提取上下文信息的分词算法[J];计算机应用;2005年09期
8 崔彩霞;王素格;;基于粗集的支持向量机文本分类方法研究[J];科技广场;2006年08期
9 顾平;朱巧明;李培峰;钱培德;;智能型汉字数码输入技术的研究[J];中文信息学报;2006年04期
10 孙景广;蔡东风;吕德新;董燕举;;基于知网的中文问题自动分类[J];中文信息学报;2007年01期
中国重要会议论文全文数据库 前8条
1 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 陈毅东;李堂秋;郑旭玲;;融合理性主义方法和经验主义方法的思路初探——汉英机器翻译系统英文生成选词模型的设计[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
3 王洁;荀恩东;宋柔;;兼类词排歧的一种方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 谷波;刘开瑛;;决策树模型和最大熵模型在文本分类中的比较研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 王洁;荀恩东;罗智勇;宋柔;;现代汉语多音词自动标音研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 李军辉;朱巧明;李培峰;;一个基于最大熵模型的文本分类方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
7 王素格;张武;李德玉;杨军玲;彭其伟;;基于最大熵模型的汉语动词与动词搭配识别[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 蔡勋梁;赵军;;信息检索中基于MLS的语言模型准确性分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
2 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
3 何婷婷;语料库研究[D];华中师范大学;2003年
4 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
5 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
6 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
7 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
8 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
9 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
10 孟静;光学层析图像的重建技术研究[D];苏州大学;2006年
中国硕士学位论文全文数据库 前10条
1 吕继兴;嵌入式系统中汉字的数字输入技术研究[D];河北农业大学;2003年
2 宋礼鹏;大规模语料库分词质量评价方法研究[D];山西大学;2004年
3 李海霞;基于自然语言的图像数据库检索技术研究[D];山东师范大学;2004年
4 王志勇;基于统计语言学模型的中文文本信息检索[D];第二军医大学;2004年
5 王源媛;中文未登录名词短语的识别方法研究[D];重庆大学;2004年
6 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
7 刘江;大规模汉语语料库分词一致性检验技术研究[D];山西大学;2005年
8 崔彩霞;基于支持向量机的文本分类方法研究[D];山西大学;2005年
9 顾平;一种智能型数码输入技术的研究与设计[D];苏州大学;2005年
10 戴石麟;汉字编码输入法研究[D];重庆大学;2005年
【二级参考文献】
中国期刊全文数据库 前2条
1 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
2 黄昌宁;关于处理大规模真实文本的谈话[J];语言文字应用;1993年02期
【相似文献】
中国期刊全文数据库 前10条
1 胡莉;;中文“词”的语言模型识别研究方法综述[J];北方文学(下半月);2011年03期
2 杨撼岳;陈笑蓉;郑高山;;水族文字笔形编码方法研究[J];计算机工程;2011年14期
3 彭成;季培培;;基于确定性退火的中文术语语义层次关联研究[J];计算机应用研究;2011年09期
4 屈克文;石奋苏;;基于Qt/E4和SQLite3的嵌入式中文输入法的设计[J];计算机应用;2011年S1期
5 张野;杨建林;;基于KNN和SVM的中文文本自动分类研究[J];情报科学;2011年09期
6 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
7 张锐;;MOTO加微软 摩托罗拉MP×200购机手记[J];无线互联科技;2005年01期
8 黑莓时光;;PlayBook三人行[J];移动信息;2011年07期
9 顾潇华;姜亦强;崔涛;;中文自动标引、全文检索及中文搜索引擎三者关系的探讨[J];图书馆学研究;2011年17期
10 张尊生;;《信息技术 信息交换用汉字编码字符集 基本集的扩充》和《信息技术 数字键盘汉字输入通用要求》国家标准发布[J];中国标准导报;2000年03期
中国重要会议论文全文数据库 前10条
1 许丹青;刘奕群;岑荣伟;马少平;茹立云;杨磊;;基于日志分析的中文输入法用户行为研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 麦世基;;旨在中文输入法的国际化 《华升码》(第二版)[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
3 张玮;孙乐;冯元勇;吕元华;;一种结合分类模型的中文输入法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
5 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
6 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
7 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
9 曾养志;曾巍;曾嵘;;最新一代中文输入法-汉字词语码编码技术[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
10 黄金富;;中文输入法的“傻瓜”境界——《智能手机码》简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 ;形形色色的中文输入法[N];中国信息报;2000年
2 ;不同手机中文输入法大比拼[N];中国质量报;2000年
3 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
4 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
5 王立建;手机中文输入法亟待规范[N];光明日报;2003年
6 倪光南;活力重现的中文信息处理[N];计算机世界;2001年
7 齐悦;速记界泰斗唐亚伟 获中文信息处理领域最高科技奖[N];中国质量报;2006年
8 侯涛;国内手机中文输入法期待突破[N];中国电子报;2005年
9 侯涛;手机中文输入法成为用户“关切之最”[N];通信产业报;2005年
10 电脑虎;指尖流彩——中文输入法[N];中国电脑教育报;2005年
中国博士学位论文全文数据库 前10条
1 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
2 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
3 周卫华;面向中文信息处理的现代汉语动宾语义搭配研究[D];华中师范大学;2007年
4 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
5 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
6 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年
7 何灿群;基于拇指操作的中文手机键盘布局的工效学研究[D];浙江大学;2009年
8 陈慧;基于DCC动态流通语料库的中文组织名考察与研究[D];北京语言大学;2008年
9 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
10 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
中国硕士学位论文全文数据库 前10条
1 陶东成;基于Linux和XIM协议的中文输入法服务器的实现及其应用[D];苏州大学;2004年
2 罗忠毅;数字化中医古籍的理想模式及其相关问题研究[D];成都中医药大学;2005年
3 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
4 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年
5 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
6 白晓梅;校园网中文搜索引掣系统的设计与实现[D];吉林大学;2006年
7 曹林峰;中文文字差错率统计软件的实现[D];西安电子科技大学;2007年
8 刘桂梅;周有光语文改革思想研究[D];山东师范大学;2005年
9 张玉华;基于码本的输入法评测系统的设计和实现[D];苏州大学;2005年
10 杜莹;汉字语法语义智能输入法核心算法及实现技术[D];河南大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026