收藏本站
《自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集》2001年
收藏 | 手机打开
二维码
手机客户端打开本文

汉语词语的两字hash算法

朱晓丹  刁倩  周富秋  
【摘要】:通过首字hash在词典中查找单词是汉语计算中很常用的一种算法,但该方法有明显的缺陷.本文提出两字hash算法,在相同的空间占用下,查找效率有很大的提高,而且hash表大小可以自由设定,可以用在汉语计算的很多领域.

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 徐菁,张辉,陆汝占;汉语语料的切分标注加工系统[J];计算机工程;2003年09期
【参考文献】
中国期刊全文数据库 前5条
1 陈桂林,王永成,韩客松,王刚;一种高效的中文电子词表数据结构[J];计算机研究与发展;2000年01期
2 陈桂林,王永成,韩客松,王刚;一种改进的快速分词算法[J];计算机研究与发展;2000年04期
3 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期
4 陈桂林,王永成;字串去重的快速算法研究[J];情报学报;2000年03期
5 郭祥昊,钟义信,杨丽;基于两字词簇的汉语快速自动分词算法[J];情报学报;1998年05期
【共引文献】
中国期刊全文数据库 前10条
1 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
2 杨树林;基于Web的开放式答疑系统的设计与实现[J];北京印刷学院学报;2005年01期
3 葛宇;梁静;陈晓敏;;搜索引擎系统中热点问题的探讨[J];成都电子机械高等专科学校学报;2009年04期
4 官礼和,杨刚,李永礼;基于词典的法律案例自动归类系统的开发[J];重庆交通学院学报;2004年01期
5 赵春红;高希龙;王柠;赵威;刘国华;;一种应用分治策略的中文分词方法[J];燕山大学学报;2009年05期
6 高洁羽,吕强,杨季文,钱培德;自动分词在输入法测试系统中的应用[J];电化教育研究;2003年02期
7 于源,衣袭;中文全切分快速分词方法[J];大连铁道学院学报;2005年02期
8 李艳欣;;搜索引擎中中文分词的研究[J];电脑知识与技术(学术交流);2007年08期
9 魏晓宁;;基于隐马尔科夫模型的中文分词研究[J];电脑知识与技术(学术交流);2007年21期
10 郭屹;;对中文自动分词机制的研究和改进[J];电脑知识与技术;2008年07期
中国重要会议论文全文数据库 前4条
1 王建民;陈佳鹏;由芳;丁卫彬;;嵌入式电子词典快速查询模型的研究与设计[A];第四届和谐人机环境联合学术会议论文集[C];2008年
2 杨超;李仁发;蒋斌;;一种高效的汉语自动分词词典机制[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 田生伟;吐尔根·依布拉音;禹龙;买合木提·木合买提;艾山·吾买尔;;EBMT中加权的维吾尔单词哈希表构造算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 陈丕海;冯建华;邢春晓;郑晓慧;;SiteSearch的关键技术分析及汉化设计[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
中国博士学位论文全文数据库 前10条
1 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
2 王兰成;基于XMARC信息描述的知识标引与概念检索研究[D];东华大学;2004年
3 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
4 张鹏洲;文语转换系统研究与应用[D];中国科学院研究生院(计算技术研究所);1999年
5 刘少辉;知识发现中粗糙集理论的研究[D];中国科学院研究生院(计算技术研究所);2003年
6 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年
7 钱铁云;关联文本分类关键技术研究[D];华中科技大学;2006年
8 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
9 宣照国;文本挖掘算法及其在知识管理中的应用研究[D];大连理工大学;2008年
10 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
中国硕士学位论文全文数据库 前10条
1 李丹;基于规则与统计的汉语自动分词研究[D];长春工业大学;2010年
2 欧伟强;Web信息挖掘的研究及应用[D];电子科技大学;2010年
3 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年
4 王荔;统计全切分中文分词系统的研究与实现[D];西安电子科技大学;2009年
5 邓科;智能搜索中的中文网页分类研究[D];兰州理工大学;2011年
6 习明;基于WEB的社区智能医疗服务系统的研究[D];吉林农业大学;2011年
7 马东;基于Nutch搜索引擎的中文分词算法研究与实现[D];内蒙古农业大学;2011年
8 雷丰云;智能搜索引擎的理论分析与应用研究[D];中南大学;2007年
9 朱世猛;中文分词算法的研究与实现[D];电子科技大学;2011年
10 罗武;农业知识库知识录入系统关键技术研究与实现[D];湖南农业大学;2011年
【二级引证文献】
中国重要会议论文全文数据库 前1条
1 古丽拉.阿东别克;达吾勒.阿布都哈依尔;;基于规则的哈萨克语词干提取系统的研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前1条
1 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
中国硕士学位论文全文数据库 前5条
1 张春国;工艺语句汉英计算机辅助翻译系统关键技术研究[D];南京航空航天大学;2004年
2 黄鑫;无指导学习下基于修正词频库的分词方法研究[D];重庆大学;2006年
3 贺胜;面向现代汉语文本处理的全文检索、自动分词通用系统[D];南京师范大学;2006年
4 刘春泳;中文问答系统中信息检索模型的研究[D];重庆大学;2007年
5 塔依尔江·苏拉依曼;多语种计算机辅助翻译系统中双向翻译记忆子系统的设计与实现[D];新疆大学;2012年
【二级参考文献】
中国期刊全文数据库 前4条
1 张民,李生,王海峰,赵铁军,王铁志;基于知识评价的快速汉语自动分词系统[J];情报学报;1996年02期
2 苏新宁;汉语词切分标引算法的改进[J];情报学报;1996年06期
3 郭祥昊,钟义信,杨丽;基于两字词簇的汉语快速自动分词算法[J];情报学报;1998年05期
4 姚卿达,杨桂桢,张俊欣;RFN-B~+树索引文件及其有效性[J];软件学报;1998年11期
【相似文献】
中国期刊全文数据库 前10条
1 冯志伟;汉语计算语义学研究的新成果——评《汉语计算语义学——关系、关系义场和形式分析》[J];语言文字应用;1999年02期
2 张虹,程大鲲;乾隆朝“钦定新清语”(三)[J];满语研究;1995年02期
3 信石;;为语文现代化全家奉献力量[J];中文信息;1995年06期
4 双山;满语构词附加成分—rgi探源[J];内蒙古民族大学学报(社会科学版);1997年03期
5 杨宪泽,秦沿海,唐向阳,撒晓英,刘明志;机器翻译中设计的两个算法[J];科技通报;2005年02期
6 ;“综合型语言知识库”获教育部科技进步奖一等奖[J];外语电化教学;2008年04期
7 D·O·朝克;论日本阿夷奴语和满通古斯诸语的有关名词──与社会及生活用品有关的几个名词[J];满语研究;1994年01期
8 ;“综合型语言知识库”获教育部科技进步奖一等奖[J];中文信息学报;2008年03期
9 李德俊;;英汉平行语料库(PECC)建成[J];外语研究;2008年06期
10 冯志伟;汉语形式语法的拓荒之作─—评《汉语形式语法和形式分析》[J];语文建设;1994年07期
中国重要会议论文全文数据库 前1条
1 朱晓丹;刁倩;周富秋;;汉语词语的两字hash算法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国硕士学位论文全文数据库 前1条
1 Duan Hairong;[D];广东外语外贸大学;2001年
中国知网广告投放
相关机构
>英特尔中国研究中心
相关作者
>朱晓丹 >刁倩
>周富秋
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026