收藏本站
《第三届全国信息检索与内容安全学术会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

一种自适应字长的中文词库的构建方法

王启户  詹海生  周水生  
【摘要】:中文搜索引擎中的词库是提高文本信息存储与查找效率的关键。本文以异或哈希算法为基础,根据对不同字长词出现概率的统计结果,利用词条的机内编码和汉字笔画数,把不同字长的词散列到不同的哈希值区间,从而将哈希值的冲突率降低到0.034%,进一步提高了查找效率。文中大规模动态词库的建立方法可用于计算机语料库建设和中文输入法等自然语言处理过程。

手机知网App
【参考文献】
中国期刊全文数据库 前4条
1 林亚平;异或哈希算法查找中文词组性能评价[J];湖南大学学报;1994年05期
2 吕学强,苏祺,孙斌,俞士汶;搜索引擎用短语词典建设[J];清华大学学报(自然科学版);2005年S1期
3 周建钦,马述杰,李进忠;关于汉字的两个分组查找算法[J];中文信息学报;1995年02期
4 吴骏;对汉字排序和查找方法探讨[J];安徽大学学报(自然科学版);1996年02期
【共引文献】
中国期刊全文数据库 前2条
1 王忠效,范植华;汉字异或动态散列分组查找算法[J];中文信息学报;1998年04期
2 路志英,林孔元,郭祺,段广玉;中文切分词典的最大匹配索引法[J];天津大学学报(自然科学与工程技术版);1999年05期
中国重要会议论文全文数据库 前1条
1 穆飞;李维佳;薛巍;舒继武;;一种分布式信息检索系统的设计与实现[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
中国硕士学位论文全文数据库 前1条
1 公茂财;列车轴温探测系统数据处理算法及实现[D];西安电子科技大学;2005年
【二级参考文献】
中国期刊全文数据库 前3条
1 张钟澍,全大克;汉字词组的快速排序研究[J];中文信息学报;1991年01期
2 张钟澍;中文词组的快速查找算法[J];中文信息学报;1992年01期
3 吕强,钱培德;基于词组的智能化汉字输入系统CIIIS/2的设计[J];中文信息学报;1992年01期
【相似文献】
中国期刊全文数据库 前10条
1 任秀丽,全成斌,范力军,栾贵兴;蓝牙安全中链接密钥改进的一种新机制[J];东北大学学报(自然科学版);2003年05期
2 刘大昕,杨小平,王桐;一种增强的动态口令认证机制[J];应用科技;2004年01期
3 张旺光,庄毅;M+树:一种新型、高效的动态哈希算法[J];计算机工程;2004年16期
4 程晓玲;;基于PKI的数字签名技术在电子商务安全保密系统中的应用[J];咸宁学院学报;2005年06期
5 张新林;;不可逆的密码生成法[J];福建电脑;2006年06期
6 章韵;潘强;;一种基于SIP代理服务器的事务匹配算法研究[J];大众科技;2008年02期
7 庞广乾;;一种基于哈希函数链的组群通信密钥分发机制[J];电脑知识与技术;2008年33期
8 肖频;;基于哈希算法的Web入侵检测系统[J];电脑编程技巧与维护;2009年08期
9 付国庆,戴勇;密码的分析与安全策略[J];现代电子技术;2004年17期
10 邵祖华;;对“一个可变换限制验证人签名协议”的评论(英文)[J];浙江科技学院学报;2006年04期
中国重要会议论文全文数据库 前10条
1 王启户;詹海生;周水生;;一种自适应字长的中文词库的构建方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 张雪松;崔维力;李昕;赫枫龄;左万利;;基于多层哈希函数的软件水印[A];第四届中国软件工程大会论文集[C];2007年
3 张键红;冀承;;两种基于离散对数的盲签名方案[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 史亚维;张茹;杨义先;钮心忻;;一种改进的用于GIF图像的脆弱水印算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
5 王春厚;许都;孙健;;一种降低误判率的BF快速匹配算法结构[A];2010年全国通信安全学术会议论文集[C];2010年
6 张一桢;金澈清;胡颢继;周傲英;;BFSQ:处理空间成员查询的方法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
7 赵婷;王健;;基于Hash函数的RFID动态认证协议[A];2010年全国通信安全学术会议论文集[C];2010年
8 蒋昱城;周健;;基于d-Left Counter Bloom Filter的深度包检测[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
9 阳德青;钱卫宁;周傲英;;对等计算系统中基于内容的XML数据分发技术[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
10 张指浩;王建民;张勇;李德毅;;向关系数据库嵌入版权人水印信息[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国重要报纸全文数据库 前1条
1 上海交通大学金桥网络工程中心 李振武 白英彩;影响Internet未来的对等网络(P2P)[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 罗宜元;对称密码和哈希函数的结构化分析[D];上海交通大学;2013年
2 钟锦敏;基于中间相遇的哈希函数原像攻击[D];上海交通大学;2011年
3 李志敏;哈希函数设计与分析[D];北京邮电大学;2009年
4 彭艳兵;TCP宏观平衡性研究[D];东南大学;2006年
5 李奕男;Ad Hoc网络门限身份认证方案及入侵检测模型研究[D];吉林大学;2010年
6 张鹏;关于多方安全协议的研究[D];浙江大学;2006年
7 李岳楠;视频信息内容管理关键问题研究[D];哈尔滨工业大学;2010年
8 曹张华;网络编码中的保密通信[D];扬州大学;2010年
9 顾洁;面向无线社区的身份认证及密钥管理技术研究[D];上海交通大学;2012年
10 曹玉东;图像检索中的特征表示和索引方法的研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 苏云玲;基于分组密码的增量哈希函数的设计与分析[D];昆明理工大学;2011年
2 肖夏雯;基于信源概率分布的加密哈希函数设计[D];南昌大学;2012年
3 李达;基于混沌映射的哈希函数分析与构造[D];北京邮电大学;2011年
4 葛颖彦;哈希函数的碰撞对问答认证协议的安全性影响[D];上海交通大学;2010年
5 霍甲;新一代哈希函数FPGA设计实现[D];北京邮电大学;2011年
6 赵丽;一种基于高效模式匹配算法的入侵检测系统[D];山西大学;2005年
7 冯书;即时消息交换体系结构及其关键技术研究[D];华东师范大学;2006年
8 王晓东;超伪随机置换的构造及安全性证明[D];中国人民解放军信息工程大学;2005年
9 宫会杰;安全电子公文系统在PKI中的设计与实现[D];山东大学;2008年
10 贾学芳;JIFEX中工程数据库管理系统的设计与实现[D];大连理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026