收藏本站
《少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

维、哈、柯文搜索引擎中自动分类技术的应用研究

王珍  维尼拉·木沙江  赵丽红  
【摘要】:本文在传统搜索引擎基础上,结合网页自动分类技术,对基于分类的维、哈、柯多语种信息检索进行了研究。文中提出了一种改进的特征选择算法,并建立了一个维吾尔文网页分类系统,搜集了大量的维文语料进行分类实验。结果表明,使用改进的特征选择方法能够有效提高分类的准确度。最后,将网页分类技术运用到维、哈、柯文搜索引擎中,实现了具有自动分类功能的多语种信息检索系统。

【参考文献】
中国期刊全文数据库 前5条
1 古丽拉·阿东别克,米吉提·阿布力米提;维吾尔语词切分方法初探[J];中文信息学报;2004年06期
2 曹树金,杨涛;自动分类在搜索引擎性能优化中的应用[J];情报科学;2004年02期
3 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
4 张玉芳;彭时名;吕佳;;基于文本分类TFIDF方法的改进与应用[J];计算机工程;2006年19期
5 徐凤亚,罗振声;文本自动分类中特征权重算法的改进研究[J];计算机工程与应用;2005年01期
【共引文献】
中国期刊全文数据库 前10条
1 李文斌;刘椿年;陈嶷瑛;;基于特征信息增益权重的文本分类算法[J];北京工业大学学报;2006年05期
2 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
3 刘梦燕;;搜索引擎分类体系及其性能优化初探[J];高校图书馆工作;2006年02期
4 鲁明羽,张红,付克明,陆玉昌;Web ME——一个大型网络挖掘环境系统[J];哈尔滨工业大学学报;2004年09期
5 刘涛,吴功宜,陈正;一种高效的用于文本聚类的无监督特征选择算法[J];计算机研究与发展;2005年03期
6 尚文倩;黄厚宽;刘玉玲;林永民;瞿有利;董红斌;;文本分类中基于基尼指数的特征选择算法研究[J];计算机研究与发展;2006年10期
7 古丽拉·阿东别克,艾尔肯·伊米尔;维吾尔文校对中常见错误分析[J];计算机工程与应用;2005年27期
8 石志伟,刘涛,吴功宜;一种快速高效的文本分类方法[J];计算机工程与应用;2005年29期
9 李国臣,段建勇;基于语法语义信息量化模型的语素字再分类[J];计算机工程;2004年11期
10 杨广翔,俞宁,谌莉;搜索引擎结果的重排序方法[J];计算机应用;2005年02期
中国重要会议论文全文数据库 前6条
1 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 维尼拉·木沙江;吴俊森;吐尔根·依布拉音;;维吾尔文搜索引擎的倒排索引设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
3 吐尔地·托合提;维尼拉·木沙江;米吉提·阿不里米提;;维吾尔文搜索引擎Web Server的实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
4 米吉提·阿不里米提;艾斯卡尔·艾木都拉;吐尔地·托合提;;维语词法分析器研究开发[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;基于Web的民文信息检索中维、哈、柯文关键词的预处理[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
6 赵燕平;李超;;网络安全信息挖掘中的特征选择与专利分析研究[A];2004年中国管理科学学术会议论文集[C];2004年
中国博士学位论文全文数据库 前9条
1 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
2 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年
3 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
4 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
5 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
6 席运江;组织知识的网络表示模型及分析方法[D];大连理工大学;2007年
7 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
8 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
9 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
中国硕士学位论文全文数据库 前10条
1 胡蓉;中文Web文档倾向性自动分类研究[D];四川大学;2003年
2 翟静;可扩展的文本分类系统的核心API的设计与实现[D];四川大学;2003年
3 刘钢;基于神经网络的文本分类系统NNTCS的设计和实现[D];中国科学院研究生院(软件研究所);2003年
4 段建勇;现代汉语词性细分类标注研究[D];山西大学;2004年
5 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
6 吴福英;面向用户的信息过滤研究与实现[D];江西师范大学;2004年
7 万中英;基于投影寻踪中文网页自动分类[D];江西师范大学;2004年
8 吴艳玲;基于SVM的网页分类器的研究[D];吉林大学;2004年
9 吴娟;军用信息自动分类的研究与实现[D];南京理工大学;2004年
10 张红霞;渐进式中文文本分类技术研究[D];河北大学;2004年
【二级参考文献】
中国期刊全文数据库 前10条
1 丁璇,侯汉清,章成志;中文网页标引源主题表达能力的调查统计[J];大学图书馆学报;2002年06期
2 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
3 陶跃华,陈丽萍,王泳;聚类分析在搜索引擎中的应用[J];计算机工程与应用;2003年21期
4 康平波,王文杰;基于自动分类的搜索引擎过滤系统[J];计算机工程;2004年02期
5 殷建平;汉语自动分词方法[J];计算机工程与科学;1998年03期
6 李晓黎,刘继敏,史忠植;基于支持向量机与无监督聚类相结合的中文网页分类器[J];计算机学报;2001年01期
7 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
8 刘少辉,董明楷,张海俊,李蓉,史忠植;一种基于向量空间模型的多层次文本分类方法[J];中文信息学报;2002年03期
9 刘斌,黄铁军,程军,高文;一种新的基于统计的自动文本分类方法[J];中文信息学报;2002年06期
10 古丽拉·阿东别克,米吉提·阿布力米提;维吾尔语词切分方法初探[J];中文信息学报;2004年06期
中国博士学位论文全文数据库 前1条
1 张伟;基于WWW的聚类引擎研究[D];重庆大学;2003年
中国硕士学位论文全文数据库 前1条
1 陈晓平;WWW上搜索引擎返回结果的模糊聚类研究[D];河海大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 许扣锁;;简单的力量[J];文苑;2011年09期
2 刘华金;;农产品销售中网络搜索引擎技术的研究与分析[J];农业考古;2011年03期
3 姜维群;;我们只会选择了吗[J];杂文选刊(职场版);2008年04期
4 ;李彦宏12年创业路[J];新经济;2011年05期
5 ;搜索让我们了解更多……[J];男生女生(金版);2006年03期
6 佚名;;2008山寨雷人之举[J];杂文选刊(中旬版);2009年02期
7 梁小华;;徐静蕾 美女、才女、老徐[J];黄金时代;2006年07期
8 黄卫峰;;卡梅隆·迪亚兹:最危险的“网络名人”[J];第二课堂(高中);2011年05期
9 曹鹏程;;新媒体时代守候报纸的“再生”[J];文艺争鸣;2011年14期
10 王莉莉;;《牛津高中英语》模块七Unit 3的Project教学设计与反思[J];英语新世纪;2011年03期
中国重要会议论文全文数据库 前10条
1 王珍;维尼拉·木沙江;赵丽红;;维、哈、柯文搜索引擎中自动分类技术的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
2 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
3 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
4 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
6 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
7 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
8 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
9 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
10 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
中国重要报纸全文数据库 前10条
1 主持人 陈建栋;搜索引擎能帮企业做什么[N];光明日报;2005年
2 本报记者 陈建栋;搜索引擎掀起第三次网络浪潮[N];光明日报;2005年
3 曾正乐;搜索引擎为啥那么热[N];经济日报;2005年
4 本报记者 秦海波;今夏搜索引擎最热[N];经济日报;2005年
5 FN记者 柳立;我国搜索引擎市场竞争格局初步确定[N];金融时报;2005年
6 闫辉;搜索引擎猜想[N];计算机世界;2005年
7 本报记者 李剑;搜索引擎进入“泛门户”时代[N];通信信息报;2005年
8 华夏;搜索引擎:有钱便是爷 涉嫌广告欺诈[N];江苏科技报;2008年
9 记者 毛涛涛;优酷主动屏蔽搜索引擎[N];北京商报;2008年
10 笑愉;2008年中国搜索引擎市场将突破50亿元[N];中国税务报;2008年
中国博士学位论文全文数据库 前10条
1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
7 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
9 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
10 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年
中国硕士学位论文全文数据库 前10条
1 王珍;维、哈、柯文搜索引擎中的自动分类技术研究[D];新疆大学;2010年
2 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
3 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年
4 李海丰;基于Lucene的企业文档搜索引擎研究与应用[D];中南林业科技大学;2009年
5 赵善明;基于Lucene的主题搜索引擎研究[D];西安电子科技大学;2008年
6 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
7 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年
8 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年
9 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年
10 王春芹;搜索引擎主题相关性研究[D];中山大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026