收藏本站
《第二十一届中国数据库学术会议论文集(研究报告篇)》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于混合模型的文本分类器的研究与实现

汪传建  李晓光  王大玲  于戈  
【摘要】:通过分析文章写作习惯,提出了一种基于混合模型的文本分类算法,通过EM算法发现局部最大后验估计模型参数,并将其应用于中文文本的分类.实验证明:①基于混合模型的分类算法的整体性能明显优于NB,是一种比较稳定的算法;②在小训练样本的情况下,混合模型分类算法表现突出.

【参考文献】
中国期刊全文数据库 前1条
1 范焱,郑诚,王清毅,蔡庆生,刘洁;用Naive Bayes方法协调分类Web网页[J];软件学报;2001年09期
【共引文献】
中国期刊全文数据库 前10条
1 李明杰;;特征抽取方法在网页分类中的应用[J];常熟理工学院学报;2005年04期
2 阮群锟;许灿;吕劲松;;超文本的集成分类算法研究[J];电脑与信息技术;2010年02期
3 盛魁;赵鹏;;中文网页自动分类综述[J];电脑知识与技术;2010年27期
4 陈治平,林亚平,彭雅,王雷,童调生;基于最小类差异的无关信息预处理算法[J];电子学报;2003年11期
5 李菁菁,邵培基,黄亦潇;数据挖掘在中国的现状和发展研究[J];管理工程学报;2004年03期
6 钟茂生;WEB页面的模糊聚类[J];华东交通大学学报;2004年05期
7 李旻;杜海顺;王琪;;基于KNC算法的中文网页分类方法研究[J];河南大学学报(自然科学版);2010年05期
8 岳峰;孙亮;王宽全;王永吉;左旺孟;;利用构建语义词典的查询自动分类方法[J];哈尔滨工业大学学报;2008年07期
9 袁家政;须德;鲍泓;;基于结构与文本关键词相关度的XML网页分类研究[J];计算机研究与发展;2006年08期
10 张茂元;邹春燕;卢正鼎;;一种基于变调整学习规则的模糊网页分类方法研究[J];计算机研究与发展;2007年01期
中国重要会议论文全文数据库 前6条
1 许勇;宋柔;;基于HMM的百科辞典文本中知识点划分方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 罗阳;季铎;张桂平;王莹莹;;面向单一网页的双语资源挖掘方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 胡蓉;唐常杰;陈敏敏;栾江;;关联规则制导的遗传算法在文本分类中的应用[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
5 ;Bayesian Filter Based on Anti-Spam Grid[A];2010 International Conference on E-Health Networking, Digital Ecosystems and Technologies Proceedings(Volume 1)[C];2010年
6 ;Bayesian Spam Filter Based on Distributed Architecture[A];Progress in Measurement and Testing—Proceedings of 2010 International Conference on Advanced Measurement and Test(AMT 2010)[C];2010年
中国博士学位论文全文数据库 前5条
1 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
2 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
3 袁家政;可伸缩矢量图形(SVG)的数据表示研究[D];北京交通大学;2008年
4 刘震;垃圾邮件过滤理论和关键技术研究[D];电子科技大学;2008年
5 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
2 陈雅芳;中文文本分类方法研究[D];浙江大学;2010年
3 刘欣;基于结构信息的中文网页自动分类技术研究[D];南京航空航天大学;2010年
4 丛帅;基于关键资源的网站分类研究[D];哈尔滨工业大学;2010年
5 阮群锟;超文本的集成分类算法研究[D];湖南大学;2009年
6 曹渝昆;基于RDF的个性化服务模型[D];重庆大学;2002年
7 胡蓉;中文Web文档倾向性自动分类研究[D];四川大学;2003年
8 翟静;可扩展的文本分类系统的核心API的设计与实现[D];四川大学;2003年
9 张承明;基于Web的数据挖掘研究[D];山东科技大学;2003年
10 李建祥;智能网页推荐系统的相关技术研究[D];西南交通大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 周宇;覃征;;聚类分析中特征选择的研究[J];计算机应用研究;2006年05期
2 王昕;覃征;韩峰岩;;基于UML的软件可靠性测试用例生成的混合模型[J];西安交通大学学报;2007年04期
3 陈冬亮;钢铁企业MES中质量控制系统的研究与设计[J];工业控制计算机;2005年06期
4 宋浩远;;基于模型的聚类方法研究[J];重庆科技学院学报(自然科学版);2008年03期
5 郭新明;弋改珍;;混合模型的用户兴趣漂移算法[J];智能系统学报;2010年02期
6 孙晓莹;王秋芬;;一种改进的C/S模式在管理信息系统中的应用[J];现代计算机(专业版);2010年14期
7 张敏,赵猛,贾云得,王俊;基于自适应高斯混合模型的图像稳定方法[J];北京理工大学学报;2004年10期
8 马江洪;葛咏;;图像线状模式的有限混合模型及其EM算法[J];计算机学报;2007年02期
9 王瑞敏;曹广益;朱新坚;;PEMFC混合模型的建模及其稳态仿真[J];系统仿真学报;2008年05期
10 严开元;欧中红;;结合故障相关的软件构件NHPP可靠性模型研究[J];计算机与数字工程;2009年06期
中国重要会议论文全文数据库 前10条
1 汪传建;李晓光;王大玲;于戈;;一种基于混合模型的文本分类器的研究与实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 赵广建;贠超;;基于SVM/HMM混合模型的银行票据识别系统研究[A];《制造业自动化与网络化制造》学术交流会论文集[C];2004年
3 李晓栋;胡清华;;汽轮机故障诊断文本支持系统的研究与建立[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
4 马永亮;赵铁军;;统计机器翻译中多分词结果的融合[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
5 易绵竹;南振兴;李绍哲;薛恩奎;;文本生成与理解的语言学模拟——伊戈尔·梅里丘克《意思(?)文本》模型评介[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 赵广建;贠超;;基于SVM/HMM混合模型的银行票据识别系统研究[A];先进制造技术论坛暨第三届制造业自动化与信息化技术交流会论文集[C];2004年
7 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
8 眭新光;沈蕾;燕继坤;朱中梁;;基于Adaboost的文本隐写分析[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
9 沈志斌;白清源;;基于加权修正的KNN文本分类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
10 徐蔚然;于武贵;郭军;;基于统计方法的混排文字切分与分类[A];第八届全国汉字识别学术会议论文集[C];2002年
中国重要报纸全文数据库 前10条
1 ;变化中的分支机构[N];网络世界;2007年
2 刘福旺;让文本动起来[N];中国电脑教育报;2002年
3 李岩;怎样快速录入报表[N];建筑报;2000年
4 安徽 高伟;文本批量替换好帮手[N];电脑报;2004年
5 李永波;实现滚动文本一例[N];中国电脑教育报;2004年
6 浙江省绍兴县职业教育中心 何永胜;让文本发声[N];中国电脑教育报;2004年
7 宋志明;文本也能转成MP3[N];中国电脑教育报;2004年
8 7star;动态文本变变变[N];中国电脑教育报;2002年
9 重庆 雪飞;文本也能批量翻译[N];电脑报;2001年
10 dogQ;网页中的文本自动输出[N];中国电脑教育报;2002年
中国博士学位论文全文数据库 前10条
1 李斌;概率混合模型的研究及其应用[D];复旦大学;2009年
2 刘建伟;流数据查询系统结构及模式查询算法的研究[D];东华大学;2005年
3 张春燕;统计形状分析及混合建模理论研究[D];安徽大学;2007年
4 刘哲;基于非参数正交多项式的图像分割和融合研究[D];江苏大学;2012年
5 尹乾;基于神经网络的软件可靠性模型[D];北京师范大学;2006年
6 郭恺;基于信号统计特性的图像超分辨率研究[D];上海交通大学;2011年
7 周仲兴;复合下肢想象动作电位的特征识别新技术研究[D];天津大学;2009年
8 谢从华;基于密度模型的医学图像分割方法研究[D];江苏大学;2011年
9 黄启宏;流形学习方法理论研究及图像中应用[D];电子科技大学;2007年
10 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 汪传建;基于混合模型的文本分类的研究[D];东北大学;2005年
2 李艳玲;文本图像页面分割和分类技术的研究[D];苏州大学;2004年
3 高永岗;医学图像的语义标注技术研究与应用[D];西北大学;2009年
4 袁磊;基于概率模型的文本聚类[D];吉林大学;2005年
5 杨鹏翼;用于基因芯片和质谱数据分析的混合模型研究[D];西南大学;2008年
6 陈琪;基于混合模型的人脸表情模拟研究[D];厦门大学;2008年
7 赵红亮;基于混合模型的车辆跟踪算法研究[D];北京邮电大学;2009年
8 许兴明;基于t混合模型的医学图像分割方法研究[D];安徽大学;2010年
9 周喆;虚拟手术系统中基于混合模型的切割仿真研究[D];上海交通大学;2012年
10 周月平;虚拟加工物理仿真系统研究与开发[D];河海大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026