收藏本站
《第二届全国学生计算语言学研讨会论文集》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于HMM的百科辞典文本中知识点划分方法

许勇  宋柔  
【摘要】:在百科全书条目文本中,往往以几个不同的侧面说明一个条目,一个侧面构成有关这一条目的一个知识点。属于同一个类型的条目文本中总是重复出现有限的几个知识点,这些知识点构成了有关该类型的知识点集合,并且这些知识点在该类型中不同的条目文本中的分布有较强的规律性。在条目文本中划分出这些知识点是百科全书中知识提取过程的重要一环。本文中提出了一种基于隐马尔科夫(HMM)模型的划分方法,利用知识点在条目文本中的转移规律以及知识点的词特征分布来判断每个句子的知识点类别,从而达到划分知识点的目的。实验表明这个方法能取得较好的结果,在《中国大百科全书》地理卷的中国县市类型的条目文本中的实验结果的正确率为91.8%。

【参考文献】
中国期刊全文数据库 前2条
1 朱华宇,孙正兴,张福炎;一个基于向量空间模型的中文文本自动分类系统[J];计算机工程;2001年02期
2 范焱,郑诚,王清毅,蔡庆生,刘洁;用Naive Bayes方法协调分类Web网页[J];软件学报;2001年09期
【共引文献】
中国期刊全文数据库 前10条
1 许云,樊孝忠,张锋;一种不需分词的中文文本分类方法[J];北京理工大学学报;2005年09期
2 李明杰;;特征抽取方法在网页分类中的应用[J];常熟理工学院学报;2005年04期
3 阮群锟;许灿;吕劲松;;超文本的集成分类算法研究[J];电脑与信息技术;2010年02期
4 李兴鹏;秦昌友;;垃圾邮件综合过滤系统的研究与设计[J];电脑知识与技术(学术交流);2007年19期
5 盛魁;赵鹏;;中文网页自动分类综述[J];电脑知识与技术;2010年27期
6 陈治平,林亚平,彭雅,王雷,童调生;基于最小类差异的无关信息预处理算法[J];电子学报;2003年11期
7 陈光;;优化K-近邻方法及其应用[J];福建电脑;2009年02期
8 李菁菁,邵培基,黄亦潇;数据挖掘在中国的现状和发展研究[J];管理工程学报;2004年03期
9 索红光;杨涛;;基于互信息的Web文档聚类方法[J];广西师范大学学报(自然科学版);2007年02期
10 钟茂生;WEB页面的模糊聚类[J];华东交通大学学报;2004年05期
中国重要会议论文全文数据库 前6条
1 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 罗阳;季铎;张桂平;王莹莹;;面向单一网页的双语资源挖掘方法[A];第六届全国信息检索学术会议论文集[C];2010年
3 胡蓉;唐常杰;陈敏敏;栾江;;关联规则制导的遗传算法在文本分类中的应用[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
4 汪传建;李晓光;王大玲;于戈;;一种基于混合模型的文本分类器的研究与实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
5 ;Bayesian Filter Based on Anti-Spam Grid[A];2010 International Conference on E-Health Networking, Digital Ecosystems and Technologies Proceedings(Volume 1)[C];2010年
6 ;Bayesian Spam Filter Based on Distributed Architecture[A];Progress in Measurement and Testing—Proceedings of 2010 International Conference on Advanced Measurement and Test(AMT 2010)[C];2010年
中国博士学位论文全文数据库 前10条
1 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
2 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
3 柏宏权;适应性教学系统中个性化教学策略研究[D];南京师范大学;2006年
4 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
5 袁家政;可伸缩矢量图形(SVG)的数据表示研究[D];北京交通大学;2008年
6 刘震;垃圾邮件过滤理论和关键技术研究[D];电子科技大学;2008年
7 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
8 宣照国;文本挖掘算法及其在知识管理中的应用研究[D];大连理工大学;2008年
9 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
10 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
2 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
3 姜伦;模糊聚类算法及其在中文文本聚类中的研究与实现[D];哈尔滨理工大学;2010年
4 陈雅芳;中文文本分类方法研究[D];浙江大学;2010年
5 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
6 刘欣;基于结构信息的中文网页自动分类技术研究[D];南京航空航天大学;2010年
7 丛帅;基于关键资源的网站分类研究[D];哈尔滨工业大学;2010年
8 阮群锟;超文本的集成分类算法研究[D];湖南大学;2009年
9 曹渝昆;基于RDF的个性化服务模型[D];重庆大学;2002年
10 陈乐;基于智能文本分类技术的素材管理软件的设计与开发[D];南京师范大学;2003年
【相似文献】
中国期刊全文数据库 前10条
1 蔡晓云;;基于知识的在线考试系统题库设计[J];计算机与现代化;2011年08期
2 特列克·巨马夏力甫;阿依兵·哈子太;;基于教材文本的本体学习方法研究[J];电脑知识与技术;2011年16期
3 廖丽嵘;;基于VBA的自动改卷系统的设计与实现[J];电脑知识与技术;2011年19期
4 祁昌平;;网络环境下个性化智能教学系统的设计[J];计算机与数字工程;2011年07期
5 ;告别混乱 给您的文档排排坐[J];电脑爱好者;2011年07期
6 张雪;;数据库技术在信息技术学习中的应用[J];电脑知识与技术;2011年19期
7 毛哲山;;拼音让汉字难堪[J];读者(原创版);2005年06期
8 廖玮;;自适应网络课程学习导航系统[J];福建电脑;2011年05期
9 钟同泉;;VB数据库选题系统[J];新课程(教育学术);2011年07期
10 ;贴心助手 管好你的知识财富[J];电脑爱好者;2011年11期
中国重要会议论文全文数据库 前8条
1 赵洋洋;徐常胜;梁超;;基于文本的自动视频摘要[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
2 于筑国;郑淑丽;刘欣;;关于《离散数学》知识点练习测试器的设计思想(英文)[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
3 王洪俊 ;沈水荣 ;黄翬 ;;“人民金典”语义检索系统实现方法和技术[A];中国新闻技术工作者联合会2011年学术年会论文集(上篇)[C];2011年
4 任福继;;面向21世纪的自然语言处理——国际共同研究项目“日中英多语言对译语料库JCE-TC”的进展与展望[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
5 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
6 詹海生;王启户;;一种自适应字长的中文词库的构建方法[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年
7 方剑;蒋彬春;;浅谈CorelDraw软件的二次开发在《安徽省地图集》编制中的应用[A];第十三届华东六省一市测绘学会学术交流会论文集[C];2011年
8 苗壮;刘剑豪;李杰;王智学;;基于领域概念集的WordNet子本体抽取方法[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
中国重要报纸全文数据库 前10条
1 山东莱芜钢城双泉路学校 张志国;学Java I/O要掌握的三个关键知识点[N];中国电脑教育报;2008年
2 安徽 高伟;文本批量替换好帮手[N];电脑报;2004年
3 高军;Java畅通 精通I/O[N];中国电脑教育报;2008年
4 李永波;实现滚动文本一例[N];中国电脑教育报;2004年
5 浙江省绍兴县职业教育中心 何永胜;让文本发声[N];中国电脑教育报;2004年
6 宋志明;文本也能转成MP3[N];中国电脑教育报;2004年
7 7star;动态文本变变变[N];中国电脑教育报;2002年
8 重庆 雪飞;文本也能批量翻译[N];电脑报;2001年
9 dogQ;网页中的文本自动输出[N];中国电脑教育报;2002年
10 重庆 常笑;从方正飞腾输出文本[N];电脑报;2004年
中国博士学位论文全文数据库 前10条
1 郝兴伟;基于知识本体的E-learning系统研究[D];山东大学;2007年
2 王晓琳;本体驱动的网络智能教学系统研究[D];华东师范大学;2009年
3 赵品勇;基于本体理论的网络教学适应性及其优化研究[D];重庆大学;2009年
4 罗纲;文本隐藏信息检测技术研究[D];湖南大学;2008年
5 柏宏权;适应性教学系统中个性化教学策略研究[D];南京师范大学;2006年
6 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
7 彭莹;基于知识体系的多媒体网络课程及工具研究[D];武汉大学;2010年
8 钟国祥;基于网格的智能学习环境研究[D];西南大学;2008年
9 欧阳杨;教育语义网中基于本体的自适应学习系统建模[D];浙江大学;2008年
10 陈仕品;适应性学习支持系统的学生模型研究[D];西南大学;2009年
中国硕士学位论文全文数据库 前10条
1 李刚;基于知识点及关联的个性化教学系统研究[D];西北大学;2011年
2 康健;以知识点为中心的智能导学系统的研究与实现[D];东北师范大学;2010年
3 谢忠新;基于网络的小学数学智能教学系统[D];上海海事大学;2003年
4 尤秀梅;教学平台中基于知识点的个性化推荐学习的研究与实现[D];天津师范大学;2010年
5 潘莹;基于需求文本的GIS语义挖掘初步研究[D];南京师范大学;2004年
6 严汉羽;联机无约束手写汉字文本行识别[D];华南理工大学;2011年
7 陈相霓;网络课程中知识点模块的设计与实现[D];天津师范大学;2010年
8 刘云中;基于隐马尔可夫模型的文本信息抽取算法研究[D];湖南大学;2004年
9 胡晓楠;基于知识点的学习内容个性化推荐研究[D];重庆大学;2010年
10 焦迪楠;基于卓越工程师能力模型的动态知识网络学习系统的研究[D];北京化工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026