收藏本站
《第四届全国信息检索与内容安全学术会议论文集(上)》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于领域本体和语块分析的信息抽取的研究与实现

丁晟春  刘逶迤  熊霞  梅健  
【摘要】:为了提高信息抽取过程中的语义深层次的理解和准确率,本文提出了一种基于领域本体和语块分析的语义信息抽取方法,在详细说明其信息抽取模型的基础上,重点针对命名实体识别、词性组合模板、基于本体的三元组和二元组规则等关键问题进行了深入的分析和研究,提出了相应的解决方法,并进行了相关试验性研究。结果表明:采用本文所述的系统结构及其技术构建文本信息抽取系统是可行的,其能在深层次语义理解的基础上进一步提高信息抽取的准确率。

【参考文献】
中国期刊全文数据库 前3条
1 孙宏林,俞士汶;浅层句法分析方法概述[J];当代语言学;2000年02期
2 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
3 陈静;朱巧明;贡正仙;;基于Ontology的信息抽取研究综述[J];计算机技术与发展;2007年10期
中国博士学位论文全文数据库 前1条
1 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 刘椿年,宋霞;基于Boosting的半结构化信息抽取[J];北京工业大学学报;2005年02期
2 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
3 何章鸿;董守斌;;基于XPath的广告数据提取研究[J];江西师范大学学报(自然科学版);2008年02期
4 何友全;徐澄;徐小乐;唐华姣;;一种基于统计学特征和DOM树的网页去噪技术[J];重庆理工大学学报(自然科学版);2011年01期
5 向毅;王成敏;;基于Abney的组块识别方法研究[J];重庆科技学院学报(自然科学版);2008年04期
6 李绍英;;基于代理技术的比较购物研究[J];当代经理人;2006年10期
7 孙铁利;教巍巍;刘淑华;;Web-Based Information Extraction Technology[J];Journal of Donghua University(English Edition);2007年02期
8 贺令亚;柳佳刚;;基于Web的包装器技术的现状与发展[J];电脑开发与应用;2007年06期
9 方莹,葛寒松;基于聚类的分级信息抽取方法初探[J];电脑知识与技术;2005年30期
10 刘军;;基于支持向量机的网页主题信息提取算法[J];电脑知识与技术(学术交流);2007年02期
中国重要会议论文全文数据库 前10条
1 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
2 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
3 ;A Classification Method for Web Information Extraction[A];Proceedings of the First Conference on Web Information System and Applications(WISA 2004)[C];2004年
4 赵敬华;高慧颖;魏军;;基于本体的商品信息查询系统与算法研究[A];中国企业运筹学[C];2009年
5 刘秉权;王喻红;葛冬梅;李佳;;基于结构树解析的网页正文抽取方法[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
6 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
7 ;A Classification Method for Web Information Extraction[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年
8 ;The Research and Application about the Information Extraction in Chinese Domain[A];第八届国际信号处理国际会议论文集[C];2006年
9 汪建伟;高军;王腾蛟;杨冬青;;一种基于显示属性的网页信息提取方法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
10 周剑辉;苑春法;黄锦辉;李文捷;;金融领域内信息抽取规则的自动获取[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
中国博士学位论文全文数据库 前10条
1 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
2 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
3 俞方桦;互联网信息资源整合研究[D];东华大学;2001年
4 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
5 郑桂华;基于网络的语文校本课程研究与实践[D];华东师范大学;2004年
6 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
7 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
8 邓绪斌;面向复杂数据源的数据抽取模型和算法研究[D];复旦大学;2005年
9 杜永萍;基于模式知识库的问题回答关键技术研究[D];复旦大学;2005年
10 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
2 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
3 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
4 陈旭;地理编码引擎的设计与实现[D];辽宁工程技术大学;2009年
5 许锦;基于本体的智能答疑系统研究与实现[D];江西师范大学;2010年
6 李小红;基于自举的弱指导中文语义关系抽取研究[D];苏州大学;2010年
7 季元叶;语言学特征在中文命名实体间语义关系抽取中的应用研究[D];苏州大学;2010年
8 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
9 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
10 王培正;基于Deep Web的网络信息抽取技术研究[D];华南理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期
3 钟义信;面向智能研究的全信息理论——纪念Shannon信息论50周年[J];北京邮电大学学报;1998年04期
4 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
5 袁颖芬 ,张玥杰;英汉机译中未登录词的识别[J];电子技术;2004年02期
6 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
7 王鑫,王丁,李向宏;基于汉语分词的信息抽取技术[J];信息技术;2003年04期
8 付国宏,王晓龙;汉语词语边界自动划分的模型与算法[J];计算机研究与发展;1999年09期
9 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
10 尤昉,李涓子,王作英;基于《知网》的中文信息结构抽取研究[J];计算机工程与应用;2002年18期
中国硕士学位论文全文数据库 前1条
1 陈晴;基于条件随机场的自动分词技术的研究[D];东北大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 于成龙;;中文网页信息抽取技术及分类算法研究[J];山东理工大学学报(自然科学版);2011年03期
2 王晋;孙涌;王璁玮;;基于领域本体的文本相似度算法[J];苏州大学学报(工科版);2011年03期
3 唐素勤;刘立浩;;一种面向语义Web的智能教学系统[J];计算机教育;2011年15期
4 邹心胜;;基于领域本体重用的机器翻译研究[J];情报科学;2011年06期
5 王全剑;李芳;;基于Wikipedia的人名简历信息抽取[J];计算机应用与软件;2011年07期
6 张泽清;;基于领域本体的语义检索技术研究[J];赤峰学院学报(自然科学版);2011年06期
7 魏晶晶;于然;廖祥文;;基于分隔符的中文论坛信息抽取[J];福建电脑;2011年06期
8 陈立峰;宋金玉;石坚;;军事通信领域本体构建与分析[J];计算机技术与发展;2011年07期
9 熊忠阳;赖苏;张玉芳;李春玲;;利用领域本体概念关系的混合信息检索方法[J];计算机应用研究;2011年07期
10 张晓孪;王西锋;;基于本体和相似图的概念语义相似度计算[J];计算机技术与发展;2011年08期
中国重要会议论文全文数据库 前10条
1 丁晟春;刘逶迤;熊霞;梅健;;基于领域本体和语块分析的信息抽取的研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 张晓莹;张桂平;王裴岩;;领域本体构建中关系辅助判断技术研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 程晓;郑德权;杨宇航;邵国军;;面向半结构化文本的领域本体关系抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 叶琼;李绍稳;张友华;刘恺;;农业领域本体知识的云化方法研究[A];中国农业工程学会2011年学术年会论文集[C];2011年
5 李贵;张兆鑫;李征宇;韩子洋;;WEB环境下基于领域本体的语义匹配技术研究[A];科学发展与社会责任(A卷)——第五届沈阳科学学术年会文集[C];2008年
6 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 姜吉发;王树西;;一种自举的二元关系获取方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 徐林昊;杨文柱;陈少飞;郝亚南;李天柱;;基于XPath的Web信息抽取[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
9 乔春庚;肖诗斌;孙丽华;施水才;;规则与统计相结合的案件名称识别[A];第三届学生计算语言学研讨会论文集[C];2006年
10 刘新华;刘文剑;;基于领域本体的技术准备信息集成技术研究[A];全国先进制造技术高层论坛暨第七届制造业自动化与信息化技术研讨会论文集[C];2008年
中国重要报纸全文数据库 前2条
1 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
2 希安;微软试水信息检索[N];经济日报;2004年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 董宝力;Web制造资源的语义发现关键技术研究[D];浙江大学;2007年
3 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
4 王菁华;文本中知识的获取[D];北京邮电大学;2008年
5 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年
6 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
7 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
8 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
9 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
10 肖敏;基于领域本体的电子商务推荐技术研究[D];武汉理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 黄婵;领域本体的构建及其在Web信息抽取中的应用研究[D];江西理工大学;2010年
2 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
3 谷文;基于概念树的Web信息抽取技术研究[D];长春工业大学;2010年
4 毕蕾;基于领域本体的Web信息抽取技术研究[D];扬州大学;2008年
5 郭力;Web正文信息抽取与面向层次结构的分类技术研究[D];华南理工大学;2011年
6 刘艺琴;基于本体的Web非规范知识处理中信息抽取技术研究[D];昆明理工大学;2005年
7 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
8 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
9 白曦;基于信息抽取的知识生成系统[D];吉林大学;2008年
10 廉成洋;基于树结构的Web信息抽取技术研究[D];南京航空航天大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026