收藏本站
《第五届全国信息检索学术会议论文集》2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于搜索引擎的人物社会关系抽取研究

甘甜  莫倩  张华平  
【摘要】:人物关系抽取是实体关系抽取研究的一个重要分支。本文提出了一种基于搜索引擎的人物社会关系抽取方法。该方法首先将人物关系特征词与测试集人名一起作为组合关键词提交到搜索引擎,在搜索结果中利用人名识别技术获取相关人名集合,再将测试集人名与相关人名结合成人物关系词对,作为初始种子提交到搜索引擎,通过退火算法迭代建立人物关系描述模式集,最后将测试集人名、相关人名和人物关系描述模式三者结合的组合关键词再次提交到搜索引擎,对搜索结果统计分析匹配度确定关系人物。实验结果表明该方法达到90%以上的准确率和召回率。

【引证文献】
中国硕士学位论文全文数据库 前2条
1 庞永杰;基于Web的社会网络搜索中人名同一性判断方法研究[D];华中科技大学;2011年
2 郝冬生;基于网页完整理解的人物信息抽取[D];吉林大学;2012年
【参考文献】
中国期刊全文数据库 前7条
1 曹恒智;余先川;;单亲遗传模拟退火及在组合优化问题中的应用[J];北京邮电大学学报;2008年03期
2 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
3 陈晓颖;胡熠;陆汝占;;实体关系模板的获取技术[J];计算机工程;2007年21期
4 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
5 车万翔,刘挺,李生;实体关系自动抽取[J];中文信息学报;2005年02期
6 毛婷婷;李丽双;黄德根;;基于混合模型的中国人名自动识别[J];中文信息学报;2007年02期
7 庄成龙;钱龙华;周国栋;;基于树核函数的实体语义关系抽取方法研究[J];中文信息学报;2009年01期
【共引文献】
中国期刊全文数据库 前10条
1 葛文英;吕靖;;基于条件随机场的中文人名识别[J];安阳师范学院学报;2010年05期
2 关丽红;;基于特定数学模型的语义抽取研究[J];白城师范学院学报;2012年03期
3 刘椿年,宋霞;基于Boosting的半结构化信息抽取[J];北京工业大学学报;2005年02期
4 何章鸿;董守斌;;基于XPath的广告数据提取研究[J];江西师范大学学报(自然科学版);2008年02期
5 史永刚;左志宏;;决策树在中文姓名信息提取中的应用研究[J];成都信息工程学院学报;2006年02期
6 何友全;徐澄;徐小乐;唐华姣;;一种基于统计学特征和DOM树的网页去噪技术[J];重庆理工大学学报(自然科学版);2011年01期
7 李绍英;;基于代理技术的比较购物研究[J];当代经理人;2006年10期
8 孙铁利;教巍巍;刘淑华;;Web-Based Information Extraction Technology[J];Journal of Donghua University(English Edition);2007年02期
9 雷霖;李伟峰;王厚军;;基于遗传算法的无线传感器网络路径优化[J];电子科技大学学报;2009年02期
10 高红;黄德根;杨元生;;汉语自动分词中中文地名识别[J];大连理工大学学报;2006年04期
中国重要会议论文全文数据库 前10条
1 陈红兵;;基于XML的电子政务信息集成框架[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
3 刘秉权;王喻红;葛冬梅;李佳;;基于结构树解析的网页正文抽取方法[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
4 ;A Classification Method for Web Information Extraction[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年
5 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
6 汪建伟;高军;王腾蛟;杨冬青;;一种基于显示属性的网页信息提取方法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
7 刘俊;张益肇;;基于统计的中文姓名提取方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
8 那顺乌日图;雪艳;淑琴;敖日格乐;;蒙古文人名自动识别研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 叶娜;吴雪军;朱靖波;陈文亮;;基于相似计算的信息抽取模板自动获取方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 叶娜;罗海涛;朱靖波;张斌;;基于归纳逻辑编程的多槽信息抽取规则自动学习方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
2 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
3 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
4 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
5 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年
6 王炼红;人工免疫优化与分类算法及其应用研究[D];湖南大学;2009年
7 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
9 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
10 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年
中国硕士学位论文全文数据库 前10条
1 樊敬川;Deep Web数据库的选择研究[D];河北大学;2009年
2 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
3 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
4 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
5 李小红;基于自举的弱指导中文语义关系抽取研究[D];苏州大学;2010年
6 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
7 季元叶;语言学特征在中文命名实体间语义关系抽取中的应用研究[D];苏州大学;2010年
8 钟晓旭;基于Web招聘信息的文本挖掘系统研究[D];合肥工业大学;2010年
9 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
10 王培正;基于Deep Web的网络信息抽取技术研究[D];华南理工大学;2010年
【同被引文献】
中国期刊全文数据库 前5条
1 吕雅娟,赵铁军,杨沐昀,于浩,李生;基于分解与动态规划策略的汉语未登录词识别[J];中文信息学报;2001年01期
2 郭绍忠;段丹;刘晓楠;甄涛;;邮件挖掘技术在社会网络分析中的研究与应用[J];计算机工程与设计;2008年09期
3 高钢;;人的社会关系的深度揭示与公民信息权利的深度实现——从“人立方关系搜索”看网络技术进步的社会意义[J];人权;2010年03期
4 岑咏华;韩哲;季培培;;基于隐马尔科夫模型的中文术语识别研究[J];现代图书情报技术;2008年12期
5 高乐;张健;田贤忠;;基于视觉的Web页面分块算法的改进与实现[J];计算机系统应用;2009年04期
中国硕士学位论文全文数据库 前1条
1 江超男;面向社会网络应用的关系抽取研究[D];南京理工大学;2010年
【二级参考文献】
中国重要会议论文全文数据库 前1条
1 季姮;罗振声;;基于反比概率模型和规则的中文姓名自动辨识系统[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 ;第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)在山东大学举行[J];山东大学学报(理学版);2006年03期
2 那罡;;移动搜索的“简单”逻辑[J];中国计算机用户;2006年26期
3 蔡建超;郭一平;王亮;;基于Lucene.Net校园网搜索引擎的设计与实现[J];计算机技术与发展;2006年11期
4 ;网络[J];电脑爱好者;2007年04期
5 ;使用搜索引擎的另类技巧[J];计算机与网络;2007年06期
6 孙成福;;网络搜索引擎的技巧与使用[J];福建电脑;2008年02期
7 杨志;;元数据在中文搜索引擎的应用研究[J];科技信息(科学教研);2008年09期
8 陈春阳;;对互联网搜索引擎的初步认识[J];硅谷;2009年10期
9 沈鑫;;如何“优+”搜索引擎账户[J];成功营销;2009年08期
10 钟晓;;自动分类在搜索引擎中的应用[J];福建电脑;2009年10期
中国重要会议论文全文数据库 前10条
1 甘甜;莫倩;张华平;;基于搜索引擎的人物社会关系抽取研究[A];第五届全国信息检索学术会议论文集[C];2009年
2 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
3 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
5 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
6 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
7 杨萌;李春丽;朱明;;网络搜索技术下的编辑工作[A];学报编辑论丛(第十一集)[C];2003年
8 陈磊;茹立云;马少平;;基于用户日志挖掘的搜索引擎广告效果分析[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 申琪君;;电子地图搜索引擎比较[A];中国地理学会2007年学术年会论文摘要集[C];2007年
10 岑荣伟;刘奕群;张敏;茹立云;马少平;;网络搜索引擎用户行为分析和研究[A];第五届全国信息检索学术会议论文集[C];2009年
中国重要报纸全文数据库 前10条
1 博文译;你的隐私 搜索引擎知道[N];计算机世界;2007年
2 杨洁;搜索引擎营销市场生变[N];中国计算机报;2007年
3 刘文君;搜索引擎也在寻求创新[N];大众科技报;2007年
4 ;法国挑战谷歌推出卫星地图搜索引擎[N];人民日报;2006年
5 MirrorCity.net技术总监 姚浩;让搜索引擎回归最初梦想[N];中国文化报;2008年
6 本报记者 操秀英;国双科技以技术加服务赢得市场[N];科技日报;2009年
7 赵敏;“鱼群理论”破解搜索营销谜局[N];中国企业报;2007年
8 本报记者 樊哲高;搜索引擎三国纷争 中文市场两军对垒[N];中国电子报;2009年
9 EndTo;优化Meta讨好搜索引擎[N];电脑报;2009年
10 本报记者 马文方;Yebol:从思维科学导出搜索引擎[N];中国计算机报;2010年
中国博士学位论文全文数据库 前10条
1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
7 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
8 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
9 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年
10 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年
2 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
3 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年
4 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年
5 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年
6 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年
7 欧建斌;基于Web挖掘与信息分类的个性化搜索引擎研究[D];暨南大学;2010年
8 张朝斌;企业级搜索引擎的优化设计与实现[D];华南理工大学;2010年
9 杨晓丹;基于Lucene的主题搜索引擎模板的设计与实现[D];浙江工商大学;2011年
10 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026