收藏本站
《第六届全国信息检索学术会议论文集》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于HITS算法的blog文摘方法

苗家  马军  陈竹敏  
【摘要】:blog文章对应了大量评论信息,评论中又包含大量的噪声,因此如何结合blog评论获取blog文章的主要内容是许多基于blog的应用所要面临的难题。以往提出的文摘方法大多是针对多文档文摘的通用方法,并未考虑blog文章的特殊性,无法有效地结合评论来处理文章。本文通过分析blog的特点提出了一种新的结合评论信息的blog文摘方法。该方法首先基于特征计算出评论的权重,然后结合图模型使用HITS算法得到正文句子权重,进而得到文摘句。通过在凤凰博客数据集上的实验表明,本文方法在ROUGE测度上优于以往方法。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 秦兵,刘挺,李生;多文档自动文摘综述[J];中文信息学报;2005年06期
【共引文献】
中国期刊全文数据库 前1条
1 刘美茹;;计算机对文章意义段划分的研究[J];计算机工程;2007年13期
中国重要会议论文全文数据库 前2条
1 胡珀;何婷婷;张勇;;基于网络化数据挖掘策略的中文多文档自动文摘研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 余军;杨建武;陈晓鸥;;一种与TDT结合的增量多文档摘要方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国硕士学位论文全文数据库 前6条
1 王丫;网络新闻流中热点事件识别与跟踪算法的改进与验证[D];燕山大学;2007年
2 李霞;XJAUQA自动问答系统的设计与实现[D];新疆农业大学;2006年
3 王麒;基于领域本体的Web文档自动摘要关键技术研究与实现[D];华东师范大学;2007年
4 司红敏;eQuiz电子考试系统试题多样性研究[D];新疆农业大学;2007年
5 刘茵;新闻文档的自动文本摘要技术研究[D];解放军信息工程大学;2007年
6 黄炜;关于商业数据处理的几点研究[D];上海交通大学;2007年
【同被引文献】
中国期刊全文数据库 前6条
1 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
2 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
3 周蕾;;基于碎片分词的未登录词识别方法[J];常熟理工学院学报;2007年02期
4 印鉴,陈忆群,张钢;搜索引擎技术研究与发展[J];计算机工程;2005年14期
5 过仕明;;PageRank技术分析及网页重要性的综合评价模型[J];图书馆论坛;2006年01期
6 罗丽姗;;垂直搜索引擎发展概述[J];图书馆学研究;2006年12期
中国硕士学位论文全文数据库 前3条
1 白广奇;网页内容过滤的关键技术研究及实现[D];山东大学;2005年
2 陈杰;主题搜索引擎中网络蜘蛛搜索策略研究[D];浙江大学;2006年
3 刘玮玮;搜索引擎中主题爬虫的研究与实现[D];南京理工大学;2006年
【二级参考文献】
中国硕士学位论文全文数据库 前1条
1 杨宇航;基于内容与链接分析的重要Blog信息源发现[D];哈尔滨工业大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 张帆;潘瑞芳;叶福军;荆丽茜;;视频游戏中碰撞检测算法的选择[J];电脑知识与技术;2011年13期
2 蒋晖;陈允锋;;数据挖掘及其一种关联规则算法[J];计算机与数字工程;2011年06期
3 金育婵;;数据挖掘技术中基于关联规则算法的研究[J];科技传播;2011年12期
4 胡红;;赫夫曼编码的几种变种形式[J];湖北职业技术学院学报;2011年02期
5 刘永生;贺升学;;三电平逆变器SVPWM控制算法研究[J];电子元器件应用;2011年06期
6 高兵;胡国萍;;诊断贝叶斯网络通用近似推理算法研究[J];电脑知识与技术;2011年25期
7 于成龙;;中文网页信息抽取技术及分类算法研究[J];山东理工大学学报(自然科学版);2011年03期
8 李晓东;;数论中任意m-order线性齐次递推数列a_n项的快速求解方法[J];北京电子科技学院学报;2011年02期
9 赵明;;农业院校本科生计算机图形学课程的研究型教学[J];计算机教育;2011年13期
10 殷超;;删除值相同元素的时间复杂度的改进算法[J];科技信息;2011年21期
中国重要会议论文全文数据库 前10条
1 苗家;马军;陈竹敏;;一种基于HITS算法的blog文摘方法[A];第六届全国信息检索学术会议论文集[C];2010年
2 章彦星;张铭;邓志鸿;;基于特征的用户评论自动摘要[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 邵玲玲;邬锐;黄炎;;多普勒天气雷达产品一中气旋在强风预报中的应用研究[A];首届长三角气象科技论坛论文集[C];2004年
4 李改肖;刘雁春;崔高嵩;刘颖;何桂敏;;海图深度基准面的确定及算法研究[A];第二十一届海洋测绘综合性学术研讨会论文集[C];2009年
5 庞兴豪;任国春;徐以涛;邱炜;;一种新型功放自适应预失真器设计[A];2009年全国无线电应用与管理学术会议论文集[C];2009年
6 庞兴豪;任国春;徐以涛;邱炜;;一种新型功放自适应预失真器设计[A];2009年全国无线电应用与管理学术会议论文集[C];2009年
7 蓝章礼;曹建秋;王华清;;基于动态梯度的指纹图像二值化算法[A];2008年计算机应用技术交流会论文集[C];2008年
8 平亮;何川;杨青彬;;无线电智能天线技术的特点及发展[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
9 杜玫芳;王昕;;基于特征加权的模糊c均值聚类算法及其应用[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
10 樊新海;李胜利;安钢;王凯;;基于Delphi的零相位数字滤波算法研究[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅲ)[C];2008年
中国重要报纸全文数据库 前10条
1 Vishala Sri-Pathma 赵容 编译;算法交易——市场增长的重要趋动因素[N];期货日报;2009年
2 冯雷;单阳算法(2)[N];财经时报;2001年
3 本报记者 晏燕;软件研发 算法先行[N];科技日报;2001年
4 李大庆;应用海啸预警算法尚待时日[N];科技日报;2005年
5 本报记者 刘霞;当算法统治世界[N];科技日报;2011年
6 PALADIN;对算法进行分析(1)[N];电脑报;2003年
7 本报记者 凌南;算法:软件的灵魂[N];中国高新技术产业导报;2002年
8 PALADIN;对算法进行分析(2)[N];电脑报;2003年
9 重庆 Over-Time;程序=算法+数据结构[N];电脑报;2004年
10 王天翊;双方认定结算法院不应否定[N];建筑时报;2003年
中国博士学位论文全文数据库 前10条
1 唐煜;均匀设计的组合性质及其构作[D];苏州大学;2005年
2 余金华;电阻层析成像技术应用研究[D];浙江大学;2005年
3 Zhao Peixin;[D];山东大学;2005年
4 吕翔;波长路由光网络相关问题研究[D];浙江大学;2006年
5 申远;一些求解结构型优化的一阶算法[D];南京大学;2012年
6 赵裕众;生物序列分析算法的研究及其应用[D];中国科学技术大学;2010年
7 彭淳容;数据挖掘方法用于参与代谢的小分子生物学功能预测研究[D];上海大学;2012年
8 杨奎元;基于深层结构的图像内容分析及其应用[D];中国科学技术大学;2012年
9 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
10 Shaker Kazem Ali(沙克);应用于疾病诊断的图像分析方法[D];中南大学;2010年
中国硕士学位论文全文数据库 前10条
1 李阜;基于滑窗取词的单文档自动摘要技术研究[D];国防科学技术大学;2010年
2 商玥;面向概念查询的生物医学多文档摘要技术研究[D];大连理工大学;2011年
3 江亮;SVM算法研究及其在交流控制系统中的应用[D];西北工业大学;2005年
4 高翔;嵌入式三维图形引擎的设计与实现[D];电子科技大学;2005年
5 朱晓丽;QoS组播路由问题研究[D];山东师范大学;2005年
6 杨浩军;计算机软件专利保护问题研究[D];中国政法大学;2006年
7 朱江;AGV车载控制原理研究[D];昆明理工大学;2006年
8 叶海锋;解鞍点问题的UZAWA算法及其收敛性分析[D];浙江大学;2005年
9 王新政;树木年轮分析系统的研究[D];东北林业大学;2007年
10 高莹莹;大孔径静态干涉成像光谱仪(LASIS)图像配准技术研究[D];中国科学院研究生院(西安光学精密机械研究所);2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026