收藏本站
《全国计算机安全学术交流会论文集·第二十五卷》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于CAAR算法的文本倾向性分析技术

单大甫  周斌  黄九鸣  
【摘要】:针对同一主题下的相关评论,本文提出了一种分析文本倾向性的方法——CAAR算法。首先,利用网络爬虫采集相关语料并分析整理,获得同一主题下相关评论的语料;其次,对语料中的评论文本采用基于语义的方法——改进的SBV极性算法,计算评论文本的倾向性,并对其进行分级,获取评论文本可信度;最后,利用评论文本可信度及关联度对评论文本的倾向性进行分析调整,最终获取评论文本的倾向性。本文通过大量相关语料进行测试,CAAR算法与改进的SBV极性算法相比,F1值提高了3%~5%,表明该算法能够有效地分析同一主题下相关评论文本倾向性。

手机知网App
【参考文献】
中国硕士学位论文全文数据库 前1条
1 宋光鹏;文本的情感倾向分析研究[D];北京邮电大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 王北斗;窦志;陈纯;卜佳俊;;支持评价类问题与电影智能搜索的问答系统构建[J];大连理工大学学报;2011年S1期
2 赵俊杰;;基于特征加权的KNNFP改进算法及在故障诊断中的应用[J];电子技术应用;2011年04期
3 庞磊;李寿山;周国栋;;基于情绪知识的中文微博情感分类方法[J];计算机工程;2012年13期
4 顾正甲;姚天昉;;评价对象及其倾向性的抽取和判别[J];中文信息学报;2012年04期
5 余鹰;苗夺谦;刘财辉;王磊;;基于变精度粗糙集的KNN分类改进算法[J];模式识别与人工智能;2012年04期
6 胡元;石冰;;基于区域划分的kNN文本快速分类算法研究[J];计算机科学;2012年10期
7 王超学;潘正茂;马春森;董丽丽;张涛;;改进型加权KNN算法的不平衡数据集分类[J];计算机工程;2012年20期
8 庞观松;蒋盛益;;文本自动分类技术研究综述[J];情报理论与实践;2012年02期
9 郝博一;夏云庆;邬晓钧;郑方;刘轶;;基于泛化和繁殖的自举式意见目标抽取方法[J];清华大学学报(自然科学版);2009年S1期
10 赵妍妍;秦兵;车万翔;刘挺;;基于句法路径的情感评价单元识别[J];软件学报;2011年05期
中国重要会议论文全文数据库 前8条
1 吴苏红;王素格;;基于依存关系的旅游景点评论的特征-观点对抽取[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
3 陈庆轩;郑德权;赵铁军;;多分类器融合的文本分类技术研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
4 邬郑;吕晓莉;晋耀红;;将HNC领域引入文本分类的尝试与探讨[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 宋鸿彦;刘军;姚天昉;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 吴琼;谭松波;张刚;段洣毅;程学旗;;基于图排序模型的跨领域倾向性分析算法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 张冠元;林健;;一种针对餐馆评论的文本倾向性分析算法[A];第五届全国信息检索学术会议论文集[C];2009年
8 沈志斌;白清源;;基于加权修正的KNN文本分类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
中国博士学位论文全文数据库 前10条
1 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
2 王修君;高效数据流和海量文本处理算法研究[D];中国科学技术大学;2011年
3 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
4 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
5 高雅田;基于MAS的数据挖掘模型自动选择方法研究[D];东北石油大学;2011年
6 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
7 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
8 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
9 王煜;基于决策树和K最近邻算法的文本分类研究[D];天津大学;2006年
10 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 吕韶华;面向中文评论文本的情感倾向性研究[D];大连理工大学;2010年
3 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
4 邓忠莹;中文文本倾向性分类系统研究[D];昆明理工大学;2009年
5 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
6 戴霖;网络舆情信息挖掘关键技术研究与应用[D];浙江工商大学;2011年
7 丁若尧;基于博客的网络话题发现及追踪的研究[D];北京交通大学;2011年
8 张博;基于SVM的中文观点句抽取[D];北京邮电大学;2011年
9 翟永勇;中文意见挖掘的特征提取与极性分析研究[D];合肥工业大学;2011年
10 曾洪波;基于类别裁剪和模糊理论的文本分类算法研究[D];暨南大学;2011年
【二级参考文献】
中国期刊全文数据库 前5条
1 杨柳;;我国餐饮业的市场现状及发展策略研究[J];北京交通大学学报(社会科学版);2006年03期
2 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
3 张东礼,汪东升,郑纬民;基于VSM的中文文本分类系统的设计与实现[J];清华大学学报(自然科学版);2003年09期
4 靳光瑾,陆汝占;从汉语句子中提取逻辑函子的一种方法[J];软件学报;1998年06期
5 周强,黄昌宁;基于局部优先的汉语句法分析方法[J];软件学报;1999年01期
【相似文献】
中国期刊全文数据库 前10条
1 杨英;处理文本用的软件[J];管理科学文摘;1996年04期
2 乔新军;;文本数字水印技术初探[J];黑龙江科技信息;2009年11期
3 仲勇;;用F8键快捷选Word文本[J];家庭科技;2010年02期
4 ;《文本之星3.3测试版》[J];电子计算机与外部设备;2001年07期
5 李从利;在FOX中实现文本的翻阅和自动滚动[J];电脑知识与技术;1998年05期
6 梁刚健;赵春晖;许增福;;基于级连式支持向量机的文本自动分类算法[J];黑龙江大学自然科学学报;2006年06期
7 白剑,杨榆,徐迎晖,钮心忻,杨义先;基于文本的信息隐藏算法[J];计算机系统应用;2005年04期
8 燕继坤,郑辉,席建民;相似文本的快速搜索[J];计算机工程;2004年15期
9 王毅;Windows 98中渐变彩色文本的实现[J];微电脑世界;1999年07期
10 张均东,孙宏;Word 2000中的几则常用技巧[J];微电脑世界;2000年21期
中国重要会议论文全文数据库 前10条
1 单大甫;周斌;黄九鸣;;基于CAAR算法的文本倾向性分析技术[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
2 李晓栋;胡清华;;汽轮机故障诊断文本支持系统的研究与建立[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
3 易绵竹;南振兴;李绍哲;薛恩奎;;文本生成与理解的语言学模拟——伊戈尔·梅里丘克《意思(?)文本》模型评介[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 沈志斌;白清源;;基于加权修正的KNN文本分类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
5 张鹏;李国臣;李茹;刘海静;石向荣;;基于FrameNet框架关系的文本蕴含识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 徐代刚;唐常杰;于中华;;从Web文档中采掘语言知识[A];第十五届全国数据库学术会议论文集[C];1998年
7 蓝章礼;曹建秋;王华清;;基于动态梯度的指纹图像二值化算法[A];2008年计算机应用技术交流会论文集[C];2008年
8 罗芳;艾廷华;王洪;;闭合坐标链多边形数据的拓扑关系快速构建[A];全国测绘科技信息网中南分网第二十四次学术信息交流会论文集[C];2010年
9 张少润;吴学军;;分布式数据库系统中探测及消除死锁的算法[A];第十届全国数据库学术会议论文集[C];1992年
10 胥幸燕;徐中伟;;一种站场图逻辑语义解析算法[A];第三届中国测试学术会议论文集[C];2004年
中国重要报纸全文数据库 前10条
1 刘福旺;让文本动起来[N];中国电脑教育报;2002年
2 李岩;怎样快速录入报表[N];建筑报;2000年
3 安徽 高伟;文本批量替换好帮手[N];电脑报;2004年
4 李永波;实现滚动文本一例[N];中国电脑教育报;2004年
5 浙江省绍兴县职业教育中心 何永胜;让文本发声[N];中国电脑教育报;2004年
6 宋志明;文本也能转成MP3[N];中国电脑教育报;2004年
7 7star;动态文本变变变[N];中国电脑教育报;2002年
8 重庆 雪飞;文本也能批量翻译[N];电脑报;2001年
9 PALADIN;算法演义[N];电脑报;2003年
10 dogQ;网页中的文本自动输出[N];中国电脑教育报;2002年
中国博士学位论文全文数据库 前10条
1 金锋;文档摘要算法的研究与应用[D];清华大学;2011年
2 罗纲;文本隐藏信息检测技术研究[D];湖南大学;2008年
3 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
4 Shaker Kazem Ali(沙克);应用于疾病诊断的图像分析方法[D];中南大学;2010年
5 杨雄;图像解译数据库与物体识别的计算机理研究[D];华中科技大学;2010年
6 陶冶;文本语音匹配的研究和应用[D];山东大学;2009年
7 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
8 赵锡英;随机进程代数的等价性判定计算[D];兰州大学;2007年
9 虎晓红;用于图像检索的语义标注技术的研究[D];中国矿业大学(北京);2010年
10 韦世奎;基于信息融合的多媒体内容搜索[D];北京交通大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘云中;基于隐马尔可夫模型的文本信息抽取算法研究[D];湖南大学;2004年
2 潘莹;基于需求文本的GIS语义挖掘初步研究[D];南京师范大学;2004年
3 汪正中;基于英文博客空间文本的情感分析研究[D];温州大学;2011年
4 王振浩;基于情感字典与机器学习相结合的文本情感分类[D];哈尔滨工业大学;2010年
5 霍宗凡;基于语义的文本倾向性分析与研究[D];南京邮电大学;2011年
6 宋勋超;文本聚类算法的语义性改进与实现[D];浙江大学;2011年
7 李本阳;句子和篇章文本倾向分析[D];哈尔滨工业大学;2010年
8 方明;基于Web的评论文本倾向性分析技术研究[D];山东师范大学;2012年
9 姚延栋;国际化文本竖排机制研究和实现[D];中国科学院研究生院(软件研究所);2005年
10 叶浩;基于类信息的潜在语义多类文本分类模型研究[D];江西师范大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026