收藏本站
《内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

监督学习方法在语气挖掘中的应用研究

唐慧丰  谭松波  程学旗  
【摘要】:Web 语气挖掘是一项具有较大实用价值的挖掘技术,这种技术对于消费者和商家作出决策都是很有帮助的。该技术的核心主要涉及语气分类问题,即判别一篇网页评论的观点倾向是肯定还是否定。本文主要研究五种常用的监督学习方法在语气挖掘中的应用,并在中文数据集上进行了实验。实验结果表明:采用 N-gram 特征表示方法、信息增益特征选择方法和 SVM 分类方法的情况下,语气挖掘能取得较好的效果。

【参考文献】
中国期刊全文数据库 前1条
1 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
【共引文献】
中国期刊全文数据库 前10条
1 史会峰,卢艳霞;基于多项式分布模型的Web文本分类[J];华北电力大学学报;2003年06期
2 张玉叶;李连;刘海见;王春歆;;文本过滤中的特征抽取应用研究[J];海军航空工程学院学报;2005年01期
3 姜卯生,王浩,姚宏亮;朴素贝叶斯分类器增量学习序列算法研究[J];计算机工程与应用;2004年14期
4 钱玲飞,刘玉树,李侃;朴素贝叶斯分类器在地形评估中的应用方法[J];计算机工程与应用;2005年12期
5 邹金凤,林鸿飞,杨志豪;文本分类中多分类器的综合机制[J];计算机工程与应用;2005年26期
6 白曦;吕晓枫;孙吉贵;;融合模拟退火的遗传算法在文档聚类中的应用[J];计算机工程与应用;2006年23期
7 宫秀军,刘少辉,史忠植;一种增量贝叶斯分类模型[J];计算机学报;2002年06期
8 王双成,苑森淼;具有丢失数据的可分解马尔可夫网络结构学习[J];计算机学报;2004年09期
9 王秀娟,郭军,郑康锋;文本分类中一种新的特征选择方法[J];计算机应用;2005年03期
10 陈炯,张永奎;一种基于词聚类的中文文本主题抽取方法[J];计算机应用;2005年04期
中国重要会议论文全文数据库 前8条
1 张娟;王慧锋;;文本分类技术在海量金融信息处理中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年
2 马后锋;樊兴华;;一种改进的增量贝叶斯分类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
3 Kefei Cheng, Cong Zhang, Rongdi Yuan, Linlin Wang institute of Computer Science and Technology Chongqing University, Chongqing University of Posts and Telecommunications Chongqing, P.R. China,;CHPC and Naive Bayesian Based Concurrent Communication System Exception Detecting[A];2005'第四届光互联网国际学术会议论文集[C];2005年
4 王秀娟;郑康锋;杨星海;;线性鉴别分析在中文文本分类中的应用[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
5 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
7 Zhenxing Wang Jingbo Zhu Institute of Computer Software and Theory,Northeastern University Shenyang,China,110004;Improving K-NN Text Categorization by Bootstrap Technique[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
8 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 陈元;基于分类模型的知识发现过程研究[D];国防科学技术大学;2002年
2 彭宏京;基于稀疏RAM的神经网络及其人脸识别应用研究[D];南京航空航天大学;2002年
3 齐建东;基于数据挖掘的入侵检测方法及系统研究[D];中国农业大学;2003年
4 王双成;面向智能数据处理的图形模式研究[D];吉林大学;2004年
5 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
6 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
7 王利民;贝叶斯学习理论中若干问题的研究[D];吉林大学;2005年
8 张聪;基于信度网的不确定性推理、学习与分类研究[D];重庆大学;2005年
9 赵晖;支持向量机分类方法及其在文本分类中的应用研究[D];大连理工大学;2006年
10 程克非;基于HPM的软件性能与状态分析研究[D];重庆大学;2005年
中国硕士学位论文全文数据库 前10条
1 何尧;基于半监督学习的中文文档分类技术研究[D];中南大学;2005年
2 汤赛丽;常识知识问答系统中知识库构建的研究与设计[D];河南大学;2005年
3 邹金凤;基于综合评价理论的多分类器容器[D];大连理工大学;2005年
4 任美睿;数字图书馆中词频提取和自动文本分类方法的研究[D];黑龙江大学;2002年
5 张磊;基于独立分量分析的入侵检测系统研究[D];西安电子科技大学;2004年
6 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
7 骆昌日;基于统计方法的中文文本自动分类研究[D];华中师范大学;2004年
8 姜卯生;数据挖掘中基于贝叶斯技术的分类问题的研究[D];合肥工业大学;2004年
9 邹银煌;贝叶斯原理与方法及其在医药新产品市场风险中的应用[D];暨南大学;2004年
10 高洁;增量式中文文本分类算法研究与实现[D];南京师范大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
2 李素建,刘群,杨志峰;基于最大熵模型的组块分析[J];计算机学报;2003年12期
3 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
4 应英,周锋,周昌乐;汉语情感意义的机器标注研究初探[J];中文信息学报;2002年02期
5 朱靖波,姚天顺;基于FIFA算法的文本分类[J];中文信息学报;2002年03期
6 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
7 周茜,赵明生,扈旻;中文文本分类中的特征选择研究[J];中文信息学报;2004年03期
8 全昌勤,何婷婷,姬东鸿,刘辉;从搭配知识获取最优种子的词义消歧方法[J];中文信息学报;2005年01期
9 孙健,王伟,钟义信;基于统计的常用词搭配(Collocation)的发现方法[J];情报学报;2002年01期
10 宫秀军,史忠植;基于Bayes潜在语义模型的半监督Web挖掘[J];软件学报;2002年08期
中国重要会议论文全文数据库 前5条
1 王根;赵军;;中文褒贬义词语倾向性的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
2 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[A];第三届学生计算语言学研讨会论文集[C];2006年
3 姚天昉;娄德成;;汉语语句主题语义倾向分析方法的研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 倪茂树;林鸿飞;;基于关联规则和极性分析的商品评论挖掘[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 时达明;林鸿飞;;基于内容相关度和情感分析的Blogger声誉度研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前3条
1 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
2 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
3 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
中国硕士学位论文全文数据库 前1条
1 彭其伟;基于统计方法的中文文本情感倾向分类研究[D];山西大学;2007年
【二级参考文献】
中国期刊全文数据库 前1条
1 孙丽华,张积东,李静梅;一种改进的kNN方法及其在文本分类中的应用[J];应用科技;2002年02期
【相似文献】
中国重要会议论文全文数据库 前1条
1 唐慧丰;谭松波;程学旗;;监督学习方法在语气挖掘中的应用研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国硕士学位论文全文数据库 前1条
1 陈睿扬;面向体育新闻领域的中文简单名词短语共指消解[D];南京理工大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026