收藏本站
《中国计算语言学研究前沿进展(2009-2011)》2011年
收藏 | 手机打开
二维码
手机客户端打开本文

情感分类中不同主动学习策略比较研究

居胜峰  王中卿  李寿山  周国栋  
【摘要】:近些年来,情感分类在自然语言处理研究领域获得了显著的发展。然而,大部分已有的研究都基于大规模标注样本的分类情况。实际情况下,收集标注样本是一件费时费力的事情。本文在基于少量标注样本的基础上,研究和探讨基于主动学习的情感分类,即主动挑选"优质"的样本进行标注和学习。本文采用了四种不同的学习策略实现主动学习,分别为不确定性、代表性、差异性和特征信息量。实验验证了主动学习对于情感分类的有效性并详细分析了四种策略在基于情感分类的主动学习过程中所发挥的作用。

【共引文献】
中国期刊全文数据库 前4条
1 谷峰;吴扬扬;;文本分类关键技术[J];福建电脑;2006年09期
2 李洋;方滨兴;郭莉;田志宏;;基于主动学习和TCM-KNN方法的有指导入侵检测技术[J];计算机学报;2007年08期
3 李仪,蔡自兴;基于贝叶斯分类器的移动机器人避障[J];控制工程;2004年04期
4 赵悦;穆志纯;;基于委员会投票选择方法的主动学习的研究[J];太原理工大学学报;2006年04期
中国博士学位论文全文数据库 前4条
1 夏定元;基于内容的图像检索通用技术研究及应用[D];华中科技大学;2004年
2 罗可;数据库中数据挖掘理论方法及应用研究[D];湖南大学;2005年
3 古平;基于贝叶斯模型的文档分类及相关技术研究[D];重庆大学;2006年
4 胡静;机器学习及其神经网络分类器优化设计[D];合肥工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 黄伟杰;基于主动贝叶斯分类器检测未知恶意可执行代码的研究与实现[D];广西师范大学;2002年
2 姜卯生;数据挖掘中基于贝叶斯技术的分类问题的研究[D];合肥工业大学;2004年
3 胡彩平;贝叶斯网络及其在范例推理中的应用研究[D];安徽大学;2004年
4 杨晓东;基于贝叶斯网络的配电网可靠性评估[D];华北电力大学(河北);2004年
5 徐松浦;反垃圾邮件中贝叶斯方法的应用研究[D];成都理工大学;2005年
6 祝翠玲;基于无监督聚类和朴素贝叶斯分类的文本分类方法研究[D];山东大学;2005年
7 王宏威;油田数据挖掘技术的研究与应用[D];大庆石油学院;2005年
8 王峻;朴素贝叶斯分类模型的研究与应用[D];合肥工业大学;2006年
9 孙周军;基于组合策略的入侵容忍系统实现方法研究[D];西安建筑科技大学;2006年
10 钟配蓉;基于Web挖掘的文本预处理研究及应用[D];湖南大学;2006年
【二级参考文献】
中国期刊全文数据库 前2条
1 王飞,刘大有,卢奕南,虞强源;基于遗传算法的动态Bayesian网结构学习的研究[J];电子学报;2003年05期
2 田凤占,陆玉昌;用动态Bayesian网络建立宏观经济系统模型[J];清华大学学报(自然科学版);2004年09期
【相似文献】
中国期刊全文数据库 前10条
1 黄长伟;;自动文摘技术研究现状分析[J];中外企业家;2011年14期
2 刘一宁;;学术定义抽取研究综述[J];情报探索;2011年08期
3 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期
4 史晓东;卢亚军;;央金藏文分词系统[J];中文信息学报;2011年04期
5 ;Web 2.0下一步:电脑自动剖析信息[J];黄金时代;2009年03期
6 王利鑫;耿焕同;孙凯;张茜;;基于自然语言处理的文本泄密自动检测技术[J];计算机工程与设计;2011年08期
7 安见才让;;藏语句子相似度算法的研究[J];中文信息学报;2011年04期
8 刘兴林;郑启伦;马千里;;中文合成词识别及分词修正[J];计算机应用研究;2011年08期
9 王波;;基于领域语料的专业英语教学词汇建构[J];电脑知识与技术;2011年13期
10 张海军;彭成;栾静;;基于外部排序的字串左右熵快速计算方法[J];计算机工程与应用;2011年19期
中国重要会议论文全文数据库 前10条
1 居胜峰;王中卿;李寿山;周国栋;;情感分类中不同主动学习策略比较研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
3 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
5 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年
9 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
10 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
中国重要报纸全文数据库 前10条
1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
2 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
3 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
4 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
5 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
6 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年
7 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年
8 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
9 ;开天辟地第一回[N];计算机世界;2002年
10 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
2 计峰;自然语言处理中序列标注模型的研究[D];复旦大学;2012年
3 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
4 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
5 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年
6 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
7 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
8 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
9 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
10 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前10条
1 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
2 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
3 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
4 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
5 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
6 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
7 崔昌利;俄语简单句述谓VP的模式化及自动识别[D];黑龙江大学;2005年
8 赵城利;基于Web的信息智能感知技术及应用[D];国防科学技术大学;2004年
9 张学;EBMT系统中翻译模板的抽取与匹配[D];大连理工大学;2006年
10 巩晓婷;基于文本的信息隐藏技术研究[D];福州大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026