收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于句子级的领域倾向词表构建

张小琴  蒋秀凤  
【摘要】:领域倾向性词典有助于提高文本倾向性挖掘的精度,是文本倾向性挖掘研究的一个热门话题。本文分析了文本级算法构建词表的局限性,提出了一种基于句子级的领域词表构建算法。该算法引入了拉普拉斯平滑计算相关性,并将文档词频和逆文档频率的概念扩展到句子级,最后采用IB算法来对候选词进行聚类。采用该方法对酒店领域的语料进行领域倾向性词表的构建,得到了准确率为71.55%的结果。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张星五;;也谱一首“桂殿秋”[J];老同志之友;2011年16期
2 周奇;;辨识和改正标点符号使用错误 叹号[J];编辑之友;2011年07期
3 孙艺红;米戎;;对校对软件的一点认识[J];科技与出版;2011年07期
4 商业南;周伟红;;广播电视新闻写作的语旨意识[J];现代传播(中国传媒大学学报);2011年06期
5 宿建军;张小燕;吐尔洪·吾司曼;李晓;;联合式多引擎维汉机器翻译系统[J];计算机工程;2011年16期
6 晋耀红;;专利文本翻译中复杂长句翻译算法研究[J];计算机应用研究;2011年08期
7 徐晓丹;;基于半监督学习的中文多文档子主题划分[J];浙江师范大学学报(自然科学版);2011年03期
8 龚书;瞿有利;田盛丰;;基于维基语义的多文档文摘研究[J];南京大学学报(自然科学版);2011年04期
9 ;《城市问题》编辑部作者来稿摘要撰写规范[J];城市问题;2011年09期
10 计红;;小学低年级学生语感训练的几点做法[J];现代教学;2011年09期
11 李俊丹;王新荣;;科技论文中常见语法错误例析[J];邯郸学院学报;2011年02期
12 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
13 Joel Holland;万婧;;短信2.0[J];创业邦;2011年09期
14 廖祥文;张小琴;;基于句型结构的领域倾向词表构建[J];福州大学学报(自然科学版);2011年04期
15 许德山;张智雄;赵妍;;中文问句与RDF三元组映射方法研究[J];图书情报工作;2011年06期
16 丁婉莹;;基于用户标签的个人本体的构建模型研究[J];现代情报;2011年07期
17 屠岸;;语林拾遗(三)[J];咬文嚼字;2011年07期
18 王全剑;李芳;;基于Wikipedia的人名简历信息抽取[J];计算机应用与软件;2011年07期
19 周奇;;辨识和改正标点符号使用错误 问号[J];编辑之友;2011年07期
20 阿依木尼萨·胡甫尔;艾斯卡尔·艾木都拉;;面向语音合成的维吾尔语音素自动切分算法研究[J];计算机应用与软件;2011年09期
中国重要会议论文全文数据库 前10条
1 张小琴;蒋秀凤;;基于句子级的领域倾向词表构建[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 康生巧;白宇;韩亚冬;蔡东风;;基于句子相似的古今句子检索[A];第六届全国信息检索学术会议论文集[C];2010年
3 孙茂松;王洪君;董秀芳;;《信息处理用现代汉语分词词表》规范[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 俞昊旻;张玥;张奇;黄萱菁;;基于Low-IDF-SIG的句子重复检测[A];第六届全国信息检索学术会议论文集[C];2010年
5 鲁川;;信息处理用汉语句子语序的认知研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 郗昕;李剑挥;蒋政;冀飞;陈艾婷;赵乌兰;;汉语扬扬格词表的编辑与等价性研究[A];2010全国耳鼻咽喉头颈外科中青年学术会议论文汇编[C];2010年
7 华却才让;;藏汉句子局部对齐策略的研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
8 李丽;王宁宇;葛晓辉;陈莉;孟伊;李金兰;;正常人背景噪声下言语测听词表的等价性分析[A];2010全国耳鼻咽喉头颈外科中青年学术会议论文汇编[C];2010年
9 李卫君;杨玉芳;;汉语句子和诗歌末尾脑电效应分析与比较[A];第十二届全国心理学学术大会论文摘要集[C];2009年
10 史中琦;张普;;基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 崔勇;儿童言语测听词表的设计和人工耳蜗植入对语前聋儿童言语识别的影响[D];复旦大学;2004年
2 孙汝建;语气和语气词研究[D];上海师范大学;1998年
3 吴晓芳;张斌语法思想研究[D];福建师范大学;2009年
4 唐秀玲;论话题及其在汉语语法分析中的应用[D];上海师范大学;1997年
5 金锋;文档摘要算法的研究与应用[D];清华大学;2011年
6 方小燕;广州话句末语气助词对句子表述性的作用[D];暨南大学;2002年
7 黄文集;形式规约语言LFC的实现和应用研究[D];中国科学院研究生院(软件研究所);2004年
8 申敬善;现代汉语“在”字句研究[D];复旦大学;2006年
9 甘瑞瑗;国别化“对外汉语教学用词表”制定的研究:以韩国为例[D];北京语言大学;2005年
10 曹勇衡;基于阅读时间的二语习得者句子空隙处理研究[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 程晓荣;句子制约效应及其机制的实验研究[D];华南师范大学;2003年
2 张金福;如何通过句子听写来提高高中学生的英语听力理解能力[D];华中师范大学;2004年
3 张志刚;领域本体构建方法的研究与应用[D];大连海事大学;2008年
4 曹勇衡;听力理解中句子处理的心理语言特性研究[D];吉林大学;2004年
5 吴旻瑜;现代汉语意向性动词研究[D];华东师范大学;2005年
6 杜静;“取得”义句子单宾性的多维考察[D];湖南科技大学;2011年
7 倪宁;汉语句子理解中句法加工与语义加工间关系的实验研究[D];云南师范大学;2002年
8 史中琦;基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析[D];北京语言大学;2005年
9 刘颖;大学英语四级词汇在轮机英语的语篇覆盖率[D];大连海事大学;2006年
10 曾铄然;大学英语词汇对普通英语的词汇覆盖率[D];大连海事大学;2008年
中国重要报纸全文数据库 前10条
1 睢县殷楼小学 轩孝英;充句子教学三步曲[N];学知报;2010年
2 ;朗读长句子有益健康[N];卫生与生活报;2008年
3 健康时报记者 熊江雪;大人应少说小孩儿话[N];健康时报;2006年
4 丁文曦;说话连“嗯”带“啊”,口头语后面的另类道理[N];新华每日电讯;2007年
5 秦秋;中医药主题词表国家标准出台[N];中国医药报;2005年
6 海门市三星中心小学 刘培;语文教学中如何引导学生质疑[N];成才导报.教育周刊;2007年
7 刘共华;金钱使人变自私[N];卫生与生活报;2007年
8 ;周汝昌谈尽心的诗词(三则)[N];人民日报海外版;2008年
9 记者 隋笑飞;词表收常用词5万余个[N];新华每日电讯;2008年
10 加州圣玛利学院教授 徐贲;诚实的政治,清晰的语言[N];南方周末;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978