基于句子级的领域倾向词表构建
【摘要】:领域倾向性词典有助于提高文本倾向性挖掘的精度,是文本倾向性挖掘研究的一个热门话题。本文分析了文本级算法构建词表的局限性,提出了一种基于句子级的领域词表构建算法。该算法引入了拉普拉斯平滑计算相关性,并将文档词频和逆文档频率的概念扩展到句子级,最后采用IB算法来对候选词进行聚类。采用该方法对酒店领域的语料进行领域倾向性词表的构建,得到了准确率为71.55%的结果。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|