收藏本站
《全国网络与信息安全技术研讨会论文集(上册)》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于短文本的独立语义特征抽取算法

胡佳妮  郭军  徐蔚然  
【摘要】:短文本广泛存在于人们的生产和生活中,有很大的研究价值,其主要特点就是短小性和多样性。本文提出了一种基于短文本的独立语义特征抽取算法,旨在降低文本向量的稀疏性并提高语义表示性。本文提出的算法首先采用潜在语义分析降低文本的维数并去除噪声,然后运用独立成份分析方法在潜在语义特征中提取出最能表达语义且相互统计独立的特征。实验证明本文提出的算法优于潜在语义索引算法。

【共引文献】
中国期刊全文数据库 前6条
1 郭景峰;赵玉艳;边伟峰;李晶;;基于改进的凝聚性和分离性的层次聚类算法[J];计算机研究与发展;2008年S1期
2 吴聪;李勃;董蓉;陈启美;;基于车型聚类的交通流参数视频检测[J];自动化学报;2011年05期
3 张雪凤;张桂珍;刘鹏;;基于聚类准则函数的改进K-means算法[J];计算机工程与应用;2011年11期
4 朱岩;景丽萍;于剑;;一种利用近邻和信息熵的主动文本标注方法[J];计算机研究与发展;2012年06期
5 胡佳妮;郭军;邓伟洪;徐蔚然;;基于短文本的独立语义特征抽取算法[J];通信学报;2007年12期
6 王纵虎;刘志镜;陈东辉;;基于统计学习的自适应文本聚类[J];四川大学学报(工程科学版);2012年01期
中国重要会议论文全文数据库 前3条
1 张俊平;袁兰;胡月明;;应用二步聚类算法对耕地质量智能分级[A];Proceedings of 2010 International Conference on Remote Sensing (ICRS 2010) Volume 3[C];2010年
2 张俊平;李颖;袁兰;胡月明;;基于Fisher判别分析模型的龙川县耕地质量智能分级[A];Proceedings of 2010 International Conference on Remote Sensing (ICRS 2010) Volume 3[C];2010年
3 ;Research on NMF based Hierarchical Clustering Methods[A];Advanced Measurement and Test—Proceedings of 2010 International Conference on Advanced Measurement and Test(AMT 2010)[C];2010年
中国博士学位论文全文数据库 前5条
1 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
2 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
3 陈树;聚类算法模型的研究及应用[D];江南大学;2007年
4 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
5 杨剑锋;适合并行的无干预文档聚类算法研究[D];武汉大学;2010年
中国硕士学位论文全文数据库 前5条
1 马玉静;基于群体智能的文本聚类技术研究[D];燕山大学;2009年
2 王元元;层次式协同聚类算法及模型选择技术研究[D];哈尔滨工业大学;2009年
3 郑翠翠;面向领域文本的潜在语义分析研究[D];南京理工大学;2010年
4 黄文江;中文文本聚类算法分析与研究[D];上海交通大学;2010年
5 解晓敏;最小最大模块化支持向量机数据划分及其应用研究[D];南京邮电大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 郭椿标;模式识别理论中的逻辑特征方法[J];西安交通大学学报;1991年03期
2 郭跃飞;邬永革;黄修武;姜志华;杨静宇;;基于离散判别函数的新的代数特征抽取方法及人脸识别[J];模式识别与人工智能;1998年03期
3 赵英男,杨静宇;一种改进的Gabor滤波器特征抽取算法及其应用[J];系统仿真学报;2005年09期
4 石跃祥;朱东辉;蔡自兴;B.Benhabib;;图像语义特征的抽取方法及其应用[J];计算机工程;2007年19期
5 栾方军;蔺蘭;许景科;;基于FFT的在线手写签名加权认证算法[J];计算机与信息技术;2008年10期
6 李娟;何伟;张玲;周阳;;双向压缩的2DPCA与PCA相结合的人脸识别算法[J];计算机应用;2009年S1期
7 惠飞;赵祥模;;基于脉冲耦合神经网络的目标特征抽取方法[J];吉林大学学报(信息科学版);2010年05期
8 吕玉琦,鲍旭东,杨宗晃;染色体图象的计算机自动分类[J];中国医学影像技术;1986年01期
9 刘其真;徐建华;何永保;;用光谱分析法识别卫星TM影像[J];自动化学报;1990年04期
10 朱学芳;毕厚杰;;一种手写印刷体汉字识别方法[J];南京邮电大学学报(自然科学版);1990年02期
中国重要会议论文全文数据库 前10条
1 胡佳妮;郭军;徐蔚然;;一种基于短文本的独立语义特征抽取算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
2 孙萌;姚建民;吕雅娟;刘群;姜文斌;;基于最大熵短语重排序模型的特征抽取算法改进[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 陈才扣;侯钰;;自适应监督鉴别投影分析[A];中国自动化学会控制理论专业委员会A卷[C];2011年
4 邓中亮;;雕刻型面的特征抽取机制与自动辩识[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
5 罗海飞;虞立群;章志凌;邵晓敏;陈林;汪更生;陈弈秋;何伟杰;;一种改进型CHI的特征抽取方法[A];第二十四届中国控制会议论文集(下册)[C];2005年
6 熊军;周德新;;基于神经网络的手写印刷体汉字识别[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
7 柳林霞;陈杰;陈文颉;;自动目标识别技术中的图像特征提取技术[A];第二十一届中国控制会议论文集[C];2002年
8 薛永刚;朱靖波;魏刚;;基于核主成分分析的文本分类[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 吴小俊;王士同;杨静宇;刘同明;;基于扰动方法和广义K-L变换的人脸特征抽取[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
10 宁健;林鸿飞;;基于改进潜在语义分析的交叉语言检索[A];第五届全国信息检索学术会议论文集[C];2009年
中国重要报纸全文数据库 前3条
1 特约撰稿人 郑优军 甄浩;文稿输入让键盘走开[N];电脑报;2001年
2 本报记者 洪奇;手写笔:21世纪的主流输入技术[N];计算机世界;2001年
3 徐昕;正在成熟的生物识别技术[N];中国计算机报;2006年
中国博士学位论文全文数据库 前10条
1 杨茂龙;相关投影分析在特征抽取中的应用研究[D];南京理工大学;2011年
2 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
3 赵才荣;基于图嵌入与视觉注意的特征抽取[D];南京理工大学;2011年
4 万鸣华;基于图嵌入的特征抽取与人脸识别研究[D];南京理工大学;2011年
5 曾雪强;偏最小二乘降维方法的研究与应用[D];上海大学;2009年
6 王正群;手写体汉字识别研究[D];南京理工大学;2001年
7 赵海涛;投影分析在人脸识别中的研究与应用[D];南京理工大学;2003年
8 徐勇;几种线性与非线性特征抽取方法及人脸识别应用[D];南京理工大学;2004年
9 陈才扣;基于核的非线性特征抽取与图象识别研究[D];南京理工大学;2004年
10 高秀梅;基于核投影分析的特征抽取及应用研究[D];南京理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 蒋冀翔;基于非负矩阵分解的信息获取方法研究[D];东南大学;2006年
2 曹丽;基于流形的特征抽取及人脸识别研究[D];扬州大学;2009年
3 朱红;基于Rough Set的特征抽取算法的研究[D];湘潭大学;2002年
4 陈治纲;基于向量空间模型的文本分类系统研究与实现[D];天津大学;2005年
5 甘立国;中文文本分类系统的研究与实现[D];北京化工大学;2006年
6 刘宏伟;搜索引擎中中文WEB文本自动分类研究[D];暨南大学;2007年
7 彭柳艳;中文网络产品评论的特征抽取及观点分类研究[D];武汉纺织大学;2011年
8 王道辉;基于统计结构的联机手写藏文识别特征抽取研究[D];西北民族大学;2011年
9 孙大伟;NERMS中智能答疑系统的研究与实现[D];吉林大学;2004年
10 王卫玲;web文本分类中特征向量优化技术研究[D];山东师范大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026