收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种高性能的文本特征自动提取算法

代劲  何中市  胡峰  
【摘要】:特征选择是文本特征降维的一种有效方法.现有选择尺度的确定均通过实验验证得到,即基于经验的方法.在综合考虑特征整体与局部分布基础上,提出了一种高性能的文本特征自动提取算法.算法引入云隶属度概念对特征分布进行修正,不需任何先验知识,能根据特征分布特点自动获取云隶属度高的特征集.分析和开放性实验表明,该特征集具有特征个数少、分类精度高的特点,性能明显优于当前主要的特征选择方法.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张全力;何卫平;秦忠宝;王政;;基于样本公共特征的产品设计信息搜集[J];计算机工程;2006年03期
2 蒋人杰;戚飞虎;徐立;吴国荣;;基于连通分量特征的文本检测与分割[J];中国图象图形学报;2006年11期
3 杨应全;文汝;;网络环境下文本自动分类分析[J];科技文献信息管理;2005年01期
4 邹腊梅;肖基毅;龚向坚;;Web文本挖掘技术研究[J];情报杂志;2007年02期
5 曹丽君;刘西印;杨燕萍;;WEB页面文本挖掘的价值与未来探究[J];商场现代化;2008年09期
6 高立敏;李俊;肖艳芹;;基于Web的网络信息挖掘技术研究[J];电脑知识与技术;2010年16期
7 李锐;;网页文本分类挖掘的几种算法研究[J];福建电脑;2008年10期
8 唐晓文;基于本体论的文本特征提取[J];电脑与信息技术;2005年01期
9 张永刚;梁颖红;颜振祥;姚建民;;基于统计的中文关键短语自动抽取[J];江南大学学报(自然科学版);2010年01期
10 莫佳;;基于Word文本的信息隐藏系统的设计与实现[J];计算机应用与软件;2009年12期
11 陈素萍;谢丽聪;;一种文本特征选择方法的研究[J];计算机技术与发展;2009年02期
12 王小华;卢小康;;基于N-Gram的文本去重方法研究[J];杭州电子科技大学学报;2010年02期
13 林东文;白清源;谢丽聪;谢伙生;张莹;;一种基于本体论的文本特征选取方法[J];计算机科学;2008年03期
14 肖人岳;秦慕婷;;一种复杂文本图像中快速文本行检测算法[J];科学技术与工程;2008年23期
15 斯琴;张力;廉德亮;;基于文本特征的文本水印算法[J];计算机应用;2009年09期
16 聂卉;;面向聚类主题的文本特征描述[J];情报学报;2009年04期
17 赵晖,荣莉莉;基于支持向量的文本特征评估和系统优化[J];计算机工程与应用;2005年10期
18 陈文亮;朱靖波;朱慕华;姚天顺;;基于领域词典的文本特征表示[J];计算机研究与发展;2005年12期
19 黄魏;高兵;刘异;杨克巍;;基于词条组合的军事类文本分词方法[J];计算机科学;2010年02期
20 路永和;曹利朝;;基于粒子群优化的文本特征选择方法[J];现代图书情报技术;2011年Z1期
中国重要会议论文全文数据库 前10条
1 王锦;王会珍;张俐;;基于维基百科类别的文本特征表示[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 苏贵洋 ;李建华 ;马颖华;;XML统一文本自动处理描述接口[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 王洪俊;俞士汶;苏祺;施水才;肖诗斌;;中文文本聚类的特征单元比较[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
4 代劲;何中市;胡峰;;一种高性能的文本特征自动提取算法[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
5 潘丽;邹建成;;一种基于英文文本内容的零水印新算法[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 朱祥玉;侯德文;陈希;;基于双重评估函数的文本特征提取方法[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年
7 马德奎;马军;张磊;;综合MPEG-7颜色描述子与元数据的WEB图像分类[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 王洪俊;施水才;俞士汶;肖诗斌;;跨语言文档对齐[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
9 黄旭;朱艳琴;罗喜召;;重复串特征提取算法在不良信息检测中的应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 王晔;黄上腾;;基于n-gram相邻字的中文文本特征提取算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 王小芳;文本主题域划分与无监督特征提取[D];吉林大学;2009年
2 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
3 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
4 许红涛;Web图像语义分析与自动标注研究[D];复旦大学;2009年
5 黄鹏;基于文本和视觉信息融合的Web图像检索[D];浙江大学;2008年
6 何儒汉;Web图像的多模融合检索研究[D];华中科技大学;2007年
7 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
8 朱朝勇;基于本体的知识库分类研究[D];中国科学技术大学;2013年
9 刘杰;食品安全突发事件跨媒体信息的语义分析与分类研究[D];北京邮电大学;2013年
10 王宝勋;面向网络社区问答对的语义挖掘研究[D];哈尔滨工业大学;2013年
中国硕士学位论文全文数据库 前10条
1 林楠;文本特征选择算法研究[D];辽宁师范大学;2010年
2 刘逵;基于野草算法的文本特征选择研究[D];西南大学;2013年
3 陈彦敏;基于联合条件熵的文本特征提取算法的研究及其应用[D];华东师范大学;2013年
4 杨雪;文本特征选择算法的研究[D];辽宁师范大学;2013年
5 都云琪;中文文本自动分类的研究与实现[D];西安电子科技大学;2002年
6 胡海峰;用户生成答案质量评价中的特征表示及融合研究[D];哈尔滨工业大学;2013年
7 于亮;科技文献的文本特征抽取研究与应用[D];北京邮电大学;2009年
8 封超;基于信息熵的文本特征加权方法研究[D];郑州大学;2012年
9 杨荣杰;文本特征选择算法的研究[D];辽宁师范大学;2012年
10 张想;面向热点话题型微博的情感分析研究[D];哈尔滨工业大学;2013年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978