收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

dNumber:超大范畴数据集的一个快速聚结算法(英文)

何增有  徐晓飞  邓胜春  宋玉福  
【摘要】:正In this paper,we present dNumber,a new fast algorithm for clustering categorical data, which is very fast and at the same time produce acceptable clustering results.It read each tuple t in sequence,a number indicating this tuple's group is produced by a mapping function which incorporates existed distribution of attribute values.Due to its characteristics,the proposed algorithm is extremely suitable for clustering data streams,where given a sequence of points,the objective is to maintain consistently good clustering of the sequence so far,using a small amount of memory and time.Experimental results on real-life and synthetic datasets verify the superiority of dNumber.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张丽新,王家廞,赵雁南,杨泽红;基于Relief的组合式特征选择[J];复旦学报(自然科学版);2004年05期
2 钟庆丰;;知识探勘的利器——丛集算法(4)[J];电子与电脑;2008年05期
3 方风波;;关联规则挖掘技术发展及应用[J];中小企业科技;2007年06期
4 时雷;虎晓红;席磊;;朴素贝叶斯分类算法及其应用研究[J];光盘技术;2008年11期
5 王海军;聂雅琳;;显现模式:一种基因分类的工具[J];计算机与现代化;2008年09期
6 巩固;张虹;;决策树算法在天气评估中的应用[J];微计算机信息;2007年34期
7 冯征;;模糊神经网络在商业规则数据挖掘中的应用[J];计算机应用研究;2006年12期
8 吴国栋;;基于近似正交表的大型数据集决策树生成方法研究[J];计算机应用与软件;2008年05期
9 邱潇钰;张化祥;;基于核的最小距离分类法的参数选择方法[J];计算机工程;2008年05期
10 王艳春,许有信;一般数据集的C~2有理保形插值[J];南京航空航天大学学报;1995年01期
11 罗印升,李人厚,张维玺;一种基于克隆选择的聚类算法[J];控制与决策;2005年11期
12 杨鹏;徐勇勇;刘丹红;潘峰;;基于XML的医院出院患者调查数据集的建立[J];第四军医大学学报;2007年10期
13 李雯睿;白晨希;;一种本体学习模型的设计与实现[J];河南大学学报(自然科学版);2006年04期
14 韦佳;彭宏;;基于局部与全局保持的半监督维数约减方法[J];软件学报;2008年11期
15 金伟健;;基于决策树算法的客户分类模型研究[J];科技资讯;2009年14期
16 胡文军;王士同;邓赵红;;适合大样本快速训练的最大夹角间隔核心集向量机[J];电子学报;2011年05期
17 章云,徐宁;大数据集基于等价类的属性重要性定义和约简[J];仪器仪表学报;2004年S1期
18 陆安生,陈永强,屠浩文;决策树C5算法的分析与应用[J];电脑知识与技术;2005年09期
19 蒋盛益,李庆华,赵延喜;一种两阶段异常检测方法[J];小型微型计算机系统;2005年07期
20 魏志轩,周良松,代仕勇,杨洁;.NET技术在华中电网稳定分析和控制系统中的应用[J];继电器;2005年22期
中国重要会议论文全文数据库 前10条
1 何增有;徐晓飞;邓胜春;宋玉福;;dNumber:超大范畴数据集的一个快速聚结算法(英文)[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 杜玫芳;王昕;;基于特征加权的模糊c均值聚类算法及其应用[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
3 李金;唐成虹;黎强;;IEC61850日志功能的实现[A];2006中国电力系统保护与控制学术研讨会论文集[C];2006年
4 蒋霈霖;;遥感图像混合谱解混的新方法[A];中国自动化学会中南六省(区)2010年第28届年会·论文集[C];2010年
5 贾让成;颜荣芳;;折扣一平均混合准则下的向量值MDP[A];1993中国控制与决策学术年会论文集[C];1993年
6 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
7 张家波;刘彧凝;段向阳;;无线传感器网络动态路由算法研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
8 宋楠;赵忠文;刘帅;戴迎春;;基于势能场的MAS局部合作Q学习算法[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
9 周龙;谢兆鸿;;一种自适应BP算法在绝缘预测中的应用[A];'99系统仿真技术及其应用学术交流会论文集[C];1999年
10 薛云灿;;一种新型控制器——EMAC[A];1995中国控制与决策学术年会论文集[C];1995年
中国博士学位论文全文数据库 前10条
1 熊毅;基于机器学习的蛋白质结合位点特征化和预测方法研究[D];武汉大学;2011年
2 余金华;电阻层析成像技术应用研究[D];浙江大学;2005年
3 罗会兰;聚类集成关键技术研究[D];浙江大学;2007年
4 叶涛;基于机器学习的软测量技术理论与应用[D];华南理工大学;2007年
5 孙明明;流形学习理论与算法研究[D];南京理工大学;2007年
6 谷方明;支持向量数据描述的若干问题及应用研究[D];吉林大学;2010年
7 林智勇;基于核方法的不平衡数据学习[D];华南理工大学;2009年
8 黄光鑫;支持向量数据描述与支持向量机及其应用[D];电子科技大学;2011年
9 张丽娟;微阵列基因表达数据分类问题中的属性选择技术研究[D];国防科学技术大学;2008年
10 赵凌潇;基于流形的半监督分类方法研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 王晓芹;类别不平衡数据的集成学习研究[D];山东师范大学;2010年
2 张健;剪枝和网格采样相结合的非平衡数据集分类方法[D];安徽大学;2012年
3 马再超;转子故障数据分类方法研究与实验台测试信息系统开发[D];兰州理工大学;2012年
4 龚薇;失衡样本分类问题的自动过滤算法的研究[D];华东师范大学;2011年
5 刘伟;机器学习中知识迁移方法研究[D];山东师范大学;2010年
6 刘维会;不平衡数据集上支持向量机算法研究[D];山东科技大学;2010年
7 杨洋;主动式半监督学习算法的研究[D];烟台大学;2012年
8 高远;空间数据的聚集最远邻居查询研究[D];浙江大学;2011年
9 韩秋玲;过抽样算法在不平衡数据学习中的应用[D];华南理工大学;2011年
10 贾敏;脑机接口中半监督分类方法研究[D];燕山大学;2012年
中国重要报纸全文数据库 前10条
1 记者 兴科 通讯员 宋春玉;“数字库尔勒”试点项目获国家批准[N];新疆日报(汉);2009年
2 毕建涛 曹彦荣 何建邦 池天河;共享海量遥感影像数据[N];计算机世界;2006年
3 ;基于SOC/IP的智能传感器设计研究(下)[N];电子报;2007年
4 本报记者  张亮;机器人技术离实际应用还远吗?[N];科技日报;2006年
5 克 军;小小机器人军团[N];大众科技报;2003年
6 柴晓光 陈佳实;慧眼识设备[N];计算机世界;2002年
7 摩托罗拉公司提供;无传感器开关磁阻电机控制[N];电子资讯时报;2002年
8 詹膑 罗杨;以多变量为基础的现代智能控制[N];光明日报;2000年
9 本报记者 冯卫东;机器人步入“基因”时代[N];科技日报;2009年
10 本报记者 聂伟;江苏造“客流眼”抢登世博直通车[N];新华日报;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978