收藏本站
《全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)》2009年
收藏 | 手机打开
二维码
手机客户端打开本文

中文文档与源代码间关联关系提取方法的研究

韩晓东  王晓博  刘超  
【摘要】:软件包括软件文档和源程序代码,发现和维护软件文档与源代码间的关联关系,对程序理解、软件维护、需求跟踪等许多软件工程活动提供很大的帮助。本文提出了一种提取中文软件文档与源代码间的关联关系的方法,根据中文软件文档和源代码的特征,在潜在语义索引模型的基础上使用了三种策略:引入项目数据词典辅助中文分词和中英文的翻译、将文档按类型分层以实现反馈、调整代码中的特征项的权值。实验结果表明,三种策略可以在提取阀值C相同的情况下,提高查全率10%~30%;在查全率不变的情况下提高查准率5%~20%。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 寇莎莎,魏振军;自动文本分类中权值公式的改进[J];计算机工程与设计;2005年06期
【共引文献】
中国期刊全文数据库 前10条
1 吕佳;;基于改进分类模型的文本分类系统实现[J];重庆师范大学学报(自然科学版);2009年02期
2 赵小华;马建芬;;文本分类算法中词语权重计算方法的改进[J];电脑知识与技术;2009年36期
3 赖冠辉;王晓博;刘超;;代码与文档间关联关系的提取方法研究和改进[J];电子学报;2009年S1期
4 刘海峰;王元元;张学仁;;文本分类中一种改进的特征选择方法[J];情报科学;2007年10期
5 姚兴山;;基于统计的中文文本分类研究[J];情报理论与实践;2009年05期
6 张海龙;王莲芝;;自动文本分类特征选择方法研究[J];计算机工程与设计;2006年20期
7 罗海飞;吴刚;杨金生;;基于贝叶斯的文本分类方法[J];计算机工程与设计;2006年24期
8 许少华;李小红;潘俊辉;;基于模糊VSM和RBF网络的文本分类方法[J];计算机工程与设计;2007年01期
9 吕佳;;文本分类中基于方差的改进特征提取算法[J];计算机工程与设计;2007年24期
10 王海鹃;韩立新;甄志龙;;基于索引项权重的文本特征选择方法[J];计算机工程与设计;2010年05期
中国重要会议论文全文数据库 前2条
1 ;User Network Construction within Online Paper Recommendation Systems[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
2 赵纪元;罗霄;;面向中图法的学术文献自动分类研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国博士学位论文全文数据库 前3条
1 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
2 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
3 曾传华;事故车辆技术状况智能鉴定系统研究[D];西南交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 刘辉;基于KNN算法的中文Web文本分类技术研究[D];辽宁工程技术大学;2010年
2 刘澎;基于Web图书光盘借阅系统的设计与实现[D];电子科技大学;2011年
3 赵彦军;基于词条数学期望的词条权重计算算法研究[D];安徽工业大学;2010年
4 李虎;基于MapReduce的分布式文本数据过滤技术研究与系统实现[D];国防科学技术大学;2011年
5 王娟;农业知识推送模型及向量特征项提取算法研究[D];湖南农业大学;2011年
6 张超林;文本分类技术在数字图书馆中的应用与研究[D];首都师范大学;2007年
7 周文刚;基于语义的信息过滤算法及其应用[D];北方工业大学;2006年
8 杨静;基于SVM的中文电子邮件作者性别识别技术研究[D];河北农业大学;2007年
9 王继明;网络新闻分类系统及个性化新闻网站的研究与应用[D];内蒙古工业大学;2007年
10 张俊丽;文本分类中的关键技术研究[D];华中师范大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 韦港;;还赞自由软件[J];工程地质计算机应用;1999年01期
2 王耕;张小龄;;中国Linux开源遭遇封闭[J];IT时代周刊;2004年22期
3 贺钧,郑彦平;学生成绩管理系统的设计与实现[J];现代电子技术;2005年17期
4 ;首个Linux与Windows双料病毒现身源码网上公开[J];网络与信息;2006年05期
5 钱磊;;开源软件的商业模式[J];软件世界;2006年14期
6 心洞;;“迷你背单词”简洁代码版[J];电脑爱好者;2009年03期
7 曹孟春;陈凯明;;一种用于反编译代码与源代码的比较算法[J];计算机工程;2009年04期
8 张建飞;钱小云;沈宇;;船载天地VHF伺服程序引导原理及改进设计[J];无线电工程;2009年04期
9 杨雪勇;;报社人事信息系统的设计与实现[J];苏州科技学院学报(自然科学版);2009年03期
10 刘艳霞;郑羽;;利用ActiveX DLL技术实现ASP源代码的保护[J];计算机时代;2010年12期
中国重要会议论文全文数据库 前10条
1 韩晓东;王晓博;刘超;;中文文档与源代码间关联关系提取方法的研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
2 高维春;李贵辉;江朝晖;;JAVA源代码中连续初始化错误及纠正策略[A];全国ISNBM学术交流会暨电脑开发与应用创刊20周年庆祝大会论文集[C];2005年
3 郑文荣;王树宗;刘刚;;软件逆向工程应用研究[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
4 陈凯明;钱海;张军;王煦法;;获取用户库函数接口及源代码[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
5 张跃华;刘莹;张玲玲;石勇;;源代码挖掘在可信软件研究中的应用[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年
6 王中卿;李寿山;朱巧明;李培峰;周国栋;;基于不平衡数据的中文情感分类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 张伟男;张宇;刘挺;;基于中心理论的中文对话省略恢复研究[A];第六届全国信息检索学术会议论文集[C];2010年
8 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
9 吴法洲;苏昊;周明;李春平;;利用英文搜索日志建立中文新词同义词词表[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 计峰;邱锡鹏;黄萱菁;;中文不确定性句子的识别研究[A];第六届全国信息检索学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 周文林;微软首次对中国开放Vista源代码[N];中国税务报;2007年
2 金华;利用源代码库提高开发效率[N];中国计算机报;2003年
3 郭莹;芯片开源门槛挺高[N];中国计算机报;2007年
4 李少林;微软向我国开放Vista源代码[N];中国证券报;2007年
5 于翔;Sun收购淡化MySQL开源味?[N];网络世界;2008年
6 翟胜军;对待开源 厂商为何“犹抱琵琶半遮面”[N];中国计算机报;2008年
7 孟冬冬;Java走上开源之路[N];计算机世界;2007年
8 佟乐;开源存储势不可挡[N];网络世界;2007年
9 罗添;微软指责谷歌浏览器采用其源代码[N];北京商报;2008年
10 王坚;欧盟再拿微软开刀[N];工人日报;2007年
中国博士学位论文全文数据库 前10条
1 张敏;面向方面的软件开发方法与实现技术研究[D];中国科学技术大学;2007年
2 张秀峰;AOP技术及其在软件安全中的应用[D];北京邮电大学;2008年
3 马良荔;基于元数据的构件集成测试技术研究[D];华中科技大学;2006年
4 文坤梅;基于本体知识库推理的语义搜索研究[D];华中科技大学;2007年
5 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
6 何丽莉;横切关注分离方法研究[D];吉林大学;2007年
7 许东;软件质量保障的若干技术研究[D];上海大学;2007年
8 王雅文;基于缺陷模式的软件测试技术研究[D];北京邮电大学;2009年
9 杨友东;自顶向下的协同装配设计过程建模及规划研究[D];浙江大学;2008年
10 闫强;信息系统安全评估研究[D];北京大学;2003年
中国硕士学位论文全文数据库 前10条
1 赵文硕;源代码抄袭检测系统的研究和实现[D];中山大学;2011年
2 张亮;源代码专家推荐系统设计与实现[D];山东大学;2010年
3 王欣;抄袭C源代码可视化智能检测方法与实现[D];大连理工大学;2011年
4 王航;软件脆弱性测试技术[D];中国科学院研究生院(软件研究所);2003年
5 秦越磊;源代码在线评测系统的设计与实现[D];北京化工大学;2008年
6 薛磊;源代码文件转换为语法高亮PDF文件的工具[D];大连理工大学;2012年
7 张京军;源代码在线评测系统的设计与实现[D];长安大学;2010年
8 刘冬平;面向中文歌词的音乐情感分类研究[D];广东工业大学;2011年
9 李丽娜;中文专家检索关键技术研究[D];昆明理工大学;2011年
10 徐德玉;中文文档内容相似度检测方法研究[D];长春工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026