收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于标引技术的特定领域XML文本自动生成

刘桐菊  于浩  赵铁军  
【摘要】:XML语言的一个突出的优点就是可以成功的解决资源共享问题,给人们的科学研究带来了广阔的发展前景。针对目前手工完成XML转换这一现状,本文将自动标引技术引入,先对文献进行标引,提取出关键词、主题词、相关人物、机构等重要信息,然后自动生成XML文本。进行自动标引时,采用了改进的TFIDF算法,针对金融领域进行了试验,给出了结果并对后期工作进行了展望。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵德平;蔡丽静;李鹏;;基于Newshingling的相似文本检测算法[J];沈阳建筑大学学报(自然科学版);2011年04期
2 刘哲;;数据清洗技术在网络教学评价体系中的应用[J];网络与信息;2011年08期
3 王俊生;施运梅;张仰森;;基于Hadoop的分布式搜索引擎关键技术[J];北京信息科技大学学报(自然科学版);2011年04期
4 贾丙静;吴长勤;葛华;;Web文本聚类的研究与实现[J];长春师范学院学报;2011年06期
5 蒋艳荣;刘习文;陈耿涛;;基于Viterbi改进算法的高棉语分词研究[J];计算机工程;2011年15期
6 齐全;董晶;;基于描述能力的视频标题分类[J];华南理工大学学报(自然科学版);2011年07期
7 吴戈;;基于混沌加密和连词替换的文本水印算法[J];长春大学学报;2011年06期
8 焦云英;吴克琦;潘世明;;信息时代档案的有效管理与利用[J];剑南文学(经典教苑);2011年06期
9 龙志祎;程葳;;基于词聚类的热点话题检测算法[J];计算机工程与设计;2011年06期
10 姜文志;顾佼佼;丛林虎;;CRF与规则相结合的军事命名实体识别研究[J];指挥控制与仿真;2011年04期
11 艾丹祥;左晖;杨君;;网络信息检索中相关反馈技术的Java实现[J];电脑知识与技术;2011年16期
12 刘里;刘小明;;基于分隔符和上下文术语的领域现象术语抽取[J];华南理工大学学报(自然科学版);2011年07期
13 高继平;丁堃;;基于专利文件知识结构的中文专利知识单元挖掘[J];情报理论与实践;2011年06期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 刘桐菊;于浩;赵铁军;;基于标引技术的特定领域XML文本自动生成[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 王兰成;;基于MM最小回溯和词义规则的知识标引研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
3 章成志;周冬敏;苏新宁;;自动标引通用评价模型研究[A];2007年中国索引学会年会暨学术研讨会论文集[C];2007年
4 徐润华;陈小荷;;一种利用注疏的《左传》分词新方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 李怡平;吴飞;;多语言环境下的分布式互联网分词平台[A];第十六届全国数据库学术会议论文集[C];1999年
6 王兰成;田梅;侯双;;PLS:一种基于信息自动标引的最小推进分词算法及其实现[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 赵伟;路永刚;吴琼;;一种新的基于BMM和RMM分词方法的研究与实现[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
8 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 徐冰;姚建民;杨沐昀;赵铁军;;汉语分词在机器翻译评价中的影响[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 陈丽江;;ACL-SIGHAN第一届国际中文分词竞赛评述[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
2 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
3 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
4 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
5 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
6 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
7 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
8 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
9 储节旺;企业应对危机的知识管理问题研究:能力、体系、机制与技术[D];南昌大学;2006年
10 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
2 陈思;中文文本投诉信息自动分类系统研究[D];东北师范大学;2010年
3 赵春红;外包数据库模型中文本数据完整性检测方案的研究[D];燕山大学;2010年
4 卢育红;半结构化药物数据智能分类技术研究与系统实现(全日制专业学位)[D];北京交通大学;2011年
5 卢忠良;基于多类的汉语文本自动分类研究[D];中国人民解放军国防科学技术大学;2002年
6 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年
7 张楚屏;从分词的静词作用看分词在计算机英语中的翻译方法[D];华中科技大学;2006年
8 盛鹏;基于全文过滤的垃圾邮件防范机制[D];昆明理工大学;2006年
9 皮鹏;智能搜索引擎系统的研究[D];哈尔滨工程大学;2002年
10 都菁;基于论坛语料的未登录词自动识别新方法[D];西南大学;2010年
中国重要报纸全文数据库 前10条
1 王萍;Web文本的知识化管理[N];计算机世界;2006年
2 高岚;海量在线做搜索引擎“卖水人”[N];中国计算机报;2004年
3 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
4 本报记者 侯闯;让企业不再“眼花”[N];计算机世界;2003年
5 李蓬涛;非结构化视频搜索技术[N];计算机世界;2006年
6 ;大恒FTR全文检索软硬件解决方案[N];计算机世界;2001年
7 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
8 章森 王伟;搜索引擎的工作机制[N];计算机世界;2006年
9 朱艳;术语解释[N];中国电脑教育报;2000年
10 郭延礼;都德《最后一课》的首译、伪译及其全译文本[N];中华读书报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978