收藏本站
《第六届全国信息检索学术会议论文集》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

面向单一网页的双语资源挖掘方法

罗阳  季铎  张桂平  王莹莹  
【摘要】:双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要。本文提出一种面向单一双语网页的双语资源挖掘方法,该方法与现今平行网页的双语资源挖掘技术不同,重点采用了以频繁序列模式为特征的SVM分类方法,实现了包含双语资源的单一网页的筛选与识别,并以此为基础挖掘具有对译的双语资源。实验结果表明,基于分类方法筛选出的双语网页具有91.25%的正确率,采用FSP算法的双语资源抽取正确率可达到92.5%。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 殷振瑾;王阳;暴宏伶;;数据挖掘技术在中医医案研究中的应用[J];承德医学院学报;2011年03期
2 朱沿旭;王怀民;史殿习;尹刚;袁霖;李翔;;基于缩进轮廓的HTML文档重复模式挖掘方法[J];计算机科学;2011年08期
3 戎翔;李玲娟;;基于MapReduce的频繁项集挖掘方法[J];西安邮电学院学报;2011年04期
4 范广玲;李春生;高雅田;;数据挖掘模型选择的通用建模研究[J];科学技术与工程;2011年19期
5 陈春颖;熊拥军;;基于序列模式挖掘的读者借阅行为分析[J];图书情报知识;2011年04期
6 柴思跃;苏奋振;周成虎;;基于周期表的时空关联规则挖掘方法与实验[J];地球信息科学学报;2011年04期
7 李帆;夏士雄;张磊;;基于模糊理论的不确定轨迹模式挖掘[J];微电子学与计算机;2011年08期
8 张连育;吕立;;基于策略模式的中医数据挖掘平台的设计与研究[J];小型微型计算机系统;2011年07期
9 闫少华;张巍;滕少华;;基于密度的离群点挖掘在入侵检测中的应用[J];计算机工程;2011年18期
10 李向东;刘晓斌;武利平;常洪梅;;面向路线图编制的模糊均值文本聚类挖掘方法研究[J];河北工业大学学报;2011年03期
11 于成龙;;中文网页信息抽取技术及分类算法研究[J];山东理工大学学报(自然科学版);2011年03期
12 李海峰;;基于GPU的闭合频繁项集挖掘方法[J];计算机工程;2011年14期
13 张韬;胡旻;;互联网Web数据挖掘模型设计与技术实现[J];卫星与网络;2010年10期
14 宫俊;董俊龙;梁茂新;唐加福;;基于关联规则的广义药对最适合病证的挖掘方法[J];东北大学学报(自然科学版);2011年08期
15 牟思;;基于垂直搜索引擎的学校网站的研究与建设[J];中国教育技术装备;2011年21期
16 耿秀丽;褚学宁;李玉鹏;;动态关联规则挖掘辅助产品服务系统规划分析[J];中国科技论文在线;2011年07期
17 郑频捷;;学前教育师资信息素养的挖掘模型设计[J];咸宁学院学报;2011年06期
18 庄仁团;;数据挖掘技术在电子政务系统中的应用[J];海峡科学;2011年05期
19 朱兴统;许波;;一种基于粗糙集理论的XML数据挖掘模型[J];科学技术与工程;2011年20期
20 尹亮;;基于孤立点的数据挖掘方法在审计中的应用与研究[J];硅谷;2011年17期
中国重要会议论文全文数据库 前10条
1 罗阳;季铎;张桂平;王莹莹;;面向单一网页的双语资源挖掘方法[A];第六届全国信息检索学术会议论文集[C];2010年
2 王晓峰;刘惟一;;从用户需求到网页集团的模糊变换[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
3 赵文兵;尤定华;;基于图形理解框架的地理信息挖掘方法[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
4 刘国华;马朝虹;马博;刘佳;;量化关联规则的隐私保持挖掘方法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 段磊;唐常杰;左劼;陈宇;钟义啸;元昌安;;基于基因表达式编程的抗噪声数据的函数挖掘方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 吴以凡;吴铁军;欧阳树生;;面向生产过程质量控制的动态数据挖掘方法[A];05'中国自动化产业高峰会议暨中国企业自动化和信息化建设论坛论文集[C];2005年
7 张阳;李战怀;近藤广幸;;WEB PAGE的自动分类[A];第十六届全国数据库学术会议论文集[C];1999年
8 李龙星;杨炳儒;颜红梅;;基于认知生物行为的时序数据挖掘方法及其在医学麻醉护理方面的应用[A];中国生物医学工程学会第六次会员代表大会暨学术会议论文摘要汇编[C];2004年
9 朱雷;张书云;王宏伟;;工作流挖掘方法在业务流程建模中的应用[A];2007年全国第十一届企业信息化与工业工程学术会议论文集[C];2007年
10 余明;陈小瑜;;基于DEM的地形数据挖掘方法及应用研究[A];中国地理学会2006年学术年会论文摘要集[C];2006年
中国重要报纸全文数据库 前6条
1 郑依华;搜索引擎也开源[N];计算机世界;2006年
2 本报记者 刘燕;中间件助力“转方式、调结构、惠民生”[N];科技日报;2010年
3 ;视频数据中挖“宝”[N];计算机世界;2002年
4 ;数据仓库与商业智能软件[N];网络世界;2002年
5 本报记者 吕刚;信息搜索不再上演“百团大战”[N];国际商报;2003年
6 ;电信实施CRM项目的研究方法[N];人民邮电;2001年
中国博士学位论文全文数据库 前10条
1 周春英;超数据集成挖掘方法与技术研究[D];浙江大学;2012年
2 刘亚波;关联规则挖掘方法的研究及应用[D];吉林大学;2005年
3 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
4 骆科东;短时间序列挖掘方法研究[D];清华大学;2004年
5 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
6 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年
7 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年
8 刘慧君;用户浏览模式挖掘方法与应用研究[D];重庆大学;2010年
9 何友全;数据挖掘方法及其在电力系统故障诊断中的应用研究[D];西南交通大学;2004年
10 彭涛;面向专业搜索引擎的主题爬行技术研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前10条
1 张航;主题爬虫的实现及其关键技术研究[D];武汉理工大学;2010年
2 寇春花;主题爬虫的研究与实现[D];东北大学;2008年
3 党春辉;网页消重和聚类算法在高校搜索引擎中的研究与应用[D];东华大学;2010年
4 卢凡;基于领域本体的主题爬虫系统研究与实现[D];电子科技大学;2011年
5 任斌;基于本体的主动学习主题爬行的研究与实现[D];吉林大学;2010年
6 任兰鹏;基于代表样本的中文网页分类研究[D];山东大学;2010年
7 薛惠;基于JAVA的移动新闻搜索引擎的研究与设计[D];河北科技大学;2010年
8 杨宇;搜索词的意图分析与应用[D];北京邮电大学;2010年
9 王立建;中文web文本过滤技术研究[D];中北大学;2010年
10 宗宝琴;基于自然语言理解的智能检索接口技术的研究及其应用[D];河北科技大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978