收藏本站
《自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集》2001年
收藏 | 手机打开
二维码
手机客户端打开本文

可分义原向量空间中的跨语种文本过滤模型

苏伟峰  李绍滋  李堂秋  尤文建  
【摘要】:本文介绍一个可以从中文或英文大量的信息中过滤出用户的兴趣所在的文档的模型,该模型采用向量空间的方式,从用户提供的文档中学习,用可分义原向量空间的一个向量来表示用户所感兴趣的文本,然后把需要处理的文本也表示成一个可分义原空间中的一个向量,利用两个向量之间的夹角来判断两个向量的相似度从而决定是否将该文本呈现给用户.实验证明,这是一个比较好的过滤方法.

【引证文献】
中国期刊全文数据库 前1条
1 郑家恒,武琼;基于元数据的Office文档表示方法的研究[J];计算机工程;2003年03期
【参考文献】
中国期刊全文数据库 前2条
1 张月杰,姚天顺;基于特征相关性的汉语文本自动分类模型的研究[J];小型微型计算机系统;1998年08期
2 苏伟峰,李绍滋,李堂秋;一个基于概念的中文文本分类模型[J];计算机工程与应用;2002年06期
【共引文献】
中国期刊全文数据库 前10条
1 吴志峰,田学东;人名、机构名在基于概念的文本分类中的应用研究[J];河北大学学报(自然科学版);2004年06期
2 钟茂生;WEB页面的模糊聚类[J];华东交通大学学报;2004年05期
3 陈勤!信息工程分院,张国煊!信息工程分院,王小华!信息工程分院;文本自动模糊分类方法的研究[J];杭州电子工业学院学报;1999年04期
4 王小华,张国煊,陆蓓;文本分类系统的评价因素探讨[J];杭州电子工业学院学报;2002年03期
5 陈勤,张国煊,王小华,陆蓓,赵葆华;基于模糊模式识别的文本自动分类法研究[J];浙江大学学报(理学版);2000年03期
6 李莼,罗振声,厉宇航;基于语义相关和概念相关的自动分类方法研究[J];计算机工程与应用;2003年12期
7 王梦云,王素格;一个基于字特征的文本分类模型[J];计算机工程与应用;2004年13期
8 王朝静,郑庆华;面向答疑文本的词类标注方法的研究与实现[J];计算机工程与应用;2004年16期
9 徐凤亚,罗振声;文本自动分类中特征权重算法的改进研究[J];计算机工程与应用;2005年01期
10 沈记全,唐菁,杨炳儒;Web文本挖掘系统及其分类算法的研究与实现[J];计算机工程;2003年17期
中国博士学位论文全文数据库 前6条
1 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
2 柏宏权;适应性教学系统中个性化教学策略研究[D];南京师范大学;2006年
3 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
4 刘少辉;知识发现中粗糙集理论的研究[D];中国科学院研究生院(计算技术研究所);2003年
5 王永恒;海量短语信息挖掘技术的研究与实现[D];国防科学技术大学;2006年
6 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 李朝阳;经济文献数据库计算机标引研究[D];南京农业大学;2000年
2 王崑崙;中文网页自动分类的一种实现[D];大连理工大学;2002年
3 皮鹏;智能搜索引擎系统的研究[D];哈尔滨工程大学;2002年
4 苏伟峰;基于概念的文本自动分类研究[D];厦门大学;2002年
5 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
6 马国俊;潜在语义索引在中文文本聚类中的应用研究[D];西安建筑科技大学;2004年
7 檀林;模糊知识处理在中文文本自动分类中的应用研究[D];山西大学;2004年
8 马建斌;基于SVM的中文电子邮件作者身份挖掘技术研究[D];河北农业大学;2004年
9 吴娟;军用信息自动分类的研究与实现[D];南京理工大学;2004年
10 张红霞;渐进式中文文本分类技术研究[D];河北大学;2004年
【同被引文献】
中国期刊全文数据库 前1条
1 戴琼,邹潇湘,罗铸楷;对一种基于多值逻辑阵列变换的加解密系统的破解[J];计算机学报;2001年06期
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 赖洪波;面向政府信息资源的数据仓库元数据研究[D];大连理工大学;2006年
【二级参考文献】
中国期刊全文数据库 前2条
1 李蕾,钟义信,郭祥昊;全信息理论在自动文摘系统中的应用[J];计算机工程与应用;2000年01期
2 曹素丽,曾伏虎,曹焕光;基于汉字字频向量的中文文本自动分类系统[J];山西大学学报(自然科学版);1999年02期
【相似文献】
中国期刊全文数据库 前10条
1 王喜义;;《血路》[J];资本市场;2011年09期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前2条
1 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
2 胡哲彬;何松柏;马岳林;闫彩明;;基于正交多项式的功放行为模型研究[A];2011年全国微波毫米波会议论文集(下册)[C];2011年
中国重要报纸全文数据库 前10条
1 寿栋芯语;揭开企业搜索的技术面纱[N];计算机世界;2008年
2 本报记者 段裕祥 通讯员 舒军忠 刘学永;回家“就业”天地宽[N];桂林日报;2009年
3 陈智罡;队列的复习要点[N];中国电脑教育报;2003年
4 本报特约撰稿人 夏玉霞 高为民;擅自通过财政返还税收的十大弊端[N];中国财经报;2003年
5 李健;速龙4内部探秘[N];中国电脑教育报;2001年
6 记者 高智虹 通讯员 董学文 李秀国;全市首家生态猪场落户青龙[N];秦皇岛日报;2008年
7 本报记者 柳春秋 许慧颖;顺义新城定位高端社区 五年建成[N];第一财经日报;2005年
8 记者 赵晓英;鞍山动漫走向全国[N];鞍山日报 ;2011年
9 杨建顺;公务员管理“一刀切”值得商榷[N];法制日报;2003年
10 本报记者  赵玫;在保护中开发[N];平凉日报;2006年
中国博士学位论文全文数据库 前10条
1 冯秀红;增广的旋量空间和Riemann-Roch算子[D];苏州大学;2006年
2 程东明;代数表示论在Hopf代数中的应用[D];浙江大学;2007年
3 曾喆昭;神经网络优化方法及其在信息处理中的应用研究[D];湖南大学;2008年
4 戴清平;有限维多项式代数的结构、算法及在编码密码学中的应用[D];国防科学技术大学;2008年
5 高遵海;线性系统状态空间模结构与可控性研究[D];华中科技大学;2007年
6 董军武;密钥预分配方案与正交阵列[D];湖南大学;2009年
7 赵海峰;基于图的模式识别及其在计算机视觉中的应用[D];南京理工大学;2011年
8 黄龙光;向量均衡及其有效性[D];西安电子科技大学;2003年
9 王菁华;文本中知识的获取[D];北京邮电大学;2008年
10 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 苏伟峰;基于概念的文本自动分类研究[D];厦门大学;2002年
2 蔡开敏;基于本体映射的概念相似性算法研究[D];华中师范大学;2011年
3 司圣涛;领域知识库的构建方法及其应用研究[D];昆明理工大学;2009年
4 吴仲霖;利用有限局部环Z/p~kZ上的向量空间构作Cartesian认证码[D];大连理工大学;2008年
5 刘青磊;汉语词语及句子相似度算法研究与应用[D];电子科技大学;2011年
6 丁若尧;基于博客的网络话题发现及追踪的研究[D];北京交通大学;2011年
7 于波;中文全文检索技术研究[D];华中师范大学;2003年
8 刘亚清;基于词义的汉语排歧方法研究[D];南京理工大学;2004年
9 李伟佳;利用有限域上的向量空间构作新的带仲裁的认证码[D];大连理工大学;2009年
10 王茹;交通术语与标准规范的符合性检测技术研究[D];长安大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026