收藏本站
《中国电子学会第十六届信息论学术年会论文集》2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于位置权重和实体识别的关键词提取

薛征  廖闻剑  
【摘要】:通过综合考虑词条的位置和命名实体的权重因子,调整TF-IDF的表达式以弥补传统TFIDF函数的高频领域词、低频人地名词提取效果不理想的缺陷。实验分析表明,调整后的TFIDF函数与单纯TFIDF函数相比,准确率提高了约13.3%,召回率提高了约13.1%。
【作者单位】:武汉邮电科学研究院 烽火通信科技有限公司
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 薛翠芳,郭炳炎;汉语文本特征词的抽取方法[J];情报学报;2000年03期
2 张玉芳;彭时名;吕佳;;基于文本分类TFIDF方法的改进与应用[J];计算机工程;2006年19期
3 宋斌,方小璐;基于网页特征的TFIDF改进算法[J];微计算机应用;2002年01期
中国博士学位论文全文数据库 前1条
1 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
【共引文献】
中国期刊全文数据库 前10条
1 唐晓文;基于本体论的文本特征提取[J];电脑与信息技术;2005年01期
2 杭娟;张冬茉;;一种基于同义词消除的文本过滤方法[J];计算机工程与应用;2006年19期
3 朱征宇;张小林;熊茜;谢祈鸿;;基于用户兴趣子类的协作推荐算法[J];计算机科学;2005年10期
4 张春元;康耀红;;基于示例的Web信息自动获取系统的设计与实现[J];计算机应用;2005年S1期
5 韩客松,王永成,沈洲,吴芳芳;三个层面的中文文本主题自动提取研究[J];中文信息学报;2001年04期
6 薛翠芳,郭炳炎;汉语文本结构的自动分析[J];情报学报;2000年04期
7 曹海;;基于文本内容分析的过滤技术研究[J];四川大学学报(自然科学版);2006年06期
8 张清军,朱才连;基于统计的中文文本主题自动提取研究[J];四川大学学报(工程科学版);2004年03期
9 朱征宇,裴仰军,陈华月,付关友;个性化服务中用户近期兴趣视图的生成[J];计算机工程与设计;2005年04期
10 于海燕;陈晓江;冯健;房鼎益;;Web文本内容过滤方法的研究[J];微电子学与计算机;2006年09期
中国重要会议论文全文数据库 前5条
1 于海燕;陈晓江;冯健;房鼎益;;Web文本内容过滤方法的研究[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
2 陈希;侯德文;朱祥玉;;基于强化学习的信息过滤模型[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年
3 朱祥玉;侯德文;陈希;;基于双重评估函数的文本特征提取方法[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年
4 刘桐菊;于浩;赵铁军;;基于标引技术的特定领域XML文本自动生成[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
中国博士学位论文全文数据库 前5条
1 WANG Jiayue;[D];广东外语外贸大学;2003年
2 王兰成;基于XMARC信息描述的知识标引与概念检索研究[D];东华大学;2004年
3 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
4 吴江;基于本体的知识管理系统关键技术研究[D];西北大学;2007年
5 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 王明燕;基于WEB页面的关键词与关键概念提取技术[D];北京工业大学;2003年
2 赵银春;用户浏览内容分析与用户兴趣挖掘[D];重庆大学;2004年
3 付关友;基于浏览行为分析的用户兴趣挖掘[D];重庆大学;2004年
4 杨孝光;中文文本自动分类系统研究—汉语分词及分类器的设计[D];电子科技大学;2004年
5 尹本雄;中文搜索引擎中的文档特征提取研究[D];广西师范大学;2004年
6 杨晓懿;基于内容分析的信息安全过滤技术研究[D];四川大学;2005年
7 余刚;基于语义概念的文本特征描述[D];重庆大学;2005年
8 王彬;通讯终端上名片识别系统的实现[D];武汉理工大学;2005年
9 王金宝;基于增量学习和阀值优化的自适应信息过滤[D];大连理工大学;2006年
10 柳培林;基于向量空间模型的中文文本分类技术研究[D];大庆石油学院;2006年
【二级参考文献】
中国期刊全文数据库 前6条
1 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
2 刘斌,黄铁军,程军,高文;一种新的基于统计的自动文本分类方法[J];中文信息学报;2002年06期
3 王军;词表的自动丰富——从元数据中提取关键词及其定位[J];中文信息学报;2005年06期
4 索红光;刘玉树;曹淑英;;一种基于词汇链的关键词抽取方法[J];中文信息学报;2006年06期
5 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
6 史继红,赖茂生;汉语自动标引加权方法试验研究[J];现代图书情报技术;1994年03期
中国博士学位论文全文数据库 前1条
1 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
【相似文献】
中国期刊全文数据库 前10条
1 杨撼岳;陈笑蓉;郑高山;;水族文字笔形编码方法研究[J];计算机工程;2011年14期
2 彭成;季培培;;基于确定性退火的中文术语语义层次关联研究[J];计算机应用研究;2011年09期
3 杨春明;韩永国;;快速的领域文档关键词自动提取算法[J];计算机工程与设计;2011年06期
4 张野;杨建林;;基于KNN和SVM的中文文本自动分类研究[J];情报科学;2011年09期
5 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
6 王晓艳;梁晋春;郭晓霞;姚颖颖;汪瑛;;基于互联网的数字媒体内容舆情分析系统[J];计算机系统应用;2011年08期
7 顾潇华;姜亦强;崔涛;;中文自动标引、全文检索及中文搜索引擎三者关系的探讨[J];图书馆学研究;2011年17期
8 张尊生;;《信息技术 信息交换用汉字编码字符集 基本集的扩充》和《信息技术 数字键盘汉字输入通用要求》国家标准发布[J];中国标准导报;2000年03期
9 赵晓凡;胡顺义;刘永革;;CRF模型中参数f在字标注汉语分词中的适用性研究[J];郑州大学学报(工学版);2011年04期
10 申兵一;巩青歌;;中文分词技术在搜索引擎中的应用研究[J];计算机与网络;2010年01期
中国重要会议论文全文数据库 前10条
1 薛征;廖闻剑;;基于位置权重和实体识别的关键词提取[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
2 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
3 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
4 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
5 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
7 李毅;亢世勇;孙茂松;孙道功;;基于奥运语料的语义成分标注规范[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 李竹;;中文信息处理与现代汉语词类研究[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
9 秦鹏;李恒训;张华平;刘金刚;;基于关键词提取的搜索结果聚类研究[A];第五届全国信息检索学术会议论文集[C];2009年
10 诺明花;张立强;刘汇丹;吴健;丁治明;;汉藏短语抽取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国重要报纸全文数据库 前10条
1 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
2 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
3 倪光南;活力重现的中文信息处理[N];计算机世界;2001年
4 齐悦;速记界泰斗唐亚伟 获中文信息处理领域最高科技奖[N];中国质量报;2006年
5 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
6 记者 段佳;中文信息处理技术加速前行[N];大众科技报;2009年
7 记者 韩晓玲通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
8 本报记者 毛国兵 通讯员 岚宇;亚伟速录:实现中文信息处理产业化的自主品牌[N];中国贸易报;2008年
9 胡唯元;文字编码新标准:不再为“名”所累[N];科技日报;2006年
10 本报记者 关逸民;中文速录成为自主核心技术产业[N];中国信息报;2006年
中国博士学位论文全文数据库 前10条
1 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
2 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
3 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
4 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
5 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
6 周卫华;面向中文信息处理的现代汉语动宾语义搭配研究[D];华中师范大学;2007年
7 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
8 姜静清;最小二乘支持向量机算法及应用研究[D];吉林大学;2007年
9 余利华;分布式数据存储和处理的若干技术研究[D];浙江大学;2008年
10 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
中国硕士学位论文全文数据库 前10条
1 陶东成;基于Linux和XIM协议的中文输入法服务器的实现及其应用[D];苏州大学;2004年
2 罗忠毅;数字化中医古籍的理想模式及其相关问题研究[D];成都中医药大学;2005年
3 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
4 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年
5 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
6 白晓梅;校园网中文搜索引掣系统的设计与实现[D];吉林大学;2006年
7 曹林峰;中文文字差错率统计软件的实现[D];西安电子科技大学;2007年
8 刘桂梅;周有光语文改革思想研究[D];山东师范大学;2005年
9 张玉华;基于码本的输入法评测系统的设计和实现[D];苏州大学;2005年
10 杜莹;汉字语法语义智能输入法核心算法及实现技术[D];河南大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026