收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于TFIDF的专业领域词汇获取的研究

刘桐菊  于浩  杨沐昀  
【摘要】:针对目前专业词典的建设中如何获取专业词汇这一问题,本文采用了TFIDF算法求加权词频,按词频高低确定专业领域词汇的方法,并针对这一思路给出了在体育领域内研究的样例,同时时这一设想作了预期评估和展望。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 高兵,高峰强;汉语字词识别中词频和语义透明度的交互作用[J];心理科学;2005年06期
2 贾宁;张石磊;陈洁彬;;词频对学习判断的影响[J];心理学探新;2010年06期
3 金朋荪;李京徽;;OUTCOME的语料库研究[J];中国电力教育;2011年13期
4 苏佳卓;;英语词汇教学策略浅析[J];河南教育学院学报(哲学社会科学版);2011年04期
5 邓琳;;英语教学中词典的选择与应用探析[J];文教资料;2006年33期
6 程颜;;大学英语构词教学模式的研究与实践[J];黑龙江科技信息;2008年30期
7 岳红;张杨;;基于自建新闻语料库对think及其同义词的搭配特征分析[J];内江科技;2009年02期
8 唐娟;冯静洁;;古代汉语词类活用说思辨[J];红河学院学报;2007年03期
9 李艳红;;英语词汇磨蚀的词频与终极外语水平的相关分析[J];外语教育;2008年00期
10 江淑娟;;石油英语学术词汇表创建研究[J];西南石油大学学报(社会科学版);2010年06期
11 陈琦;高云;;学术英语中的半技术性词汇[J];外语教学;2010年06期
12 李静;;基于语料库的Assure和Ensure两词的对比研究[J];长春理工大学学报(社会科学版);2011年01期
13 李红;缪道蓉;;规则屈折词形在心理词汇中的表征与提取——基于词频还是规则?[J];外国语言文学研究;2004年04期
14 刘中富;;论《现代汉语常用词表(草案)》处理异形词的得失[J];中国海洋大学学报(社会科学版);2011年04期
15 谭力海,彭聃龄;现代心理学关于单词识别的研究——单词识别的理论模型简介[J];心理学报;1989年04期
16 胡勤,王健芳;构词教学模式探讨[J];贵州大学学报(农业与生物科学版);2000年04期
17 张伟;马广惠;;《英语(新目标)》教材词汇分析[J];中小学外语教学(中学篇);2007年01期
18 李慧;张一平;;词频对中国大学英语学习者词汇习得的影响[J];兰州交通大学学报;2008年05期
19 吴瑾;邹青;;中国学生英语口笔语语体特征研究:词汇密度与词频[J];山东外语教学;2009年01期
20 刘文宇;王小珏;;三语者同形异义词的通达机制研究[J];四川外语学院学报;2009年S2期
中国重要会议论文全文数据库 前10条
1 刘桐菊;于浩;杨沐昀;;基于TFIDF的专业领域词汇获取的研究[A];第一届学生计算语言学研讨会论文集[C];2002年
2 周炎涛;唐剑波;王家琴;;基于信息熵的改进TFIDF特征选择算法[A];第二十六届中国控制会议论文集[C];2007年
3 张必隐;;中文双字词认知中的邻近词频率效果[A];第八届全国心理学学术会议文摘选集[C];1997年
4 胡景贺;;《人民日报》1998年语料库中若干基本语言数据的统计与分析[A];第一届学生计算语言学研讨会论文集[C];2002年
5 薛征;廖闻剑;;基于位置权重和实体识别的关键词提取[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
6 宁海燕;刘秉权;张德园;刘远超;王晓龙;;基于统计的中文领域术语自动抽取方法的比较研究[A];第五届全国信息检索学术会议论文集[C];2009年
7 韩丽;张奇;;关键词词频、句法结构及呈现方式对大学生英语听力效果的影响[A];第十二届全国心理学学术大会论文摘要集[C];2009年
8 乔维;孙茂松;;基于生语料、最大匹配切分语料以及熟语料的中文词频估计方法[A];第三届学生计算语言学研讨会论文集[C];2006年
9 田宏杰;闫国利;刘新颜;;中文双字词在心理词典中的储存方式的发展研究[A];第十届全国心理学学术大会论文摘要集[C];2005年
10 刘欣;章勇;王娟;;增量学习的TFIDF_NB协同训练分类算法[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
中国博士学位论文全文数据库 前7条
1 杨梅;现代汉语合成词构词研究[D];南京师范大学;2006年
2 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
3 李乐夫;中国公有经济部门人力资本回报的实证研究[D];清华大学;2009年
4 吴恩锋;基于经济报道标题语料库的概念隐喻研究[D];浙江大学;2008年
5 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
6 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
7 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
中国硕士学位论文全文数据库 前10条
1 肖根胜;改进TFIDF和谱分割的关键词自动抽取方法研究[D];华中师范大学;2012年
2 任美睿;数字图书馆中词频提取和自动文本分类方法的研究[D];黑龙江大学;2002年
3 魏连娣;汉语短时识别中的偏好效应[D];东北师范大学;2002年
4 陈琦;医学论文中半技术性词汇的分析[D];第四军医大学;2004年
5 高兵;中文双字合成词加工中的透明度效应[D];山东师范大学;2004年
6 吕艳辉;基于语料库的现代汉语准口语计量研究[D];山东大学;2005年
7 张亚静;工作记忆中的语音回路对汉语阅读理解的影响[D];河北师范大学;2006年
8 袁媛;收集基础反应时是启动实验不可或缺的步骤[D];广东外语外贸大学;2006年
9 陈琳;论中国学生被动语态的使用模式与特点[D];大连海事大学;2004年
10 田宏杰;词频、首字字频和尾字字频对双字词识别作用的发展研究[D];天津师范大学;2005年
中国重要报纸全文数据库 前10条
1 本报记者 吴刚;提案数量骤增 热词频现[N];湘声报;2010年
2 深圳特区报记者 梁婷;我们正进入全民“词时代”[N];深圳特区报;2010年
3 王志军;Google输入法的六大特色功能[N];中国电脑教育报;2007年
4 陶维洲包永辉;长三角破行政壁垒,“跨区”新词频现[N];新华每日电讯;2008年
5 吴兢;政府法治30年 权利与权力走向良性互动[N];今日信息报;2008年
6 韩岩杰;咨询:企业的医生[N];中国国门时报;2004年
7 本报记者 高渊采集;两会高频词[N];人民日报;2003年
8 ;第一批异形词整理表[N];新华每日电讯;2001年
9 记者 张先国 季明;让中央的部署以最快速度惠民[N];新华每日电讯;2009年
10 本报记者 王东;有方法 有卖点 好营销[N];中国图书商报;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978