收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于未标注语料的领域词汇自动抽取

肖诗斌  乔春庚  李渝勤  施水才  
【摘要】:领域词汇集中体现和承载了一个学科领域的核心知识,领域词汇的抽取是很多自然语言处理应用的一个起始点。文中提出了一种基于未标注语料的领域词汇自动抽取方法。首先计算了词语间的结合紧密度,然后统计词汇特征,最后使用 SVM 分类的方法自动获取领域词汇。对公安领域语料进行实验,该方法抽取的前3000个词语的准确率达到了70%。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 ;[J];;2011年05期
2 ;[J];;2011年05期
3 ;[J];;2011年05期
4 ;[J];;2011年05期
5 ;[J];;2011年05期
6 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
7 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
8 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
9 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
10 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
11 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
12 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
13 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
14 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
15 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
16 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
17 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
18 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
19 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
20 聂志强;;本体自动抽取中的概念相似性分析[J];计算机工程与应用;2007年26期
中国重要会议论文全文数据库 前10条
1 肖诗斌;乔春庚;李渝勤;施水才;;基于未标注语料的领域词汇自动抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 邱艳霞;余正涛;张志坤;司圣涛;韩露;孟祥燕;;领域术语自动抽取方法研究[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
3 胡东东;孟小峰;;一种基于树结构的Web数据自动抽取方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
4 王海雄;郭剑毅;余正涛;毛存礼;张朝胜;雷春雅;;基于CRFs的中文领域术语自动抽取研究[A];第六届全国信息检索学术会议论文集[C];2010年
5 王栋;盛玉麒;;汉语否定极项(NPI)自动抽取研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 聂志强;李庆忠;;电子政务信息集成中本体的自动抽取及优化[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
7 封盛;张铭;;基于DOM树的半指导科技文献元数据自动抽取[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
8 李超;王会珍;朱慕华;张俐;朱靖波;;基于领域类别信息C-value的多词串自动抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 史东娜;王枞;李卫;;车牌识别领域的中文术语自动抽取[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
10 王江云;;仿真是适应多学科领域的应用技术[A];新观点新学说学术沙龙文集8:仿真——认识和改造世界的第三种方法吗[C];2007年
中国博士学位论文全文数据库 前7条
1 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
2 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
3 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年
4 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
5 周浪;中文术语抽取若干问题研究[D];南京理工大学;2010年
6 李旭东;人脸图像合成技术研究及数字水印技术[D];浙江大学;2005年
7 李学宁;现代汉语形容词概念语义模型研究[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 邱艳霞;领域术语自动抽取及关系分类研究[D];昆明理工大学;2009年
2 姚贤明;领域概念自动抽取研究[D];昆明理工大学;2010年
3 杨继刚;基于J2EE-SSH框架的小鼠信息数据库系统的设计与实现—PBMICE-SR语义检索框架[D];江南大学;2009年
4 陈雪杰;Web数据抽取技术研究[D];哈尔滨工程大学;2009年
5 蔡军卫;音乐旋律自动抽取与哼唱检索系统关键技术研究[D];兰州大学;2008年
6 刘登志;人体角色的自动绑定与卡通运动[D];浙江大学;2011年
7 王可为;基于统计的双语术语自动抽取[D];南京理工大学;2007年
8 陈雅菊;现代汉语词语搭配的自动抽取方法[D];华东师范大学;2006年
9 段国成;基于CCD的术语抽取研究[D];郑州大学;2007年
10 崔红;基于量化和近似匹配算法的试卷生成系统研究[D];吉林大学;2007年
中国重要报纸全文数据库 前5条
1 Paul F. Uhlir Peter Schroder;开放科技数据助力全球科研[N];计算机世界;2006年
2 ;教育部与甲骨文签署五年战略合作备忘录[N];中国电脑教育报;2007年
3 陶颖;利用图书馆资源优势 构建区域经济信息中心[N];黑龙江经济报;2006年
4 高郝;明星CIO栽在何处[N];中国计算机报;2007年
5 侯力明王芳;联创以软件技术带动产业创新[N];江苏经济报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978