收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于条件随机域的生物医学命名实体识别

李彦鹏  杨志豪  林鸿飞  
【摘要】:命名实体识别是生物医学文献文本挖掘重要的第一步。近年有很多人研究,然而效果并不理想。JNLPBA2004测评中最好的系统只能达到72.6%的F-score。本文使用条件随机域(Conditional Random Fields,CRF)模型,采用GENIA语料进行训练,在JNLPBA2004测试集上得到了71.9%的F-score。本文讨论了不同规模训练语料,不同特征对CRF模型标注结果的影响。边界识别错误是识别中很严重的问题,本文针对左边界错误才采用了一种基于CRF的二次标注方法,使左边界错误率减少了7.2%。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 余传明;黄建秋;郭飞;;从客户评论中识别命名实体——基于最大熵模型的实现[J];现代图书情报技术;2011年05期
2 王浩畅;李钰;赵铁军;;面向生物医学命名实体识别的多Agent元学习框架[J];计算机学报;2010年07期
3 邱莎;;几种基于机器学习的生物命名实体识别模型比较[J];电脑知识与技术(学术交流);2007年05期
4 马续补;郭菊娥;;基于GATE的任务信息抽取研究[J];情报杂志;2010年01期
5 ;浅析大规模文本数据挖掘技术在媒体中的创新应用[J];中国传媒科技;2007年11期
6 肖洪;薛德军;;基于大规模真实文本的数值知识元挖掘研究[J];计算机工程与应用;2008年30期
7 胥桂仙,朴泰雄,杨丹丹,徐小博,高旭;中文文本挖掘中最长频繁序列的发现算法[J];中央民族大学学报(自然科学版);2004年01期
8 渡部勇;;文本挖掘技术应用于专利检索分析[J];微电脑世界;2007年12期
9 苏芳仲,林世平;Web文本挖掘中的一种中文分词算法研究及其实现[J];福州大学学报(自然科学版);2004年S1期
10 付国瑜;;Web文本分类挖掘[J];科学咨询(决策管理);2008年03期
11 曹丽君;刘西印;杨燕萍;;WEB页面文本挖掘的价值与未来探究[J];商场现代化;2008年09期
12 韩洁;;Web文本挖掘技术在信息生产领域的应用研究[J];硅谷;2010年08期
13 胥桂仙,杨丹丹,高旭,陈立新;中文文本挖掘中姓名特征提取技术的研究[J];中央民族大学学报(自然科学版);2003年04期
14 刘春艳,张爱连,胡铁军;数据挖掘及其在信息服务业应用的研究现状[J];医学情报工作;2004年06期
15 吕冬煜,党齐民;基于文本挖掘的可视化竞争情报提取[J];计算机应用与软件;2005年02期
16 李文炬;文本挖掘技术在农业科技基础数据库中应用的探讨[J];农业网络信息;2005年11期
17 王珍珍;;关于文本挖掘中文本分类与文本聚类的研究[J];科技信息;2007年06期
18 李翠霞;林楠;;浅析文本挖掘技术[J];科技信息;2007年10期
19 李湘云;;ISODATA动态聚类算法在文本挖掘中的应用[J];长春工程学院学报(自然科学版);2007年02期
20 孙玉娣;裴勇;;基于可视化文本挖掘的本体构建[J];情报杂志;2007年12期
中国重要会议论文全文数据库 前10条
1 李彦鹏;杨志豪;林鸿飞;;基于条件随机域的生物医学命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
2 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
3 王继成;孙颖;张福炎;;文本挖掘-数据挖掘研究的新课题[A];第十六届全国数据库学术会议论文集[C];1999年
4 张贺秋;;胶体金探针的制备和在生物医学中的应用[A];中国动物学会全国显微与亚显微形态科学(细胞及分子显微技术科学)分会第十一次学术研讨会论文摘要集[C];2002年
5 王浩畅;赵铁军;李艳;;生物医学命名实体识别的特征选取与评价[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 李渝勤;孙丽华;;面向互联网舆情的热词分析技术[A];第六届全国信息检索学术会议论文集[C];2010年
7 王浩畅;赵铁军;刘延力;于浩;;生物医学文本中命名实体识别的智能化方法[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
8 张佳宝;周斌;吴泉源;;基于Hadoop的并行化命名实体识别技术研究与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
9 蒋子海;周斌;吴泉源;;基于UIMA AS的文本挖掘系统的性能分析与评估[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
10 齐振宇;赵军;杨帆;;一种开放式中文命名实体识别的新方法[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 杨志豪;面向生物医学领域的文本挖掘技术研究[D];大连理工大学;2008年
2 李彦鹏;特征耦合泛化及其在文体挖掘中的应用[D];大连理工大学;2011年
3 江会星;汉语命名实体识别研究[D];北京邮电大学;2012年
4 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
5 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
6 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
7 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
8 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
9 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
10 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年
中国硕士学位论文全文数据库 前10条
1 周昆;基于规则的命名实体识别研究[D];合肥工业大学;2010年
2 刘明岩;面向语义关系发现的文本挖掘研究[D];南京理工大学;2010年
3 李钝;基于粗糙集理论的文本挖掘技术研究[D];山西大学;2003年
4 周荣鹏;生物医学文献中命名实体的识别[D];大连理工大学;2009年
5 陈扬;基于命名实体识别的学科智能答疑模型研究[D];东北师范大学;2010年
6 程春惠;公安犯罪案件文本挖掘关键技术研究[D];浙江大学;2010年
7 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
8 王江伟;基于最大熵模型的中文命名实体识别[D];南京理工大学;2005年
9 姚继伟;基于XML的Web文本挖掘的研究[D];吉林大学;2010年
10 张晓艳;基于混合统计模型的汉语命名实体识别方法的研究与实现[D];国防科学技术大学;2004年
中国重要报纸全文数据库 前9条
1 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
2 ;用挖掘技术使学术资源利用效益最大化[N];中国计算机报;2007年
3 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
4 刘家豪;东软集团做全球优秀的IT服务商[N];中国企业报;2008年
5 本报记者 徐述湘;保障医疗安全策略之创建可靠的医疗保健系统[N];中国医药报;2009年
6 ;未来十年展望之体验技术[N];中国计算机报;2010年
7 主任记者 李海英;东软健康服务产业园落户泗水科技城[N];沈阳日报;2010年
8 ;自助服务BI、实时分析声势渐强[N];网络世界;2011年
9 记者 陈钧;翁杰明会见东软集团董事长刘积仁[N];重庆日报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978