收藏本站
《第二届全国学生计算语言学研讨会论文集》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于一元语法模型的中文话题追踪

王会珍  朱靖波  陈文亮  季铎  张斌  
【摘要】:话题追踪(topic tracking)的目的是监控新闻故事流识别出与预先给定几个新闻故事表述的话题相关的后继故事。本文采用一元语法模型对中文故事进行话题追踪,并分析了影响中文话题追踪性能的3个因素:特征数目、分词技术、命名实体识别技术。实验结果显示选取适当的特征数目、使用好的分词技术、使用命名实体识别技术都能改进中文话题追踪系统的性能。本文选用TDT3语料作为测试语料,系统达到最好的追踪性能时,在漏报率为4.0%的情况下,误报率仅为1.8%,系统最小开销为0.0029,Norm(C_(track))为0.1239。

【引证文献】
中国期刊全文数据库 前2条
1 施侃晟;刘海涛;白英彩;宋文涛;周书勇;;便于快速信息融合的主题检测算法[J];电子科技大学学报;2012年06期
2 王会珍;朱靖波;季铎;叶娜;张斌;;基于反馈学习自适应的中文话题追踪[J];中文信息学报;2006年03期
中国重要会议论文全文数据库 前3条
1 王会珍;朱靖波;季铎;张斌;;基于多向量模型的中文话题追踪[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 王会珍;朱靖波;季铎;叶娜;张斌;;基于反馈学习自适应的中文话题追踪[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 王会珍;张希娟;朱靖波;张斌;;基于主动学习的自适应话题追踪[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
【同被引文献】
中国期刊全文数据库 前10条
1 孙其博;刘杰;黎羴;范春晓;孙娟娟;;物联网:概念、架构与关键技术研究综述[J];北京邮电大学学报;2010年03期
2 王桐;赵春晖;焉晓贞;;基于PML及Hedge的物联网异构信息集成处理模型[J];东南大学学报(自然科学版);2011年02期
3 赵华;赵铁军;张姝;王浩畅;;基于内容分析的话题检测研究[J];哈尔滨工业大学学报;2006年10期
4 张阔;李涓子;吴刚;王克宏;;基于关键词元的话题内事件检测[J];计算机研究与发展;2009年02期
5 刘强;崔莉;陈海明;;物联网关键技术与应用[J];计算机科学;2010年06期
6 张京阳;张华平;刘金刚;;基于聚团词的大规模文本转载识别算法[J];计算机应用;2010年06期
7 王会珍;朱靖波;季铎;叶娜;张斌;;基于反馈学习自适应的中文话题追踪[J];中文信息学报;2006年03期
8 洪宇;张宇;刘挺;李生;;话题检测与跟踪的评测及研究综述[J];中文信息学报;2007年06期
9 张辉;周敬民;王亮;赵莉萍;;基于三维文档向量的自适应话题追踪器模型[J];中文信息学报;2010年05期
10 洪宇;张宇;范基礼;刘挺;李生;;基于语义域语言模型的中文话题关联检测[J];软件学报;2008年09期
【二级引证文献】
中国期刊全文数据库 前3条
1 武军娜;戚银城;杨迪;张华芳子;刘明军;;时间信息在话题跟踪中的应用[J];电子科技;2012年07期
2 施侃晟;刘海涛;白英彩;宋文涛;周书勇;;便于快速信息融合的主题检测算法[J];电子科技大学学报;2012年06期
3 姚长青;杜永萍;;基于主题的舆情跟踪方法研究及性能评价[J];图书情报工作;2012年18期
中国重要会议论文全文数据库 前3条
1 陈都;郑玲;;基于反馈学习的自适应搜索机制的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
2 邱立坤;陶然;龙志祎;程葳;;面向互联网的话题发现技术研究[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
3 郑伟;张宇;邹博伟;洪宇;刘挺;;基于相关性模型的中文话题跟踪研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前3条
1 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
2 王肃;基于多Agent的突发事件信息智能监测系统研究[D];北京邮电大学;2011年
3 郝秀兰;文本分类技术与应用研究[D];复旦大学;2008年
中国硕士学位论文全文数据库 前10条
1 吕楠;话题追踪与演化分析技术研究[D];解放军信息工程大学;2009年
2 刘旭;基于互联网数据的话题发现及追踪技术研究与实现[D];复旦大学;2010年
3 刘旭;博客热点话题挖掘方法[D];哈尔滨工业大学;2010年
4 许志凯;网络舆情分析关键技术的研究与实现[D];哈尔滨工业大学;2011年
5 宋丹;基于语义和链接的话题跟踪方法[D];大连理工大学;2007年
6 杨丽英;基于主题要素的突发事件后续报道追踪方法研究[D];山西大学;2008年
7 郑希文;互联网话题演变与传播分析技术研究[D];哈尔滨工程大学;2009年
8 齐海凤;网络舆情热点发现与事件跟踪技术研究[D];哈尔滨工程大学;2008年
9 张楷卉;面向新闻报道的话题检测技术研究[D];哈尔滨工程大学;2008年
10 王金柱;基于系统相似模型与持续时间的话题检测技术研究[D];复旦大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 李茉娜;李茉莉;;“每隔+数量_1+VP+数量_2”的语法意义和句法功能[J];云南师范大学学报(对外汉语教学与研究版);2010年06期
2 孟广道;三字格语料琐谈[J];固原师专学报;1996年05期
3 孙德金;现代汉语动词做状语考察[J];语言教学与研究;1997年03期
4 张宁志;;汉语教材语料难度的定量分析[J];世界汉语教学;2000年03期
5 邱丽佳;;中古词汇研究的几个问题[J];科技信息;2009年25期
6 贾秀春;;浅谈现代汉语教学方式与学习方式的变革——透视研究性学习[J];黑龙江科技信息;2010年14期
7 刘英林;中国汉语水平考试十年(一)[J];汉语学习;1996年04期
8 梅勇,王群生,徐秉铮;基于 FoxPro for Windows 的汉语语料库系统的构造[J];华南理工大学学报(自然科学版);1998年01期
9 王茂林;解说式广播话语之间断分析[J];暨南大学华文学院学报;2004年03期
10 洪晓鹏,姚鸿勋,徐铭辉;基于句子级的唇读语料库及其切分算法[J];计算机工程与应用;2005年03期
中国重要会议论文全文数据库 前10条
1 王会珍;朱靖波;陈文亮;季铎;张斌;;基于一元语法模型的中文话题追踪[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 刘昆;张建平;颜永红;;统计语言模型中语料的选择[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
3 蒋宏飞;曹海龙;杨沐昀;;基于大规模语料的中文词聚类研究与实现[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 吴金星;长青;;蒙古语语料库基本加工规范初探[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 曲维光;;分词系统计量研究与改进方案[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 李文;李淼;张建;陈雷;雪艳;;一种带权值参数的非监督式形态切分方法[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 徐洁;;语料是语言研究的根本——读王希杰先生语言论著有悟[A];王希杰修辞思想研究续辑——暨王希杰修辞思想研讨会论文集[C];2004年
8 张昱琪;周强;;大规模真实文本中汉语动词语法搭配模板的自动识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 吾守尔·斯拉木;;前言[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
10 赵彦春;;认知词典学发轫——关于词典学认知方法的探索[A];中国辞书论集2001[C];2001年
中国重要报纸全文数据库 前10条
1 温端政;山西社科院试建“汉语俗语语料数据库”[N];中国社会科学院院报;2003年
2 记者 吕诺;掌握千字万词,即可看懂九成中文读物[N];新华每日电讯;2006年
3 本报记者 姚从权;我国自己的大规模口语库即将建成[N];中国社会科学院院报;2004年
4 李玉兰;中国语言文字观念正在变化[N];光明日报;2007年
5 喻京英;国民母语意识增强[N];人民日报海外版;2007年
6 王珊;国家语言资源监测与研究中心工作会议在厦门召开[N];语言文字周报;2006年
7 本报记者 塔娜;为中国少数民族语言研究提供资源平台[N];中国社会科学院院报;2007年
8 王铁琨;《2006汉语新词语》序(节选)[N];语言文字周报;2008年
9 江获;数据库是语言学家的重要工具[N];中国社会科学院院报;2004年
10 本报记者 王继晟 张然;流行语多少财富在流行[N];市场报;2003年
中国博士学位论文全文数据库 前10条
1 李线宜;上海手语类标记结构调查研究[D];复旦大学;2010年
2 姚美玲;唐代墓誌词汇研究[D];南京师范大学;2004年
3 于飞;两汉常用词研究[D];吉林大学;2008年
4 李梅;半机构性话语中的他人修正[D];上海外国语大学;2008年
5 贾红霞;普通话儿童空间范畴表达发展的个案研究[D];中国社会科学院研究生院;2009年
6 罗黎丽;五周岁汉语儿童的言语交际研究[D];暨南大学;2012年
7 何婷婷;语料库研究[D];华中师范大学;2003年
8 许菊芳;四种现存托名汉代小说语料鉴别研究[D];浙江大学;2009年
9 王淑华;晚唐五代连词研究[D];山东大学;2009年
10 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
中国硕士学位论文全文数据库 前10条
1 李桂东;现代汉语动宾式动词的认知研究[D];上海外国语大学;2009年
2 王晓斌;阜宁方言调查研究[D];南京师范大学;2004年
3 樊谊军;现代汉语“能”与“会”的用法对比及其偏误分析[D];上海师范大学;2012年
4 秦雯;上海地区口语中普通话与上海话之间的语码转换现象[D];华东师范大学;2007年
5 李腊梅;三套对外汉语初中级听力材料对比研究[D];厦门大学;2008年
6 夏远航;手机报语言研究[D];安徽大学;2010年
7 朱鑫;词语搭配自动抽取方法对比研究[D];大连海事大学;2011年
8 林宝珠;隐喻的意识形态力—布什和胡锦涛的政治演讲语料的个案分析[D];福建师范大学;2009年
9 张健;翻译过程中翻译策略和翻译单位的TAPs语料研究[D];清华大学;2004年
10 谢玲琍;基于语料的歌曲翻译变化研究[D];湖南大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026