收藏本站
《中国计算语言学研究前沿进展(2009-2011)》2011年
收藏 | 手机打开
二维码
手机客户端打开本文

事件词驱动的文本事件信息结构初探

曾青青  杨尔弘  
【摘要】:本文结合戴伊克新闻文本的话语图式,以体现文本重要事件信息的事件词所分布的句子为观测点,指出了突发事件文本由主线信息链和副线信息链构成。其中,明确提出主线信息链代表了文本的事件信息结构,由前核心事件链、核心事件链、次生事件链和再生事件链构成。副线信息链则是由"评价"部分、"背景"部分以及"情节"部分中的过细节信息以及事件词缺省的事件信息所在的句子等构成。同时,针对事件词有效性和区分度的问题,本文利用知网(HowNet)对事件词进行扩充,利用部分词语标记过滤副线信息链,实验结果证明方法具有可行性。
【作者单位】:北京语言大学应用语言学研究所
【关键词】:事件词 事件信息结构 话语图式 主线信息链 副线信息链
【基金】:国家社科基金项目“面向内容计算的文本信息标注研究”(06YY047)
【分类号】:TP391.1
【正文快照】:
1引言随着互联网的广泛应用,新闻信息的利用需求不断提高,准确地从大量无序、杂乱、无结构的信息中提取用户感兴趣的事件信息已经成为信息抽取领域一个重要的研究课题。现有的事件抽取研究还主要局限在句子范围内,对整篇文本进行事件信息抽取的研究并不多。一个主题文本中

【参考文献】
中国期刊全文数据库 前4条
1 钱敏汝;;戴伊克的话语宏观结构论(上)[J];国外语言学;1988年02期
2 钱敏汝;;戴伊克的话语宏观结构论(下)[J];国外语言学;1988年03期
3 袁毓林;信息抽取的语义知识资源研究[J];中文信息学报;2002年05期
4 赵妍妍;秦兵;车万翔;刘挺;;中文事件抽取技术研究[J];中文信息学报;2008年01期
中国博士学位论文全文数据库 前2条
1 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
2 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
【共引文献】
中国期刊全文数据库 前10条
1 叶枫;;话语的宏观结构与高级英语教学[J];安徽工业大学学报(社会科学版);2010年01期
2 贺明华;;群体性事件深度报道话语分析——以瓮安6·28事件深度报道为例[J];安庆师范学院学报(社会科学版);2011年03期
3 庄永志;;《焦点访谈》和《新闻调查》有关艾滋病报道的发展变化[J];中国编辑;2008年01期
4 李建伟;董彦君;;我国女性文摘类期刊:现状及建构[J];编辑之友;2010年03期
5 董雪飞;;权力·意识形态·启蒙——格拉斯哥媒介研究小组的批判理论述评[J];今传媒;2008年06期
6 仲兆满;刘宗田;;基于两级概念格的信息抽取的研究[J];江西师范大学学报(自然科学版);2008年02期
7 杨勇涛;;文本自动摘要提取算法[J];成都大学学报(自然科学版);2009年02期
8 舒晓谷,彭宣维;五种语篇信息理论模式述评[J];重庆大学学报(社会科学版);1997年01期
9 刘晓东;朱翊;孙立坚;柳棽;;面向突发事件的地理信息服务研究[J];测绘科学;2010年06期
10 林纲;;网络新闻语言的隐性功能分析[J];传媒观察;2008年07期
中国重要会议论文全文数据库 前10条
1 陈静静;;大众传媒中的文化冲突建构——“100%安全套项目”报道的个案分析[A];2006中国传播学论坛论文集(Ⅰ)[C];2006年
2 刘晓东;朱翊;柳棽;;基于突发事件的空间信息定位匹配方法研究[A];中国测绘学会九届三次理事会暨2007年“信息化测绘论坛”学术年会论文集[C];2007年
3 张萱;;媒介文本分析视角下的中国大陆地区“城市主流生活杂志”——以上海、广州、武汉三地杂志为例[A];中国传媒大学第二届全国新闻学与传播学博士生学术研讨会论文集[C];2008年
4 胡范铸;;中国新闻言语行为构成性规则的演绎分析[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
5 骆正林;;领导干部的媒体素养与突发性事件的处理[A];新闻传媒与社会发展论坛·2007——中国新闻业发展现状与趋势论文集[C];2007年
6 方莹;杨尔弘;;基于多特征的句子聚类方法研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 杨尔弘;邹红建;;面向内容计算的意义单元及其标注研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 陈慧;张普;;基于DCC动态流通语料库的中文组织名监测与研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 陈慧;董守志;张普;;基于动态流通语料库(DCC)的中文组织名简称考察与研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
10 钟涛;陈群秀;;基于Web主题性信息检索的灾难性事件信息抽取系统[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 原雪;二语/外语语境下的批判性阅读理论构建研究[D];上海外国语大学;2010年
2 张小峰;现代汉语语气词“吧”、“呢”、“啊”的话语功能研究[D];上海师范大学;2003年
3 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
4 孔祥军;新闻精品:一种理论建构和组织文化的框架[D];复旦大学;2005年
5 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
6 熊文新;信息检索Query语言分析[D];北京语言大学;2006年
7 杨效宏;媒介话语,现代传播中的个体呈现[D];四川大学;2006年
8 海阔;大众传媒与中国现代性[D];浙江大学;2006年
9 陈振宇;现代汉语时间系统的认知模型与运算[D];复旦大学;2006年
10 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
中国硕士学位论文全文数据库 前10条
1 申卫峰;《足球》报国际足球深度报道的叙事学研究[D];上海体育学院;2010年
2 潘红英;时政深度报道的传播符号研究[D];上海外国语大学;2010年
3 张晓媚;中美媒体对中国在金融危机中经济角色的建构[D];上海外国语大学;2010年
4 孙晓农;美国三大电视网“三聚氰胺事件”拟态环境建构研究[D];上海外国语大学;2010年
5 郑闯;镜像与他者:《印度时报》涉华报道研究[D];上海外国语大学;2010年
6 黄华;灾难新闻“英雄”原型研究[D];湘潭大学;2010年
7 尹成;中国新闻奖的价值分析[D];湘潭大学;2010年
8 曹碧波;突发事件报道中的国家形象构建[D];湘潭大学;2010年
9 陈琦;大众文化叙事下的媒介公信力研究[D];湘潭大学;2010年
10 张同;从布迪厄的惯习、场域理论看网络论坛中网民话语权[D];江西师范大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 顾阳;论元结构理论介绍[J];国外语言学;1994年01期
2 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
3 廖乐健,曹元大,李新颖;基于Ontology的信息抽取[J];计算机工程与应用;2002年23期
4 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
5 周志华;史忠植;;人工智能国际研究进展——第17届国际人工智能联合大会评述[J];计算机科学;2001年12期
6 姜吉发;一种跨语句汉语事件信息抽取方法[J];计算机工程;2005年02期
7 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
8 袁毓林;信息抽取的语义知识资源研究[J];中文信息学报;2002年05期
9 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
10 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
中国重要会议论文全文数据库 前1条
1 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前2条
1 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
2 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
中国硕士学位论文全文数据库 前2条
1 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
2 王昀;金融领域中汉语时间信息抽取的研究[D];清华大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 仲勇;;用F8键快捷选Word文本[J];家庭科技;2010年02期
2 ;《文本之星3.3测试版》[J];电子计算机与外部设备;2001年07期
3 杨英;处理文本用的软件[J];管理科学文摘;1996年04期
4 王毅;Windows 98中渐变彩色文本的实现[J];微电脑世界;1999年07期
5 张均东,孙宏;Word 2000中的几则常用技巧[J];微电脑世界;2000年21期
6 李建生!云南;EmEditor──文本飞扬[J];电子科技;2001年11期
7 东东;轻松文本[J];网络与信息;2004年04期
8 柴振荣;文本管理程序[J];管理科学文摘;1995年04期
9 石磊,周敏;用Borland C++设计CAI课件的文本和图形[J];华北科技学院学报;1999年02期
10 胡贤金;AUTOLISP中LISP文本与命令文本的耦合完成复杂零件的绘图[J];兵工自动化;1990年04期
中国重要会议论文全文数据库 前10条
1 曾青青;杨尔弘;;事件词驱动的文本事件信息结构初探[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 李晓栋;胡清华;;汽轮机故障诊断文本支持系统的研究与建立[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
3 易绵竹;南振兴;李绍哲;薛恩奎;;文本生成与理解的语言学模拟——伊戈尔·梅里丘克《意思(?)文本》模型评介[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 沈志斌;白清源;;基于加权修正的KNN文本分类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
5 张鹏;李国臣;李茹;刘海静;石向荣;;基于FrameNet框架关系的文本蕴含识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 单大甫;周斌;黄九鸣;;基于CAAR算法的文本倾向性分析技术[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
7 徐代刚;唐常杰;于中华;;从Web文档中采掘语言知识[A];第十五届全国数据库学术会议论文集[C];1998年
8 曾青青;杨尔弘;;突发事件文本的信息结构分析[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 曾青青;杨尔弘;朱丹青;;基于信息结构的突发事件文本事件信息自动抽取策略研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
10 眭新光;沈蕾;燕继坤;朱中梁;;基于Adaboost的文本隐写分析[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
中国重要报纸全文数据库 前10条
1 刘福旺;让文本动起来[N];中国电脑教育报;2002年
2 李岩;怎样快速录入报表[N];建筑报;2000年
3 安徽 高伟;文本批量替换好帮手[N];电脑报;2004年
4 李永波;实现滚动文本一例[N];中国电脑教育报;2004年
5 浙江省绍兴县职业教育中心 何永胜;让文本发声[N];中国电脑教育报;2004年
6 宋志明;文本也能转成MP3[N];中国电脑教育报;2004年
7 7star;动态文本变变变[N];中国电脑教育报;2002年
8 重庆 雪飞;文本也能批量翻译[N];电脑报;2001年
9 dogQ;网页中的文本自动输出[N];中国电脑教育报;2002年
10 重庆 常笑;从方正飞腾输出文本[N];电脑报;2004年
中国博士学位论文全文数据库 前10条
1 罗纲;文本隐藏信息检测技术研究[D];湖南大学;2008年
2 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
3 陶冶;文本语音匹配的研究和应用[D];山东大学;2009年
4 韦世奎;基于信息融合的多媒体内容搜索[D];北京交通大学;2010年
5 赵韩涛;基于GIS-T的高速公路紧急救援系统构建及相关模型研究[D];吉林大学;2006年
6 周英华;位置相关Web搜索的检索技术研究[D];中国科学技术大学;2006年
7 吴磊;视觉语言分析:从底层视觉特征表达到语义距离学习[D];中国科学技术大学;2010年
8 杨雄;图像解译数据库与物体识别的计算机理研究[D];华中科技大学;2010年
9 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
10 赵世奇;基于统计的复述获取与生成技术研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 潘莹;基于需求文本的GIS语义挖掘初步研究[D];南京师范大学;2004年
2 刘云中;基于隐马尔可夫模型的文本信息抽取算法研究[D];湖南大学;2004年
3 汪正中;基于英文博客空间文本的情感分析研究[D];温州大学;2011年
4 王振浩;基于情感字典与机器学习相结合的文本情感分类[D];哈尔滨工业大学;2010年
5 霍宗凡;基于语义的文本倾向性分析与研究[D];南京邮电大学;2011年
6 宋勋超;文本聚类算法的语义性改进与实现[D];浙江大学;2011年
7 李本阳;句子和篇章文本倾向分析[D];哈尔滨工业大学;2010年
8 方明;基于Web的评论文本倾向性分析技术研究[D];山东师范大学;2012年
9 姚延栋;国际化文本竖排机制研究和实现[D];中国科学院研究生院(软件研究所);2005年
10 马焱炜;可视化集成开发环境研究[D];武汉理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026