收藏本站
《第三届学生计算语言学研讨会论文集》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

全切分图与路径表达式在分词算法中的应用

陈晓苏  邹园斌  张文珂  
【摘要】:汉语句子S的全切分图记作Graph(S),意思是,该图的所有路径之集Path(Graph(S))正好表示了S的所有切分方案之集Seg(S).我们用一个正则表达式Path-Expression(S)来表示该图的所有路径之集.因此有Path-Expression(S)=Seg(S).然后我们分别给出了分解Graph(S)与Path-Expression(S)为素子图(仍然是全切分图)与素因式(仍然是路径表达式)的做法,最后还给出利用全切分图给它的所有路径编码-译码的算法。所有这些想法与做法不仅其正确性可严格论证,而且已设计有算法, 并已在计算机上实现了。上述两种素分解能使路径集呈指数性削减,路径表达式全局性地把握路径集,素子图与素因式又都十分简单,可望能给汉语语句的词切分与词性标注,甚至给短语确认和句法成分认定等工作带来积极的影响。

手机知网App
【参考文献】
中国期刊全文数据库 前4条
1 于源,衣袭;中文全切分快速分词方法[J];大连铁道学院学报;2005年02期
2 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
3 徐华中;徐刚;;一种新的汉语自动分词算法的研究和应用[J];计算机与数字工程;2006年02期
4 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
中国重要会议论文全文数据库 前2条
1 曲维光;;分词系统计量研究与改进方案[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 江丰;刘慧;陈玉泉;陆汝占;;一个可扩展的汉语词法和句法分析一体化系统[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
【共引文献】
中国期刊全文数据库 前10条
1 耿增民;刘万春;朱玉文;;受限领域的自动文摘方法研究[J];北京理工大学学报;2006年08期
2 李六杏;区凤霞;;基于最优属性约简的中文邮件过滤系统[J];电脑知识与技术(学术交流);2007年05期
3 魏晓宁;;基于隐马尔科夫模型的中文分词研究[J];电脑知识与技术(学术交流);2007年21期
4 张磊;张代远;;中文分词算法解析[J];电脑知识与技术;2009年01期
5 陈文君;於文雪;;汉英跨语言检索系统中关键词提取方法的研究[J];电脑知识与技术;2009年28期
6 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
7 冯永;贺迅;唐黎;陈显勇;陈贞;;面向文本知识管理的自适应中文分词算法[J];重庆大学学报;2010年10期
8 王坚,赵恒永;专业搜索引擎中文分词算法的实现与研究[J];福建电脑;2005年07期
9 蔡勇智;;未登录词识别算法的改进[J];福建电脑;2006年03期
10 刘延华;林嘉雯;;基于贝叶斯算法的中文邮件过滤系统设计[J];福建电脑;2009年11期
中国重要会议论文全文数据库 前10条
1 沈焕生;朱磊;;基于信息内容的关键词抽取研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
2 朱春江;陆宇旻;李陶深;杜衡斌;唐晟;;分布式网络监控系统中网页安全挖掘的研究[A];广西计算机学会2008年年会论文集[C];2008年
3 邓攀;刘功申;;基于标引信息的网络新概念发现算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
4 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
5 李斌;;中文单字国名简称的自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 林小俊;田浩;王馨浩;杜蕴璇;许敏;吴玺宏;迟惠生;;语言模型训练语料处理方法及解码词典的设计[A];第八届全国人机语音通讯学术会议论文集[C];2005年
7 何中军;刘群;林守勋;;统计机器翻译中短语切分的新方法[A];第三届学生计算语言学研讨会论文集[C];2006年
8 朱鉴;张建;李淼;强静;杨攀;;面向民族语言信息处理的汉语分词方法[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 文捷;汪卫;王轶彤;;ECMail:基于实体发现、查找和管理的中文邮件管理系统[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
10 刘力;皮德常;;基于词性的文本挖掘算法在IDS日志中的应用[A];2009年中国智能自动化会议论文集(第三分册)[C];2009年
中国博士学位论文全文数据库 前10条
1 刘运通;产品设计过程知识配送服务关键技术研究[D];浙江大学;2011年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
4 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
5 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
6 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
7 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
8 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
9 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
10 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年
中国硕士学位论文全文数据库 前10条
1 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
2 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年
3 陈旭;地理编码引擎的设计与实现[D];辽宁工程技术大学;2009年
4 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
5 常富国;高技术虚拟企业谈判支持问题处理系统研究[D];哈尔滨理工大学;2010年
6 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
7 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年
8 兰冲;基于统计规则的中文分词研究[D];西安电子科技大学;2011年
9 李长进;基于中文带权关键词树的受限领域问答系统研究[D];山东经济学院;2011年
10 林冬盛;中文分词算法的研究与实现[D];西北大学;2011年
【二级参考文献】
中国期刊全文数据库 前3条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
3 郭祥昊,钟义信,杨丽;基于两字词簇的汉语快速自动分词算法[J];情报学报;1998年05期
中国重要会议论文全文数据库 前1条
1 曲维光;陈小荷;;标注语料机器校对的研究与实践[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【相似文献】
中国期刊全文数据库 前10条
1 鲁明羽,陆玉昌;基于OEM模型的半结构化数据的模式抽取[J];清华大学学报(自然科学版);2004年09期
2 李熙;徐德智;;基于模式的XML查询重写研究[J];中国科技信息;2009年12期
3 胡少伟;;XML路径表达式的查询优化技术[J];科学之友(B版);2009年08期
4 车五一;;基于Xpath的XML安全访问控制方法[J];辽宁石油化工大学学报;2007年02期
5 王静,孟小峰,王珊;基于区域划分的XML结构连接[J];软件学报;2004年05期
6 赵东范;一个求有向图路径表达式的算法NNRA[J];吉林大学学报(信息科学版);1991年01期
7 吉凤岗;一种共享资源并发存取控制机制——路径表达式[J];华北电力大学学报;1991年01期
8 姚全珠;丁晓剑;;处理XML文档查询的高效结构连接方法[J];计算机工程;2006年18期
9 范新灿;杨丽娟;;基于路径表达式的XML查询优化模型研究与设计[J];情报杂志;2008年11期
10 李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期
中国重要会议论文全文数据库 前10条
1 陈晓苏;邹园斌;张文珂;;全切分图与路径表达式在分词算法中的应用[A];第三届学生计算语言学研讨会论文集[C];2006年
2 肖艳芹;王宇;黄炜;李天柱;;带量词路径表达式计算的优化[A];第十六届全国数据库学术会议论文集[C];1999年
3 方强;王国仁;于戈;郑怀远;;计算路径表达式的并行级联式半连接算法[A];第十六届全国数据库学术会议论文集[C];1999年
4 鲍培明;;XML的语义结构模型设计[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 万常选;林大海;;基于X-RESTORE有效地处理XPath路径表达式[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
6 姚建中;孙建伶;姜忠鼎;董金祥;;OSCAR路径表达式的查询处理[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
7 王宇;孟小峰;王珊;;Orient-X中的复杂路径表达式求解[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
8 方强;王国仁;于戈;郑怀远;;并行调度路径表达式的代价模型和自适应调度算法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
9 何震瀛;李建中;王春宇;;一种XML数据库的存储结构——ASRX[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
10 严梅;郭瑞强;贾晓辉;乐嘉锦;;基于S&V索引的XML文档查询[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国重要报纸全文数据库 前1条
1 北京邮电大学 张剑;XML的显示——XSL样式单(下)[N];计算机世界;2001年
中国博士学位论文全文数据库 前6条
1 宫学庆;基于Bloom Filter的路径表达式查询处理[D];复旦大学;2006年
2 向桂林;XML引擎研究[D];中国科学院研究生院(文献情报中心);2004年
3 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
4 王静;XML路径查询处理关键技术研究[D];中国科学院研究生院(计算技术研究所);2003年
5 刘逸敏;基于访问目的的隐私数据访问控制机制研究[D];复旦大学;2012年
6 李效东;自治异构数据源的集成查询处理[D];中国科学院研究生院(软件研究所);2002年
中国硕士学位论文全文数据库 前10条
1 白林;基于路径表达式的XML索引查询技术[D];郑州大学;2010年
2 唐红光;基于XPath路径表达式的选择度估算研究[D];中南林业科技大学;2007年
3 韩新超;XML数据的存储和查询的研究[D];燕山大学;2004年
4 沈剑沧;XML查询方法研究[D];华东师范大学;2006年
5 冯林;XML查询处理结构中的一种逻辑优化算法[D];西南大学;2008年
6 张静;Native XML数据库的查询优化研究[D];中国石油大学;2008年
7 段洪秀;一种基于关系数据库的XML文档存储和查询的方法[D];山西大学;2006年
8 王宁;基于前缀编码XML查询新策略的研究[D];山东大学;2008年
9 陈波;XML文档数据查询技术研究[D];山东大学;2005年
10 曾时应;面向生物信息数据的XML存储和查询优化[D];国防科学技术大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026