收藏本站
收藏 | 论文排版

邮件语料库的语料添加算法研究与实现

李军辉  朱巧明  钱培德  
【摘要】:本文介绍了在构建动态邮件语料库时所必须解决的问题-邮件语料的添加。由于待添加的邮件预先都已标好类别,根据其类别是否属于原有的类别体系,分两种情况进行处理:1)属于原有类别的新邮件, 将这类邮件细分为Ⅰ、Ⅱ和Ⅲ类,最后只将属于Ⅲ类的新邮件添加到原语料库中;2)不属于原有类别的新邮件,将此类邮件进行去重后全部添加到语料库中。模拟的邮件语料添加实验表明了待添加语料裁剪的必要性及添加算法的有效性。

知网文化
【相似文献】
中国重要会议论文全文数据库 前1条
1 李军辉;朱巧明;钱培德;;邮件语料库的语料添加算法研究与实现[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978