使用互信息辅助在篇章范围内识别命名实体
【摘要】:识别命名实体(本文指专有名称、未登录普通词和篇章术语)是中文处理的一个重要问题。本文采用篇章内统计的方法,计算文本文档初步切分后任意两个邻接项(包括词和落单字)的互信息,以此作为判定这两个邻接项是否可能形成新的命名实体的依据。对于可能形成新命名实体的串,继续利用互信息并结合构词法向左右两个方向扩展来确定其边界。最后根据串的内部构造和篇章上下文确定命名实体的类别。
|
|
|
|
1 |
杨胜,施鹏飞,顾钧;基于互信息和Beam搜索的粗糙集属性约简算法[J];控制与决策;2004年11期 |
2 |
李卫华,周军,周连文,程英蕾;一种基于互信息和小波分解的图像配准算法[J];计算机工程与应用;2005年33期 |
3 |
张国伟;邵世煌;齐金鹏;张颖;;基于信息度量的基因网络建模[J];生物信息学;2006年04期 |
4 |
杨春兰;郑链;李晓明;;高阶熵在医学图像配准中的应用研究[J];计算机工程与应用;2007年11期 |
5 |
朱冰莲;田学隆;宋维杰;;基于人工免疫系统的医学图像配准[J];仪器仪表学报;2009年07期 |
6 |
裘意娜;李均利;金林鹏;;基于概率和引力优化模型的医学图像配准[J];中国生物医学工程学报;2010年03期 |
7 |
赵秦怡;王丽珍;;一种基于互信息的串扫描中文文本分词方法[J];情报杂志;2010年07期 |
8 |
张国煊,郁梅,王小华;基于互信息的汉语短语边界划分[J];杭州电子工业学院学报;1995年01期 |
9 |
刘琚,鲁子奕,何振亚,梅良模;基于信息理论准则的盲源分离方法[J];应用科学学报;1999年02期 |
10 |
杨代明,张立明,胡波;多输入多输出衰落信道的最小互信息盲均衡[J];电子学报;2004年12期 |
11 |
张锋,许云,侯艳,樊孝忠;基于互信息的中文术语抽取系统[J];计算机应用研究;2005年05期 |
12 |
杨烜;裴继红;谢维信;;图像插值方法对互信息局部极值的影响分析[J];电子与信息学报;2006年10期 |
13 |
李泽峰;王煜;;基于RBF神经网络和关联规则的Web文本分类规则获取方法[J];图书情报工作;2006年10期 |
14 |
臧丽;王敬东;;基于互信息的红外与可见光图像快速配准[J];红外与激光工程;2008年01期 |
15 |
刘井莲;赵卫绩;;一种基于互信息的规则约简方法[J];计算机与信息技术;2008年05期 |
16 |
袁红玉;樊玮;马婕;;基于二元信道互信息的属性约简方法及其应用[J];航空计算技术;2008年06期 |
17 |
张佃中;;小波互信息及其在心电分析中的应用[J];数据采集与处理;2009年03期 |
18 |
梁颖红;张文静;张有承;;C值和互信息相结合的术语抽取[J];计算机应用与软件;2010年04期 |
19 |
于淼;李式巨;杨志敏;;自适应随机共振二进制基带信号处理[J];浙江大学学报(工学版);2010年04期 |
20 |
刘喜平;龚晓彦;郭希娟;;基于互信息的医学图像匹配中的改进插值算法[J];计算机仿真;2010年07期 |
|