收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于电子商务用户行为的同义词识别

张书娟  董喜双  关毅  
【摘要】:本文研究了电子商务领域同义词的自动识别问题。针对该领域新词多、错别字多、近义词多的用词特点,提出基于用户行为的同义词识别方法。首先通过并列关系符号切分商品标题和基于SimRank思想聚集查询两种方法获取候选集合,进而获取两词的字面特征以及标题、查询、点击等用户行为特征,然后借助Gradient Boosting DecisionTree(GBDT)模型判断是否同义。实验表明同义词识别准确率达到了54.46%,高于SVM近4个百分点。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘政;朱杰;吴树芳;曹振;;信息检索中的同义词[J];电脑知识与技术;2009年09期
2 章成志;苏新宁;;面向信息检索的词汇知识发现[J];现代图书情报技术;2007年01期
3 向坚持;刘相滨;徐选华;;基于用户行为的Web使用挖掘数据采集技术研究[J];计算机与现代化;2007年12期
4 王庆稳;邓小昭;;网络数据库历史记录界面设计[J];情报科学;2008年05期
5 周涛;鲁耀斌;张金隆;;整合TTF与UTAUT视角的移动银行用户采纳行为研究[J];管理科学;2009年03期
6 彭耶萍;;个性化信息检索系统中用户兴趣模型的建立[J];电脑知识与技术;2009年20期
7 巩玉玺;罗容;;基于deep web数据库的个性化推荐系统[J];煤炭技术;2009年08期
8 苏红;万国根;;基于用户行为关联分析的电子取证系统研究[J];电信科学;2010年12期
9 张秋;;运用Web2.0元素设计学位论文库2.0[J];图书馆学研究;2011年03期
10 罗忠凤;用户需求对因特网信息资源建设的影响[J];图书馆学刊;2005年05期
11 章森;;基于混合字词网格的汉语音字转换问题的求解[J];计算机学报;2007年07期
12 冯少栋;朱江;王凡;李广侠;;基于用户行为的LEO境外业务建模与仿真[J];无线电工程;2008年01期
13 李珊;白彦霞;云彩霞;杨鹏;;基于用户行为和Web日志的用户兴趣挖掘[J];计算机时代;2008年07期
14 顾立平;;基于共异变数结构方程式的Web2.0用户心智模型[J];图书情报工作;2009年10期
15 蔡岳;袁津生;;用户行为聚类的搜索引擎算法与实现[J];计算机系统应用;2010年04期
16 潘雁钦;;基于情境模式的个性化搜索初探[J];内蒙古科技与经济;2011年15期
17 刘臻;鲁学亮;;基于校园网的可信任视频会议系统的研究[J];中国电化教育;2011年07期
18 曹丽娟;丁申桃;;高校图书馆网络用户研究[J];图书馆学刊;2007年05期
19 袁嘉;赵江洪;;基于用户行为的笔记本电脑输入模式研究及设计[J];包装工程;2008年03期
20 欧阳秀平;王攀;饶翔;;基于业务智能感知和行为分析引擎的用户行为分析模型[J];电信快报;2008年10期
中国重要会议论文全文数据库 前10条
1 张书娟;董喜双;关毅;;基于电子商务用户行为的同义词识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 宋丹;师庆辉;薛德军;林鸿飞;;术语同义词的自动抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 陈都;郑玲;;基于反馈学习的自适应搜索机制的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
5 岑荣伟;刘奕群;茹立云;张敏;马少平;;基于虚拟主题的网络关键资源页面定位技术研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 刘威;李石坚;潘纲;;uRecorder:基于位置的社会行为自动日志[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
7 翟素兰;罗斌;郭玉堂;;双向Boosting模糊聚类集成[A];第二十六届中国控制会议论文集[C];2007年
8 李训青;黄磊;刘迎建;;基于Boosting集成的SMO增强型分类器设计[A];第八届全国汉字识别学术会议论文集[C];2002年
9 刘建华;;一个智能搜索引擎的用户行为聚类分析[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
10 苗强;周兴社;於志文;倪红波;;一种非觉察式的睡眠行为识别技术研究[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 赖祥伟;面向用户行为模型的软件可用性研究[D];西南大学;2007年
2 谭良;可信操作若干关键问题的研究[D];电子科技大学;2007年
3 朱卫未;电子政务系统信息安全策略研究[D];中国科学技术大学;2006年
4 阳维;乳腺肿瘤的超声图像特征定量分析与良恶性识别[D];上海交通大学;2009年
5 彭宏京;基于稀疏RAM的神经网络及其人脸识别应用研究[D];南京航空航天大学;2002年
6 刘华文;基于信息熵的特征选择算法研究[D];吉林大学;2010年
7 杨风雷;基于图像结构的目标检测方法研究[D];华东师范大学;2010年
8 徐金波;面向目标检测识别应用的算法加速器体系结构研究[D];国防科学技术大学;2009年
9 牛志恒;面部特征点定位方法研究[D];哈尔滨工业大学;2009年
10 钱诚;增量型目标跟踪关键技术研究[D];浙江大学;2011年
中国硕士学位论文全文数据库 前10条
1 张书娟;基于电子商务用户行为的同义词识别[D];哈尔滨工业大学;2011年
2 宋宇轩;基于搜索日志和点击日志的同义词挖掘的研究和实现[D];北京交通大学;2011年
3 曹晶;同义词挖掘及其在概念信息检索系统中的应用研究[D];东北师范大学;2006年
4 赵文华;基于用户的个性化搜索引擎研究[D];首都师范大学;2008年
5 陈都;基于用户行为的智能搜索研究[D];华北电力大学(北京);2008年
6 全海金;基于用户行为及语义相关实时更新的用户兴趣模型[D];西南师范大学;2005年
7 苏雪峰;隐交互式个性化搜索引擎研究[D];太原理工大学;2007年
8 高金;语义查询优化[D];吉林大学;2008年
9 李柯;用户行为偏好分析系统的设计与实现[D];北京邮电大学;2010年
10 姜晓旭;基于用户行为的网络广告点击欺骗检测与研究[D];西安科技大学;2011年
中国重要报纸全文数据库 前10条
1 ;数据库压缩产品可以有效防护数据丢失吗[N];中国计算机报;2008年
2 薛倩;阅读2.0:新一代读书人群悄悄流向这里[N];中国图书商报;2007年
3 边歆;多重安防需求汇于一点[N];网络世界;2009年
4 王力朱立智;网络审计监管急需统一框架[N];计算机世界;2007年
5 中科院软件所智能工程实验室 关志伟 戴国忠 马翠霞;人机一体[N];计算机世界;2002年
6 本报记者 李玫;300知名专家研讨数字图书馆建设[N];深圳特区报;2007年
7 电脑商报记者 张振;厦门高士达:“三专”突击[N];电脑商报;2008年
8 本报实习记者 姜旭;公共文化资源利用与服务遭遇尴尬[N];中国知识产权报;2009年
9 中国信息主管网 郝峥嵘;W&W AG:多种保险渠道智慧整合[N];中国计算机报;2009年
10 ;网络浏览软件有效使用时间优势巨大地位无可撼动[N];中华新闻报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978