第一章 绪论
1.2 国内外研究现状
知识图谱(KG) 是一种大规模的可以表示来自多个领域的信息网络[9]。遵循资源描述框架(Resource Description Framework, RDF)标准[10]是描述 KG 的一种常用方法,其中节点表示实体,而图中的边表示实体之间的关系。边与实体之间的联系用三元组(头实体、关系、尾实体)的形式表示,在图中也称为事实,这意味着头实体和尾实体之间的特定关系。比如,(Donald Trump, president of,America)表明Donald Trump 是美国的总统。KG 是一个异构网络,因为它在图中包含多种类型的节点和关系。这种图具有较强的表示能力,可以通过跟随图中的不同边获得实体的多个属性,并通过这些关系链接发现实体的高阶关系。知识图谱的概念是在20 世纪 80 年代[11]发展起来的,当时 KGs 被整合到医学和社会科学专家系统的框架中。后来,它的应用扩展到语言和逻辑领域。2012 年,谷歌在搜索框架中引入了 KG,以便更好地理解查询,对搜索结果更加友好[12]。到目前为止,KGs 已经被应用于多个场景,包括推荐系统、问答系统 [13]和关系检测 [14]等等。
基于辅助信息增强的会话推荐模型思考目录
第三章 基于上下文增强的会话推荐模型
3.1 引言
近年来,电子商务网站的流行吸引着用户的注意力,越来越多的用户在网上购物上花费大量的时间。因此,合理预测用户的购物意图在电子商务推荐系统中发挥着越来越重要的作用[37]。通常来讲,消费者访问电子商务网站时一般是带着特定的短期目的,这为追踪其细粒度的购物意图提供了线索,合理建模相关数据可以为用户提供合理有效的推荐。
基于会话的推荐(Session-based Recommender Systems, SBRS)是基于正在进行的会话中的一系列动作来预测用户的下一个动作,以便跟踪用户的短期意图[38-39]。 由于在现实的电子商务场景中,用户点击行为背后的成因十分复杂,这使得基于会话的电子商务推荐仍然具有挑战性。
首先,用户的点击行为难以捉摸,并且容易受到电子商务平台中各种推荐和广告的影响。既有的一些方法如基于 RNN 的 SBRS 和基于马尔可夫链的 SBRS 总是对物品点击的连续性有很强的依赖性。但是,在真实世界的交易数据中可能不具备这样的连续性,因为用户可能只是随机地将一些他/她有兴趣却不属于当下购物意图的物品放入购物车。而这些随机选择的物品可能与已经被选择的物品和将要选择的物品无关。在这种情况下,推荐结果很容易被这些噪声数据所影响。此外,以前的工作都是通过把会话数据中最后一个点击动作(产生交互的物品)作为监督信号来表示用户的隐式行为。然而,这种方式会造成推荐结果倾斜的后果。即优先推荐与标记数据相同或类似的物品,而忽略其他满足用户购物意愿的不同id 的物品。例如,如图 3-1 所示。在当前会话数据中,真实数据值为方太油烟机,如果候选推荐物品中存在方太油烟机,则它大概率会被系统作为首要推荐物品推荐给用户,而其他可能满足用户需求的类似物品则可能不被推荐给用户或者推荐排名靠后。
图 3-1 我们的模型和一般的基于会话的推荐模型之间的比较案例
第五章 基于会话推荐的原型系统
5.1 环境配置
网络环境:上下行 50M 光纤; CPU:Intel i5-3375; 内存:32G; 显卡:Nvidia GeForce MX 350; 硬盘:512GB 机械硬盘; OS:Windows 10 ; 浏览器:Chrome/IE10; 编程语言:Python 3.6,Keras 2.2,TensorFlow1.6; IDE:IDEA
本系统的页面布局如下:左侧边栏包含训练模型、测试模型和评价指标等三个图标。点击训练模型图标,右侧空白处会出现一个包含五个 tab 的选项卡,前两个 tab 属于 CESR 模型的两个数据集选项,后三个 tab 属于 KGESR 模型的三个数据集选项。点击测试模型图标,右侧空白处会出现五个单选钮,用于对训练好的模型进行测试。点击评价指标图标,右侧空白处会出现五个单选钮,用于对测试好的模型进行评价指标的展示。原型系统的初始界面如图 5-1 所示。
图 5-1 原型系统的初始界面
......................
结论
推荐系统对我们生活的重要性不言而喻,它包含许多推荐方法。其中,基于会话的推荐不同于一些传统推荐方法,它以一个会话作为推荐的基本单元,综合地考虑了从一个会话到另一个会话的过程信息,基于此可以最大限度地减少由于忽略或破坏会话结构而造成的信息损失,从而达到更精确的推荐效果。而辅助信息有助于缓解在实际的推荐场景中遇到的推荐结果倾斜和单一的问题。由此,本文基于不同的辅助信息,提出了两种模型,主要研究成果如下:
1. 基于上下文增强的会话推荐模型,该模型通过对物品驻留时间、物品间隔时间等上下文信息建模,结合物品的类别属性来缓解推荐结果倾斜的问题。首先,我们利用 M-LSTM 计算上下文输入和先前状态进入 LSTM 内部前的交互,来增强模型的上下文建模能力;然后利用多任务学习将类别生成集成到基于会话推荐,用于增强推荐效果;最后,我们探讨了在多任务学习中,不同的点击预测损失权重对点击预测的影响。通过在大规模真实数据集上进行试验来评估该模型的有效性,我们可以发现它比其他模型表现得更好。
2. 基于知识图谱增强的会话推荐模型,该模型把知识图谱看作一种辅助信息,采用多任务学习对 KGE 和会话推荐两个模块进行联合训练。为了自动学习二者之间的高阶交互,我们采用混合单元来关联它们,混合单元可以有效地在两个任务之间传递知识。实体间丰富的语义关联有助于合理扩展用户兴趣,进而提高推荐结果的多样性。最后,我们在三个推荐场景中进行了大量的实验。结果表明,与其他模型对比,本文提出的模型推荐效果更好。
参考文献(略)