砖头书笔记(自用)
前言
有几本砖头书在图书馆里我不断续借,网上又没有PDF,现在要毕业了,只有勉强把它看完了…
高级论问题和应用
- 推荐系统中的冷启动问题
太常见不说了。 - 抗攻击推荐系统
只要指恶意评论。 - 组推荐系统
针对一组用户推荐,而不是单一用户。 - 多标准推荐系统
如,用户可以给予情节、音乐、特效等对电影进行评分。在多标准推荐系统中,用户可能根本没有给出整体评分。 - 推荐系统中的主动学习
鼓励用户输入评分以完善系统的机制。例如,用户可能会为某些物品评分获得奖励。因此,必须明智地选择由特定用户进行评分的物品。如,某用户已评价大量动作片,那么要求该用户去评价另一部动作电影对预测其他的动作电影评分帮助不大,并且对预测属于无关种类的电影评分的帮助甚至更少。另一方面,要求用户评价不太热门种类的电影将对预测这种类型的电影评分有显著帮助。当然,如果用户被要求评价无关的电影,他不一定能够提供反馈,因为他可能根本没有看过那部电影。**(此处举例我存疑)**因此,在推荐系统的主动学习问题中有许多在其他问题领域(如分类问题)没有遇到的有趣权衡问题。 - 推荐系统中的隐私问题
- 保护隐私的推荐算法。
- 应用领域
推荐系统评估
评估设计的总体目标
- 精确性
- 覆盖率
- 置信度和信任度
- 新颖度
- 惊喜度
- 多样性
- 健壮性和稳定性
- 可扩展性
离线评估的精确性指标
独立预测评分的精确性
RMSE, MAE
RMSE计算时用的是误差的平方,所以它更加显著地被大的误差值或者异常值所影响。一些被预测失败的评分会显著地破坏RMSE方法。在各种评分的预测健壮性非常重要的应用中,RMSE可能是一个更加合适的方法。另一方面,当评估的异常值有限时,MAE能更好地反映精确性。RMSE主要的问题是它不是平均误差的真实反映,而且它又是会导致有误导的结果。
通过相关性评估排名
- Spearman等级相关系数
- 肯德尔等级相关系数
通过效用评估排名
基于效用方法的总体目标就是给出用户可能找到推荐系统排名的有用程度的简单量化。这种方法下隐含的一个重要准则就是相对于物品的总量而言,推荐列表是简短的。因此一个具体评分的效用大部分情况下应该基于在推荐列表中相关性高的物品。这种情况下,RMSE指标有一个缺点,因为它对低排名物品和那些高排名物品赋予了同样的权重。
NDCG, ARHR(平均逆命中率)
ARHR也被称作是平均倒数排名(MRR)
通过ROC曲线评估排名
抵抗攻击的推荐系统
攻击类型
- 随机攻击
- 均值攻击
- bandwagon攻击
- 流行攻击
- 爱/憎攻击
- 反向bandwagon攻击
- 探测攻击
- 分段攻击
健壮推荐设计策略
- 用CAPTCHA防止自动攻击
- 使用社会信任
- 设计健壮的推荐算法
排名学习
pointwise
pairwise: BPR, Eigen Rank, pLPA, CR
listwise: NDCG, MRR
多臂赌博机算法
组推荐系统
- 协同和基于内容的系统
- 基于知识的系统
多标准推荐系统
- 基于近邻的方法
- 基于集成的方法
- 无整体评分的多标准系统
推荐系统中的主动学习
- 基于异质性的模型
- 基于性能的模型
推荐系统中的隐私
- 基于冷凝的隐私
- 高维数据的挑战
应用领域
- 门户内容个性化
- 计算广告与推荐系统
- 互惠推荐系统
基本思想是当考虑多个具有不对称兴趣的利益相关人的推荐的效用时,推荐的任务会发生改变。如在线约会的互惠推荐系统。
- 用户意识到交易的成功取决于另一方的许可。另一方是互惠环境中的“物品”。
- 用户和物品在系统中可能只出现一次,在一次成功的事物后它们可能永远不会重现。冷启动问题在互惠场景中更加显著。
方法: - 利用混合方法
在这些方法中,两个传统的推荐方法被构造出来,分别对应着两个互惠方的喜好。然后,这两个互惠方的预测被组合起来。 - 利用链路预测方法
当冷启动问题不是很严重或者可以用来自类似用户和物品的数据来增加评分数据时,可以在系统中采用链路预测方法。