靖待的技术博客

- 主页
- 分类
- 标签
- 归档
- 友链
- 关于
- 留言板
- 自语
- 在线交流

靖待的技术博客

小清新IT旅程 | 为中华之崛起而读书

《推荐系统：原理与实践》笔记

靖待

推荐系统

发布于：2022年6月15日

次浏览

　　砖头书笔记（自用）

前言

　　有几本砖头书在图书馆里我不断续借，网上又没有PDF，现在要毕业了，只有勉强把它看完了……

高级论问题和应用

推荐系统中的冷启动问题
太常见不说了。
抗攻击推荐系统
只要指恶意评论。
组推荐系统
针对一组用户推荐，而不是单一用户。
多标准推荐系统
如，用户可以给予情节、音乐、特效等对电影进行评分。在多标准推荐系统中，用户可能根本没有给出整体评分。
推荐系统中的主动学习
鼓励用户输入评分以完善系统的机制。例如，用户可能会为某些物品评分获得奖励。因此，必须明智地选择由特定用户进行评分的物品。如，某用户已评价大量动作片，那么要求该用户去评价另一部动作电影对预测其他的动作电影评分帮助不大，并且对预测属于无关种类的电影评分的帮助甚至更少。另一方面，要求用户评价不太热门种类的电影将对预测这种类型的电影评分有显著帮助。当然，如果用户被要求评价无关的电影，他不一定能够提供反馈，因为他可能根本没有看过那部电影。（此处举例我存疑）因此，在推荐系统的主动学习问题中有许多在其他问题领域（如分类问题）没有遇到的有趣权衡问题。
推荐系统中的隐私问题
保护隐私的推荐算法。
应用领域

推荐系统评估

评估设计的总体目标

精确性
覆盖率
置信度和信任度
新颖度
惊喜度
多样性
健壮性和稳定性
可扩展性
离线评估的精确性指标
独立预测评分的精确性
　　RMSE, MAE
　　RMSE计算时用的是误差的平方，所以它更加显著地被大的误差值或者异常值所影响。一些被预测失败的评分会显著地破坏RMSE方法。在各种评分的预测健壮性非常重要的应用中，RMSE可能是一个更加合适的方法。另一方面，当评估的异常值有限时，MAE能更好地反映精确性。RMSE主要的问题是它不是平均误差的真实反映，而且它又是会导致有误导的结果。
通过相关性评估排名
Spearman等级相关系数
肯德尔等级相关系数
通过效用评估排名
　　基于效用方法的总体目标就是给出用户可能找到推荐系统排名的有用程度的简单量化。这种方法下隐含的一个重要准则就是相对于物品的总量而言，推荐列表是简短的。因此一个具体评分的效用大部分情况下应该基于在推荐列表中相关性高的物品。这种情况下，RMSE指标有一个缺点，因为它对低排名物品和那些高排名物品赋予了同样的权重。

　　NDCG, ARHR（平均逆命中率）
　　ARHR也被称作是平均倒数排名（MRR）

通过ROC曲线评估排名

抵抗攻击的推荐系统

攻击类型

随机攻击
均值攻击
bandwagon攻击
流行攻击
爱/憎攻击
反向bandwagon攻击
探测攻击
分段攻击
健壮推荐设计策略
用CAPTCHA防止自动攻击
使用社会信任
设计健壮的推荐算法

排名学习

　　pointwise
　　pairwise: BPR, Eigen Rank, pLPA, CR
　　listwise: NDCG, MRR

多臂赌博机算法

组推荐系统

协同和基于内容的系统
基于知识的系统
多标准推荐系统
基于近邻的方法
基于集成的方法
无整体评分的多标准系统
推荐系统中的主动学习
基于异质性的模型
基于性能的模型
推荐系统中的隐私
基于冷凝的隐私
高维数据的挑战

应用领域

门户内容个性化
计算广告与推荐系统
互惠推荐系统
　　基本思想是当考虑多个具有不对称兴趣的利益相关人的推荐的效用时，推荐的任务会发生改变。如在线约会的互惠推荐系统。

用户意识到交易的成功取决于另一方的许可。另一方是互惠环境中的“物品”。
用户和物品在系统中可能只出现一次，在一次成功的事物后它们可能永远不会重现。冷启动问题在互惠场景中更加显著。
　　方法：
利用混合方法
在这些方法中，两个传统的推荐方法被构造出来，分别对应着两个互惠方的喜好。然后，这两个互惠方的预测被组合起来。
利用链路预测方法
当冷启动问题不是很严重或者可以用来自类似用户和物品的数据来增加评分数据时，可以在系统中采用链路预测方法。

更新于：2022年6月15日

推荐算法

毕业

　　一篇六月底就写好、八月中才发布的毕业总结。　　技术博客只谈学习和技术。每次我在这里写这种总结文的时候，必须时刻提醒自己这句话，否则我的思路一旦打开，就不知道飞到哪里去了。　　对比本...

2022年最新教程！Hexo + GitLab搭建个人博客详细教程

　　不是标题党，我自己刚写的，保证最新。（2022年6月）前言（可不看）　　以前生活博客放在Gitee上，每次命令部署后还得登录网页管理端手动更新一下Page服务才能完成一次部署，着实很...

评论

粘贴文本
全选文本
剪切文本
复制文本
站内搜索
必应搜索
新标签页打开
复制链接地址
复制图片
广告位招租

暗黑模式
打印页面
阅读模式