
“协同过滤”词汇来源。
论文情况
COMMUN ACM, 1992. David Goldberg, David Nichols, Brian M.Oki, and Douglas Terry 10页
题目直译:使用协同过滤去构造一个信息tapestry
截至2020年11月15日,该论文在谷歌学术上被引用次数为5239次。
论文内容
文章提出了协同过滤(Collaborative filtering)这个词,最早是用于邮件系统Tapestry。
文章对协同过滤的定义是:Collaborative filtering simply means that people collaborate to help one another perform filtering by recording their reactions to documents they read.
协同过滤的亮点在于,它不仅仅是一个过滤邮件的机制,还是过去发送邮件的存储库。Tapestry将对这个存储库的临时查询与对传入数据的过滤统一起来。文章提到不仅可以处理邮件,也可以处理类似流数据,比如新闻。
不过该文重点还是在邮件系统本身上,用户可以对邮件进行注解,这些注解可以用来进行协同过滤。本文设计了两种类型的阅读器。一种eager readers可以获取全部文件,另一种casual readers会进行注解,并且阅读基于此的文件。文章用了大量篇幅介绍了邮件系统本身的各个部件和查询语言(TQL),和推荐系统相关的不太多,因此本文属于浏览,未细致阅读。但毕竟是协同过滤鼻祖,所以记录一下。