VALSE

查看: 5996|回复: 0

【机器学习】推荐无处不在

[复制链接]
发表于 2015-5-4 23:59:55 | 显示全部楼层 |阅读模式
http://article.yeeyan.org/view/461508/452536

【机器学习】推荐无处不在译者:Zebra小年 原作者:ML Blog Team
发表时间:2015-04-28浏览量:417评论数:0挑错数:0


这篇博客由微软主要研究者Thore Graepel执笔并发表。
博客正文
好的推荐任何地方都用得着。无论是找一部你可能喜欢的电影,或者一本你可能感兴趣的书籍,甚至是寻求facebook或linkedin上志同道合的朋友,自动推荐系统将会是个得力助手。刚开始自动推荐系统只限于网络用户,如今,随着微软Azure机器学习的不断普及,越来越多的人可以享受到自动推荐系统的优质服务,小到个人大到企业,为其客户带来便利。
自推系统如何是如何运作的?
一般而言,推荐系统是个二元体系,一个是"用户",另一个是"商品"。用户指推荐物品的对象人群,"商品"指你想要推荐的物品,可以是电影,书籍,网页,菜谱,甚至是网友。
举个例子,假如我想给一个指定用户推荐饭店,参考该用户以及其他用户对其中一些饭店的历史评价(五星评价标准)。我们的推荐任务可以分两步走:

  • 预测该用户会如何评价每个饭店(五星评价标准)。
  • 从一份合格饭店清单中选出该用户可能会给出最高评分的饭店。

但是如果某个用户没有评价过这些饭店,那我们如何预测该用户的评价走向呢?机器学习发挥作用的时候到了。
如何预测评价?
针对"用户--商品"这种模式,我们需要收集各种形式的数据(用户ID,商品ID,评价等)来建立一个机器学习预测性模型,预测用户的评价走向。
你可以把它想成一个大型矩阵,用户为行,商品为列,而评分就是元素。

这是个稀疏矩阵(大量条目缺失),因为普通用户只会给一小部分商品评分。Azure中贝叶斯推荐系统小工具(Bayesian RS implemented接收这些训练数据,设计相应的模型,预测该用户的评价结果,应用于“用户--商品”模式。评价标准不限于五星评级,只要不要涉及到隐私,比如购买次数,点击量或购买所花时间等判断标准也同样可行。
以上是如何做到的呢?
RS将用户和商品嵌入我们称之为潜在特质空间的地方(见下图)。如果用户(蓝点)和商品(红点)向量方向一致,那么该用户对该商品评价很高。反之则评价一般。特质空间里,相关用户和相似商品会放到一起,使"指定用户——商品"模式下预测用户评价成为可能,而训练数据库里是不提供评价的。
下图是一个二维特质空间,用来作阐述说明,而我们系统中使用20-100个维度的特质空间来分析。有时我们可以发现一些可以解释的特质,举个例子。南北走向的特质可能指“成人”和“小孩”,而东西走向的特质可能为“主流”和“小众”。

面对新用户和新商品如何作出预测?
RS的唯一问题在于它属于慢热型产品。新用户作评价的次数不多,新商品收到的评价数也寥寥无几,因此很难作出预测。为了改善这一问题,Azure不仅使用ID来表示用户和商品,还使用了一种由元数据构成的特质向量。代表用户的特质向量包含所有个人信息,比如年龄,所在地等;代表电影的特质向量包括电影题材,演员,导演,上映日期等。最后,系统会利用元数据中的共同特质整合出相关用户和相似商品。
了解更多
如果你对自动推荐系统很好奇,可以看看Matchbox的论文: Large Scale Bayesian Recommendations.
如果你想建立自己的推荐系统传送通道,等Azure机器学习正式发布后,可以自己动手尝试一下。
下图所示的Azure机器学习工作室,备有一个推荐系统模板和功能强大的浏览器支持的用户界面,还有"拖动"功能,让整个过程变得相对简单。

事实上,Azure机器学习预测用户评价结果包括两大模式——内容筛选和协作筛选。最后通过普及该应用,我们希望会有更多的人使用自动推荐系统,并在各种场合中发挥作用


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|Vision And Learning SEminar

GMT+8, 2024-11-22 16:52 , Processed in 0.017824 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表