老板问我,什么是协同过滤?

工程架构方向的程序员,看到推荐/搜索/广告等和算法相关的技术,心中或多或少有一丝胆怯。但认真研究之后,发现其实没有这么难。

 

今天给大家介绍下推荐系统中的“协同过滤”,绝无任何公式,保证大伙弄懂。

 

什么是协同过滤(Collaborative Filtering)

:通过找到兴趣相投,或者有共同经验的群体,来向用户推荐感兴趣的信息。

 

举例,如何协同过滤,来对用户A进行电影推荐?

:简要步骤如下:

(1)找到用户A(user_id_1)的兴趣爱好;

(2)找到与用户A(user_id_1)具有相同电影兴趣爱好的用户群体集合Set

(3)找到该群体喜欢的电影集合Set

(4)将这些电影Set推荐给用户A(user_id_1)

 

具体实施步骤如何?

:简要步骤如下:

(1)画一个大表格,横坐标是所有的movie_id纵坐标所有的user_id交叉处代表这个用户喜爱这部电影;

老板问我,什么是协同过滤?

如上表:

  • 横坐标,假设有10w部电影,所以横坐标有10w个movie_id数据来源自数据库

  • 纵坐标,假设有100w个用户,所以纵坐标有100w个user_id,数据也来自数据库

  • 交叉处,“1”代表用户喜爱这部电影,数据来自日志

画外音:什么是“喜欢”,需要人为定义,例如浏览过,查找过,点赞过,反正日志里有这些数据。

 

(2)找到用户A(user_id_1)的兴趣爱好;

老板问我,什么是协同过滤?

如上表,可以看到,用户A喜欢电影{m1, m2, m3}

 

(3)找到与用户A(user_id_1)具有相同电影兴趣爱好的用户群体集合Set

老板问我,什么是协同过滤?

如上表,可以看到,喜欢{m1, m2, m3}的用户,除了u1,还有{u2, u3}

 

(4)找到该群体喜欢的电影集合Set

老板问我,什么是协同过滤?

如上表,具备相同喜好的用户群里{u2, u3},还喜好的电影集合是{m4, m5}

画外音:“协同”就体现在这里。

 

(5)未来用户A(use_id_1)来访问网站时,要推荐电影{m4, m5}给ta。

 

协同过滤大致原理如上,希望大家有收获。

架构师之路-分享可落地的技术文章

相关文章

架构师之路,20年干货精选

发布者:糖太宗,转载请注明出处:https://www.qztxs.com/archives/science/technology/6020

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022年5月11日 下午8:13
下一篇 2022年5月11日 下午8:15

相关推荐

  • 为什么微服务并不是越早越好?

    微服务架构,是分层架构演进过程中很重要的一环,那微服务是不是越早越好呢?今天和大家一起聊聊这一个问题。 什么时候进行DAO层的分层抽象? 最开始,分层架构长什么样? 一个业务系统最初的分层架构如上: (1)web-server层从db层获取数据并进行加工处理; (2)db层存储数据;   此时,web-server层如何获取底层的数据呢? web-serve...

    2022年5月14日
    2900
  • 系统通知,居然用拉取?

    广义系统通知,有1对1的通知,以及一对多的通知,有相对实时的业务通知,也有能够容忍一定延时的系统通知。任何脱离业务场景的架构设计都是耍流氓,结合具体的场景来看下,这样的一些系统通知,究竟是推还是拉?   第一大类:系统对1的通知 典型业务,计数类通知: (1)有10个美女添加了你为好友; (2)有8个好友私信了你; 很多业务经常有这类计数通知,通知结果只针对...

    技术 2022年5月15日
    2200
  • 零基础学Java第六节(面向对象二)

    本篇文章是《零基础学Java》专栏的第六篇文章,文章采用通俗易懂的文字、图示及代码实战,从零基础开始带大家走上高薪之路! 本文章首发于公众号【编程攻略】 继承 创建一个Person类 我们创建一个用于描述人的类。我们怎么抽象出一个人这个类呢?我们以不同的角度做抽象,得到的属性和行为都会有些区别。这里,我们主要从人的社会属性来抽象。为了表示性别,我们先顶一个枚...

    2022年5月22日
    1500
  • Lynis + ansible

    Lynis是一款面向Linux、Mac OS X、BSD以及Solaris等Unix类系统的安全审计与强化工具。它能够深入扫描并检测系统中的问题、存在漏洞的软件包以及配置设置,并提出相关解决建议。Lynis能够轻松实现安全评估、合规性测试、漏洞检测、配置管理以及补丁管理。   安装使用 1 2 3 4 5 6 7 8 9 # 下载 git clon...

    技术 2022年5月28日
    1200
  • 全网显示 IP 归属地,是怎么实现的

    上个星期开始,微博、抖音、公众号等多个平台纷纷上线了 IP 归属地功能。 我想很多小伙伴会好奇互联网平台商们是怎么通过 IP 定位到我们所属地区的?这背后的原理是什么?IP 归属地背后又有哪些实际的应用? 所以,今天我们就来聊聊 IP 归属地背后的技术原理。 如何通过 IP 找到地址? 在我们印象中,我们都知道可以通过 IP 地址找到某个人。但当我们细想一下...

    2022年5月18日
    5200

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信