Pinterest 凭什么拥有那么多用户?它背后的机器学习是答案

简介:

编者按:目前,Pinterest 月平均活跃用户量达到 1 亿,这家以图片为主的公司是如何留住用户并盈利的呢?Pinterest 的主要目标是向用户推荐相关的图片或内容,推荐的内容足够精确才能提高用户黏性。近期,《快公司》发文表示,Pinterest 正从机器学习切入,向用户推荐更精准的内容,并拓展新的在线业务。

在 Pinterest 平台上,人们可以搜索、下载全网范围内的图片和文章,找到与自己喜好契合的内容自然能够增加他们的用户忠诚度。Pinterest 推荐的相关内容提高了 30% 的参与度和 25% 的购买度。这些精准推荐都是依托尖端的数据驱动技术和大量实验的结果。

用户可以通过 Pinterest 台的虚拟钉板收藏全网范围的在线商品、帖子、图片,就是说这个平台完全是基于用户兴趣偏好建立的。Pinterest 无需像其他社交网络一样,根据用户的点击模式或者特定页面停留时间来猜测其兴趣。这也意味着它的算法能推测到 750 亿个收藏的内容数据库中相互关联的信息,因为相似的内容更容易被固定在同一个钉板上,从而轻易识别用户偏好。

Pinterest 可以说是一个社交图,由数十亿相互联系的用户、被不同用户收藏的同一个项目、收藏类似项目的虚拟钉板三部分构成,这样的组成结构同时决定了其用户量将会不断增长。

Pinterest 的高级发现科学工程师 Mohammad Shahangian 说,“我们通过数百次的实验对我们的算法做出微小修正,确定发现问题的方向“。简单地根据用户关注人群决定为其推荐内容的模型是不理想的,假设一个用户正在策划自己的婚礼,她的虚拟钉板添加了很多礼服款式的图片,而她的关注者并不一定需要这类服饰,为他们推荐礼服可能造成无意义的重复。而 Pinterest 所有的数据可以让 Pinterest 的用户获得 。

Shahangian 表示,“ 如果你的虚拟钉板收藏了一个厨房水槽的链接,我们是否需要向你推送一万多款厨房水槽,或启发你怎么能整体设计你的厨房呢?” 为了在这样的情况下做出正确判断,该公司的工程师们测试了多种机器学习算法,来研究不同公式如何执行对相似或不同的测试集的收藏,以及他们最终如何影响现实世界的用户的参与度。

然而,事实上,Pinterest 的技术研发缺乏实例测试,研究员无法通过给某个特定的用户付钱来测试他是否会接受一组新的推荐。虽然后面的测试过程无法进行,目前的算法已经基本可以实现通过用户的收藏内容来判定此人是否愿意担任人工测试者。Pintesrest 从自身的一路发展中收获了不少启发,个性化一直是提高用户参与度最大的影响因素之一。与此同时,该公司也一直致力于提高视觉搜索功能,帮助用户获取与目标图片相似的内容。 今年早些时候,Pinterest 的工程师们与来自伯克利加利福尼亚大学视觉与学习中心的研究人员一起开发了可自动检测图像内容的深度学习技术。

Pinterest 的高级视觉搜索工程师 Dmitry Kislyuk 说,当我们试图去分辩图片内容是一只猫还是一条狗时,这并不算一个分类任务,关键在于保证实时性的前提下寻找图像之间的视觉相似性。可视化搜索工具尤其适合收集家居装饰和时尚类商品的信息。未来,公司希望提高将目标内容映射到其类别的能力,举例来讲,当用户想找同一种食材的新食谱时,就不要只提供这种食材的类似照片。

高级视觉搜索工程师 Andrew Zhai 指出, “我认为我们的模型可以更语义化,有效地将深度学习应用于映射更加概念化的图像。与此同时,Pinterest 的的工程师们正在专注于完善目标的检测和搜索开发一款应用程序,让智能手机用户通过给现实世界中需求物品拍照,上传到平台后,得到相关的推荐。

本文转自d1net(转载)

相关文章
如何用限制立方样条(RCS)做生存分析?
如何用限制立方样条(RCS)做生存分析?
1070 0
如何用限制立方样条(RCS)做生存分析?
|
1月前
|
人工智能 图形学
2025年度数字人公司排名推荐:厂商技术实力、优势、定位全方位对比
现在的AI虚拟技术发展越来越普遍,涉足数字人相关内容的公司层出不穷,但质量上参差不齐。对于企业而言,若需专门对接服务商制作数字人视频,技术过硬、经验丰富的公司才是可靠之选——这类公司能精准匹配企业场景需求,输出高质量数字人内容。接下来,为您盘点2025年值得关注的优秀数字人公司。
|
SQL 关系型数据库 PostgreSQL
PostgreSQL 浮点数类型
PostgreSQL 浮点数类型
3045 0
|
10月前
|
存储 编解码 安全
阿里云高性能企业级甄选Intel第八代计算型c8i、通用型g8i和内存型r8i实例简介
计算型c8i、通用型g8i和内存型r8i实例是阿里云推出的高性能企业级甄选Intel第八代云服务器实例,采用CIPU+飞天技术架构,搭载最新的Intel 第五代至强可扩展处理器(代号EMR),性能进一步大幅提升,同时拥有AMX加持的AI能力增强,并在全球范围率先支持TDX机密虚拟机能力,实现了AI增强和全面安全防护的两大特色优势。本文将为您介绍这三个实例规格的性能、适用场景及最新活动价格以及选择指南,以供选择参考。
425 18
|
自然语言处理 算法 数据挖掘
探讨如何利用Python中的NLP工具,从被动收集到主动分析文本数据的过程
【10月更文挑战第11天】本文介绍了自然语言处理(NLP)在文本分析中的应用,从被动收集到主动分析的过程。通过Python代码示例,详细展示了文本预处理、特征提取、情感分析和主题建模等关键技术,帮助读者理解如何有效利用NLP工具进行文本数据分析。
300 2
|
算法 网络协议 Java
【JVM】——GC垃圾回收机制(图解通俗易懂)
GC垃圾回收,标识出垃圾(计数机制、可达性分析)内存释放机制(标记清除、复制算法、标记整理、分代回收)
|
Docker 容器
docker:记录如何在x86架构上构造和使用arm架构的镜像
为了实现国产化适配,需将原x86平台上的Docker镜像转换为适用于ARM平台的镜像。本文介绍了如何配置Docker buildx环境,包括检查Docker版本、安装buildx插件、启用实验性功能及构建多平台镜像的具体步骤。通过这些操作,可以在x86平台上成功构建并运行ARM64镜像,实现跨平台的应用部署。
9896 2
|
Prometheus 运维 监控
云原生时代如何用 Prometheus 实现性能压测可观测-Metrics 篇
可观测性包括 Metrics、Traces、Logs3 个维度。可观测能力帮助我们在复杂的分布式系统中快速排查、定位问题,是分布式系统中必不可少的运维工具。
云原生时代如何用 Prometheus 实现性能压测可观测-Metrics 篇
|
Linux 开发者 iOS开发
Python常用打包工具比较
以上是常用的四种打包工具比较。各自有着自己的优缺点,开发者可以根据自己的需求来选择合适的工具。如果你只需要在 Windows 平台上运行应用程序,可以选择 py2exe。如果你需要跨平台支持,并且希望打包过程简单,可以选择 Briefcase。如果你需要支持多个平台,并且打包过程比较复杂,可以选择 cx_Freeze。如果你需要支持多个平台,并且对第三方库的兼容性有较高的要求,可以选择 PyInstaller。
1670 4