TikTok「魔力」推荐算法坐收一亿用户,不含算法的TikTok一文不值

简介: TikTok的收购再添疑云,有个重要原因就是核心算法无法出售了。美国的竞购方在探讨自己攻关的可能性,但专家经过深入分析后表示,无法复制出TikTok的算法魔力。

微信图片_20220109161711.png


近日,商务部调整发布了《中国禁止出口限制出口技术目录》公告,其中计算机服务业技术下面,明确提及和TikTok相关的「基于数据分析的个性化信息推送服务技术」。

 

限制类技术出口规定调整一出,意味着字节跳动需要获得许可才能向美国出售其算法了。

 

那TikTok出售的话,算法就成为核心争议点了。

 

有专家仔细分析了TikTok的推荐系统后说,相关算法无法复制,没有算法的TikTok一文不值。


四种收购方案,没有算法行不行?


一直以来,特朗普政府以威胁美国国家安全为由,对TikTok在美业务的出售持续加压。特朗普更是多次给字节下达最后通牒:交易必须在9月15日之前达成。

 

据报道,有意收购TikTok业务的潜在竞购方目前正在讨论以下4种收购方案:

 

1.在没有算法的情况下出售TikTok

2.与美国外国投资委员会(CFIUS)谈判一个长达一年的「过渡期」

3.寻求中方的批准,将算法出售给美国公司

4.买家向字节跳动取得使用TikTok算法的授权

 

第一种方案目前来看更为可行。如果收购过程不包括算法,那就简单了许多。因为这种方案将会规避商务部所发布的出口管制规定,并且可以加快出售速度。

 

此前报道中,微软收购TikTok一直面临着最大的难题之一,那便是TikTok的内容推荐算法。

     微信图片_20220109161714.gif


这个算法主要运用在TikTok的「For You」界面,通过分析用户的行为来推荐下一个视频。

 

TikTok 使用的算法与国内抖音相互独立,但比较难处理的是算法使用的内容和用户信息。微软前首席信息官 Jim Dubois 曾表示,「如果没有数据,算法就一文不值。对这些国家数据进行分析是一项重要任务」。

 

如果可以放弃算法,达成TikTok在美收购案,对竞购者来说是一场重大的赌博,他们需要在尽快时间内找到TikTok核心算法的替代方案。

 

与美国外国投资委员会(CFIUS)谈判一个长达一年的「过渡期」,这一方案存在不确定性,目前还不清楚中方的规则是否允许在规定的时间内这样做。

 

第三种方案可能性几乎为零...

 

寻求中方批准,允许字节跳动将TikTok核心算法出售给美方买家,简直异想天开。


微信图片_20220109161716.gif


上周末,商务部调整发布《中国禁止出口限制出口技术目录》公告,导致了潜在的交易搁浅,再一次否定了这一方案的可能性。

 

再看第四种方案,买家向字节跳动取得TikTok的算法授权,貌似这一方案可行。但是,这可能会让美国外国投资委员会感到担忧,该机构希望字节跳动与TikTok美国业务撇清所有关系。

 

上个月,特朗普签署的行政令要求字节必须在90天内出售或剥离所有能够在美运营TikTok的资产,如果只是获得算法授权,在美国当局看来是不可行的。

 

那如果不能获得算法本身或者相关授权,TikTok还值300亿美金吗?或者收购后能否将算法复现出来?


仔细分析算法后,专家说:「TikTok的魔力」无法复制

  

据美国行业专家分析,任何一家收购 TikTok 的公司如果没能获得TikTok的核心算法,那么他们可能很难复制这项视频应用的「魔鬼传播力」

 

在特朗普8月威胁要禁止TikTok后,字节跳动正在与竞标者就出售 TikTok 的美国业务进行谈判。这笔交易的主要竞标者包括沃尔玛、微软和甲骨文,竞标价格可能高达300亿美元。


    微信图片_20220109161718.png


但由于中国限制包括算法在内的关键服务出口的新规定,相关谈判有所放缓。

 

结果是,美国买家可能最终会买下 TikTok 的美国业务,但只是授权使用推荐算法。

 

昆士兰科技大学一名深入研究过 TikTok算法的研究员Kaye表示,「我个人认为,如果没有它的算法,TikTok 就是一张白纸」。


字节员工:TikTok推荐算法是「皇冠上的宝石」


TikTok在美国已经吸引了大约1亿用户,而且从表面上看,受欢迎程度已经和 YouTube 相当了。

 

这个应用程序的不同之处在于它的「For You」页面,它提供了一个诱人的高度可分享的短视频混合体。这个系统建议用户接下来应该看什么,而TikTok的魔力就在于此。

 

字节的推荐算法是由字节跳动的人工智能实验室和北京大学实验室合作开发的,字节的员工也自豪地称该算法是字节成功的「皇冠上的宝石」


微信图片_20220109161722.png


它最初是为字节跳动的新闻聚合神器「 今日头条」开发的,现在已经应用于字节跳动的所有应用,包括抖音。

 

有黑客曾经试图对TikTok的推荐算法进行逆向工程,但至今没人能完美复现。

 

打开TikTok后,就会出现「For You」的界面,如其所言,「For You」推荐的视频都是为你个性化定制的,可以很容易地找到喜欢的内容和创作者。


      微信图片_20220109161724.png


这个推荐系统就是TikTok 的魔力所在,虽然不同的人可能会看到相同的视频,但是总的来看,每个人接到的推荐都是独一无二的


吃进你的「弹幕」,推荐系统从此更懂你


那在TikTok上,都有哪些因素会影响这个推荐系统呢?

 

协同过滤、矩阵分解这些专业的词汇有点难懂,今天我们尝试从用户的角度一起感受下TikTok的推荐算法。

 

用户交互

 

系统在记录了用户与视频的互动后,比如发布评论或点赞之后,就会更新内容建议,下次你就会发现内容的相关性更强了,不喜欢的都过滤掉了。


微信图片_20220109161725.gif


视频信息

 

包括弹幕、声音和标签等细节,跟B站的有些类似,这次在视频的某个部分发了弹幕,推荐系统就会实时「吃进」你的弹幕,找到你关注的点。

 

设备和帐户设置

 

如语言首选项、国家设置和设备类型。这些因素首先会确保系统的性能得到优化,它们在推荐系统中的权重虽然较低,但是没有交互数据时可以完成推荐的「冷启动」。

 

用户每一次新的交互都会帮助系统更了解你的兴趣,管理「FOR YOU」的最佳方式就是简单地使用和享受这个应用程序。随着时间的推移,系统会越来越「懂你」。

 

那如何获得最优的推荐呢?


微信图片_20220109161727.jpg


少看不感兴趣的东西,有时可能会遇到一个不太合口味的视频,可以简单地长按一个视频,然后点击「不感兴趣」,同时也可以选择隐藏视频,如果在不喜欢的地方停留太久,就会「误导」系统。

 

传统推荐引擎固有的毛病,就是它们可能会在不经意间限制你的体验,推荐过于死板,呈现越来越同质化的内容,而TikTok专门对这个弊端做了优化。

 

打破重复模式, For You feed 通常不会显示同一创建者制作的两个视频,tiktok也不会推荐重复的内容、你已经看过的内容或者任何被认为是垃圾的内容。


    微信图片_20220109161729.jpg


建议多样化,对于维持一个繁荣的社区至关重要,有时候你可能会在你的 feed 流中看到一个与你的兴趣不相关的视频,或者已经获得了大量的赞的视频,可能勾起你新的兴趣点。

 

这是都是推荐系统的重要组成部分,但TikTok的精华在于,在你喜欢的内容和探索你的新兴趣点之间找到了一个完美平衡。

 

开发和维护 TikTok 的推荐系统是一个复杂的过程,因为要根据用户交互数据来改进准确性、调整模型、重新评估推荐的因素和权重。

 

字节雇佣了大量的工程人员开发各种算法,除了算法本身还有很多工程层面的优化,绝不是一朝一夕可以复制出来的。

 

TikTok最终能否「卖身」还有很多未知数,但包括推荐算法在内的各种核心技术,将成为字节跳动在谈判桌的重要筹码。

 

人工智能时代,还是算法为王。


参考链接:
https://newsroom.tiktok.com/en-us/how-tiktok-recommends-videos-for-you

相关文章
|
7月前
|
机器学习/深度学习 算法 搜索推荐
抖音快手小视频推荐算法之--协同过滤算法剖析
抖音快手小视频推荐算法之--协同过滤算法剖析
|
算法 数据可视化
推荐算法学习网址:【数据结构和算法动态可视化】
推荐算法学习网址:【数据结构和算法动态可视化】
124 0
推荐算法学习网址:【数据结构和算法动态可视化】
|
机器学习/深度学习 算法 数据库
②机器学习推荐算法之关联规则Apriori与FP-Growth算法详解
机器学习推荐算法之关联规则Apriori与FP-Growth算法详解
286 0
②机器学习推荐算法之关联规则Apriori与FP-Growth算法详解
|
机器学习/深度学习 算法 数据库
①机器学习推荐算法之关联规则Apriori与FP-Growth算法详解
机器学习推荐算法之关联规则Apriori与FP-Growth算法详解
200 0
①机器学习推荐算法之关联规则Apriori与FP-Growth算法详解
|
机器学习/深度学习 算法
③机器学习推荐算法之关联规则Apriori与FP-Growth算法详解
机器学习推荐算法之关联规则Apriori与FP-Growth算法详解
265 0
|
机器学习/深度学习 人工智能 自然语言处理
基于Flink的机器学习算法平台 Alink(二)推荐算法介绍
Alink在“周二开源日”的第二节分享,主要介绍了推荐算法的框架和设计细节。 内容简要: 一、Alink介绍 整体介绍 和SparkML对比 算法调用方式 二、Alink 推荐 Demo Alink推荐相关算法整体介绍 影片推荐Demo CTR点击率预估Demo Web Demo
3399 0
基于Flink的机器学习算法平台 Alink(二)推荐算法介绍
|
算法 搜索推荐
推荐算法---协同过滤推荐算法
基于用户的协同过滤推荐算法原理和实现       在推荐系统众多方法中,基于用户的协同过滤推荐算法是最早诞生的,原理也较为简单。该算法1992年提出并用于邮件过滤系统,两年后1994年被 GroupLens 用于新闻过滤。一直到2000年,该算法都是推荐系统领域最著名的算法。       本文简单介绍基于用户的协同过滤算法思想以及原理,最后基于该算法实现园友的推荐
2384 0
|
4天前
|
机器学习/深度学习 自然语言处理 算法
m基于深度学习的OFDM+QPSK链路信道估计和均衡算法误码率matlab仿真,对比LS,MMSE及LMMSE传统算法
**摘要:** 升级版MATLAB仿真对比了深度学习与LS、MMSE、LMMSE的OFDM信道估计算法,新增自动样本生成、复杂度分析及抗频偏性能评估。深度学习在无线通信中,尤其在OFDM的信道估计问题上展现潜力,解决了传统方法的局限。程序涉及信道估计器设计,深度学习模型通过学习导频信息估计信道响应,适应频域变化。核心代码展示了信号处理流程,包括编码、调制、信道模拟、降噪、信道估计和解调。
26 8
|
6天前
|
算法
基于GA遗传优化的混合发电系统优化配置算法matlab仿真
**摘要:** 该研究利用遗传算法(GA)对混合发电系统进行优化配置,旨在最小化风能、太阳能及电池储能的成本并提升系统性能。MATLAB 2022a用于实现这一算法。仿真结果展示了一系列图表,包括总成本随代数变化、最佳适应度随代数变化,以及不同数据的分布情况,如负荷、风速、太阳辐射、弃电、缺电和电池状态等。此外,代码示例展示了如何运用GA求解,并绘制了发电单元的功率输出和年变化。该系统原理基于GA的自然选择和遗传原理,通过染色体编码、初始种群生成、适应度函数、选择、交叉和变异操作来寻找最优容量配置,以平衡成本、效率和可靠性。