Web2.0:数据的大浪淘沙时代,
诞生互联网巨头
Web2.0诞生的标志性事件应该就是谷歌在2003年后陆续发表了关于GFS、MapReduce和BigTable的论文,解决了数据存储、计算和处理的成本问题。谷歌通过内部自研,攻克了互联网领域的这三座大山。谷歌通过大数据的成本优势,很早就实现了盈利,并于2004年公开上市。
其他的互联网公司,有些用游戏、短信、甚至一些擦边球的业务利润继续补贴互联网业务,熬过了没有大数据技术的艰难时光。后来各互联网公司通过开源和合作的方式逐渐把谷歌的理论工程化,形成了后来的大数据技术和生态体系,成为互联网业务的基石。Web2.0时代是数据、计算和产品的工业化时代,互联网平台处理数据的成本越低、效率越高,其垄断地位就会逐渐形成。过去十几年里,在搜索、社交、地理服务和信息发布等各个领域,出现了各种各样的互联网平台,这些巨头利用自身在数据上的技术和规模优势,不仅仅通过精准广告实现了数据的价值,也通过数据、流量和场景的结合对传统行业造成了巨大的挑战。一些传统行业公司甚至畏惧与互联网公司合作,因为担心自己积累了几十年的宝贵行业经验建立的护城河,被互联网企业通过数据和流量轻松攻破。
有了精准的数据,就可以形成巨大的流量;有了流量,就等于把控了线上的营销渠道。那些对制造、供应链、物流和渠道依赖性不高的产品,在垄断性的流量前基本没有还手之力。通过大数据和千人千面的精准建模,互联网巨头也开始渗透金融领域,通过金融的杠杆不断放大业务规模。海量的个人隐私数据让一些互联网平台得以引导用户购买特定产品,使得用户对投放的内容和产品上瘾。它们利用大数据杀熟,同样的商品和服务,多次查看价格会出现变化,老客户的价格比新客户更高。它们只推荐能带来潜在商业利益的产品甚至假冒伪劣产品,而不是对用户最适合、最恰当的商品。一些平台甚至可以利用数据,对个人的欲望、情绪乃至意识形态加以操控,指引用户阅读特定文章,为特定人投票或对特定群体产生特定的偏见。它们甚至可以成为特定政治势力的代理工具,影响国家大选。即使是大国总统,也可能被互联网平台禁言而失去自己的舆论阵地。在Web2.0,因为智能手机的兴起,从网页时代进入了APP时代,各种弊端表现得尤其明显。Web2.0时代一个不公平的现象,是广大用户贡献了互联网平台需要的数据,但是双方的地位并不对等。用户贡献了账户和数据,但是Web2.0的架构是站在互联网应用的视角来建设的。对于个人来说,其数据是存在一个个APP的服务器里。当互联网应用关闭的情况下,用户的博客、文章、好友列表和关系、聊天记录都将从互联网上消失,并且很难被个人用户在本地长期保存下来。
在基于PC网页浏览器的互联网时代,各个网站之间还能相互跳转,相互引用,互联网用户还能够方便地订阅不同平台的信息。在APP时代,一些平台美名其曰ALL IN移动端,大幅砍掉纯Web的内容和服务,不登录不让看商品目录,不下载APP就不让看全文。用户成了数据运营和流量转化的工具人,成了各个APP的笼中之物,却没有享受到互联网带来的开放透明。在数据安全上,在“不登录不让使用”“不同意收集数据不让使用”等条款下,个人数据被过度采集。互联网平台在管理用户数据的时候,其管理政策和技术过程的披露不够公开透明,也发生过对内监管不严数据被过度使用、对外数据泄露的安全事故。一些互联网平台被用户贴上了垄断、霸道、乱用算法的标签。凡此种种,都违背了互联网发展的初衷,互联网用户期待未来能有一些改变。
延展思考
* 在Web2.0时代,你清楚自己的数据被怎样使用么?
Web3.0:数字化的普及
和对等价值交换为了规范管理互联网平台的扩张和对数据的使用,欧洲颁布了《通用数据保护条例》(GDPR),中国也制定了数据安全法。GDPR规定数据主体享有的七项数据权利分别是:访问权、更正权、删除权(“被遗忘权”)、限制处理权、可携带权、反对权,以及不受制于自动化决策的权利。与此同时,在区块链的分布式和去中心化的哲学思潮的影响下,科技圈也希望用更透明、更公平、更开放、更去中心化和价值连接的方式实现一个全新的互联网。个体用户不仅仅在乎数据的权力,也在乎怎样在新的互联网架构体系下分享到价值,这就是Web3.0概念的产生。火爆的ICO、加密货币、Defi、GameFi、NFT等概念层出不穷,使得Web3.0的概念在媒体、投资圈、技术圈讨论火热。很多人认为Web3.0是下一代颠覆性的互联网架构,也有很多人认为Web3.0只是一个理念的炒作,很难真正落地,最终只会是一地鸡毛。如果说,Web2.0给用户带来的困扰是垄断、算法不透明和数据滥用,那么Web3.0就需要在分布式、隐私、开源、信任和连接上做到更好,让互联网用户能够真正分享到Web3.0的好处。在Web2.0时代,即使作品版权归用户,但由于流量完全控制在互联网平台,用户很难将自己的作品或者数据变现。所以对Web3.0的定义,信息对等的价值交换取代了“Own”的概念,如果资源不能带来预期的收益,用户的所有权无法体现价值。
与互联网巨头谈对等价值交换,除了法律保障,还得有实力和资源。这里有两种实现对等关系的途径。
第一个途径是把以前的互联网平台完全排除在外,通过对等的个体或者是通过限制个体的规模,建立一个独立的Web3.0的生态体系。类似比特币那样的区块链架构是非常完备的体系,对大多数个体也有公平清晰的规则,但是用这样的架构无法支撑Web3.0的海量用户和应用场景。比特币的架构体系完美得让人感觉冷血,这个游戏好像是为机器人设计的。在比特币里最关键的两个因素是能源和算力,二者构成了机器世界的生存基本元素。想象一下,在一个完全是机器人的世界里,机器人依靠能源产生比特币,也可以用比特币来交换能源,获得更多能源和更优算力的机器人,可以轻松淘汰其他机器人。也许区块链大放异彩的时刻,要等到Web5.0时代吧。如果不使用闭环的区块链架构,很多项目披着Web3.0的外衣,带有很强的迷惑性,使得大众难以辨别是非。关于一些乱象,可以参考这篇文章:《Web3.0里的各种乱象:谈谈StepN和NFT》。
第二个途径是加强普通企业和个人的数据管理、技术和价值交换的能力,参与原先的体系,与互联网平台共舞。借用区块链的哲学思想和技术体系,充分利用现有的技术和法律的保障来构建Web3.0可能更实际一些。到目前为止,GDPR也只是一系列的法规,还没有具体的技术和产品跟法规一一对应,整个Web3.0的发展和落地应该会比大家想象的要更漫长。如果Web3.0的核心是数据平等和对等价值交换,数据平等是为了更好的和规模化的对等价值交换,那么可以围绕这两点来展开各种探索。
Web3.0对个人的影响大多数企业都已经完成了基础的数字化建设,通过各种系统很容易追溯到过往的记录。企业即使是用SaaS应用软件或者公有云,也会将数据留存在自己的管控范围内。但是对于个人来讲,大多数人除了照片、文档和各种笔记外,其他的数据都在哪里呢?个人的数字化,并不是一堆照片和文档的堆积,就像企业级的ERP应用也不只是一堆文件和数据的堆积。例如个人用户的手机里有各种银行和理财的APP,却很少有一个值得信赖的总账管家,来帮助自己管理各个账户里的交易和数据。虽然个人手机里有几十个APP,有的APP记录了自己的跑步数据,有的APP记录了自己的睡眠数据,有的APP记录了自己的体重数据,但是当你想把这些数据汇总在一起做一个归因分析的时候,对于非技术人员来讲几乎不可能。因业务调整,跑步软件NRC APP从2022年7月8日起停止中国大陆地区服务。虽然用户可以从NRC APP里导出自己需要的数据,但是裸数据对用户来讲并没有太大的价值,原始的经纬度的记录也需要应用才能被用户理解。当你换一个新的健身APP的时候,是否还能用以前的数据和记录?HTTP协议发明者蒂姆·伯纳斯-李(Tim Berners-Lee)在1998年提出一个语义网(Semantic Web)概念,它的核心是:通过给互联网上的文档(如: HTML文档)添加能够被计算机理解的语义(元数据),从而使整个互联网成为一个通用的信息交换介质。但是在进入APP时代后,互联网平台并没有沿着这个开放的方向发展。因为不满互联网平台对数据的垄断,Tim Lee又做过一次尝试,在2018年发布了Solid的去中心化平台,这并不是一个区块链平台,https://solid.mit.edu/。Solid的设计思路是每个人都可以拥有一个数据POD,这个POD可以架设在自家的服务器上,也可以由第三方网站托管。当用户访问互联网应用的时候,数据留在个人的Solid的数据POD上,把互联网应用、平台数据和个人数据分开。Solid只是第一步,个人数据保存在POD上,也还需要维持数据的一致性和整合。
当一个用户想把自己在互联网平台的文章迁移出去,可能会使用beepress或者wxsync这样的插件工具把文章同步到自己部署的开源Wordpress系统上。当用户想收藏整理自己在各种APP里阅读的内容,可能会用到Cubox这样的工具。Web2.0时代APP造成的数据墙,使得个人数字化的难度加大了很多,在Web1.0时代很简单的浏览器收藏夹所实现的功能,现在却需要很多专业的工具才能完成。在Web3.0时代,应该会有更好的工具来帮助个人实现更深层次的数字化,这或许是个不错的机会点。大多数成熟的企业都已经建立了数据平台。在Web3.0时代,个人也需要一个属于自己的数据管家,用来管理自己所有的数据存储、分析和交互方式。当APP需要调用数据的时候,由管家来决定哪些数据可以被调用,是否需APP来支付数据调用的成本;当APP产生数据的时候,需要把属于个人的数据也保存在个人数据管家里;当APP停止运营的时候,需要把个人的数据以方便读取的方式交给个人数据管家,用另一个开源或者免费的应用来接管这些数据;个人数据管家还可以对多个APP产生的数据进行关联分析;个人创作的作品,例如文章、视频等,也是第一时间保存在个人数据管家中,然后通过接口与各个内容分发的平台进行数据和价值的交换。随着时间的推移,各种关于个人的数据都将长期保管在个人数据管家之中,形成个人的虚拟印象,最终产生足够智能的AI数字人,数据积累对AI的孵化,是Web4.0发展的一个重要基础。个人数据想要得到价值,必须通过服务或者产品来体现,在Web3.0时代,个人也需要将自己的能力打造成标准的产品,这样可以更好地进行对等交易。过去几年,无论是自媒体、公众号还是短视频,都有非常多的专家在将自己的价值产品化,逐渐形成清晰的个人画像。这点上,微信公众号的Slogan倒是挺符合Web3.0的价值观。