互联网上下50年,万字长文推演Web1.0到Web5.0(2)

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 互联网上下50年,万字长文推演Web1.0到Web5.0

Web2.0:数据的大浪淘沙时代,

诞生互联网巨头

Web2.0诞生的标志性事件应该就是谷歌在2003年后陆续发表了关于GFS、MapReduce和BigTable的论文,解决了数据存储、计算和处理的成本问题。谷歌通过内部自研,攻克了互联网领域的这三座大山。谷歌通过大数据的成本优势,很早就实现了盈利,并于2004年公开上市。


其他的互联网公司,有些用游戏、短信、甚至一些擦边球的业务利润继续补贴互联网业务,熬过了没有大数据技术的艰难时光。后来各互联网公司通过开源和合作的方式逐渐把谷歌的理论工程化,形成了后来的大数据技术和生态体系,成为互联网业务的基石。Web2.0时代是数据、计算和产品的工业化时代,互联网平台处理数据的成本越低、效率越高,其垄断地位就会逐渐形成。过去十几年里,在搜索、社交、地理服务和信息发布等各个领域,出现了各种各样的互联网平台,这些巨头利用自身在数据上的技术和规模优势,不仅仅通过精准广告实现了数据的价值,也通过数据、流量和场景的结合对传统行业造成了巨大的挑战。一些传统行业公司甚至畏惧与互联网公司合作,因为担心自己积累了几十年的宝贵行业经验建立的护城河,被互联网企业通过数据和流量轻松攻破。


有了精准的数据,就可以形成巨大的流量;有了流量,就等于把控了线上的营销渠道。那些对制造、供应链、物流和渠道依赖性不高的产品,在垄断性的流量前基本没有还手之力。通过大数据和千人千面的精准建模,互联网巨头也开始渗透金融领域,通过金融的杠杆不断放大业务规模。海量的个人隐私数据让一些互联网平台得以引导用户购买特定产品,使得用户对投放的内容和产品上瘾。它们利用大数据杀熟,同样的商品和服务,多次查看价格会出现变化,老客户的价格比新客户更高。它们只推荐能带来潜在商业利益的产品甚至假冒伪劣产品,而不是对用户最适合、最恰当的商品。一些平台甚至可以利用数据,对个人的欲望、情绪乃至意识形态加以操控,指引用户阅读特定文章,为特定人投票或对特定群体产生特定的偏见。它们甚至可以成为特定政治势力的代理工具,影响国家大选。即使是大国总统,也可能被互联网平台禁言而失去自己的舆论阵地。在Web2.0,因为智能手机的兴起,从网页时代进入了APP时代,各种弊端表现得尤其明显。Web2.0时代一个不公平的现象,是广大用户贡献了互联网平台需要的数据,但是双方的地位并不对等。用户贡献了账户和数据,但是Web2.0的架构是站在互联网应用的视角来建设的。对于个人来说,其数据是存在一个个APP的服务器里。当互联网应用关闭的情况下,用户的博客、文章、好友列表和关系、聊天记录都将从互联网上消失,并且很难被个人用户在本地长期保存下来。


在基于PC网页浏览器的互联网时代,各个网站之间还能相互跳转,相互引用,互联网用户还能够方便地订阅不同平台的信息。在APP时代,一些平台美名其曰ALL IN移动端,大幅砍掉纯Web的内容和服务,不登录不让看商品目录,不下载APP就不让看全文。用户成了数据运营和流量转化的工具人,成了各个APP的笼中之物,却没有享受到互联网带来的开放透明。在数据安全上,在“不登录不让使用”“不同意收集数据不让使用”等条款下,个人数据被过度采集。互联网平台在管理用户数据的时候,其管理政策和技术过程的披露不够公开透明,也发生过对内监管不严数据被过度使用、对外数据泄露的安全事故。一些互联网平台被用户贴上了垄断、霸道、乱用算法的标签。凡此种种,都违背了互联网发展的初衷,互联网用户期待未来能有一些改变。

延展思考


* Web2.0时代,你清楚自己的数据被怎样使用么 




Web3.0:数字化的普及

和对等价值交换为了规范管理互联网平台的扩张和对数据的使用,欧洲颁布了《通用数据保护条例》(GDPR),中国也制定了数据安全法。GDPR规定数据主体享有的七项数据权利分别是:访问权、更正权、删除权(“被遗忘权”)、限制处理权、可携带权、反对权,以及不受制于自动化决策的权利。与此同时,在区块链的分布式和去中心化的哲学思潮的影响下,科技圈也希望用更透明、更公平、更开放、更去中心化和价值连接的方式实现一个全新的互联网。个体用户不仅仅在乎数据的权力,也在乎怎样在新的互联网架构体系下分享到价值,这就是Web3.0概念的产生。火爆的ICO、加密货币、Defi、GameFi、NFT等概念层出不穷,使得Web3.0的概念在媒体、投资圈、技术圈讨论火热。很多人认为Web3.0是下一代颠覆性的互联网架构,也有很多人认为Web3.0只是一个理念的炒作,很难真正落地,最终只会是一地鸡毛。如果说,Web2.0给用户带来的困扰是垄断、算法不透明和数据滥用,那么Web3.0就需要在分布式、隐私、开源、信任和连接上做到更好,让互联网用户能够真正分享到Web3.0的好处。在Web2.0时代,即使作品版权归用户,但由于流量完全控制在互联网平台,用户很难将自己的作品或者数据变现。所以对Web3.0的定义,信息对等的价值交换取代了“Own”的概念,如果资源不能带来预期的收益,用户的所有权无法体现价值。


与互联网巨头谈对等价值交换,除了法律保障,还得有实力和资源。这里有两种实现对等关系的途径。


第一个途径是把以前的互联网平台完全排除在外,通过对等的个体或者是通过限制个体的规模,建立一个独立的Web3.0的生态体系。类似比特币那样的区块链架构是非常完备的体系,对大多数个体也有公平清晰的规则,但是用这样的架构无法支撑Web3.0的海量用户和应用场景。比特币的架构体系完美得让人感觉冷血,这个游戏好像是为机器人设计的。在比特币里最关键的两个因素是能源和算力,二者构成了机器世界的生存基本元素。想象一下,在一个完全是机器人的世界里,机器人依靠能源产生比特币,也可以用比特币来交换能源,获得更多能源和更优算力的机器人,可以轻松淘汰其他机器人。也许区块链大放异彩的时刻,要等到Web5.0时代吧。如果不使用闭环的区块链架构,很多项目披着Web3.0的外衣,带有很强的迷惑性,使得大众难以辨别是非。关于一些乱象,可以参考这篇文章:《Web3.0里的各种乱象:谈谈StepN和NFT


第二个途径是加强普通企业和个人的数据管理、技术和价值交换的能力,参与原先的体系,与互联网平台共舞。借用区块链的哲学思想和技术体系,充分利用现有的技术和法律的保障来构建Web3.0可能更实际一些。到目前为止,GDPR也只是一系列的法规,还没有具体的技术和产品跟法规一一对应,整个Web3.0的发展和落地应该会比大家想象的要更漫长。如果Web3.0的核心是数据平等和对等价值交换,数据平等是为了更好的和规模化的对等价值交换,那么可以围绕这两点来展开各种探索。


Web3.0对个人的影响大多数企业都已经完成了基础的数字化建设,通过各种系统很容易追溯到过往的记录。企业即使是用SaaS应用软件或者公有云,也会将数据留存在自己的管控范围内。但是对于个人来讲,大多数人除了照片、文档和各种笔记外,其他的数据都在哪里呢?个人的数字化,并不是一堆照片和文档的堆积,就像企业级的ERP应用也不只是一堆文件和数据的堆积。例如个人用户的手机里有各种银行和理财的APP,却很少有一个值得信赖的总账管家,来帮助自己管理各个账户里的交易和数据。虽然个人手机里有几十个APP,有的APP记录了自己的跑步数据,有的APP记录了自己的睡眠数据,有的APP记录了自己的体重数据,但是当你想把这些数据汇总在一起做一个归因分析的时候,对于非技术人员来讲几乎不可能。因业务调整,跑步软件NRC APP从2022年7月8日起停止中国大陆地区服务。虽然用户可以从NRC APP里导出自己需要的数据,但是裸数据对用户来讲并没有太大的价值,原始的经纬度的记录也需要应用才能被用户理解。当你换一个新的健身APP的时候,是否还能用以前的数据和记录?HTTP协议发明者蒂姆·伯纳斯-李(Tim Berners-Lee)在1998年提出一个语义网(Semantic Web)概念,它的核心是:通过给互联网上的文档(如: HTML文档)添加能够被计算机理解的语义(元数据),从而使整个互联网成为一个通用的信息交换介质。但是在进入APP时代后,互联网平台并没有沿着这个开放的方向发展。因为不满互联网平台对数据的垄断Tim Lee又做过一次尝试,在2018年发布了Solid的去中心化平台,这并不是一个区块链平台,https://solid.mit.edu/Solid的设计思路是每个人都可以拥有一个数据POD,这个POD可以架设在自家的服务器上,也可以由第三方网站托管。当用户访问互联网应用的时候,数据留在个人的Solid的数据POD上,把互联网应用、平台数据和个人数据分开。Solid只是第一步,个人数据保存在POD上,也还需要维持数据的一致性和整合。


当一个用户想把自己在互联网平台的文章迁移出去,可能会使用beepress或者wxsync这样的插件工具把文章同步到自己部署的开源Wordpress系统上。当用户想收藏整理自己在各种APP里阅读的内容,可能会用到Cubox这样的工具。Web2.0时代APP造成的数据墙,使得个人数字化的难度加大了很多,在Web1.0时代很简单的浏览器收藏夹所实现的功能,现在却需要很多专业的工具才能完成。在Web3.0时代,应该会有更好的工具来帮助个人实现更深层次的数字化,这或许是个不错的机会点。大多数成熟的企业都已经建立了数据平台。在Web3.0时代,个人也需要一个属于自己的数据管家,用来管理自己所有的数据存储、分析和交互方式。当APP需要调用数据的时候,由管家来决定哪些数据可以被调用,是否需APP来支付数据调用的成本;当APP产生数据的时候,需要把属于个人的数据也保存在个人数据管家里;当APP停止运营的时候,需要把个人的数据以方便读取的方式交给个人数据管家,用另一个开源或者免费的应用来接管这些数据;个人数据管家还可以对多个APP产生的数据进行关联分析;个人创作的作品,例如文章、视频等,也是第一时间保存在个人数据管家中,然后通过接口与各个内容分发的平台进行数据和价值的交换。随着时间的推移,各种关于个人的数据都将长期保管在个人数据管家之中,形成个人的虚拟印象,最终产生足够智能的AI数字人,数据积累对AI的孵化,是Web4.0发展的一个重要基础。个人数据想要得到价值,必须通过服务或者产品来体现,在Web3.0时代,个人也需要将自己的能力打造成标准的产品,这样可以更好地进行对等交易。过去几年,无论是自媒体、公众号还是短视频,都有非常多的专家在将自己的价值产品化,逐渐形成清晰的个人画像。这点上,微信公众号的Slogan倒是挺符合Web3.0的价值观。



相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
安全 前端开发 JavaScript
互联网并发与安全系列教程(07) - 常见的Web安全漏洞(其它漏洞)
互联网并发与安全系列教程(07) - 常见的Web安全漏洞(其它漏洞)
109 0
|
安全 NoSQL Java
互联网并发与安全系列教程(06) - 常见的Web安全漏洞(CSRF攻击)
互联网并发与安全系列教程(06) - 常见的Web安全漏洞(CSRF攻击)
124 0
|
存储 JSON 安全
解锁互联网安全的新钥匙:JWT(JSON Web Token)
解锁互联网安全的新钥匙:JWT(JSON Web Token)
222 0
|
1月前
|
存储 消息中间件 缓存
构建互联网高性能WEB系统经验总结
构建互联网高性能WEB系统经验总结
|
5月前
|
JSON API 网络架构
揭秘!Python Web框架下的RESTful API设计,为何成为互联网新宠?
【7月更文挑战第24天】在互联网快速发展背景下,RESTful API以其简洁性和可扩展性成为应用间通信的首选。REST强调资源为核心,利用HTTP方法处理CRUD操作,促进前后端分离,提高开发效率。Python的Flask框架支持轻松构建RESTful API,通过路由、请求和响应机制实现。示例代码展示了如何使用Flask创建、读取和更新用户信息。Python Web框架因其丰富的工具和库,简化RESTful API开发,适应微服务架构需求,在互联网发展中扮演重要角色。
56 3
|
5月前
|
存储 自然语言处理 前端开发
Web1.0、Web2.0 和 Web3.0 的区别
【7月更文挑战第4天】Web1.0是只读的互联网,内容由网站所有者发布,用户被动接收;Web2.0强调用户生成内容和社交互动,如博客、社交媒体,用户能积极参与;而Web3.0则走向去中心化,基于区块链,强调语义网、数字资产、用户隐私和数据主权,赋予用户更多控制权。从单向传播到深度互动,再到去中心化和智能服务,互联网不断演进。
555 6
|
7月前
|
存储 人工智能 应用服务中间件
Web应用是一种通过互联网浏览器和网络技术在互联网上执行任务的计算机程序
【5月更文挑战第30天】Web应用是一种通过互联网浏览器和网络技术在互联网上执行任务的计算机程序
92 2
|
SQL 安全 JavaScript
互联网并发与安全系列教程(05) - 常见的Web安全漏洞(XSS攻击、SQL注入、防盗链)
互联网并发与安全系列教程(05) - 常见的Web安全漏洞(XSS攻击、SQL注入、防盗链)
95 0
|
2月前
|
XML JSON API
ServiceStack:不仅仅是一个高性能Web API和微服务框架,更是一站式解决方案——深入解析其多协议支持及简便开发流程,带您体验前所未有的.NET开发效率革命
【10月更文挑战第9天】ServiceStack 是一个高性能的 Web API 和微服务框架,支持 JSON、XML、CSV 等多种数据格式。它简化了 .NET 应用的开发流程,提供了直观的 RESTful 服务构建方式。ServiceStack 支持高并发请求和复杂业务逻辑,安装简单,通过 NuGet 包管理器即可快速集成。示例代码展示了如何创建一个返回当前日期的简单服务,包括定义请求和响应 DTO、实现服务逻辑、配置路由和宿主。ServiceStack 还支持 WebSocket、SignalR 等实时通信协议,具备自动验证、自动过滤器等丰富功能,适合快速搭建高性能、可扩展的服务端应用。
126 3
|
28天前
|
设计模式 前端开发 数据库
Python Web开发:Django框架下的全栈开发实战
【10月更文挑战第27天】本文介绍了Django框架在Python Web开发中的应用,涵盖了Django与Flask等框架的比较、项目结构、模型、视图、模板和URL配置等内容,并展示了实际代码示例,帮助读者快速掌握Django全栈开发的核心技术。
139 45