北京大学软件研究所副所长黄罡:大数据视角下的API经济

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:
北京大学软件研究所副所长黄罡:大数据视角下的API经济

今天我来跟大家分享的是,邬院士上午讲的都是以数据集为核心的大数据的共享开放流通交易里面产生的种种弊端,但是其实我们放眼看世界,以美国为代表的数据开放流通共享交易几乎不是以数据集为核心,而是以API,也就是应用编程接口。今天我希望从大数据视角下,尤其是邬院士讲了开放流通共享领域的问题,我们看API经济是怎么回事。

API经济是针对APP的,APP是手机里的应用,移动互联网出现以后所有移动互联网的产业价值和用户价值都是以APP来体现的,但是我们也知道随着APP在iOs过100万用户以后,95%以上的应用已经变成了僵尸应用,美国由此产生新的应用分发模式API,就是用户根本不用再花心思开发一个APP在应用商店上大力推广,你要做的事情是把自己的业务做好,把你的业务以API的方式开放出去,别人会在他的应用里面,不管是微信还是Face book,不管是电商还是采购都会集成你的,只要你的业务功能有价值,你的数据就有价值。

我们可以看这张统计图,推特是聊天的,它每天有150亿的API对它的调用不是走它的APP而是走API,谷歌也是每天100亿API调用,当然还有美国其他的。我们可以看到越来越多APP的功能其实不是通过打开应用使用的,而是通过API。当然大家要问了,为什么要把API开放出来?从大数据领域得到了什么?大家越来越多的可以看到,我的API出去以后随着用户对我的调用,我会得到用户对我业务的诉求,我可以优化,所以基本上今天不管是微软、谷歌还是Face book,他们人工智能的核心业务一个方式是开源,第二方式是API,因为它的API发出去以后用户对API所有使用,它可以得到进一步调优他的算法,这是我们的API经济。

第一种模式是对外提供API,第二种模式就是应用集成。大家可以看到今天用的Top应用里,微信2015年已经集成了583个第三方应用的API,包括滴滴打车、大众点评,根本不用再打开那个APP,在微信、淘宝里就可以打开。美国的亚马逊的Echo,最上面是定时,播放音乐,帮我读新闻,帮我开灯关灯,帮我调温控,Echo把家里的智能服务以及移动互联网上APP以API的方式塞到了这个音箱里面,以语音交互的方式给你,这是我们看到的第二个趋势。API很像当年的网站,应用集成很像当年的门户,自然而然我们可以看到确实有搜索引擎存在,而且这块是我个人要呼吁的,大家都在说苹果不创新了,我们国内的手机厂说今天干掉苹果明天干掉谁,大家可以看看苹果已经在2015年9月10月推iOS9,通知栏已经可以让你收到苹果自己的应用。去年8月份iOs10已经实现第三方APP应用类数据或者API的搜索,大家可以看到这是我们的截屏。在手机里搜美食就可以把美团搜出来,是美团里的数据,不是美团APP。谷歌在数据API走得较缓,苹果是成功的,谷歌去年10月份推出了手机里面Google Assistant内嵌了苹果的搜索功能。

API真正遇到什么问题呢,最大的问题就是数据孤岛的问题,就像今天陈部长谢司长说的,越来越多的数据是从移动设备、物联网设备产生的,这些数据不是网站可以用爬虫公开爬到的。今天上午邬院士讲了很多数据开放共享流通的问题,API经济能解决类似的问题,以应用为驱动的方式,如果我们要解决数据孤岛目前有什么样的方式。

据我们对国内一流大企业调研,典型的政府和央企的信息孤岛要打开要花数百万人民币,而且这在里面从数据开放流通的角度最大的问题是应用开发商成了关键角色,但这个关键角色不合理,因为在大数据里面真正的数据是产生者和运营者,跟开发商没关系。就像iOS和谷歌,后端数据不好拿,中间逻辑层重构太难,热点是我们在前面的表现层通过智能感知把数据拿出来,具体的技术我就不说了,总而言之整个这套技术目前除了斯坦福等顶级高效也就是iOs里面有一点。

北京大学从2003年开始做类似的研究,研究的成果,我们如果能打破APP的边界,我们可以在各个不同的APP之间跳来跳去,再也不用关心一个APP接下来要去打车要去订餐,全部可以给你打通。

接下来是邬院士反复强调的数据的问题,今天个人数据主要是以程序化通过APP搜到平台卖给了别人,你在淘宝里的一双鞋在今日头条马上给你推,我们每个人都被边缘化甚至都被忽视掉,没有数据的人权。我们利用这套API技术做的什么,这是我们做的demo程序,你可以看到在你的手机上你有什么数据,第一你知道你的数据在哪个地方,第二你也可以知道每天在这些APP里产生了哪些数据,第三只要你授权,我们可以帮你把所有的产生的数据进行优化整合。

这样达到一个什么好处呢?我们解决了数据开放共享流通里个人的问题,第一这个数据至少每个人本身是有权利而且你确实知道这个数据在哪个地方,第二这个数据通过API的方式可以把它拿出来,当然我们不能阻止APP厂商使用,因为你跟它签了和约,但是这个数据本身是属于你,但是此前是因为APP根本不提供任何方式让你把数据拿出来,所以数据根本不能使用,这样的话用了我们这一套API的技术以后就可以使用了。最后你也可以进一步的利用加工,所有这些东西全是在你个人的手机上,永远不会上网,这样就极大保护了个人的隐私,当然这套数据人权保护合不合理,能不能成功,我不知道,我们只是从学术上提供一个可能的探讨思考。

我们同时也在帮政府和企业做到了燕云的DAAS平台,政府和企业信息系统里的数据全部是政府和企业的,但是今天真正要把它开放的时候往往受制于系统的开发,系统开发又说我要集成的时候又被另外一个开发商给打了,这样带来了极大的问题,燕云DAAS提供了API的方式,以APID方式把你的数据开放出去,可以做到流程可控、来源可溯,明天会有具体的介绍。

北京大学花了十几年时间,在这套系统软件上做了一套东西,我们希望把互联网和移动互联网以及物联网存在的各个系统里的数据,在数据拥有者授权的情况下帮他开发出来,帮他进行流通,帮他进行共享,这是一套大的生态,北京大学希望跟产学研各界和政府合作,共创中国特色的而且是领先的API经济。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
11天前
|
存储 缓存 API
API接口详解及其在电子商务中的应用研究
通过这些内容的详细介绍和实际案例分析,希望能帮助您深入理解API接口及其在电子商务中的应用,提高系统的互操作性和用户体验。
55 14
|
14天前
|
安全 测试技术 API
探秘驱动软件系统高效协同的高效协同之API接口
在数字化时代,API(应用程序编程接口)作为现代软件开发的核心组件,犹如无形的桥梁,连接不同应用、平台和服务,促进数据和功能自由流动。本文深入探讨API的基本概念、工作原理、核心组成部分及其在现代软件开发中的应用与最佳实践。通过统一数据格式、确保安全性和实施版本控制,API助力高效协同,并在社交媒体、物联网及企业系统中展现出巨大价值。未来,API将朝着智能化方向发展,同时面临并解决安全挑战,推动各行业的数字化转型。
47 6
|
3月前
|
消息中间件 NoSQL Kafka
大数据-52 Kafka 基础概念和基本架构 核心API介绍 应用场景等
大数据-52 Kafka 基础概念和基本架构 核心API介绍 应用场景等
91 5
|
3月前
|
分布式计算 Java 大数据
大数据-147 Apache Kudu 常用 Java API 增删改查
大数据-147 Apache Kudu 常用 Java API 增删改查
49 1
|
4月前
|
人工智能 分布式计算 大数据
超级计算与大数据:推动科学研究的发展
【9月更文挑战第30天】在信息时代,超级计算和大数据技术正成为推动科学研究的关键力量。超级计算凭借强大的计算能力,在尖端科研、国防军工等领域发挥重要作用;大数据技术则提供高效的数据处理工具,促进跨学科合作与创新。两者融合不仅提升了数据处理效率,还推动了人工智能、生物科学等领域的快速发展。未来,随着技术进步和跨学科合作的加深,超级计算与大数据将在科学研究中扮演更加重要的角色。
|
5月前
|
存储 数据可视化 数据挖掘
大数据环境下的房地产数据分析与预测研究的设计与实现
本文介绍了一个基于Python大数据环境下的昆明房地产市场分析与预测系统,通过数据采集、清洗、分析、机器学习建模和数据可视化技术,为房地产行业提供决策支持和市场洞察,探讨了模型的可行性、功能需求、数据库设计及实现过程,并展望了未来研究方向。
265 4
大数据环境下的房地产数据分析与预测研究的设计与实现
|
5月前
|
机器学习/深度学习 数据采集 大数据
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解
本文详细介绍了2022年第三届MathorCup高校数学建模挑战赛大数据竞赛赛道B的题目——北京移动用户体验影响因素研究,提供了问题一的建模方案、代码实现以及相关性分析,并对问题二的建模方案进行了阐述。
104 0
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解
|
5月前
|
机器学习/深度学习 自然语言处理 数据可视化
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
本文探讨了基于Python大数据技术对京东产品评论进行情感分析的研究,涵盖了文本预处理、情感分类、主题建模等步骤,并运用了snwonlp情感分析和LDA主题分析方法,旨在帮助电商企业和消费者做出更明智的决策。
185 1
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
|
5月前
|
机器学习/深度学习 数据采集 大数据
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题二建模方案及代码实现详解
本文详细介绍了2022年第三届MathorCup高校数学建模挑战赛大数据竞赛赛道B的问题二的建模方案和Python代码实现,包括数据预处理、特征工程、模型训练以及预测结果的输出,旨在通过数据分析与建模方法帮助中国移动北京公司提升客户满意度。
85 2
|
5月前
|
开发框架 人工智能 自然语言处理
基于ChatGPT的API的C#接入研究
基于ChatGPT的API的C#接入研究