云上企业如何加速创新?亚马逊云科技发布数智融合新趋势

简介: 日前,以“云领数智融合,重塑创新引领”为主题的亚马逊云科技大数据与机器学习媒体沟通会在北京举行。亚马逊云科技大中华区产品部总经理陈晓建、亚马逊云科技大中华区产品部技术专家团队总监王晓野、亚马逊云科技大中华区产品部机器学习产品高级经理张洋接受了 InfoQ 在内的少数几家媒体采访。

随着信息技术日益发展,近几年,全球数据量激增。统计显示,2020 年,全球数据量达到了 60ZB,其中中国数据量增速迅猛。预计 2025 年中国数据量将增至 48.6ZB,占全球数据量的 27.8%。

毋庸置疑,数据早已成为企业最重要的资产,但数据价值却未得到充分利用。福布斯调研报告数据显示,如果能够成为一个数据驱动型公司,那么公司收入会增加 20%,成本会减少 30%。

亚马逊云科技认为,企业要想重塑数据洞察,一定要做到数智融合,将数据(大数据技术)和智能(机器学习技术)进行融合和统一。从而更加高效地围绕数据构建和实施项目,使得数据在两者之间无缝流转,成员快速具备相关能力,推动公司企业数字化转型迈向新的高度。

当大数据遇上机器学习

IT 时代产生的数据呈指数级增长,而数据也被应用到了更多的领域中。与过去相比,数据的规模日益庞大,应用场景日益复杂,这些都给大数据计算提出了更高的挑战。而企业对大数据服务也提出了更高的要求。越来越多的企业希望拥有按小时,甚至按分钟级实时的大数据服务。

与此同时,随着 AI 技术不断发展,AI 技术的应用深度和广度也在不断加深。根据 IDC 报告显示,到 2023 年,AI 系统支出将达到 979 亿美元(约合 6557 亿元人民币),比 2019 年增加 2.5 倍。另外根据 Gartner 的分析,到 2024 年,75% 的企业将把机器学习技术真正用于生产,为业务所赋能。

“从这两点来看,大数据和机器学习技术会对企业业务产生越来越大的作用,越来越多的企业希望能够通过融合大数据和机器学习能力来提供业务产出,以充分发挥数据的价值。”陈晓建说道。

可以看到的企业需求趋势是,在组织架构层面,企业将原来分散在各个部门的机器学习实践进行整合,并与大数据项目进行统一协调和资源配置;在人员能力层面,企业要求和安排原有传统的大数据实践者掌握机器学习技术,应用到大数据具体项目或承接新的机器学习相关的项目需求,要求机器学习从业者也要掌握大数据处理能力,更好、更便捷地完成模型所需的数据准备和加工;在项目实施层面,仅依靠传统的大数据技术是无法全方位提供充足的数据见解,仍需要机器学习的模型能力补充,越来越多的数据项目会融合大数据和机器学习两者的能力;在工具支撑层面,企业需要面向大数据技术和机器学习构建统一的开发平台和技术基础,可能是对已有大数据平台进行改造增加机器学习相关场景和能力,或是完全推倒重新构建一个面向两者的通用的平台。

陈晓建认为,数智融合需要解决三个问题:

第一,数据和机器学习分而治之,数据及技术孤岛制约敏捷迭代。数据的丰富性、准确性和质量,直接决定了机器学习最终的效果。但企业通常分开独立建设大数据能力和机器学习能力,多个部门数据孤岛式呈现。

第二,数据处理能力不足。在生产制造企业,机器学习帮助客户对产品售后维修需求进行预测,由被动响应变为主动规划。但由于不具备足够的大数据处理能力,模型开发成功后 ,不能够有效收集处理海量的运营数据,致使预测不准确,无法达到预期业务目标。

第三,数据分析人员参与度低。现实情况经常是,模型在实验环节效果良好,但实际使用中却不尽人意,实验环境只是对真实环境的简单模拟,生产环境要复杂得多。

实现数智融合需要构建三大核心能力

“企业在云中要打造统一的数据基础底座,实现大数据和机器学习的’双剑合璧’,为企业发展提供创新引擎。这是我认为实现数智融合最有效的一条途径。”

陈晓建表示,实现数智有效融合的途径一是建立统一融合的治理底座,如数据质量、数据权限、数据开发、数据工作流、可视化;二是要让大数据和机器学习之间高效充分的双向互动,互为支撑,互为因果,形成正向循环。

而企业要想实现数智融合需要构建三大核心能力:

  • 统一数据共享。让数据资产化,打破数据孤岛。
  • 统一权限管控。因为只有具备完善的权限控制能力,放心的让数据在不同的业务系统之间流转。
  • 统一开发及流程编排。融合端到端的大数据和机器学习任务,提升整体的开发效率。

亚马逊云科技的经验之一就是构建云中统一的数据治理底座,打破数据及技能孤岛。企业需要构建统一的数据治理底座,实现大数据和机器学习的数据共享,数据权限的统一管控,以及两者统一的开发和流程编排。云中统一的数据治理底座不仅能提升大数据和机器学习的高效融合,还能减少大数据和机器学习重复构建的工作,并且显著降低成本。

“在 2021 re:Invent 期间,我们的 Amazon SageMaker Studio 进行了能力升级,通过 Amazon SageMaker Studio 统一的开发界面,现在可以实现数据科学家或是数据工程师用统一的界面实现机器学习、算法模型开发之外的能力,还可以通过 Amazon Athena 访 问不同数据源的数据,也可以通过 Amazon EMR 实现大数据处理,也可以通过同样的界面,通过代码调用 Amazon Redshift,访问数据仓库里的数据。”王晓野说道。

此外,还需要助力机器学习由实验转为实践,为机器学习提供生产级别的数据处理能力。机器学习项目成功的关键,就是对复杂的数据进行加工和准备。

最后,让数据分析智能化,赋能业务人员探索创新。比较常见的方式是通过一些工具降低探索机器学习建模难度,比如亚马逊深度集成机器学习 Amazon SageMaker 模型预测能力的 Amazon QuickSight 、在分析结果中添加基于模型预测的 Amazon Athena ML,都可以帮助开发者使用熟悉的技术,甚至通过自然语言来使用机器学习。

“大数据技术与机器学习技术,其实有着非常不同的发展路径。但是有一部分的企业已经走在了数据驱动转型的前沿,借助云计算实现了它们二者有机的融合。”王晓野说道。

人工智能将无处不在

人工智能从出现到发展至今不过十年。不过根据 IDC 2022 年中国人工智能及自动化市场的十大预测,人工智能将无处不在。

IDC 中国助理研究总监卢言霞表示,到 2022 年,60% 的中国 1000 强公司将在所有关键业务的横向职能中扩大使用 AI/ML,如营销、法务、人力资源、采购和供应链、物流等。由于机器学习更加依赖算力、算法、数据,人工智能的快速发展拉动了对 AI 基础数据服务的需求,预计在未来几年内将稳步增长。

而随着 AI 技术进一步发展,大数据与 AI 结合的优势也将进一步显现。可以预见的是,云上企业要想加速创新,或将必然加入这场数智融合之旅中。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
3月前
|
人工智能 搜索推荐 算法
产品服务技术创新
产品服务技术创新
29 6
|
10月前
|
编解码 开发框架 Kubernetes
《面向分布式云的直播及点播云技术创新方案》获中国信通院“分布式云技术创新先锋案例”
《面向分布式云的直播及点播云技术创新方案》获中国信通院“分布式云技术创新先锋案例”
129 0
|
12月前
|
云安全 弹性计算 人工智能
重磅发布 | 云服务:支撑中国数字经济新比较优势形成
编者按 当前,我国经济发展的外部环境和内部动力正加速调整,数字经济的增长引擎作用逐步凸显。新型云计算服务体系已经成为现代化基础设施的关键支撑,能够助力我国构建新的比较优势。阿里云研究院联合外部专家,对云服务促进经济发展的机理进行深入研究。
122 0
|
运维 监控 Cloud Native
阿里云云原生加速器成员企业袋鼠云创始人陈吉平:深耕国产自研数字化技术与服务,持续为客户创造价值
如今,袋鼠云已成功服务 5000 多家客户,涵盖金融、政务、教育、制造等 20+行业。11 月初,袋鼠云刚刚宣布完成过亿元 C+轮融资。袋鼠云秉承着“让数据产生价值”的使命,以科技创新驱动发展,不断迭代优化解决方案和生态结构,其中与阿里云的合作不得不说。
阿里云云原生加速器成员企业袋鼠云创始人陈吉平:深耕国产自研数字化技术与服务,持续为客户创造价值
|
人工智能 达摩院 Cloud Native
阿里云云原生应用平台总经理丁宇:“连接、合作、赋能”,携手加速器伙伴助力企业云上创新
阿里巴巴研究员、阿里云智能云原生应用平台总经理丁宇表示,如果用三个词来形容我们希望达到的效果,就是连接、合作、赋能。
阿里云云原生应用平台总经理丁宇:“连接、合作、赋能”,携手加速器伙伴助力企业云上创新
|
机器人 BI
伙伴客户案例|阿里云RPA携手中电金信赋能大型保险企业业务发展(二)
RPA全称机器人流程自动化(Robotic Process Automation),是一种新兴的“数字劳动力”,可以替代或辅助人完成规则明确的重复性劳动,大幅提升业务流程销量,实现企业业务流程的自动化和智能化,从而降本增效。目前,RPA解决方案的应用场景几乎涵盖了所有行业,包括银行、保险、制造、零售、医疗、物流、电子商务甚至政府和公共机构。
伙伴客户案例|阿里云RPA携手中电金信赋能大型保险企业业务发展(二)
伙伴客户案例|阿里云RPA携手中电金信赋能大型保险企业业务发展
RPA全称机器人流程自动化(Robotic Process Automation),是一种新兴的“数字劳动力”,可以替代或辅助人完成规则明确的重复性劳动,大幅提升业务流程销量,实现企业业务流程的自动化和智能化,从而降本增效。目前,RPA解决方案的应用场景几乎涵盖了所有行业,包括银行、保险、制造、零售、医疗、物流、电子商务甚至政府和公共机构。
伙伴客户案例|阿里云RPA携手中电金信赋能大型保险企业业务发展
|
存储 弹性计算 人工智能
洞见科技携手阿里云,以“隐私计算+云”推动场景应用大规模落地
基于阿里云第七代实例构建的隐私计算解决方案,提供稳定可靠、灵活调度的算力来源,更好地帮助洞见科技为政务、金融等客户打破数据孤岛,赋能数据价值的安全释放和数据智能的合规应用。
洞见科技携手阿里云,以“隐私计算+云”推动场景应用大规模落地
|
人工智能 运维 监控
骞云与阿里云达成合作,强强联合加速云原生下的企业数字化转型
近日,骞云科技与阿里云就如何更好的管理云原生服务达成深入合作,共同推出适用于阿里云生态技术的云管理解决方案,SmartCMP SaaS平台正式登陆阿里云控制台工具与解决方案中心及云市场。
387 0
骞云与阿里云达成合作,强强联合加速云原生下的企业数字化转型