安永合伙人Beatriz Sanz Sáiz:垃圾数据,是大数据分析行业的毒瘤

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 我们不能“卖”AI,而是应以AI为媒介,把它当成一种工具,为传统产业客户提供针对性的思路与方法。

我们不能“卖”AI,而是应以AI为媒介,把它当成一种工具,为传统产业客户提供针对性的思路与方法。

AI是什么?

深度学习技术?机器人?还是大数据?

其实很多人都不能给出准确的答案。

安永合伙人兼全球数据分析与咨询主管Beatriz Sanz Sáiz说,“其实,AI是一系列不同技术的整合。它就是在人类已有的基础上,学习人类大脑、身体等各部位的功能,做进一步增强。”

TB1aHPYEgHqK1RjSZJnXXbNLpXa.jpg

图 | 安永合伙人兼全球数据分析与咨询主管Beatriz Sanz Sáiz

而学习,数据便不可或缺。

用优质数据和算法,输出优质分析内容

在AI刚刚火起来的时候,大数据公司经常会用到一个词,叫“海量数据”,以显示手握庞大资源。

但实际上,随着产业对大数据输出内容要求的提升,这似乎已经不是一个具有“正能量”的词了,反而是例如“小数据”、“知识图谱”等越来越受欢迎。

可以看到,因大数据产业市场规模可期,很大公司蜂拥而至,信息平台、数据库、各类研究院等层出不穷。相关数据统计显示,到2022年的时候,全球将有90%的公司发展战略都将变成以数据为核心,它将成为一项非常重要的资产,而数据分析也将成为不可或缺的能力。

但在Beatriz看来,现在的大部分公司并没有理解大数据及数据分析真正的价值所在。

“很多公司都会说他们有海量数据,但数据质量却不怎么样。加之算法不够简化,输出的数据质量必定大多不到位。所以,品质,才是数据的关键。”

而由于对大数据价值认识不够清晰,行业也逐渐形成两大趋势,一种喜欢标榜海量数据,实际输出的分析内容实用价值不大,Beatriz称之为垃圾数据;一种是非常看重数据价值,甚至把数据分析作为企业文化的核心之一,如新型的互联网企业、银行等。而后者,显然已在AI方面领先了。

亚太地区数据分析与咨询主管Cameron Wall补充说,“数据分为两类,结构化数据和非结构化数据。前者表示问题已知,而后者则表示问题是未知的。”

TB1SYzZEgHqK1RjSZFEXXcGMXXa.jpg

图 | 亚太地区数据分析与咨询主管Cameron Wall

具体来说,以审计行业,在处理报表业务时,结构化的数据通常意味着已经将各项数据分门别类,甚至已经理清了各个数据间的逻辑关系;而非结构化数据则只是面前一堆数据,如一团乱麻,需要先一一理清将其变成结构化数据,再做进一步分析处理。

Cameron解释称,“在安永,我们会基于图片和文件做智能化处理,建立自己的数据库,以保证数据的优质。”

目前,安永在内部已经建立了强大且优质的数据库,因应用AI技术,每年所节省的人工时间超300万小时。

那么,大数据和AI技术究竟能做哪些事情呢?

AI正在重新审视、修正一些传统概念

2018年AI行业有个词非常火,就是“赋能”。有了这个功能,AI几乎在所有传统行业都能起到促进升级、推动发展的作用。可以说,AI赋能,对于传统行业来说就是新生。

但Bertriz不这么认为,“AI赋能取决于你对AI的理解是否成熟。”

在她看来,由于AI赋能作用的日益凸显,很多公司在AI发展上都只强调一个字,“快”,甚至将其列入到了CIO的工作日程中。

但实际上,以当前AI技术及产业的发展状况看,AI技术最适合赋能的应该是自动化产业,特别是在工业4.0的当下,对AI技术做大量整合,并具备足够的洞察力将其结合到创新应用上,才能真正AI赋能。

因此,AI技术在更多层面上看其实是一种方法,它给了传统产业一个机会,用语修正已经“老旧”、传统的概念,例如健康医疗、制造业、金融行业等。

Beatriz强调,“我们不是在卖AI,而是以AI为媒介,把它当成一种工具,为传统产业客户提供针对性的思路与方法。”

以智能投顾为例,安永通过建立大数据平台及相关技术,让AI替代人工,处理大量数据整理及分析工作,而投资顾问节省了大量时间,以从专业的角度给客户提供更好的投资建议。

TB10ZfVEgHqK1RjSZFPXXcwapXa.jpg

再者,例如在大型超市中,通过数据分析帮助超市对客户进行分析预测,提前预判消费者可能的消费行为,以科学安排商品进货量、摆放位置及相关促销活动,并适当加以引导。

但这其中又涉及到一个问题,如何给予客户信心,让他们愿意把数据共享出来?

保障数据安全,是企业道德底线

去年年初,因Facebook泄漏了5000万用户信息,全球范围内大数据产业几乎都面临了一个问题:该如何保障数据安全?

对此,Beatriz以安永为例,“在安永内部有着非常严格的规定,仅数据监控方面,我们就共设有55个监控平台。除此之外,因为我们是审计出身,对于审计师来说,数据保护是天职。再加上我们的品牌效应,足以给予客户信心。”

Cameron还补充说,“Facebook的数据泄露,在很大程度是因为他们没有用以户为导向,没有在充分考虑用户隐私保护的意愿。只能说,这是一个道德层面的问题。”

最后

在安永看来,持续以数据为中心、以AI算法为驱动,通过形成内部数据库,为客户提供创造性的解决方案,是可以更加高效为客户提供服务的。

而谈及中国市场与海外市场的差别,Cameron表示,“中国客户的胃口更大,亚太地区很多国家的目标只是‘赶超’,而中国客户是希望成为‘领头羊’。这让我们感到非常兴奋。”

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
打赏
0
0
0
0
11
分享
相关文章
从湖仓分离到湖仓一体,四川航空基于 SelectDB 的多源数据联邦分析实践
川航选择引入 SelectDB 建设湖仓一体大数据分析引擎,取得了数据导入效率提升 3-6 倍,查询分析性能提升 10-18 倍、实时性提升至 5 秒内等收益。
从湖仓分离到湖仓一体,四川航空基于 SelectDB 的多源数据联邦分析实践
数据的秘密:如何用大数据分析挖掘商业价值
数据的秘密:如何用大数据分析挖掘商业价值
71 9
机器学习与大数据分析的结合:智能决策的新引擎
机器学习与大数据分析的结合:智能决策的新引擎
330 15
DataWorks产品测评|基于DataWorks和MaxCompute产品组合实现用户画像分析
本文介绍了如何使用DataWorks和MaxCompute产品组合实现用户画像分析。首先,通过阿里云官网开通DataWorks服务并创建资源组,接着创建MaxCompute项目和数据源。随后,利用DataWorks的数据集成和数据开发模块,将业务数据同步至MaxCompute,并通过ODPS SQL完成用户画像的数据加工,最终将结果写入`ads_user_info_1d`表。文章详细记录了每一步的操作过程,包括任务开发、运行、运维操作和资源释放,帮助读者顺利完成用户画像分析。此外,还指出了文档中的一些不一致之处,并提供了相应的解决方法。
用户画像分析(MaxCompute简化版)
通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行数仓开发与分析,并通过案例体验DataWorks数据集成、数据开发和运维中心模块的相关能力。
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
280 4
【大数据分析&机器学习】分布式机器学习
本文主要介绍分布式机器学习基础知识,并介绍主流的分布式机器学习框架,结合实例介绍一些机器学习算法。
715 5
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等