安永合伙人Beatriz Sanz Sáiz:垃圾数据,是大数据分析行业的毒瘤

简介: 我们不能“卖”AI,而是应以AI为媒介,把它当成一种工具,为传统产业客户提供针对性的思路与方法。

我们不能“卖”AI,而是应以AI为媒介,把它当成一种工具,为传统产业客户提供针对性的思路与方法。

AI是什么?

深度学习技术?机器人?还是大数据?

其实很多人都不能给出准确的答案。

安永合伙人兼全球数据分析与咨询主管Beatriz Sanz Sáiz说,“其实,AI是一系列不同技术的整合。它就是在人类已有的基础上,学习人类大脑、身体等各部位的功能,做进一步增强。”

TB1aHPYEgHqK1RjSZJnXXbNLpXa.jpg

图 | 安永合伙人兼全球数据分析与咨询主管Beatriz Sanz Sáiz

而学习,数据便不可或缺。

用优质数据和算法,输出优质分析内容

在AI刚刚火起来的时候,大数据公司经常会用到一个词,叫“海量数据”,以显示手握庞大资源。

但实际上,随着产业对大数据输出内容要求的提升,这似乎已经不是一个具有“正能量”的词了,反而是例如“小数据”、“知识图谱”等越来越受欢迎。

可以看到,因大数据产业市场规模可期,很大公司蜂拥而至,信息平台、数据库、各类研究院等层出不穷。相关数据统计显示,到2022年的时候,全球将有90%的公司发展战略都将变成以数据为核心,它将成为一项非常重要的资产,而数据分析也将成为不可或缺的能力。

但在Beatriz看来,现在的大部分公司并没有理解大数据及数据分析真正的价值所在。

“很多公司都会说他们有海量数据,但数据质量却不怎么样。加之算法不够简化,输出的数据质量必定大多不到位。所以,品质,才是数据的关键。”

而由于对大数据价值认识不够清晰,行业也逐渐形成两大趋势,一种喜欢标榜海量数据,实际输出的分析内容实用价值不大,Beatriz称之为垃圾数据;一种是非常看重数据价值,甚至把数据分析作为企业文化的核心之一,如新型的互联网企业、银行等。而后者,显然已在AI方面领先了。

亚太地区数据分析与咨询主管Cameron Wall补充说,“数据分为两类,结构化数据和非结构化数据。前者表示问题已知,而后者则表示问题是未知的。”

TB1SYzZEgHqK1RjSZFEXXcGMXXa.jpg

图 | 亚太地区数据分析与咨询主管Cameron Wall

具体来说,以审计行业,在处理报表业务时,结构化的数据通常意味着已经将各项数据分门别类,甚至已经理清了各个数据间的逻辑关系;而非结构化数据则只是面前一堆数据,如一团乱麻,需要先一一理清将其变成结构化数据,再做进一步分析处理。

Cameron解释称,“在安永,我们会基于图片和文件做智能化处理,建立自己的数据库,以保证数据的优质。”

目前,安永在内部已经建立了强大且优质的数据库,因应用AI技术,每年所节省的人工时间超300万小时。

那么,大数据和AI技术究竟能做哪些事情呢?

AI正在重新审视、修正一些传统概念

2018年AI行业有个词非常火,就是“赋能”。有了这个功能,AI几乎在所有传统行业都能起到促进升级、推动发展的作用。可以说,AI赋能,对于传统行业来说就是新生。

但Bertriz不这么认为,“AI赋能取决于你对AI的理解是否成熟。”

在她看来,由于AI赋能作用的日益凸显,很多公司在AI发展上都只强调一个字,“快”,甚至将其列入到了CIO的工作日程中。

但实际上,以当前AI技术及产业的发展状况看,AI技术最适合赋能的应该是自动化产业,特别是在工业4.0的当下,对AI技术做大量整合,并具备足够的洞察力将其结合到创新应用上,才能真正AI赋能。

因此,AI技术在更多层面上看其实是一种方法,它给了传统产业一个机会,用语修正已经“老旧”、传统的概念,例如健康医疗、制造业、金融行业等。

Beatriz强调,“我们不是在卖AI,而是以AI为媒介,把它当成一种工具,为传统产业客户提供针对性的思路与方法。”

以智能投顾为例,安永通过建立大数据平台及相关技术,让AI替代人工,处理大量数据整理及分析工作,而投资顾问节省了大量时间,以从专业的角度给客户提供更好的投资建议。

TB10ZfVEgHqK1RjSZFPXXcwapXa.jpg

再者,例如在大型超市中,通过数据分析帮助超市对客户进行分析预测,提前预判消费者可能的消费行为,以科学安排商品进货量、摆放位置及相关促销活动,并适当加以引导。

但这其中又涉及到一个问题,如何给予客户信心,让他们愿意把数据共享出来?

保障数据安全,是企业道德底线

去年年初,因Facebook泄漏了5000万用户信息,全球范围内大数据产业几乎都面临了一个问题:该如何保障数据安全?

对此,Beatriz以安永为例,“在安永内部有着非常严格的规定,仅数据监控方面,我们就共设有55个监控平台。除此之外,因为我们是审计出身,对于审计师来说,数据保护是天职。再加上我们的品牌效应,足以给予客户信心。”

Cameron还补充说,“Facebook的数据泄露,在很大程度是因为他们没有用以户为导向,没有在充分考虑用户隐私保护的意愿。只能说,这是一个道德层面的问题。”

最后

在安永看来,持续以数据为中心、以AI算法为驱动,通过形成内部数据库,为客户提供创造性的解决方案,是可以更加高效为客户提供服务的。

而谈及中国市场与海外市场的差别,Cameron表示,“中国客户的胃口更大,亚太地区很多国家的目标只是‘赶超’,而中国客户是希望成为‘领头羊’。这让我们感到非常兴奋。”

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
14天前
|
存储 消息中间件 监控
【Flume】Flume在大数据分析领域的应用
【4月更文挑战第4天】【Flume】Flume在大数据分析领域的应用
|
27天前
|
Cloud Native 数据处理 云计算
探索云原生技术在大数据分析中的应用
随着云计算技术的不断发展,云原生架构作为一种全新的软件开发和部署模式,正逐渐引起企业的广泛关注。本文将探讨云原生技术在大数据分析领域的应用,介绍其优势与挑战,并探讨如何利用云原生技术提升大数据分析的效率和可靠性。
|
1月前
|
存储 消息中间件 大数据
Go语言在大数据处理中的实际应用与案例分析
【2月更文挑战第22天】本文深入探讨了Go语言在大数据处理中的实际应用,通过案例分析展示了Go语言在处理大数据时的优势和实践效果。文章首先介绍了大数据处理的挑战与需求,然后详细分析了Go语言在大数据处理中的适用性和核心技术,最后通过具体案例展示了Go语言在大数据处理中的实际应用。
|
1月前
|
数据采集 运维 数据挖掘
API电商接口大数据分析与数据挖掘 (商品详情店铺)
API接口、数据分析以及数据挖掘在商品详情和店铺相关的应用中,各自扮演着重要的角色。以下是关于它们各自的功能以及如何在商品详情和店铺分析中协同工作的简要说明。
|
3月前
|
关系型数据库 MySQL Serverless
高顿教育:大数据抽数分析业务引入polardb mysql serverless
高顿教育通过使用polardb serverless形态进行数据汇总,然后统一进行数据同步到数仓,业务有明显高低峰期,灵活的弹性伸缩能力,大大降低了客户使用成本。
|
3月前
|
机器学习/深度学习 数据采集 算法
大数据分析技术与方法探究
在当今信息化时代,数据量的增长速度远快于人类的处理能力。因此,如何高效地利用大数据,成为了企业和机构关注的焦点。本文将从大数据分析的技术和方法两个方面进行探究,为各行业提供更好的数据应用方向。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
大数据分析的技术和方法:从深度学习到机器学习
大数据时代的到来,让数据分析成为了企业和组织中不可或缺的一环。如何高效地处理庞大的数据集并且从中发现潜在的价值是每个数据分析师都需要掌握的技能。本文将介绍大数据分析的技术和方法,包括深度学习、机器学习、数据挖掘等方面的应用,以及如何通过这些技术和方法来解决实际问题。
49 2
|
3月前
|
机器学习/深度学习 人工智能 运维
大数据分析:探索信息世界的钥匙
在当今信息爆炸的时代,大数据分析成为挖掘宝藏般的技术和方法。本文将介绍大数据分析的基本概念、技术与方法,并探讨其在商业、科学和社会领域中的广泛应用。从数据收集和预处理到模型构建和结果解读,大数据分析为我们揭示了信息世界的钥匙,为决策者提供了有力的支持。
|
2月前
|
API
GEE案例分析——利用sentinel-3数据计算空气污染指数(Air Pollution Index,简称API)
GEE案例分析——利用sentinel-3数据计算空气污染指数(Air Pollution Index,简称API)
104 0
|
3月前
|
数据挖掘
离线大数据分析的应用
离线大数据分析的应用