安永合伙人Beatriz Sanz Sáiz:垃圾数据,是大数据分析行业的毒瘤

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 我们不能“卖”AI,而是应以AI为媒介,把它当成一种工具,为传统产业客户提供针对性的思路与方法。

我们不能“卖”AI,而是应以AI为媒介,把它当成一种工具,为传统产业客户提供针对性的思路与方法。

AI是什么?

深度学习技术?机器人?还是大数据?

其实很多人都不能给出准确的答案。

安永合伙人兼全球数据分析与咨询主管Beatriz Sanz Sáiz说,“其实,AI是一系列不同技术的整合。它就是在人类已有的基础上,学习人类大脑、身体等各部位的功能,做进一步增强。”

TB1aHPYEgHqK1RjSZJnXXbNLpXa.jpg

图 | 安永合伙人兼全球数据分析与咨询主管Beatriz Sanz Sáiz

而学习,数据便不可或缺。

用优质数据和算法,输出优质分析内容

在AI刚刚火起来的时候,大数据公司经常会用到一个词,叫“海量数据”,以显示手握庞大资源。

但实际上,随着产业对大数据输出内容要求的提升,这似乎已经不是一个具有“正能量”的词了,反而是例如“小数据”、“知识图谱”等越来越受欢迎。

可以看到,因大数据产业市场规模可期,很大公司蜂拥而至,信息平台、数据库、各类研究院等层出不穷。相关数据统计显示,到2022年的时候,全球将有90%的公司发展战略都将变成以数据为核心,它将成为一项非常重要的资产,而数据分析也将成为不可或缺的能力。

但在Beatriz看来,现在的大部分公司并没有理解大数据及数据分析真正的价值所在。

“很多公司都会说他们有海量数据,但数据质量却不怎么样。加之算法不够简化,输出的数据质量必定大多不到位。所以,品质,才是数据的关键。”

而由于对大数据价值认识不够清晰,行业也逐渐形成两大趋势,一种喜欢标榜海量数据,实际输出的分析内容实用价值不大,Beatriz称之为垃圾数据;一种是非常看重数据价值,甚至把数据分析作为企业文化的核心之一,如新型的互联网企业、银行等。而后者,显然已在AI方面领先了。

亚太地区数据分析与咨询主管Cameron Wall补充说,“数据分为两类,结构化数据和非结构化数据。前者表示问题已知,而后者则表示问题是未知的。”

TB1SYzZEgHqK1RjSZFEXXcGMXXa.jpg

图 | 亚太地区数据分析与咨询主管Cameron Wall

具体来说,以审计行业,在处理报表业务时,结构化的数据通常意味着已经将各项数据分门别类,甚至已经理清了各个数据间的逻辑关系;而非结构化数据则只是面前一堆数据,如一团乱麻,需要先一一理清将其变成结构化数据,再做进一步分析处理。

Cameron解释称,“在安永,我们会基于图片和文件做智能化处理,建立自己的数据库,以保证数据的优质。”

目前,安永在内部已经建立了强大且优质的数据库,因应用AI技术,每年所节省的人工时间超300万小时。

那么,大数据和AI技术究竟能做哪些事情呢?

AI正在重新审视、修正一些传统概念

2018年AI行业有个词非常火,就是“赋能”。有了这个功能,AI几乎在所有传统行业都能起到促进升级、推动发展的作用。可以说,AI赋能,对于传统行业来说就是新生。

但Bertriz不这么认为,“AI赋能取决于你对AI的理解是否成熟。”

在她看来,由于AI赋能作用的日益凸显,很多公司在AI发展上都只强调一个字,“快”,甚至将其列入到了CIO的工作日程中。

但实际上,以当前AI技术及产业的发展状况看,AI技术最适合赋能的应该是自动化产业,特别是在工业4.0的当下,对AI技术做大量整合,并具备足够的洞察力将其结合到创新应用上,才能真正AI赋能。

因此,AI技术在更多层面上看其实是一种方法,它给了传统产业一个机会,用语修正已经“老旧”、传统的概念,例如健康医疗、制造业、金融行业等。

Beatriz强调,“我们不是在卖AI,而是以AI为媒介,把它当成一种工具,为传统产业客户提供针对性的思路与方法。”

以智能投顾为例,安永通过建立大数据平台及相关技术,让AI替代人工,处理大量数据整理及分析工作,而投资顾问节省了大量时间,以从专业的角度给客户提供更好的投资建议。

TB10ZfVEgHqK1RjSZFPXXcwapXa.jpg

再者,例如在大型超市中,通过数据分析帮助超市对客户进行分析预测,提前预判消费者可能的消费行为,以科学安排商品进货量、摆放位置及相关促销活动,并适当加以引导。

但这其中又涉及到一个问题,如何给予客户信心,让他们愿意把数据共享出来?

保障数据安全,是企业道德底线

去年年初,因Facebook泄漏了5000万用户信息,全球范围内大数据产业几乎都面临了一个问题:该如何保障数据安全?

对此,Beatriz以安永为例,“在安永内部有着非常严格的规定,仅数据监控方面,我们就共设有55个监控平台。除此之外,因为我们是审计出身,对于审计师来说,数据保护是天职。再加上我们的品牌效应,足以给予客户信心。”

Cameron还补充说,“Facebook的数据泄露,在很大程度是因为他们没有用以户为导向,没有在充分考虑用户隐私保护的意愿。只能说,这是一个道德层面的问题。”

最后

在安永看来,持续以数据为中心、以AI算法为驱动,通过形成内部数据库,为客户提供创造性的解决方案,是可以更加高效为客户提供服务的。

而谈及中国市场与海外市场的差别,Cameron表示,“中国客户的胃口更大,亚太地区很多国家的目标只是‘赶超’,而中国客户是希望成为‘领头羊’。这让我们感到非常兴奋。”

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
1月前
|
数据可视化 搜索推荐 大数据
基于python大数据的北京旅游可视化及分析系统
本文深入探讨智慧旅游系统的背景、意义及研究现状,分析其在旅游业中的作用与发展潜力,介绍平台架构、技术创新、数据挖掘与服务优化等核心内容,并展示系统实现界面。
|
2月前
|
数据采集 人工智能 分布式计算
ODPS在AI时代的发展战略与技术演进分析报告
ODPS(现MaxCompute)历经十五年发展,从分布式计算平台演进为AI时代的数据基础设施,以超大规模处理、多模态融合与Data+AI协同为核心竞争力,支撑大模型训练与实时分析等前沿场景,助力企业实现数据驱动与智能化转型。
271 4
|
2月前
|
JSON 大数据 API
巧用苏宁易购 API,精准分析苏宁易购家电销售大数据
在数据驱动的电商时代,精准分析销售数据能助力企业优化库存、提升营销效果。本文详解如何利用苏宁易购API获取家电销售数据,结合Python进行数据清洗与统计分析,实现销量预测与洞察提取,帮助企业降本增效。
64 0
|
3月前
|
消息中间件 NoSQL 数据可视化
数据说了算,可你得“听得快”——聊聊大数据里的实时分析
数据说了算,可你得“听得快”——聊聊大数据里的实时分析
98 2
|
23天前
|
存储 SQL 分布式计算
终于!大数据分析不用再“又要快又要省钱”二选一了!Dataphin新功能太香了!
Dataphin推出查询加速新功能,支持用StarRocks等引擎直连MaxCompute或Hadoop查原始数据,无需同步、秒级响应。数据只存一份,省成本、提效率,权限统一管理,打破“又要快又要省”的不可能三角,助力企业实现分析自由。
134 49
|
4月前
|
数据采集 人工智能 算法
数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程
数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程
122 1
|
28天前
|
数据采集 数据可视化 关系型数据库
基于python大数据的电影数据可视化分析系统
电影分析与可视化平台顺应电影产业数字化趋势,整合大数据处理、人工智能与Web技术,实现电影数据的采集、分析与可视化展示。平台支持票房、评分、观众行为等多维度分析,助力行业洞察与决策,同时提供互动界面,增强观众对电影文化的理解。技术上依托Python、MySQL、Flask、HTML等构建,融合数据采集与AI分析,提升电影行业的数据应用能力。
|
1月前
|
数据可视化 大数据 数据挖掘
基于python大数据的招聘数据可视化分析系统
本系统基于Python开发,整合多渠道招聘数据,利用数据分析与可视化技术,助力企业高效决策。核心功能包括数据采集、智能分析、可视化展示及权限管理,提升招聘效率与人才管理水平,推动人力资源管理数字化转型。
|
1月前
|
机器学习/深度学习 搜索推荐 算法
基于python大数据的口红商品分析与推荐系统
本研究基于Python大数据技术,构建口红商品分析与推荐系统,旨在解决口红市场产品同质化与消费者选择困难问题。通过分析颜色、质地、价格等多维度数据及用户行为,实现个性化推荐,提升购物体验与品牌营销效率,推动美妆行业数字化转型,具有重要现实意义与市场价值。
|
3月前
|
SQL 存储 机器学习/深度学习
基于 Dify + Hologres + QWen3 进行企业级大数据的处理和分析
在数字化时代,企业如何高效处理和分析海量数据成为提升竞争力的关键。本文介绍了基于 Dify 平台与 Hologres 数据仓库构建的企业级大数据处理与分析解决方案。Dify 作为开源大语言模型平台,助力快速开发生成式 AI 应用;Hologres 提供高性能实时数仓能力。两者结合,不仅提升了数据处理效率,还实现了智能化分析与灵活扩展,为企业提供精准决策支持,助力数字化转型。
587 2
基于 Dify + Hologres + QWen3 进行企业级大数据的处理和分析

热门文章

最新文章