能否利用数据产生的巨大价值,正逐步拉大企业间的差距

简介: 北美和南美经营业务的黄金生产商Goldcorp拥有大量的地质数据,但因数据异构性太强而难以访问和使用。

对企业而言,持续积累的大量数据比黄金还宝贵

北美和南美经营业务的黄金生产商Goldcorp拥有大量的地质数据,但因数据异构性太强而难以访问和使用。他们既有手工台账,也有存储在多个关系数据库中的结构化数据,甚至还有闲置在搁架上未经处理的核心样本。由此产生的结果是,Goldcorp的地质学家将总分析时间的80%都用在了从钻探日志、地质块模型及其他非结构化信息中搜索和准备数据以供分析。为解决这个问题,Goldcorp将数据迁移到云端的高性能3D地理空间数据平台,通过这一举措,他们获得了复杂的3D距离计算和数据探索能力。同时,还部署了特定于地质领域的机器学习模型,用于为新钻探目标选择提供认知型决策支持。Goldcorp现已将数据处理时间从165小时缩短为4.5小时,这使得地质学家能够腾出更多时间,通过创造性协作性的方式寻找金矿。

大数据持续快速增长且数据的价值也在不断提升,尤其是对企业差异化优势的形成

通常情况下,谁能够访问范围最为广泛、种类最多的异构数据,谁就能够获得最大的优势。数据的范围和多样性非常重要,因为企业若能综合利用这些数据,则很有可能获得创新的业务模式所需的关键信息与洞察。

例如,现在供应链的数据访问量是五年前的50倍。但这些数据中只有不到四分之一得到了实时或接近实时的分析。谁能享受到数据红利,并持续发展?决定因素并不仅限于他们所拥有的数据量和范围。具有数据思维并采取行动的的企业将成为新的领导者:

―通过整合并综合管理专有及异构数据与分析,提高业务平台的赋能输出。

―信任数据和避免偏见乃是实现有效的认知工作流程与决策的核心。

―数据权限问题和信息访问控制将变得越来越重要。

全球约80%的数据都位于企业的防火墙之后。这些传统企业可从线上和线下活动中提取海量数据。他们所积累的都是专有数据。只有他们有权利用这些数据;但大多数企业都承认这些数据远未得到充分利用。换句话说,他们虽然拥有大数据,但基本上无法从中获取洞察和价值。

能否利用数据产生的巨大价值,正逐步拉大企业间的差距

采用平台业务模式的企业拥有的数据量是平均水平的两倍,而收入则通常达到平均水平的八倍。这些平台运营商擅长全面利用数据和分析,为其制定业务战略提供数据依据,并助力持续提升业绩。这些数据经过有效整合,挖掘数据价值以支持创新模式和商业目的。

719f2979dd444fb7e0e24cf7b4e4eacd.png

但对大多数企业而言,整合组织范围的数据仍然只是美好的梦想。在整个企业范围实现数据整合或者设计和部署企业范围数据架构的企业占比还不到2/5。此外,业务目标也在不断变化,企业发现自己距离目标实现并非咫尺之遥,而是越来越远。例如,企业认识到,将所有数据简单地放入数据湖中并指望大家都能去湖中“钓鱼”,已经不足以助力实现业务目标。相反,他们必须综合管理并不断丰富数据,才能满足特定的业务、功能和工作流程的需求。例如,营销人员所需的数据完全不同于研发人员青睐的深度数据挖掘。

到目前为止,只有不到一半的企业开发了系统化的数据综合管理方法。要想做到这一点,企业需要在业务需求的推动下建立强大的数据监管机制,此外还需要有合适的元数据。作为对信息进行解释说明的信息,元数据同时对内容和上下文进行描述,包括数据之间的关系及其来源和历史。如果没有强大的元数据,就难以整合数据,无法针对特定目的检索数据,不能部署分析和人工智能模型。

非结构化数据和实时数据也带来了挑战

为应对这些挑战,有些企业训练虚拟客服,让它们“听”客户来电录音。人工智能将语音转换为文本,汇总来电的上下文、所提问题之答案,然后生成划分优先级的对话列表。但必须维护与关联各种不同形式的数据,包括语音、文本及问答汇总等。这是因为,通常当企业完成项目的某个阶段时,数据分析师能够回溯到起点,提出一些当时未曾想到的好点子。

比如,某国有银行为了实现大零售战略,希望能够进一步优化客户服务流程、提升营销效率、改善客户体验,使客户管理、交易预测和产品营销渠道实现更好的匹配。该银行采用大数据分析技术,开展了基于客户、产品、渠道的大数据挖掘和智能应用项目。他们将传统的统计模型和数据挖掘模型与机器学习的先进算法相结合,建立了基于客户行为、产品响应和渠道匹配等模型的营销策略。并结合全量客户特征,设计了针对性的精细化建模方案,建立了一个辅助财富顾问为客户提供资产配置建议的模型。该大数据项目帮助该银行进一步深入推进了大零售战略,为实现客户满意最大化、产品价值最大化、应用效果最优化三大目的,打下了坚实的基础

人工智能及其生成公正客观建议的能力将对亟需恢复信任的行业起到巨大的帮助作用

首先,企业需要考虑数据质量。因为尽管并非有意,数据沿袭关系和认知偏见的存在证明,许多人工智能模型和数据中的质量问题都令人堪忧。

人工智能的最终表现是其学习能力―采集专家和人类知识,从历史数据和实时数据中提取知识。数据集越深入,训练效果就越好。当然,前提是数据必须准确。若要知道数据是否值得信赖,企业需要验证数据的来源和沿袭关系。随着越来越多的企业开始利用非结构化数据,包括GPS系统、卫星和物联网设备生成的数据流,跟踪数据来源和沿袭关系的难度显著提升。

区块链技术可通过强大可靠的方式对数据来源和沿袭关系进行详细跟踪

这包括数据来源、访问者的身份、对数据的任何变更以及数据变更的时间和原因等。区块链可消除“数据漂移”问题。保持数据的沿袭关系以及消除偏见都是企业面临的难题。通常情况下,算法模型本身就可能存在偏见。例如,这些模型的创建人可能认为决定信誉好坏的最佳数据是过往历史数据。而实际上,其他因素可能同等重要,甚至更具决定性。

28aa315955555948f3655d3d2950bc4f.png

建立信任需要全面了解数据、算法和工作流程的一体性

迄今为止,我们定义并分类了180多种会影响到人类决策的人类偏见。发现并消除可能存在偏见的每一项数据是非常复杂的任务,最好能够自动执行。许多企业正在学习如何训练模型,使其能够发现并自动消除偏见。随着由人工智能系统支持和做出的决策变得越来越重要,员工和使用者都希望确保算法得出的答案可以信任。

大多数企业都可能由一系列业务平台构成,其中一些由他们自己拥有并运营;另外一些则属于他们参与的平台。这里的难题在于:如何确保这种由多个业务平台构成的新型业务架构与新型技术架构保持一致。大多数的企业都希望能够大规模地处理数据和交易。但企业架构必须要考虑到生态系统中各成员之间的界线越来越模糊。业务平台成功与否,部分取决于能否通过快速扩展来领先于竞争对手,因此,平台拥有者有义务确保新的业务伙伴能够尽可能轻松地加入到平台之中。他们必须为所有架构层的无摩擦连接设计平台:基础架构、应用、数据和呈指数级发展的技术。

2c77eee9b37a29581df80fad90f478b4.png

要想利用数据、分析和人工智能了解并满足人类需求,必须创新设计思维方法

随着企业逐渐认识到将数据置于上下文之中有助于增强客户互动体验,他们对业务运营也开始采用类似的方法。继运营效率提高之后,企业现在又开始利用数据来提高响应能力。例如,精益六西格玛等管理方法依赖于历史数据推动持续改进,根据以往的成功经验建立标准化的流程。传统的企业资源规划(ERP)方法基于业界最佳实践,有效地解决了浪费和低效问题。但是,ERP虽然优化了运营效率,但也导致运营与ERP牢牢捆绑在一起。而基于人工智能、自动化、机器学习和物联网(IoT)的工作流改变了这种情况。

企业可以检测到周围发生的一切事情,无论是人员或设备的移动、库存周转还是断开的电线。企业若能快速检测到周边环境的变化,就能借助情境感知能力优化运营,包括快速应对意外情况。这些全新的敏捷工作流甚至可以成为新业务模式的灵感来源。通过预测性即时优化,就能够实现真正的突破,例如消除浪费(无论是因错误还是库存问题)、自动运行全动态流程等。自动驾驶卡车能在载货量和自动化需求之间达成平衡。销售预测能够在工厂实时做出供货调整。现在,分析技术能够预测某台设备何时可能发生故障或需要维修。也可以通过对天气事件进行复杂建模,预测可能会减缓工作速度或提高灌溉系统智能化的模式。

但是,很少有企业肯将决策权交给机器―让机器能够自主采取行动。仅仅实现机器人流程自动化(RPA)是不够的。通过人工智能,机器可从模式和趋势中学习,并针对它们自己的工作流提出更改和重新配置建议。通过这种方式,“智能自动化”开启了第四次工业革命的大门。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
人工智能
Sora对哪些行业影响较大?
【2月更文挑战第9天】Sora对哪些行业影响较大?
70 1
Sora对哪些行业影响较大?
|
新零售 人工智能 新能源
解读双11:技术价值内蕴其中 数据价值彰显其外
解读双11:技术价值内蕴其中 数据价值彰显其外
解读双11:技术价值内蕴其中 数据价值彰显其外
|
机器学习/深度学习 人工智能 安全
全球数字化转型 从颠覆未知到快慢平衡
全球数字化转型 从颠覆未知到快慢平衡
全球数字化转型 从颠覆未知到快慢平衡
|
人工智能 自然语言处理 Oracle
RPA生态系统大揭秘,支撑RPA企业数十亿估值的生命本源
RPA生态系统大揭秘,支撑RPA企业数十亿估值的生命本源 产品、技术与市场?生态系统也是RPA估值高涨的绝密杀器 为什么RPA企业都要构建生态系统?这里有你要的全部答案
288 0
RPA生态系统大揭秘,支撑RPA企业数十亿估值的生命本源
|
传感器 人工智能 自然语言处理
IBM Watson 持续扩张,认知计算正悄然改变我们的生活
在去年 IBM 发布的一则很有创意的广告中,Watson 用 IBM 最新的认知计算机咨询单元与 Bob Dylan 聊了半分钟。Watson 说它每秒能读 8 亿页,并识别出 Dylan 作品中常用的主题,比如时间流逝和爱情消逝。
297 0
|
数据采集 监控 小程序
数据增长新思维:留量思维折射出新的增长体系
传统的流量思维需要迭代升级,向留量思维转变。而要实现从业务数据化到数据应用化,就要经历从What到Why到How的三个层次。从数据报表,到数据分析洞察,再到数据的运营。
数据增长新思维:留量思维折射出新的增长体系
|
机器学习/深度学习 算法 量子技术
|
存储 安全 区块链
未来十年大规模应用还是趋于消亡,区块链发展中的五大阻碍因素
交易效率低下、交易所安全事故频发、智能合约安全保障机制不完善、分布式存储不成熟及比特币挖矿耗费资源高的问题,阻碍着区块链技术得到大规模的应用。
1342 0
|
机器学习/深度学习 存储 人工智能