人工智能与大数据的完美结合

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 人工智能是一种在大数据世界中指引方向和获取规律的方法。

人工智能(AI)已经存在几十年了。然而,最近随着大数据的出现,它得到了越来越多的关注。维基百科对人工智能的释义如下:

在计算机科学中,人工智能研究的领域将自己定义为智能代理AI和大数据:完美结合的研究:任何设备都能感知到它的环境,并采取一些行为最大化其在一些目标上获得成功的机会。

而将大数据描述如下:

大数据是如此的庞大或者复杂,以至于传统的数据处理应用软件不足以处理它们。

计算机已经变得如此强大,以至于我们现在有能力在每秒存储数百万条的数据记录。不幸的是,分析数据的能力可能是一个瓶颈,继续使用传统的方法并不可取。

人工智能和大数据:完美结合

那么,大数据为什么会引起对人工智能的关注呢?答案很简单,人工智能可以用传统人类无法处理的方式来处理大数据集

以银行应用程序为例。该应用程序每秒钟的数据流以百万级来记录,我们希望它在异常活动发生时发出警报,例如欺诈或者盗窃等行为。遇到这种情况,人们也许不太可能完整地去处理和分析这一数据量,而是选择一个小片段,一秒一秒的处理。即使有数以百计的人在分析欺诈可能性的情况下,如此大量的数据也会降低决策能力。

那么对于传统的数据处理系统呢?问题是,它们仅仅是算法,必然会束缚那些相同的逻辑。当寻找异常的时候灵活性是必需的,传统的方法并不擅长

现在我们进入人工智能。这些系统运行起来具有模糊性。他们预测会考虑一条路径,但是如果新数据否定了一个推理思路,那么就可以放弃它了,然后开始寻找一个新的方向。由于在给人工智能系统提供更多数据时它会变得更聪明,因此这非常适合于识别随时间变化的异常。

现在让我们来看看一些大数据应用的人工智能技术。

应用于大数据的人工智能技术

外推

外推是在原始观测范围之外,根据变量与其它变量的关系来评估变量的值的过程。我们假设一些数据呈现出一种趋势公司高管想知道:如果这种趋势持续下去,三个月后公司将会发展到什么情况?外推法可以做到。请记住,并非所有的趋势都是线性的。线性趋势很简单;一个简单的直线图就足够了。非线性的趋势需要更多地参与,这就是外推函数有用处的地方。这些算法是基于多项式、圆锥曲线或曲线方程的。

异常检测

异常检测也被称为异常值检测。它包括标识不符合预期模式的识别数据项、事件或观测,或数据集中的其它项。异常检测可以识别诸如银行欺诈(先前提到的AI的应用)之类的事件。它也适用于几个其它领域,包括(但不限于):故障检测系统健康监测传感器网络和生态系统干扰。

贝叶斯原理

在概率论和数理统计学之中,贝叶斯原理描述了一个事件的概率,它是基于与事件相关的条件前验知识。这是基于先前事件来预测未来的一种方式。假设一个公司希望知道哪些客户有流失的风险。使用贝叶斯方法,可以收集满意度不足的客户的历史数据,并用于预测以后有可能流失的客户。这是一个非常适合应用大数据的例子,因为更多的历史数据被馈送到贝叶斯算法里,其预测结果变得更准确。

自动化计算密集型人类行为

在某些情况下,人类有可能分析大量的数据,但随着时间的推移,这很繁琐,就需要人工智能来帮忙。基于规则的系统可以用来从人类这里提取、存储和操纵知识,以便以有用的方式来解释数据。在实践中,规则是从人类经验中产生出来的,并表示为一组如果-那么的语句,它们使用一组断言,在这些断言上面创建如何对其采取行动的规则。基于规则的系统可以用来创建软件来代替人类专家提供问题的答案。这些系统也可以称为专家系统。考虑一个公司,它有一个能为特定目标分析数据的人类专家,但是,这项任务比较单调乏味。基于规则的系统可以捕获和自动操作这种专门技能。

图形原理

在数学中,图形原理是用来模拟对象之间成对关系的数学结构的研究。在此上下文中的图形由顶点、节点或由边、圆弧和线段连接的点组成,并且可以相当复杂和庞大。利用图形原理,可以很容易地了解数据之间的关系。例如,考虑一个复杂的计算机网络。图形原理可以提供一些见解,以了解网络中的瓶颈如何导致其它问题以及某一特殊瓶颈的根本原因。

模式识别

顾名思义,模式识别用于检测数据中的模式和规律,它是机器学习的一种形式。模式识别系统利用数据训练的过程被称为监督学习。它们还可以被用来发现以前未知的数据模式,这个过程称为无监督学习。与基于单个数据类型的潜在异常的异常检测方法不同,模式识别可以发现以前在多个数据片中未知的模式,并考虑数据之间的模式(或关系)。一个公司(包括任何行业)可能都有兴趣知道什么时候发生了不寻常的事情,比如如果消费者突然开始购买一种与另一种一起购买的商品。这种模式可能是一个企业所感兴趣的。

总之,人工智能是一种在大数据世界中指引方向和收集规律的方法。


 数十款阿里云产品限时折扣中,赶紧点击领劵开始云上实践吧!

以上为译文。

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《Artificial Intelligence and Big Data: A Perfect Match》,译者:Mags,审校:袁虎。

文章为简译,更为详细的内容,请查看原文

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
28天前
|
人工智能 分布式计算 DataWorks
大数据&AI产品月刊【2024年8月】
大数据& AI 产品技术月刊【2024年8月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
7天前
|
机器学习/深度学习 人工智能 分布式计算
人工智能与大数据的融合应用##
随着科技的快速发展,人工智能(AI)和大数据技术已经深刻地改变了我们的生活。本文将探讨人工智能与大数据的基本概念、发展历程及其在多个领域的融合应用。同时,还将讨论这些技术所带来的优势与挑战,并展望未来的发展趋势。希望通过这篇文章,读者能够对人工智能与大数据有更深入的理解,并思考其对未来社会的影响。 ##
|
2月前
|
数据采集 人工智能 安全
AI大数据处理与分析实战--体育问卷分析
本文是关于使用AI进行大数据处理与分析的实战案例,详细记录了对深圳市义务教育阶段学校“每天一节体育课”网络问卷的分析过程,包括数据概览、交互Prompt、代码处理、年级和学校维度的深入分析,以及通过AI工具辅助得出的分析结果和结论。
|
2月前
|
分布式计算 搜索推荐 物联网
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
|
2月前
|
人工智能 分布式计算 架构师
大数据及AI典型场景实践问题之基于MaxCompute构建Noxmobi全球化精准营销系统如何解决
大数据及AI典型场景实践问题之基于MaxCompute构建Noxmobi全球化精准营销系统如何解决
|
2月前
|
存储 人工智能 算法
AI与大数据的结合:案例分析与技术探讨
【8月更文挑战第22天】AI与大数据的结合为各行各业带来了前所未有的机遇和挑战。通过具体案例分析可以看出,AI与大数据在电商、智能驾驶、医疗等领域的应用已经取得了显著成效。未来,随着技术的不断进步和应用场景的不断拓展,AI与大数据的结合将继续推动各行业的创新与变革。
|
2月前
|
SQL 人工智能 分布式计算
飞天发布时刻:大数据AI平台产品升级发布
阿里云飞天发布时刻产品发布会围绕阿里云大数据AI平台的新能力和新产品进行详细介绍。人工智能平台PAI、云原生大数据计算服务MaxCompute、开源大数据平台E-MapReduce、实时数仓Hologres、阿里云Elasticsearch、向量检索Milvus等产品均带来了相关发布的深度解读。
|
2月前
|
人工智能 分布式计算 大数据
大数据AI产品月刊-2024年7月
大数据& AI 产品技术月刊【2024年7月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
2月前
|
人工智能 分布式计算 大数据
大数据及AI典型场景实践问题之“开发者藏经阁计划”的定义如何解决
大数据及AI典型场景实践问题之“开发者藏经阁计划”的定义如何解决
|
3月前
|
存储 人工智能 分布式计算
大数据&AI产品月刊【2024年6月】
大数据&AI产品技术月刊【2024年6月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。
下一篇
无影云桌面