蓝色巨人的人工智能发展史:沃森为名,数据为实

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
简介:

对于IBM的“认知”AI雄心,Jeopardy问答竞赛仅仅是个开端。

一位数据专家在如今的企业领域确立了自己的名号,同时亦引发了广泛关注。他拥有着闪电般敏捷的思维与极强的学习能力,会说八种语言,并在多个方向上具备深入理解。他拥有着一套堪称典范的工作思路,阅读速度极快,同时拥有着他人所无法企及的洞穴能力。就个人而言,他是一位全方位的发展的通才,甚至能够提供相当靠谱的约会建议。

这位大牛到底是何方神圣?沃森,IBM的沃森。

作为继承IBM公司首次CEO的重要开发成果,沃森于2007年正式诞生,不过当时其仅属于IBM研究部门开发的问答系统中的组成部分之一,而这套系统的终极目标则是参加美国电视问答节目“Jeopardy”。然而自2011年成功战胜各位人类选手之后,沃森的功能已经得到显著扩展。回顾当初,沃森还仅仅拥有单一核心能力,即以自然语言回答由人类提出的问题; 但如今,沃森已经能够跨越语言、语音、视觉及数据分析等范畴提供数十项服务。

沃森目前使用总计约50项技术,其中包括机器学习、深度学习、神经网络、自然语言处理、计算机视觉、语音识别与情绪分析等多项人工智能相关技术。不过在IBM公司看来,沃森并不仅仅是一套AI解决方案——事实上,蓝色巨人更倾向于使用“认知”这一术语对其进行描述。不同于必须以编程方式执行任务的现有计算机,沃森正努力以人类的方式理解这个世界——包括通过感官、学习与经验,IBM方面解释称。

“当我们提到‘认知’时,我们所指的是其能够学习、理解、溯源并互动,”IBM公司沃森平台主管Steve Abrams表示。“沃森能够利用人员、数据或其它系统实现以上几项目标。”

凭借着每秒超过8000万页内容的读取能力,沃森系统能够分析极为庞大的数据规模——荐包括非结构化数据——且整个处理过程包括理解自然语言、利用证据建立假设并随着分析推进而不断学习。

很多人会将沃森想象成一个巨大的“大脑”,其身处IBM公司研究设施核心之内,但实际情况却并非如此。

“将沃森称为一台认知计算机其实并不准确,或者说是种过分简单化的理解方式,”Endpoint Technologies公司首席分析师Roger Kay表示。“其真正的能力在于组织特定领域的资源,并通过自然语言接口保证相关信息可直接服务于人类。”

其中“认知”的部分在于,沃森能够“利用自身知识经由AI与机器学习算法为用户的问题找到潜在答案,”Kay进一步补充称。“IBM公司目前的成果在于打造出一套巨大的引擎,专门用于实现此类分析; 此外,其还提供了一种相当简单的使用规程,并为最终用户准备了非常直观的人类使用界面。”

时至今日,沃森已经可以被视为一套云工具,他指出:“这是一项由IBM运行的强大功能,且可通过网络进行访问。”

2014年,IBM公司建立起专门的沃森事业部,其全球总部位于纽约市,主要负责这项技术的推广与商业化工作。第二年,也就是2015年,位于波士顿的医疗部门与位于德国的物联网总部亦相继建立。目前,沃森已经可通过云端以及约30种应用编程接口(简称API)供合作伙伴及开发人员使用。来自世界各地超过29个行业、跨越36个国家的成百上千IBM客户与合作伙伴如今正积极以沃森为基础建立活跃项目,IBM公司指出。

沃森开发者社区目前拥有来自17个行业及学科的超过550名开发人员,其中超过100位已经开始打造商用型“认知”应用程序、产品与服务。便于超过100万开发者在IBM的Bluemix平台之上使用沃森开发者云,并借此实现新型业务构思的实验、测试与部署。IBM公司已经投入了1亿美元风险投资用于支持这一社区。

OmniEarth是一家环境分析企业,其最近与IBM公司建立起合作伙伴关系,旨在利用沃森的视觉识别服务对航空及卫星图像中的物理特征进行解读与分类,进而立足于这部分分析结论解决加利福尼亚州目前面临的干旱问题。

“从根本层面讲,我们正在观测能够掌握的户外耗水量情况,预测一块土地可能需要多少水资源才能保持健康状态,”OmniEarth公司首席数据科学家Shay Strong解释称。

根据Strong的介绍,以往对航空照片及卫星图像进行识别——包括整理特定地段中的游泳池及其它相关景观特征——需要花费大量时间并要求操作者具备相当程度的专业知识。

如今,OmniEarth公司利用一系列机器学习算法执行这项任务——一部分为自主开发,也有一部分为沃森所提供。(大家可以点击此处自行测试沃森的视觉API; 亦可点击此处了解OmniEarth公司所使用的技术。) 其中涉及大量数据——单是洛杉矶一地的数据就接近1 TB,Strong指出——但机器学习能够显著加快这一处理流程。OmniEarth公司如今能够将图像处理速度提升至原先水平的40倍,例如原本需要数个小时才能完成的15万张图片,现在12分钟左右即可处理完毕。

“沃森为我们带来了难以置信的出色效率表现,”Strong指出。

沃森还能够更好地进行规划与预算处理。举例来说,原本福尔索姆市与东湾市水域的水资源需求通过使用全州平均值进行估算,但如今OmniEarth基于AI的分析结论使其能够更为准确地提供预测。再有,沃森还在帮助各地区公共事业机构及圣安娜流域项目局等组织调整其工作计划,从而更好地引导当地居民控制自身用水量。

Macy公司最近亦成为沃森的用户。今年夏季,这家零售巨头推出了一项基于沃森的网络服务,旨在帮助客户在购物时浏览其商店页面。通过由IBM公司合作伙伴Satisfi提供的网络服务,Macy允许客户以自然语言输入内容提出各家店面内的产品分类、服务与设施等问题,而后获取对应答案。Macy公司目前正在美国本土的10家店面内试点使用这款新工具。

“我们还列出了一份长长的潜在用途清单,”这家零售商数字化媒体部门副总裁Serena Potter表示。“我们的最终目标在于实现更多其它认知服务。”

沃森目前的其它使用方式还包括“Olli”自动驾驶车辆,医疗卫生类项目以及Deep Thunder——一款专门面向企业的超级本地天气预报工具,源自IBM公司对The Weather Company的收购。

在实现这些成果的过程当中,IBM公司制定了一项核心目标,即尽可能帮助合作伙伴与开发人员免受AI相关复杂数学难题的影响。“我们认为这类问题对于开发人员而言相当不友好,毕竟大多数人并不属于机器学习技术专家,”Abrams解释称。

举例来说,沃森的自然语言分类器旨在理解人类的陈述意图,并且能够立足于特定目标进行训练。其中一项实例在于以酒店前台的立场回答问题,事实上基于沃森的“Connie”机器人已经于今年早些时候开始在希尔顿酒店进行试点推广。“沃森能够理解‘你们几点开始清理不再续房的客人’,即将其与‘客人应该几点退房’联系起来。”Abrams解释道。

然而IBM公司并非以通用方式提供这项功能。相反,IBM公司要求开发人员上传一份列有其希望沃森掌握的人类话语表格。在此之后,IBM方面将在幕后工作,即有针对性地训练智能模型。

“我们利用世界一流的机器学习技术打造出这套分类器,但我不希望其具体使用给开发人员带来困扰,”Abrams指出。“就我的立场而言,沃森其实是一整套服务集合,用于帮助开发人员构建适合自身需求的认知系统。展望未来,IBM公司将致力于推动沃森的科学技术进步,同时简化并扩展各类相关服务,”他进一步补充称。

IBM公司无疑在沃森与认知计算身上押下了重注,且其目前已经不再将其视为一类前沿性技术,而是作为自身业务的核心组成部分。

“当数字化革命全面来临时,各个行业都将拥有自己的优步、自己的特斯拉,那么大家要如何让自己在市场上独树一帜?”IBM公司主席、总裁兼CEO罗睿兰在最近的一次采访中强调称。“答案显然是认知,认知才是区分您所在企业的关键。”

就目前来看,这样的偏重应该能够得到很好的回报。根据Allied Market Research公司的预期,认知计算市场预计将在2020年产生高达137亿美元的营收。

当然,IBM公司并不是这一领域当中惟一的一家参与厂商。

“沃森所使用的各项技术正在被其它企业所复制,”Endpoint公司的Kay解释称。不过“着眼于全部AI/机器学习工具,沃森的成熟度最大且历史最为悠久。”

Abrams则表示,“我们的目标在于让认知成为计算领域的一项主要规范,并使得沃森成为其中一套最为重要的平台。”


本文作者:核子可乐

来源:51CTO

相关文章
|
4月前
|
机器学习/深度学习 人工智能 专有云
人工智能平台PAI使用问题之怎么将DLC的数据写入到另一个阿里云主账号的OSS中
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
4月前
|
数据采集 人工智能 自然语言处理
GPT被封锁了怎么办?轻松获取高质量的数据,训练自己的人工智能和大语言模型。
2023年标志着AI大模型时代的到来,GPT-4等模型在多个领域展现巨大潜力。然而,OpenAI对中国区服务的限制提出了挑战。本文探讨如何使用亮数据代理获取训练大模型所需的数据,包括确定目标、选择代理、数据抓取、清洗,并以西方历史为例,展示如何使用亮数据的静态住宅代理稳定获取DE区域数据,最终在国产AI平台上训练模型,提升知识库的丰富度和准确性。尽管面临外部障碍,但自主获取和训练数据能增强本土AI能力。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能(AI)技术的发展史
人工智能 (AI) 的发展历程从20世纪50年代起步,历经初始探索、早期发展、专家系统兴起、机器学习崛起直至深度学习革命。1950年图灵测试提出,1956年达特茅斯会议标志着AI研究开端。60-70年代AI虽取得初步成果但仍遭遇困境。80年代专家系统如MYCIN展现AI应用潜力。90年代机器学习突飞猛进,1997年深蓝战胜国际象棋冠军。21世纪以来,深度学习技术革新了AI,在图像、语音识别等领域取得重大成就。尽管AI已广泛应用,但仍面临数据隐私、伦理等挑战。未来AI将加强人机协作、增强学习与情感智能,并在医疗、教育等领域发挥更大作用。
|
4月前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI使用问题之如何在MaxCompute上使用Protobuf处理数据
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
4月前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI使用问题之如何实现数据在MaxCompute中是永久的
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
5月前
|
机器学习/深度学习 人工智能 前端开发
人工智能平台PAI产品使用合集之创建了实时特征视图,里面的数据是通过什么传入的
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
5月前
|
机器学习/深度学习 人工智能 监控
人工智能平台PAI产品使用合集之设置了7个特征,但在最后生成的数据表中只包含了6个id_feature的特征,是什么导致的
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
4月前
|
存储 人工智能 安全
人工智能浪潮下的数据隐私保护技术
在大数据与人工智能(AI)的高速发展中,数据隐私保护成为亟待解决的关键议题。本文将探讨当前AI时代下数据隐私保护的技术手段及其面临的挑战,并分析未来发展趋势。文章首先介绍数据隐私的重要性和当前面临的风险,然后深入讨论加密技术和匿名化处理等保护措施,最后评估这些技术的有效性及潜在的改进方向。
183 0
|
5月前
|
机器学习/深度学习 人工智能 算法
人工智能伦理:机器学习中的数据偏见与公平性挑战
在机器学习领域,算法的公正性与透明度日益成为社会关注的焦点。本文深入探讨了AI系统在处理数据时可能遇到的偏见问题及其对社会公平性的影响。通过分析具体案例和最新研究成果,本文揭示了数据偏见如何影响算法决策,并提出了减轻这些偏见的策略。文章呼吁开发更加负责任的AI系统,以促进技术与社会价值的和谐共存。
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
【AI 生成式】如何利用生成式人工智能进行机器学习的数据增强?
【5月更文挑战第4天】【AI 生成式】如何利用生成式人工智能进行机器学习的数据增强?