当下,越来越多的公司在人工智能上进行投资。然而,要想取得成功,他们需要在推理的可解释性、低数据密度环境以及实现更丰富的知识图谱方面进行实际考量。
在企业中,人工智能的应用正在稳步上升。根据Constellation Research对众多行业C级管理人员的调查,70%的受访者表示他们的组织目前使用了某种形式的人工智能技术。此外,大部分受访者表示,2018年将在人工智能投资上花费高达500万美元。
随着越来越多的公司意识到人工智能带来的巨大机遇,他们逐渐意识到需要考虑一些实际问题,以便在整个企业中看到这项新技术将带来的重大业务影响。根据我们在众多客户环境中应用人工智能的经验,我们发现组织必须解决三个因素:缺乏可解释的人工智能、低数据密度环境以及对更丰富的知识图谱的需求。为了正确采用和实施,企业必须首先考虑这些实际问题,并在整个AI实施过程中始终将其放在首位。
1.缺乏可解释的人工智能
可解释的AI集中在回答问题的能力上,“为什么?”“为什么机器会做出某个具体的决定?事实上,许多新出现的人工智能都有一个固有的“黑匣子”概念。“将很多数据输入到盒子里,然后从盒子里拿出实际的决定或建议。然而,当人们试图打开盒子并弄清楚它的逻辑时,它就成了一个重大挑战。这在受监管的市场上可能很难被采用,因为市场会要求公司披露和解释具体决策背后的理由。此外,缺乏可解释的人工智能可能会影响整个公司所需的变更管理,以便成功实施人工智能。如果人们无法追踪到原始数据集或文档的答案,那么它可能会成为一个员工难以接受的价值主张。
实现具有可追溯性的人工智能是应对这一挑战的一种方式。例如,商业银行管理在线投资组合中的风险。银行可以向5000家中小企业贷款。它将在贷款组合的资产负债表中监测他们的健康状况。这些表可以是不同的语言或有不同的会计标准。
有了人工智能,银行实际上可以利用所有的这些资产负债表,提取信息,将非结构化数据转换为结构化数据,然后得出风险评分。该银行应该能够接受风险评分,点击并深入查看导致最终评分的子组件编号。如果发现有一个分数看起来不太对时。用户可以深入到下一个细节层次,依此类推,直到他们得出没有意义的数字,然后,例如,可以将他们引向第16页的第36个资产负债表。在那里的脚注里会有系统用来推导分数的信息。用户可以查看一个决策并解析驱动机器到达该端点的组件信息。可追溯性的实现有助于合规性的满足并推动人工智能的应用。
2.低数据密度环境
当人工智能能够利用大量数据时,它就能运行得很好。例如与Siri等虚拟助手进行会话AI,可以访问电子邮件,在线购物和多个应用程序。这就是为什么大多数AI应用程序都是在企业对消费者(B2C)环境中开始的,在B2C环境中,算法可以运行在数百万个数据点中。企业通常无法始终访问相同的数据量。例如,如果一个组织正在准备过去的合同,那么它可能要处理10万份合同——而不是100万或1000万份。因此,企业面临着双重挑战:他们需要手动处理的文件太多而无法训练算法。从这些文档中提取数据的一种方法是通过使用统计方法的传统自然语言处理算法。此外,我们还发现,基于上下文来解读含义和提取数据的计算语言学在受到少量数据的挑战时可能是有效的。
在另一个例子中,一家财富管理公司可以使用自然语言处理和机器学习等技术,以高速聚合金融机构和投资者的报表。每家公司可以有8万份文件,每份50到60页长,每页40到50笔交易,最终从中提取知识。这是一个相当大的数据量,并且手动处理非常繁琐,但只是许多主流人工智能应用程序数据量的一小部分。
因此,需要注意的是,并非所有人工智能都能获得其必须的数据量。在确定最佳人工智能解决方案时,了解数据环境非常重要。在高数据密度环境中,组织可以更有效地运行无监督学习算法。在低数据密度的环境中,监督学习是最有效的。在缺乏所有必要数据的情况下,合成数据创建等新技术可以帮助企业培训模型。例如,在零售业,公司可以使用游戏模拟来创建合成数据。
3.需要更丰富的知识图谱
正如人工智能在低数据密度环境中难以产生最优结果一样,人工智能目前还缺乏丰富的知识图谱,无法使人工智能与特定领域和行业应用相关联。
知识图谱可以捕获上下文的关系,在人工智能中训练数据模型,并在正确的上下文中对传入的信息进行分类。它们使像Alexa或Siri这样的语音助手能够回答常见的问题,比如“最近的星巴克在哪里?”Alexa和Siri可以通过连接数以百万计的参考点(包括来自亚马逊或苹果服务的搜索结果)为用户提供即时答案。虽然对于这些简单的交互很有用,但是当前的AI仍然无法复制或理解真实人类对话的复杂性并捕获消费者期望的经过深思熟虑的交互。
例如,如果一个五岁的孩子抱怨他的母亲,“Ben推了我。我摔倒了,我站了起来,把他推了回去。老师看到了我,但是没有看到Ben,所以只有我被留校了——这不公平。”每个五岁的孩子都会理解这句话的意思,但是对于人工智能系统仍然会遇到困难,因为他们不理解因果关系和公平。除了知识图谱,人工智能系统还需要对话界面来完成他们的思考。
在企业内部,许多人通过聊天机器人来使用会话式的人工智能,试图为客户提供更具互动性的体验。在这方面,银行一直站在最前沿,允许客户通过聊天机器人在他们的在线门户或移动应用程序中获取基本的账户信息。然而,更复杂的请求,如贷款申请或合同审查,对机器来说可能是一个挑战。机器人需要能够将所使用的词的本体、所问问题的上下文以及多个会话流的线程连接在一起进行综合考虑。它需要特定领域、特定语境、特定知识的有机结合,才能使整个过程更加流畅。公司正在积极地开发特定领域的AI,并将它们嵌入到正确的知识管理系统中,以便在商业环境中推动AI实现更有吸引力的体验和应用。
随着人工智能的不断投入和实施,企业必须考虑这三个实际因素:首先,打开黑匣子,跟踪机器的决定,并以一种可解释的方式呈现它。其次,知道如何在没有大量信息的环境中应用人工智能。最后,嵌入领域知识和体验式学习,以丰富它们的知识图谱并推动实现更有效的人工智能应用。