人工智能内部原理(二)(1)https://developer.aliyun.com/article/1525483
11.14 可扩展性
许多计算机系统在走向实用性的道路上面临着重大挑战:无法有效处理高要求的工作负载。这个问题在商业世界中尤为突出,因为可扩展性是任何计算机程序的首要要求。可扩展性意味着 AI 系统能够灵活地适应和应对不断增加的工作负载和数据量,而不会牺牲性能或响应能力。这是至关重要的,因为企业往往在数据生成和处理需求迅速增长的动态环境中运营。可扩展性使组织能够在其业务扩张时有效地使用 AI,确保系统能够持续提供及时的见解、支持决策制定并提供有价值的成果。它还通过允许企业有效地分配资源并避免昂贵的系统升级来实现成本优化。
下一代 AI 系统应该优先考虑可扩展的 AI 算法,因为可扩展性代表着解决方案是否值得的关键测试。即使是最聪明、最精确的预测模型,如果缺乏满足业务应用需求的可扩展性,也可能会不足以应对挑战。
11.15 弹性和健壮性
当系统能够在挑战性情况下保持其性能时,被视为具有弹性。这些不利条件可能涵盖硬件故障、网络攻击、停电、网络中断或同时发生这些问题的组合。弹性是在面临挑战时保持性能的重要能力。例如,在航空航天行业,飞机导航依赖于先进的航空电子系统,在这种情况下,弹性确保单个硬件故障或网络攻击不会危及乘客安全。同样,在能源部门,电网控制系统必须表现出弹性,以减轻自然灾害的影响,确保持续向家庭和企业供电。在医疗保健领域,电子健康记录系统必须在网络中断或网络威胁的情况下保持运行。
要想证明人工智能工具的真正有效性,它必须通过确保其功能在各种情况下保持完整,甚至在次优条件下。
11.16 安全
在人工智能领域,特别是对于关键应用,安全至关重要。不幸的是,新兴技术的格局也成为了恶意行为者,包括恐怖主义组织的游乐场。这些实体已经证明了他们的适应能力,利用最新的进展来策划攻击。随着人工智能系统的不断发展和变得更加强大,它们所带来的风险也变得更大。恶意行为者准备利用人工智能的能力发动毁灭性的网络攻击,并创建高度破坏性的恶意软件。这种威胁格局的一个引人注目的表现是勒索软件攻击的激增和复杂化。这些攻击以各种形式出现,其中一种常见的情形涉及对受害者文件系统的远程加密。然后,肇事者要求赎金以换取解密密钥,有效地将关键数据挟持。
根据 2020 年的一项令人沮丧的统计数据,仅在美国就有近 2400 个政府办公室、医疗机构和教育机构成为了勒索软件攻击的受害者。一次特别令人难忘的事件发生在 2015 年,当时殖民管道公司因为一次网络攻击被迫关闭了一整周的运营。这次中断导致了重大的混乱,破坏了美国范围内柴油、汽油和喷气燃料等重要燃料的供应。强调了情况的严重性,殖民管道公司的首席执行官约瑟夫·布劳恩特做出了支付 440 万美元的赎金的决定。《华尔街日报》报道称:“鉴于涉及到如此关键的能源基础设施的关闭所涉及的风险,这是他觉得必须采取的一种选择。据公司称,殖民管道提供了美国东海岸约 45%的燃料”。
根据 CNBC [6] 报道,在 2023 年 9 月,赌场运营商凯撒支付了一笔价值 1500 万美元的赎金给一家成功渗透和破坏其系统的网络犯罪团伙。
随着世界越来越依赖先进的计算技术,潜在的危害场景清单变得越来越长。这凸显了设计具有端到端加密功能的人工智能平台的重要性,以保护数据免受截获到未经授权访问,并保护决策过程的完整性。
11.17 可解释性
确保人工智能系统的广泛接受,特别是在决策具有重要社会后果的情况下,取决于能够解释这些系统如何得出其结论。使用黑匣子算法,特别是根植于深度学习神经网络的算法,在符合要求可解释性和透明性的监管方面提出了巨大挑战。这使得这些算法不适合在借贷和刑事司法等领域做出关键性决策。此外,这个问题不仅仅是监管方面的遵从。可信度在任务关键型应用中变得尤为重要。在这些情况下,责任需要全面了解决策是如何达成的。“电脑告诉我这样做”通常达不到期望。
为此,下一代人工智能系统必须具有操作上的可理解性和对其输出提供连贯解释的双重目标。这种透明性应该包括人工智能的内部工作原理,允许利益相关者和最终用户分辨每个决定背后的理由。
11.18 可追溯性和监控
能够追踪人工智能系统的变化并回溯其历史对于防止其被滥用以及帮助澄清责任非常重要。例如,考虑这样一个场景:一名医生依赖人工智能系统提供了不准确的诊断;这引发了一个复杂的问题:责任应该主要落在使用人工智能工具的医生身上,还是应该由负责其创建的公司承担责任?解决这个复杂的问题需要进行全面的调查,分析不仅所有事件和人工智能系统的使用方式,还有在使用时其状态和性能。
此外,人工智能系统应提供一个强大的框架,以跟踪其模型性能和其处理的数据内部趋势的演变,确保其持续的有效性和相关性。
11.19 隐私
在当今快速发展的技术格局中,我们的个人信息正以前所未有的速度积累,这是由不断扩大的先进技术阵列所驱动的。从精确记录我们生物节律的健身追踪器到记录我们指纹和面部表情的复杂登录系统,我们重要数据的相当一部分越来越容易被利用。此种脆弱性不仅给有组织的罪犯创造了机会,还对渴望进行诸如身份盗窃、欺诈和其他非法活动的国家提出了诱人的邀请。隐私保护不足的后果往往是灾难性的。例如,考虑一下频繁发生的数据泄露暴露了数百万人的个人数据,使这些个人易受金融欺诈和身份盗窃之害。这类泄露的后果可能是长久的,并且对受影响的个人造成财务上的破产。
针对这些威胁,下一代人工智能系统必须纳入强大的隐私保护模块是至关重要的。例如,它们应当采用先进的匿名化技术,从原始数据中剥离个人标识符,使其不可能追溯到个人。此外,人工智能系统应允许个人保留对自己数据的控制,决定谁可以访问以及出于什么目的,从而加强他们的隐私权。
11.20 时间推理
时间概念是我们理解世界的固有特性。原因和结果之间的关系需要理解一个事件发生在另一个事件之前和之后。事件在时间上的特性各不相同;有些是瞬间发生的,而另一些则有持续时间,并且它们可以发生在不同的时间框架内或展现出不同形式的重叠。某些事件可能是其他事件的先决条件。虽然这些观察对人类来说是直观的,经常被视为理所当然,但机器将需要特定的编程逻辑。
一个可能的方法是依赖于艾伦区间,这是一个全面的框架,定义了事件之间可能的 13 种时间关系。例如,它可以确定一个事件何时遇到另一个事件(相遇),一个事件发生在另一个事件之前,或者一个事件何时相对于另一个事件开始(开始)或结束(结束)。重叠区间(重叠)意味着同时发生但不完全重合的事件,而"期间"(During)意味着包含。系统还可以识别相反的关系,例如被遇见、后、开始、结束,以捕捉这些时间连接的相反方向。此外,它还可以识别一个事件何时完全重叠或包含另一个事件,以及两个事件在持续时间上相等(相等)。这一全面的时间关系集使人工智能系统能够理解数据的时间方面,促进了在各个领域的应用,从日程安排到自然语言理解等等。
11.21 上下文推理
上下文推理是任何智能决策系统不可或缺的元素,因为它使人工智能能够超越数据的表面水平,理解给定情况的复杂性。这使得系统能够考虑各种要素和情况,根据特定的上下文调整其逻辑和响应。这种适应性对于做出明智的选择、防止错误并实现最佳结果至关重要。无论是在医疗保健、金融、内容审核还是其他任何领域,能够理解和整合上下文的人工智能系统可以提供更精确、相关和可靠的帮助,从而成为增强人工智能解决方案在现实世界中效用和可靠性的重要组成部分。
为了突出上下文理解和推理的重要性,让我们重新审视本书早期章节中讨论过的一些例子。临床推理,例如,严重依赖于上下文。考虑一个怀孕的女人,上下文会极大地改变对药物处方的方法。许多药物可能会对发育中的胎儿造成伤害,而其他一些药物可能是安全的,甚至对母亲和婴儿的健康都是必要的。在这种情况下的上下文推理涉及考虑妊娠阶段、具体医疗状况、任何现有状况、风险与利益的比例以及替代治疗选项。
同样,在欺诈预防方面,人工智能系统必须适应特殊事件期间的支出行为变化,如黑色星期五或度假期间预期会有大量交易是正常的情况下。识别上下文并自动调整参数可以显著减少虚警。
另一个上下文敏感的领域是股票交易,在这里,诸如高利率、地缘政治问题、失业、通货膨胀等因素至关重要。这些因素中的每一个都可能深刻影响股市,需要一种灵活和上下文敏感的人工智能方法。
在文本挖掘中,理解一篇文章需要推断正确的上下文,因为同一个词在不同的上下文中可能具有不同的含义。例如,苹果可以指水果、纽约市、计算机或一家公司。
在内容审核中,上下文起着关键作用。想象一下关于第三帝国的视频,它既可以作为一个教育工具,向人们介绍纳粹主义的暴行,也可以作为新法西斯主义团体的宣传工具。在一个情境中,会鼓励推广,而在另一个情境中,封锁将是必要的。
因此,下一代 AI 系统必须将上下文推理作为其功能的一个组成部分,因为现实世界的动态和复杂性。上下文为每个领域和情境提供了制定智能决策和行动所需的重要信息。没有上下文,AI 系统可能会产生不准确或不合适的结果。
11.22 因果推理
因果关系是我们对世界的理解的基础,就像我们对时间的感知一样。它作为理解事件、行为和结果之间关系的关键框架。然而,当我们考虑如何将因果关系的概念编码到计算机程序中时,它就成为了一个挑战。因果关系远不止是观察事件按时间顺序发生。它分析了定义事件发生原因的复杂关系网。这就涉及到事件、条件、对象和过程都可以在相互影响中发挥作用的想法。
下一代 AI 系统必须能够不仅识别模式和相关性,而且理解潜在的因果因素。这使 AI 能够创建能够以更高效率进行推理、规划和行动的商业解决方案,最终在许多方面造福社会。
11.23 类比推理和可转移性
人类拥有非凡的类比推理天赋,这是一种深深植根于我们识别模式、建立联系并在各种情况下借鉴过去经验的认知技能。这种心智能力与我们对抽象和概括的能力密切相关,使我们能够识别看似无关的场景之间的相似之处。这种独特能力使我们能够顺利地将知识和有效的解决问题策略从一个领域转移到另一个领域。在历史上,类比推理一直是许多具有突破性发明的推动力。例如,乔治·德梅斯特拉通过观察草籽粘在他的衣服和狗毛上的方式找到灵感,最终发明了 Velcro。同样,詹姆斯·戴森通过在锯木厂离心机的高效、不易堵塞的动作和自己的真空吸尘器原型之间找到类比,从而颠覆了吸尘器领域。
下一代 AI 应该具有执行类比推理并将从一个领域学到的解决问题技巧应用到另一个领域的能力。这种增强将显著提高它们的效率和适应性。
11.24 个性化
个性化是各个领域的一个关键因素。当前的人工智能系统,它们从广泛的数据集中学习,往往只能识别在整体人群水平上相关的模式。以今天在金融交易中常见的典型人工智能系统为例;它通常将相同的逻辑应用于每个商家。然而,每个商家都有独特的特点和活动模式。同样,持卡人表现出不同的消费模式和购买习惯。忽视这些个体差异可能导致更低的欺诈检测率和更高的误报率。个性化可以增强人工智能系统的效率。例如,在教育领域,由人工智能驱动的个性化学习平台可以适应每个学生的学习速度和学习风格。在医疗保健领域,个性化确保每个患者都接受到最合适的治疗方案。
个性化承认个体和情境的独特性。因此,将其整合到人工智能系统中将使它们能够满足个体和情境的独特特征和要求,从而改善结果。
11.25 可持续人工智能
当前的人工智能系统在各个领域取得了显著进展,但其背后伴随着巨大的环境成本。其中一个主要关注点是与人工智能相关的巨大能源消耗,这是由训练和运行复杂模型的计算需求所驱动的。承载这些人工智能基础设施的数据中心是碳排放的重要贡献者,通常依赖于非可再生能源。
这种环境影响进一步体现在WIRED杂志报道的人工智能里程碑所需的计算能力的惊人增长上,从 2012 年到 2018 年增加了 300,000 倍 [7]。此外,麻省理工技术评论最近的一份报告 [8] 揭示了一个令人震惊的事实:从零开始构建和训练一个人工智能系统的整个过程产生了惊人的 78,468 磅 CO2 排放量。这个数量超过了一个人一生中呼出的数量,也超过了他们整个汽车使用寿命所产生的排放量。考虑到这些令人担忧的数字,人们担心人工智能系统可能越来越被视为对气候的威胁。
为了解决这一环境挑战,下一代人工智能必须将效率作为核心设计原则。这包括开发和利用更加简化的算法,能够以显著更少的计算资源实现可比较的结果。此外,努力应该集中在减少人工智能训练的数据需求,从而减少与数据存储和传输相关的环境影响。
通过采用这些策略,下一代人工智能不仅可以保持其技术实力,还可以履行其环境意识的责任,为更可持续的未来做出贡献。
11.26 适应性
在充满不可预测性和不断变化的真实世界中,准确预测未来事件和趋势可能是一项极具挑战性的任务。这正是适应性概念在各种商业应用成功中的关键因素。
为了进一步探讨这个概念,让我们回顾一下第四章的先前讨论,我们的焦点主要是支付行业。在那个背景下,我们强调了采用灵活的 AI 解决方案的重要性。这些解决方案对于有效应对不断变化的欺诈活动和不断发展的洗钱策略的挑战至关重要,这些挑战对这个行业构成了重大挑战。我们讨论的挑战之一是,传统的 AI 系统在面对甚至是对给定问题参数的微小修改或调整时往往表现得僵化而笨重。这些系统通常需要进行彻底的改革和重新培训,这个过程不仅消耗了大量资源,而且远非可扩展的。
因此,下一代 AI 平台必须依赖于具有持续学习和适应能力的框架。
11.27 人机协作
AI 系统通常在孤立环境下运作,独立于人类交互。然而,科技领域的不断发展以及我们对 AI 的依赖日益增长,要求向不仅能够独立完成任务,而且能够与人类形成合作伙伴关系的 AI 平台转变。这种转变是由于人类创造力和人工智能相交融才能真正实现创新和提高生产力的认识驱动的。因此,下一代 AI 系统应该具备促进人机之间顺畅沟通和合作的能力,从而最终提升双方的能力。
摘要
- 一个好的 AI 模型应该处理多样化和大规模的数据来源,并且通过特征工程进行增强。
- 项目团队应该考虑将多种技术结合起来,包括(好的)无监督学习。
- AI 解决方案应该是简单易用的模块,非专家也能轻松集成的。
- 公司在使用 AI 模型时应该应用适当的质量保证,以确保它们能按预期工作,具有韧性,并且能够有效扩展。
- AI 模型应该易于部署和安全,并且应该解决隐私问题。人类应该能够理解它们的运作方式。
- 为了达到一定程度的智能,未来的 AI 系统应该理解类比、推理、上下文等当前缺失的许多概念。
人工智能内部原理(二)(3)https://developer.aliyun.com/article/1525485