埃森哲发布主题为“AI拐点:重塑人类潜力”的《技术展望2024》报告。报告指出,人们身处巨大的技术变革中,其中AI等颠覆性技术正趋于“人性化”,将重塑市场和组织的生产力规则。
人类对技术的设计理念始终未变,只是从先前的以技术为主导转变为现今的以人性化为核心。新一代技术更加契合人类的思维与行为模式,紧密贴合人类的需求与想象力,与生活的方方面面紧密相连。如今,人类已无需再受制于机器的需求和局限,例如在导航时为了避免偏离目标而不得不忍受导航仪的干扰。借助AI等人性化技术,技术将变得更直观和易用,我们可以更加顺畅地优化和释放人类潜能,让技术真正服务于我们的需求,而不是反过来成为我们的束缚。越来越多人也将通过AI等技术,轻松接触和利用技术,扩大获得知识的机会并参与持续创新。
在此背景下,领导者仍会面临产品和服务是否扩大规模、新数据的应用和制定变革策略等问题,此外还会增加新的思考维度:任何监督人工智能?不同人在数字化转型中担当怎样的角色?因此,AI等技术对于众多企业来讲,既是机遇也是挑战。
01人类与数据关系颠覆:从知识到智识的革新
数据是塑造当今数字化企业最重要的因素之一,对于企业来讲是十分珍贵的资源。企业希望客户、员工、合作伙伴和投资者能够找到并使用这些信息。但在现实应用场景中,可能会因为不记得正确的搜索词等,导致无法编写查询,数据只是孤立地存在“数据池”,难以应用。现在,数据和人类的关系正在发生变化,人们从搜索获取数据,变为通过询问人工智能聊天机器人来寻求答案。对于当今的数据驱动型业务来说,生成式AI可以带来不可估量的潜在价值。
数字化企业的整个基础将被颠覆,企业将使用大语言模型顾问,使企业充分利用数据,最终实现数据驱动业务运营。
“顾问”型聊天机器人需要综合大量信息,使用不同的数据模式,才能提供更准确的答案和建议。这要求企业从根本上思考如何收集和构建数据及更广泛的架构,并将人工智能应用于数字化框架中。无论企业数字化的基础如何,大数据模型顾问都需要完整且易用访问的数据基础。
数据图谱是其中最重要的技术之一。它是一种用于表示和分析数据之间关系的可视化工具,核心部分包括节点和边,节点通常代表人、物品、公司等数据实体,边则代表这些实体之间的关系,如购买、合作、关联等。数据图谱的结构能展示数据的复杂网络结构,并允许用户深入探索和分析。
除了数据图谱之外,企业更新重整架构,还需要使用数据网格和数据架构来匹配和梳理企业需要处理的信息。
为了实现从搜索到真正的顾问模式的转变,企业还需要做更多数据培训。通常企业会选择以下模式训练大语言模型:第一种从零训练。但这需要投入大量资源,因此比较少见,常见于领先的人工智能公司;第二种对现有大语言模型进行“微调”。企业借助大型云厂商等数据企业的通用大数据模型,根据特定需求,进行进一步的培训,使其符合自身专业领域的需求。与从头开始训练相比,这种模式的成本明显要低得多,但可能需要对实时性进行一些妥协。此外,微调模式也在不断升级,针对特定场景,企业开始微调小语言模型,这种方法效率更高、运行成本也更低,而且可以更快地进行训练,并用于较小的边缘设备。
最后,构建大语言模型顾问的一种流行方法是提供更具相关性、特定用例信息来关联训练。通常这是通过检索增强生成(Retrieval-Augmented Generation ,RAG)实现 ,它将信息检索系统和生成模型相结合,让模型既能自我训练又能直接使用,通过API即可访问。情境学习和RAG所需的时间和计算资源较少,适合对信息时效性要求比较高的场景,但精确性仍有待验证。
无论企业选择哪种方式或者探索更多的方式构建大数据模型,都必须具备坚实的数据基础和相关语境,否则大数据模型将始终无法达到预期效果。
02探索大语言模型的未来:洞见风险并寻求降低之道
获得大语言模型带来新机遇的同时,企业也要了解相关风险。例如,大数据模型被训练为以高度确定性提供概率性答案,因此有时模型会传达错误信息。此外,数据的安全性和权限等问题也值得关注。
但这些挑战瑕不掩瑜,大语言模型仍然有许多利好。接下来企业需要关注大模型的准确性提升和理性判断。首先,输入到大语言模型中的数据,无论是用于培训还是提示,都应该是新鲜、标签明确且完整客观的高质量数据;其次,数据权限要明确,确保用户有权访问为情境学习而检索的任何数据;第三,生成式AI聊天机器人的输出应该与品牌调性保持一致,确保模型不会回答敏感数据或有害言论,以及不能回答超出其范围的问题,并告知回答的不确定性并提供验证来源;最后,聊天机器人需要持续接受测试和人工监督。
在人类科技发展的关键时刻,生成式AI等技术正成为数据和软件领域的引领者,促使数字化企业深入反思并创新其与客户、员工及合作伙伴的交互方式。