带你读《创新之巅: 未来十年重构商业的六大战略性技术》第一章未来十年重构商业的 六大技术1.3AI 如何工作

简介: 带你读《创新之巅: 未来十年重构商业的六大战略性技术》第一章未来十年重构商业的 六大技术1.3

 

 

AI如何工作

 

要使用 AI,你并不一定非得了解它是如何工作的。但是这种洞察可以帮助你了解当前技术的能力和局限性。以下文字是针对非技术类型人员的理解而设计的,但是如果这段文字对于你来说还是太过遥远并让你陷于困惑,请跳到下一部分。

 

神经网络、训练和模型

 

神经网络支撑着今天大部分的人工智能。它们的运行与传统数字计算机迥然不同。传统计算机是性能叠加、锦上添花式机器,而神经网络的组织则更像是创建在我们大脑中的高度互联式结构。神经网络由互相连接的节点构成,它的行为与神经元类似。每个节点都具备一个数值。不像使用01工作的二进制计算机,神经网络的每个节点都具备一个取值范围,取值范围则取决于应用范围。节点又依照层次进行安排。第一层称为输入层,最后一层称为输出层,处于这之间的层称为隐藏层(如图 1.1所示)。

image.png



1.1一个简单的神经网络

 

通常来说,层次越多、每层节点越多,神经网络的能力就越强。具备很多层的神经网络被称为深度神经网络,这也是深度学习这个术语的由来。


隐藏层中的每个节点都既有输入也有输出。每个节点既与上一层的所有节点相连接,也与下一层的所有节点相连接。每个节点的值受其连接的上一层所有节点值的影响。棘手的一点是:一些节点对后续节点的值的影响较其他节点更强,它们的影响就要加权。因此,每个节点的值是前面节点值的加权和。这些权值在训练阶段确定,并共同构成所谓的模型。模型决定神经网络的函数:权值不同,函数不同。信息通过这个复杂的加权网络,从输入层传递到输出层。


神经网络通过被称为反向传播backpropagation,商业中亦称为backprop)的程序进行训练。反向传播如何工作的细节已经超出本书的范围。从更高层面来说,反向传播是一种计算量大的统计方法,将神经网络的期望输出与真正输出进行比较,然后调整网络中的权重以提升结果的准确性。当正确结果已经给定,得出正确结果的整个神经网络中的所有路径的权重都得以增强。如果结果是错误的,则得出错误结果的路径被弱化。随着时间的推移,以及接触的数据越来越多,模型也就变得越来越正确。神经网络就是这样学习输入和输出之间正确   的、复杂的关联关系。

 

案例:放射学AI

 

为了训练 AI读懂放射学图表并发现肿瘤,需要让它接触很多图表样例(输入),每张图表都要标识放射科医生的诊断肿瘤或非肿瘤(期望输出)。神经网络的输出是一张图片,图片上注明了患肿瘤的概率。每次神经网络都接触一张新的图片,将神经网络的输出与正确的结果进行比较。如果图片中存在肿瘤,结果应该接近于 100%。如果不存在肿瘤,结果就接近于 0。反向传播的使用就是为了调整网络的模型(节点间连接的权重),强化得到正确结果的连接的权重,反之,弱化得到错误结果的连接的权重。一旦经过足够多的数据训练,神经网络诊断的准确率会高得令人难以置信。更复杂的网络甚至可能有几个输出结果,例如出现肿瘤的概率、栓塞的概率、骨折的概率等。


如果这些很难理解,那也没关系。需要理解的关键在于,神经网络能够推导出从样例中如何执行任务,而无须领域专家提供外显式规则。


放射科医生要经过很多年的训练来读懂 X射线、计算机断层扫描(CT)、核磁共振成像(MRI)和正电子放射型计算机断层扫描(PET)等图片。从医学院毕业后,放射科医生还要经过额外的培训,通常包括四年的住院医生见习期。在那之后,有的放射科医生还要做其他额外的专业化培训。要读懂图片、发现肿瘤及其他疾病需要用到全部放射科相关技能、经验和训练。然而,这个任务却在神经网络所能完成的范围内。给出足够多的训练数据,一个 AI可以培养出类似人类放射科医生一样的诊断能力,而一个人要成为放射科医生的背后却是十年左右的密集型教育。训练神经网络本质上是在编纂知识合集,以及学习来自成百上千的放射科医生的几十年的专业经验。他们的经验和诊断洞察被采集在所生成的模型中。


一些放射科医生在阅读放射学图表时,已经使用 AI工具以提供第二种意。随着这些工具阅读常规图表的准确率超过人类放射科医生,放射科医生也就可以将其注意力集中在更复杂、更高价值和更以病人为中心的任务和程序上。放射学所取得的进步也预示着其他医学分科的未来。在未来十年中,机器学习将应用于更多其他的医疗诊断领域和病理学中。


当进行 AI训练时,要创建一个模型需要大量的计算性能,而在使用这个模型时所需要的计算性能就少得多。使用模型的过程也被称为推理。通常来说,训练发生在工作站或在云上,而推理则发生在设备上。大多数未来的计算机芯片将包括推理引擎,优化后的硅加速器运行 AI模型就相对更为容易。

 

模式识别

 

模式识别是很多 AI系统的核心能力,这也体现在我们刚探讨过的放射学案例中。模式识别存在于很多应用中,并且不同应用范畴各具风格。记住所有这些不同的方法并不重要。在此列举它们只是为了举例说明机器学习的一些重要能力。阅读的时候,思考一下,可以如何使用这样一种能力来解决你们组织中的一些商业问题。


(1)分类,AI可以将数据划分为相似的类型。比如,放射科 AI将图片划分为阳性和阴性两个类别。在一个制造业工厂中,可以使用类似的方法进行外观检验和质量检查,或在一个水果包装厂进行水果完好度和成熟度的识别。


(2)  聚类,营销专家利用聚类算法将消费者划分为一个个具有相似特购买习惯、收入层次以及需求或欲望的细分市场。推荐引擎使用的也是聚类。流媒体音乐服务平台 Spotify通过分析历史听歌数据向你推荐你可能喜欢的歌曲。聚类算法可以发现歌曲和听歌者之间的复杂关系。聚类算法可能了解到我喜欢歌曲 ABC,而你喜欢歌曲 BCD。它就可以得出结论,你可能会喜欢歌曲 A,而我可能喜欢歌曲D聚类有助于提供个性化体验。


(3)  回归分析,能够发现不同数据之间关系描述的模式。比如,回归分析可能观察到,如果事件A发生,大部分时间事件B会紧接着发生。它也可能发现更错综复杂的关系,例如如果数据点 A低于一定阈值,而且事件B和事件 C没有发生,那么事件 D发生的可能性高于 46%预测分析工具也被用于对未来进行预测。比如沃尔玛使用回归分析预测某些食物商品的销量如何受特定天气条件的影响。


(4)  序列标注,是一种用于语音识别、手写体识别以及手势识别的模式识别方法。序列标注可被用于将句子分解为词组和短语,并通过获取上下文的方式对它们做出标注。比如,序列标注判定哪个词是名词、动词和专有名词。词语置于一个内容更为丰富的上下文中才能得到最好的解释。序列标注算法通过检查其所处的上下文,对句子中的词语或者对手写体中的手写字母进行分类。


(5)  时间序列预测,可用于天气预报、股票市场预测和灾难预测。这些算法分析一系列的历史数据点,并且用它来预测某序列中接下来可能出现的数据点。


这些模式匹配算法利用复杂的数学来施展它们的魔法。你不需要理解模式匹配是如何工作的,甚至无须记得以上列出的全部技术。你所需要理解的是,AI促使计算机理解物理世界、做出预测并且发现隐藏在数据中的复杂关系。而这些任务是很多商业问题得以解决的根本。

 


相关文章
|
5天前
|
人工智能 自然语言处理 机器人
文档智能与RAG技术如何提升AI大模型的业务理解能力
随着人工智能的发展,AI大模型在自然语言处理中的应用日益广泛。文档智能和检索增强生成(RAG)技术的兴起,为模型更好地理解和适应特定业务场景提供了新方案。文档智能通过自动化提取和分析非结构化文档中的信息,提高工作效率和准确性。RAG结合检索机制和生成模型,利用外部知识库提高生成内容的相关性和准确性。两者的结合进一步增强了AI大模型的业务理解能力,助力企业数字化转型。
34 3
|
3天前
|
人工智能 文字识别 运维
AI多模态的5大核心关键技术,让高端制造实现智能化管理
结合大模型应用场景,通过AI技术解析高端制造业的复杂设备与文档数据,自动化地将大型零件、机械图纸、操作手册等文档结构化。核心技术包括版面识别、表格抽取、要素抽取和文档抽取,实现信息的系统化管理和高效查询,大幅提升设备维护和生产管理的效率。
|
8天前
|
人工智能 自然语言处理 算法
企业内训|AI/大模型/智能体的测评/评估技术-某电信运营商互联网研发中心
本课程是TsingtaoAI专为某电信运营商的互联网研发中心的AI算法工程师设计,已于近日在广州对客户团队完成交付。课程聚焦AI算法工程师在AI、大模型和智能体的测评/评估技术中的关键能力建设,深入探讨如何基于当前先进的AI、大模型与智能体技术,构建符合实际场景需求的科学测评体系。课程内容涵盖大模型及智能体的基础理论、测评集构建、评分标准、自动化与人工测评方法,以及特定垂直场景下的测评实战等方面。
42 4
|
8天前
|
机器学习/深度学习 人工智能 算法
基于AI的性能优化技术研究
基于AI的性能优化技术研究
|
10天前
|
人工智能 算法
AI技术在医疗领域的应用及其挑战
【10月更文挑战第31天】本文将探讨AI技术在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念开始,然后详细介绍其在医疗领域的应用,包括疾病诊断、药物研发、患者护理等方面。最后,我们将讨论AI技术在医疗领域面临的挑战,如数据隐私、算法偏见等问题。
|
11天前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
|
9天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗领域的应用及其挑战
【10月更文挑战第33天】随着人工智能技术的不断发展,其在医疗领域的应用也越来越广泛。从辅助诊断到治疗方案的制定,AI技术都发挥着重要作用。然而,随之而来的挑战也不容忽视,如数据隐私保护、算法的透明度和可解释性等问题。本文将探讨AI技术在医疗领域的应用及其面临的挑战。
20 0
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
AI在医疗领域的应用及其挑战
【10月更文挑战第34天】本文将探讨人工智能(AI)在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念入手,然后详细介绍其在医疗领域的各种应用,如疾病诊断、药物研发、患者护理等。最后,我们将讨论AI在医疗领域面临的主要挑战,包括数据隐私、算法偏见、法规合规等问题。
27 1
|
6天前
|
机器学习/深度学习 人工智能 算法
AI在医疗领域的应用与挑战
本文探讨了人工智能(AI)在医疗领域的应用,包括其在疾病诊断、治疗方案制定、患者管理等方面的优势和潜力。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题以及技术局限性等。通过对这些内容的深入分析,旨在为读者提供一个全面了解AI在医疗领域现状和未来发展的视角。
31 10