《百炼成金-大金融模型新篇章》––10.金融级AI原生的六大要素(1)

简介: 《百炼成金-大金融模型新篇章》––10.金融级AI原生的六大要素(1)

本文来源于阿里云社区电子书《百炼成金-大金融模型新篇章》


AI 技术在金融行业中扎根生长并深入应用,必须严格遵循金融行业的业务规则与标准,这就催生了专为金融领域打造的金融级 AI 原生。综合考虑金融级行业要求、AI 原生核心技术,我们将金融级 AI 原生总结为如下 6 大要素:


image.png


要素 1:可靠性和稳定性


当前金融行业随着数字化、智能化的转型,越来越多的金融级 AI 原生应用涌现,大规模智算资源的统筹管理和编排调度,对于确保金融基础设施的连续性与稳定性成为至关重要的能力基石。下面从训练态和推理态两个方面来说明智算平台需要提供怎样的能力来保证应用的可靠性和稳定性。


训练态:


智算平台需要大规模集群调度管理,洞察集群状态与性能变化,掌控系统全貌。通过训练引擎自动容错来屏蔽底层错误,提升任务稳定性和鲁棒性。通过实时保存模型文件,大幅度提高训练任务的整体效率。通过云原生性能测试平台,完成一键测试系统性能,及时发现隐藏的瓶颈。


image.png


image.png

推理态:


目前大模型的推理部署还没有一个事实标准,一方面不断有新的模型发布,另一方面也不断有新的训练和推理方法被提出,再者国产化 GPU 硬件和软件生态也在快速迭代,这给大模型推理服务生产上落地带来不小挑战。为了应对上述挑战在模型准备和部署阶段,我们建议遵从以下原则:


image.png


分层设计:由于模型本身文件较大,模型加载和启动时间往往以分钟甚至小时计。在模型准备阶段,将运行依赖环境、模型文件、推理代码分层设计统一验证并推送到合适的存储服务层;在模型部署阶段,通过云平台存算分离,共享挂载、缓存加速等方式实现模型的快速部署和加速启动;


统一调度:基于 K8S对 IaaS云服务或者客户IDC内各种异构的计算(如 CPU,GPU,NPU)、存储(OSS,NAS,CPFS,HDFS)、网络(TCP,RDMA)资源进行抽象,统一管理、运维和分配,通过弹性和软硬协同优化,持续提升资源利用率。


云化部署:借助 K8S 调度框架和云化基础设施,实现对大模型应用的多实例高可用部署和故障自动切换。


要素 2:低延时与高并发


大模型在实现低延时和高并发处理方面是 AI 原生应用的重大挑战之一,尤其是在需要实时响应和服务大量用户的应用场景中。


实时交易的场景下,系统需要几乎实时地处理和响应用户的查询或请求。如银行行业客户通话的场景中,需要应用大模型实时识别用户意图,并实时反馈相应的话术,这个场景对大模型的时延要求非常高,需要在很短的时间来做出相应的应答。同样在保险行业中,利用大模型处理车险、健康险等理赔案件,需要迅速分析上传的图片、视频及其他证据材料,快速准确地完成初步定损工作。当前,推理优化、加速主要有几种方式,如模型架构(使用 MoE 架构)优化、模型本身(剪枝、量化、知识蒸馏等)优化,和利用多机多卡环境进行数据并行、模型并行,分散模型负载,加速计算过程。


高并发场景是指在短时间内有大量用户请求涌入系统,要求系统能快速响应并处理这些请求,保证服务的稳定性和用户体验。如红包发放的促销活动期间,大量用户同时进行请求,在红包领取的同时需要应用大模型做实时推荐。高并发可以通过调度优化来支撑,调度系统可以根据请求状态的动态变化对调度决策进行适应性调整,并以此实现如负载均衡、碎片整理、请求优先级、高效的实例扩缩容等一系列调度特性和优化。


我们来看一个实际的案例:一家互联网金融企业,在外呼过程中,通过大模型识别客户意愿,完成多轮客户对话交互。


image.png


从当前业务模式观察,存在显著的忙闲周期:在需求高峰时段,必须确保充足计算能力以维持业务运营,确保客户享受到优质的外呼体验;而到了低谷期,则需释放这些资源,以便供给其他业务利用。然而,当这些释放的计算资源无其他业务承接时,便会造成极大的资源闲置。专为某特定业务保有大量计算资源是不切实际的,因为通常情况下,这些资源的使用效率极低,仅能达到约 10%。因此,寻找一种既能应对峰值需求,又能高效利用资源的策略显得尤为重要。而混合云架构可以较好地解决这个问题,利用金融云的弹性资源来满足波峰波谷的业务需求。


《百炼成金-大金融模型新篇章》––10.金融级AI原生的六大要素(2):https://developer.aliyun.com/article/1539485

相关文章
|
1天前
|
人工智能 Cloud Native Java
从云原生视角看 AI 原生应用架构的实践
本文核心观点: • 基于大模型的 AI 原生应用将越来越多,容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民,并引入了更多流量,催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能,承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要,API 网关、消息队列、可观测是 AI Infra 的重要组成。
|
4天前
|
机器学习/深度学习 人工智能 算法
AI - 决策树模型
决策树算法起源于古希腊的逻辑推理,20世纪在军事策略研究中首次提出。它通过构建树形模型模拟决策过程,每个节点代表一个属性判断,分支代表可能结果。ID3算法基于信息增益,C4.5则引入信息增益率,解决了ID3偏好多值属性的问题,还能处理缺失值。CART决策树适用于分类和回归任务,使用基尼系数或信息增益来选择特征。在Python的`sklearn`库中,`DecisionTreeClassifier`实现决策树分类,通过参数如`criterion`、`max_depth`等控制模型。
|
4天前
|
机器学习/深度学习 资源调度 算法
AI-逻辑回归模型
逻辑回归是一种用于分类问题的统计模型,尤其适合二分类任务,如预测广告点击率、判断邮件是否为垃圾邮件、评估疾病风险和预测信用卡违约等。模型通过线性方程(logit函数)结合Sigmoid函数将结果映射到0到1区间,表示概率。损失函数通常使用交叉熵,优化时常用梯度下降。评估指标包括ROC曲线和AUC,后者衡量模型整体性能,值越接近1表示性能越好。在不平衡数据集上,可使用`class_weight='balanced'`来调整样本权重。
|
4天前
|
机器学习/深度学习 算法 大数据
AI-线性回归模型(二)
这篇内容介绍了梯度下降法在机器学习中的应用,特别是在线性回归中的角色。它是一种迭代优化算法,用于找到损失函数最小值的参数。全梯度下降(FGD)使用所有数据计算梯度,适合大数据但计算成本高;随机梯度下降(SGD)随机选取样本,速度快但可能收敛到局部最小值。随机平均梯度下降(SAG)结合两者的优点,提高收敛速度。评估线性回归模型的性能通常使用平均绝对误差、均方误差和均方根误差。文中还展示了波士顿房价预测案例,使用SGDRegressor进行训练,并讨论了学习率的影响。最后提到了如何使用`joblib`库保存和加载模型。
|
4天前
|
机器学习/深度学习 API Python
AI-线性回归模型(一)
线性回归是用于分析变量间线性关系的统计方法,常见于房价预测、销售额预测和贷款额度评估。通过最小二乘法寻找最佳直线方程y=wx+b,其中y是因变量,x是自变量,w和b是模型参数。在Python的`sklearn`库中,使用`LinearRegression`类可构建模型,通过`fit`训练和`predict`进行预测。损失函数通常用平方损失(均方误差)衡量预测误差,优化目标是最小化这些误差的平方和。
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
AI大模型的核心成功因素通常可以归结为三大要素:大数据、大算力和强算法。
AI大模型的核心成功因素通常可以归结为三大要素:大数据、大算力和强算法。
18 0
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
AI大模型的核心
AI大模型的核心
13 0
|
5天前
|
人工智能 自然语言处理 测试技术
通义灵码评测: 阿里云出品通义大模型AI代码编程辅助工具
通义灵码是阿里云出品的一款基于通义大模型的AI智能编码辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力,并针对阿里云 SDK/OpenAPI 的使用场景调优,助力开发者高效、流畅的编码。
209 0
|
5天前
|
人工智能 自然语言处理 搜索推荐
AI时代:人工智能大模型引领科技创造新时代
AI时代:人工智能大模型引领科技创造新时代
35 0
|
5天前
|
人工智能 供应链 安全
AI预测区块链接技术未来
**区块链未来趋势摘要**: - 技术迭代优化,提升性能、安全,广泛应用于金融、供应链、医疗。 - 深度融合产业,扩展至智能合约、数字身份,全球化应用更均衡。 - 标准化规范化进程加速,国家与行业制定相应规则。 - NFT、元宇宙催生新应用,金融区块链受益于数字人民币发展。 - 市场规模预计2026年达163.68亿美元,中国年复合增速73%,潜力巨大。 - 多维度发展势头强劲,区块链将重塑信任与数字经济格局。