《百炼成金-大金融模型新篇章》––10.金融级AI原生的六大要素(3)

简介: 百炼必定成金,新质生产力会催生新质劳动力,谨以此文抛砖引玉,希望与业内的各位朋友一同探讨如何积极拥抱并运用大模型技术,以应对和驾驭不断变化的市场环境,实现科技金融持续稳定的提质增效和创新发展,携手开启金融大模型未来新篇章。

本文来源于阿里云社区电子书《百炼成金-大金融模型新篇章》


《百炼成金-大金融模型新篇章》––10.金融级AI原生的六大要素(2):https://developer.aliyun.com/article/1539485


内容安全:采用知识计算的风险防控模式(采用人机协同的方式定义计算框架),主要涉及到数据层、知识层、算子层三个层面的能力。

●  数据层汇聚了涉及内容风险的原始数据,以及针对不同风险领域精炼加工的结构化数据;

●  知识层包含预训练模型和知识图谱,预训练模型用于实现对通用数据的归纳,知识图谱实现对风控专业知识的组织与沉淀,解决知识碎片化、数据获取难的问题;

●  算子层拆解出目标更明确的简单任务,构建端到端的神经算子,实现风险复杂判定逻辑简化解耦。


image.png

大模型的合规性关乎遵守相关法律、法规和内部政策,确保大模型的应用不违反任何法律规定,并保护消费者的利益。


数据隐私与保护,语言大模型的主要功能是模拟人类的思维活动方式生成人类可以理解和使用的内容,模型的训练对语料库这一类知识性内容有强烈的需求,但不依赖和使用用户行为数据。


透明度和可解释性,金融等行业的监管机构要求理解 AI 模型的决策过程,尤其在关系到重大决定如贷款审批或保险索赔时。因此提高模型的透明度和可解释性是一个重要的合规要求。


偏见和公平,消除这些偏见并确保模型对所有人群公平是模型合规性的重要部分。


持续监管和审计,合规性不是一次性的任务,而是需要持续监管和审计。金融机构等需要确保使用的大模型在整个生命周期内都符合监管要求,并能适应法规的变化。


大模型的合规性是一个多层面的、涉及多个利益相关者的挑战,需要综合技术、法律和道德考虑来处理。金融机构在使用大模型时需要密切关注相关法律法规的发展,并且可能需要专门的法律和技术专家团队来确保模型遵循所有适用的合规要求。

要素 5:准确性与严肃性


大模型的“准确性”与“严肃性”是两个评估模型性能和适用性的关键维度,特别是在涉及专业场景和重要决策时尤为重要。


准确性是衡量大模型输出结果与预期目标或实际情况相符的程度。模型在处理给定任务时,例如回答问题、分类文档、翻译文本或者识别图像时,其输出与真实答案或标准标签的匹配程度。严肃性在大模型的语境下,更多指模型生成内容的专业性、可靠性、责任性和道德规范性。在金融这个高度专业化和监管严格的领域,大模型产出的信息必须是经过严格筛选、无误导性且遵循行业规范的。严肃性还包括模型不得滥用或传播不实、不恰当或有害的信息。


为了保证大模型的准确性和严肃性,不仅要在技术层面提升模型的泛化能力和知识完备性,还要在训练数据、模型设计、后处理步骤等方面进行严格控制,并结合领域专家知识、实时监控和用户反馈进行持续优化和修正。同时,对于可能出现的伦理和社会影响问题,也要有相应的政策和机制来预防和应对。


下面是某证券公司的实施案例:


1、构建知识库:基于咨询信息、专业内容、投教百科研报、投研框架、指标信息等,构建基础投研知识库。并将以往历史问答、专家经验以投研框架的方式进行回流,实现持续性的知识生产和知识库运营。


2、知识加工:将各种知识,经过以下的步骤进行处理,文本分段(chunking)、类目标签、实体抽取、质量分、向量表示、item 的时效性等,形成相应的向量。


3、知识检索:用户的 query 进来,经过 Query 改写、向量召回和相关性模型打分等几个步骤,把得分高的知识送到大模型。


4、观点打分:对与大模型生成观点,由专家进行打分。作为 RLHF 的训练样本,从而不断优化模型。


image.png


要素 6:开放性与兼容性


金融级 AI 原生开放性的核心,在于确保安全合规的基础之上,借助先进的技术架构与广泛的生态合作力量,驱动金融服务向智能化方向转型升级,加快创新步伐,满足日益增长的市场需求。而大模型的开源实践,则成为了实现这一开放性愿景最为直接且高效的战略路径。开源对于创新活力、产业生态、行业发展、模型优化都具有重大意义。开源模型可以降低技术门槛,使得更多的研究者和开发者能够访问最先进的 AI 工具,受到启发,提升创新活力。


开源大模型通过社区的方式,吸引开发者和研究人员共同改进模型,以及在模型的基础上构建各种工具,推动模型的深度应用,打造产业生态。促进行业发展,一方面,企业间开放共享可以减少重复开发相同功能的模型所浪费的资源,使得企业能够集中精力在差异性的研究上;另一方面,开源允许任何人在代码级别检查模型的行为和性能,增强了大模型的代码透明度。最后,开源社区的使用者往往具有较高的技术水平,开源模型可以让企业获得来自社区的宝贵反馈,有助于改进模型的性能和功能。


通过开源模型 + 商业版模型组合方式的积极实践,得益于开源社区的生态支持和开发者反馈,使得模型可以在性能及能力上不断优化和增强,另外商业版模型提供了持续的技术支持与咨询服务,以及企业级的安全与隐私保护,所以金融企业在商业化大模型应用时,往往采购商业版本的基础模型。


大模型相较于传统深度学习模型,在规模上实现了显著的扩容,随之而来的是对计算资源的大幅增长需求。在各种 GPU 资源出现时,推理平台能兼容各种芯片,成为了亟待解决的基本问题。与此同时,开源领域的创新势头迅猛,不仅涌现出 Llama、Qwen、Mistral/Mixtral、ChatGLM、Falcon 等诸多新型模型,还在模型优化方面不断突破,例如发展出有损与无损的 Attention 算法、多种量化技术革新、投机采样及 LookAhead 等新颖采样策略,要能适应算法的更新发展。推理层面上,主流的推理框架如 vLLM、HuggingFaceTGI(TextGenerationInference)、FasterTransformer 以及 DeepSpeed,引领了推理特性的新变革,对推理提出了新的要求。


针对上述挑战,一个综合模型、系统、集群与应用层面的协同优化、兼容异构 GPU、各种大模型、推理框架的平台显得尤为重要,旨在实现卓越的性能与成本效益比。


模型层面:MQA(MultiQueryAttention)和 GQA(Group-QueryAttention是许多大模型推理优化的核心探索方向,以及模型的 MOE(Mixture-of-Experts)架构。


系统层面:聚焦于高性能计算算子的开发,优化模型并行执行、显存管理与执行框架,同时强化请求调度能力,确保系统运行的高效与流畅。


集群层面:通过智能的请求调度机制,最大化集群处理能力,有效整合异构资源,提升资源利用率至最优状态。


应用层面:深入分析 LLM 的工作负载特性,将 Prompt 缓存等针对性优化措施融入系统设计,进一步增强应用的响应速度与用户体验。

相关文章
|
4天前
|
人工智能 运维 监控
首个云上 AI 原生全栈可观测平台来了!
9月21日,2024 云栖大会,阿里云发布全新的 AI 原生全栈可观测平台,首次实现云上 AI 大模型从训练到推理再到应用的全链路实时观测、告警与诊断。
|
20天前
|
人工智能 测试技术 API
AI计算机视觉笔记二十 九:yolov10竹签模型,自动数竹签
本文介绍了如何在AutoDL平台上搭建YOLOv10环境并进行竹签检测与计数。首先从官网下载YOLOv10源码并创建虚拟环境,安装依赖库。接着通过官方模型测试环境是否正常工作。然后下载自定义数据集并配置`mycoco128.yaml`文件,使用`yolo detect train`命令或Python代码进行训练。最后,通过命令行或API调用测试训练结果,并展示竹签计数功能。如需转载,请注明原文出处。
|
13天前
|
机器学习/深度学习 人工智能 UED
OpenAI o1模型:AI通用复杂推理的新篇章
OpenAI发布了其最新的AI模型——o1,这款模型以其独特的复杂推理能力和全新的训练方式,引起了业界的广泛关注。今天,我们就来深入剖析o1模型的特点、背后的原理,以及一些有趣的八卦信息。
196 73
|
8天前
|
存储 人工智能 算法
阿里云AI基础设施升级亮相,模型算力利用率提升超20%
阿里云AI基础设施升级亮相,模型算力利用率提升超20%
|
5天前
|
人工智能 Cloud Native Java
新趋势、新开源、新实践|云栖大会 AI 原生应用架构专场邀您参会
新趋势、新开源、新实践|云栖大会 AI 原生应用架构专场邀您参会
|
14天前
|
消息中间件 人工智能 运维
|
9天前
|
人工智能 运维 安全
专访浪潮信息:AI 原生时代,浪潮信息引领服务器操作系统创新 全面贡献龙蜥社区
分享了关于 AI 原生化趋势下服务器操作系统进化的思考,以及浪潮信息在龙蜥社区开源贡献的思路、成果与未来技术发展规划。
专访浪潮信息:AI 原生时代,浪潮信息引领服务器操作系统创新 全面贡献龙蜥社区
|
15天前
|
人工智能 自动驾驶 云计算
【通义】AI视界|谷歌大模型被盯上!欧盟最高隐私监管机构对PaLM2模型展开调查~
本文汇总了近24小时内科技领域的五大要闻:欧盟对谷歌PaLM2模型启动隐私合规调查;甲骨文推出Zettascale云计算集群,集成大量NVIDIA GPU强化计算力;红杉资本偏好AI应用投资而非模型构建;夸克新推智能助手CueMe,支持长达2万字内容生成;沃尔沃与NVIDIA合作,未来车型将采用后者先进芯片提升自动驾驶功能。以上内容由通义自动生成。
|
17天前
|
机器学习/深度学习 人工智能 供应链
【通义】AI视界|OpenAI的“草莓”模型预计两周内上线!像人类一样思考!
本文介绍了近期科技领域的五大亮点:OpenAI即将推出的新一代AI模型“草莓”,具备高级推理能力;亚马逊测试AI技术加速有声读物生产,通过语音克隆提高效率;Kimi API新增联网搜索功能,拓宽信息来源;顺丰发布物流行业专用大语言模型“丰语”,提升工作效率;钉钉推出“AI班级群”功能,改善家校沟通体验。更多详情,请访问[通义官网]。
|
21天前
|
人工智能 自然语言处理 数据挖掘
【通义】AI视界|性能超越GPT-4o?最强大的开源AI模型来了……
本文介绍了五项最新AI技术动态,包括性能超越GPT-4o的开源AI模型Reflection70B、智谱清言App限时免费的视频通话功能、哈佛医学院研发的癌症诊断AI模型CHIEF、Replit推出的AI编程助手,以及英特尔与日本AIST合作设立的芯片制造研发中心。这些进展展示了AI领域的快速创新与广泛应用。更多详情,请访问通义官网体验。