企业内训|LLM大模型技术在金融领域的应用及实践-某商业银行分行IT团队

简介: 本企业培训是TsingtaoAI技术团队专们为某商业银行分行IT团队开发的LLM大模型技术课程。课程深入分析大模型在金融行业中的发展趋势、底层技术及应用场景,重点提升学员在大模型应用中的实际操作能力与业务场景适应力。通过对全球商用 LLM 产品及国内外技术生态的深度对比,学员将了解大模型在不同企业中的发展路径,掌握如 GPT 系列、Claude 系列、文心一言等大模型的前沿技术。针对金融行业的业务需求,学员将学会如何结合多模态技术改进用户体验、数据分析等服务流程,并掌握大模型训练与工具链的实操技术,尤其是模型的微调、迁移学习与压缩技术。

本企业培训是TsingtaoAI技术团队专们为某商业银行分行IT团队开发的LLM大模型技术课程。课程深入分析大模型在金融行业中的发展趋势、底层技术及应用场景,重点提升学员在大模型应用中的实际操作能力与业务场景适应力。通过对全球商用 LLM 产品及国内外技术生态的深度对比,学员将了解大模型在不同企业中的发展路径,掌握如 GPT 系列、Claude 系列、文心一言等大模型的前沿技术。针对金融行业的业务需求,学员将学会如何结合多模态技术改进用户体验、数据分析等服务流程,并掌握大模型训练与工具链的实操技术,尤其是模型的微调、迁移学习与压缩技术。课程将帮助学员提升 Prompt 工程设计及调优能力,解决在智能客服、风险评估、合规审查等场景中的实际问题,同时通过真实案例和项目实践,学员将具备在金融场景中进行 LLM 部署与优化的能力,实现业务流程的智能化与自动化。

培训对象

  • 产品经理
  • 研发工程师
  • 算法工程师

培训时长及形式

2天,每天6小时,一共12小时。线上或线下培训均可支持。

课程大纲

第一部分:大模型发展方向与金融行业的应用趋势

  1. 大模型概述与发展方向
    1. 全球商用 LLM 发展现状
      1. 对比 OpenAI、Anthropic、Google DeepMind 等企业最新发布的 LLM 产品。
      2. OpenAI GPT 系列(GPT-4、GPT-4 Turbo、GPT-5 预期发展)与 Claude 系列(Claude 3)的比较与发展方向。
      3. Google DeepMind Gemini 系列大模型的发展趋势。
      4. 国内外大模型生态圈的差异与发展路径:重点分析国内如百度文心一言、阿里通义千问等商用大模型的技术演进与实践。
    2. 多模态大模型的兴起
      1. DALLE3、Suno、Sora、GPT-4V 等多模态大模型的应用场景及技术创新。
      2. 如何结合多模态技术改进金融服务中的用户体验、数据分析、以及金融产品设计。
    3. 大模型的最新技术突破与研究前沿
      1. 面向未来的大模型技术挑战:推理能力优化、能耗控制与计算成本问题。
      2. 当前前沿研究中的方向:例如 Self-supervised Learning 和 Multitask Learning 在大模型中的应用。
  2. LLM 在金融行业的场景化应用趋势
    1. 金融领域的 AI 应用场景概览
      1. 基于 LLM 的智能客服、风险评估、欺诈检测、合规审查等金融场景中的应用。
      2. 如何结合分行和总行的金融业务模式进行大模型 AI 的定制开发与落地。
    2. 国内外领先银行的 LLM 实践
      1. 通过案例剖析国内外领先大型银行如何应用 LLM 优化业务流程。
      2. 不同金融机构如何通过大模型提升精准营销、投资分析、贷款风险评估等具体场景的效率。

第二部分:大模型的底层技术与模型训练

  1. 大模型的技术原理与架构设计
    1. LLM 架构与传统 NLP 技术的比较
      1. 大模型架构(Transformer、Attention 机制)与传统 NLP 模型的对比。
      2. 如何优化金融行业中大模型的推理速度与精度。
    2. 大模型的多模态扩展
      1. 介绍如何在金融行业中利用文本、图像、语音数据的多模态融合提升智能决策能力。
    3. 分层架构与模块化设计在 LLM 中的应用
      1. 探讨如何在金融领域通过模块化设计优化模型的训练与推理效率。
  2. 从 0 到 1 构建 LLM 全流程解析
    1. 大模型的训练框架与方法
      1. 介绍深度学习框架 PyTorch、TensorFlow 在大模型训练中的应用。
      2. 微调与迁移学习在金融领域中的应用场景与优势。
      3. 基于金融领域特殊需求的大模型训练策略:数据标注、数据清洗、特征选择等核心技术流程。
    2. LLM 模型的工具链
      1. Hugging Face、LangChain 等工具链的深入讲解与使用方法。
      2. Agent 框架、React 和 Cot 在大模型中的应用,如何提升金融场景中的任务执行效率。
    3. 小模型与大模型协同工作的实践
      1. 如何结合意图识别等小模型技术,提升大模型在银行业务场景中的效率与精度。

第三部分:Prompt 工程与大模型调优

  1. Prompt 工程的核心技术与应用实践
    1. Prompt 工程的原理与发展
      1. 大模型的 Prompt 原理:如何通过设计 Prompt 优化大模型的输出质量。
      2. 针对不同金融场景的 Prompt 设计方法:客户服务、风险预测、市场分析等场景。
    2. Prompt 设计的高级技巧
      1. 基于金融数据的复杂 Prompt 构建方法与实践技巧。
      2. 如何通过多轮 Prompt 增强金融分析模型的深度与准确性。
    3. Prompt 工程中的常见问题与优化策略
      1. 针对金融领域中常见的 Prompt 设计误区与解决方案。
  2. LLM 模型的调优与性能优化
    1. 金融场景下的大模型性能调优策略
      1. 如何在银行业务中针对高并发、低延迟的需求进行大模型的性能优化。
      2. 大模型的压缩技术:量化、蒸馏、剪枝等方法在金融领域的应用。
    2. 大模型的可解释性与透明度
      1. 如何提升大模型在金融决策中的可解释性,以满足合规要求和客户信任。
      2. 针对 LLM 在银行业中应用的模型透明化技术,如 SHAP、LIME 等可解释性框架的应用。

第四部分:大模型的金融应用与案例分析

  1. LLM 在金融行业的应用实战
    1. 基于 LLM 的智能客服与客户管理
      1. 如何利用 LLM 处理客户咨询、投诉与反馈,实现精准的客户管理。
      2. 基于真实项目的代码示例:如何通过大模型提升客户满意度与业务效率。
    2. 金融场景中的 LLM 结合 RPA(机器人流程自动化)
      1. LLM 与 RPA 的集成:如何通过自动化流程管理优化银行的后台运营。
      2. 银行业务中的 RPA 应用实例:账户管理、风险监控、资金流动分析等。
    3. 金融决策支持系统的 AI 应用
      1. LLM 如何结合历史数据进行决策支持,提升市场预测与风险管理能力。
      2. 如何通过知识图谱与 LLM 结合,提升决策系统的智能化水平。
  2. 金融分析模型与具体案例剖析
    1. 金融风险评估模型的开发与优化
      1. 大模型在金融风险控制中的应用:如何通过 LLM 提升欺诈检测与风险评估的准确率。
      2. 案例:构建一个基于 LLM 的贷款风险评估系统。
    2. 金融市场趋势分析与投资组合优化
      1. 如何利用 LLM 结合大数据分析进行市场趋势预测与投资策略优化。
      2. 案例:基于 LLM 的股票市场分析与投资组合管理策略的开发与优化。

讲师介绍

赵老师 资深大模型算法专家

北京邮电大学本硕连读,拥有扎实的人工智能理论知识和丰富的项目实践经验。在字节跳动和中国银行担任算法工程师,现在在AI科技公司负责大语言模型(LLM)落地项目。已构建自研训练框架,可适配ChatGLM1&2、Baichuan1&2、Qwen14B等主流开源模型的全参/lora/Qlora微调,支持各种训练指标可视化,方便对比实验;已构建训练数据生成流程,基于不同业务需求进行训练数据处理;已构建推理服务,基于自训模型及推理服务成功在APP上线与用户交互。

过往授课课程

  • Python编程与大数据应用
  • ChatGLM与其他LLM的部署、训练与微调
  • LangChain框架深度解析与实践
  • 多模态处理与多模态大语言模型实践
  • 知识图谱技术在大数据中的应用
  • 大模型(LLM)数据预处理与特征工程

LLM培训案例

  1. 中信银行:LLM Driving课程
    1. 课程内容:讲解LLM的基础原理、部署策略以及微调技巧,帮助学生在实际项目中应用LLM。
    2. 培训效果:提高了学员对LLM的理解和实际操作能力,促进了项目的顺利进行。
  2. 广汽如祺:AIGC大模型应用开发技能培训
    1. 课程内容:为技术团队提供LLM模型与多模态AIGC联合应用,利用LLM能力助力多模态生成。
    2. 培训效果:提升了团队的多模态生成技术水平,增强了企业在AIGC领域的竞争力。

个人资质

  • 精通Python、Go语言,具有丰富的后端开发经验,涉及数据库、kafka、高并发处理等。
  • 具备深厚的大模型、NLP、RAG、思维链CoT、语音识别(ASR)和语音测评(GOP)技术背景,曾基于kaldi和conformer+transformer框架开发相关服务。
  • 熟悉主流开源大语言模型的全参/lora/Qlora微调技术,并能够根据不同业务需求进行定制化训练数据处理。

发表论文与发明专利

  • 发表论文:《基于多模态大语言模型的智能客服系统研究》《大模型在金融行业的应用与实践》
  • 发明专利:一种用于金融风险预测的多模态大语言模型;基于LLM的智能语音交互系统。

其他项目经验

  1. Python&Go语言后端开发
    1. 项目内容:负责后端开发,涉及数据库管理、kafka消息队列、高并发处理等技术。
    2. 项目成果:提高了系统的稳定性和处理效率,满足了高并发需求。
  2. 语音测评(GOP)服务
    1. 项目内容:基于kaldi框架训练语音测评模型,实现服务端和手机端本地化推理。
    2. 项目成果:该服务成功应用于用户APP的中英文口语练习,实现了自动化打分评价。
  3. 语音识别(ASR)服务
    1. 项目内容:基于conformer+transformer框架训练端到端模型,实现服务端离线识别和流式识别。
    2. 项目成果:该服务成功应用于客服系统和语音审核场景,提高了识别准确率和效率。

客户反馈

部分授课课件

陈老师 AI资深研发专家

大模型算法及应用开发资深专家,超过10年的AI、数据科学、软件开发和系统架构经验,专注于人工智能生成模型(AIGC)、Python、Java语言方向。现任TsingtaoAI研发及算法项目负责人。陈老师以其深厚的AI技术背景和丰富的实践经验,致力于通过高质量的培训课程帮助学员提升专业AI技能。在金融行业大模型技术的研发和实际落地方面拥有广泛的实践经验,并且多次主导和参与了针对金融行业的大模型技术培训和辅导项目。

教育背景

  • 2005.09—2008.07 天津大学 计算机科学与技术 硕士
  • 2001.09—2005.07 山东大学 计算机科学与技术 学士

过往培训内容

  • 大模型(LLM)技术原理与应用
  • 大模型在金融行业的具体落地案例分析
  • 金融行业数据分析与智能决策
  • 金融科技创新与未来发展趋势
  • 机器学习与神经网络基础及进阶
  • Python及Java编程语言应用

金融行业研发项目

  • 金融智能决策系统:带领团队开发基于大模型技术的金融智能决策系统,应用于多家银行的风险管理与客户推荐系统。
  • 智能投顾平台:负责开发的智能投顾平台,帮助个人投资者提供个性化投资建议,提高用户满意度和投资收益。

培训案例

  • TsingtaoAI:为公司研发团队进行大模型技术培训,内容涵盖大模型的基本原理、开发实践以及在金融科技和营销业务中的应用。
  • 苏泊尔:对IT/AI技术团队进行大模型技术培训,提升团队对大模型技术的理解、掌握和应用能力。
  • 建设银行:开展关于大模型技术系统的专题培训,分享大模型系统设计、技术实现及实际应用中的经验和挑战。

相关知识产权和论文:一种基于大模型的金融智能决策方法;智能投顾系统及其实现方法;基于神经网络的金融数据分析方法研究。

工作&专业经验

  • TsingtaoAI:研发及算法负责人,负责相应的大模型微调及应用开发,开发产品包括:基于数隐产业图谱的数据流通服务平台;基于GLM大模型的智能客服应用平台;基于多模态大模型的动物X光片智能诊断系统;基于LLM的AIGC应用开发实训平台。负责大模型技术在教育培训中的应用与推广
  • 360数科贷前风控模型专家,根据实际业务需求,搭建完善全生命周期的风控模型产品体系,有效识别客群降低风险;对内外部数据进行特征衍生与挖掘,分析与评估,选择最合适,成本优,效果佳的数据源,平衡商业需求的同时,使得模型产品达到效果;负责项目中模型的研究、开发、部署、监控、维护、优化迭代全流程工作训项目负责人。
  • 北京正己基业教育科技有限公司:架构师及算法研发,负责公司SaaS平台的技术架构设计与实施。
  • 北京运道科技有限公司:技术负责人,主导智能物流及供应链金融平台的研发与应用。

相关实践学习
基于阿里云短信服务的防机器人验证
基于阿里云相关产品和服务实现一个手机验证码登录的功能,防止机器人批量注册,服务端采用阿里云ECS服务器,程序语言选用JAVA,服务器软件选用Tomcat,应用服务采用阿里云短信服务,
目录
相关文章
|
10天前
|
机器学习/深度学习 存储 缓存
ORCA:基于持续批处理的LLM推理性能优化技术详解
大语言模型(LLMs)的批处理优化面临诸多挑战,尤其是由于推理过程的迭代性导致的资源利用不均问题。ORCA系统通过引入迭代级调度和选择性批处理技术,有效解决了这些问题,大幅提高了GPU资源利用率和系统吞吐量,相比FasterTransformer实现了最高37倍的性能提升。
69 26
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出网络共识
大型语言模型(LLM)如ChatGPT正改变人机交互,但在生成看似真实的错误信息方面存在“幻觉”问题。这种现象源于LLM依赖统计概率而非语义理解,导致在处理争议或冷门话题时易出错。研究显示,LLM的准确性高度依赖于训练数据的质量和数量。尽管如此,LLM仍具巨大潜力,需持续优化并保持批判性使用。
41 12
|
17天前
|
人工智能 自然语言处理
大模型在装傻!谷歌苹果最新发现:LLM知道但不告诉你,掌握知识比表现出来的多
在AI领域,大模型(LLM)展现出了惊人的进步,但在谷歌和苹果的最新研究中,发现这些模型有时会故意“装傻”,即使已知正确答案也不告知用户。这种“隐藏智慧”现象揭示了大模型可能具备超出表面表现的深层能力,对AI评估与应用提出了新挑战,同时也带来了设计更高效模型的新机遇。论文链接:https://arxiv.org/pdf/2410.02707
31 11
|
16天前
|
自然语言处理 资源调度 并行计算
从本地部署到企业级服务:十种主流LLM推理框架的技术介绍与对比
本文深入探讨了十种主流的大语言模型(LLM)服务引擎和工具,涵盖从轻量级本地部署到高性能企业级解决方案,详细分析了它们的技术特点、优势及局限性,旨在为研究人员和工程团队提供适合不同应用场景的技术方案。内容涉及WebLLM、LM Studio、Ollama、vLLM、LightLLM、OpenLLM、HuggingFace TGI、GPT4ALL、llama.cpp及Triton Inference Server与TensorRT-LLM等。
83 7
|
1月前
|
自然语言处理 开发者
多模态大模型LLM、MLLM性能评估方法
针对多模态大模型(LLM)和多语言大模型(MLLM)的性能评估,本文介绍了多种关键方法和标准,包括模态融合率(MIR)、多模态大语言模型综合评估基准(MME)、CheckList评估方法、多模态增益(MG)和多模态泄露(ML),以及LLaVA Bench。这些方法为评估模型的多模态和多语言能力提供了全面的框架,有助于研究者和开发者优化和改进模型。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
大模型强崩溃!Meta新作:合成数据有剧毒,1%即成LLM杀手
在人工智能领域,大型语言模型(LLMs)的快速发展令人瞩目,但递归生成数据可能导致“模型崩溃”。Meta的研究揭示,模型在训练过程中会逐渐遗忘低概率事件,导致数据分布偏差。即使少量合成数据(如1%)也会显著影响模型性能,最终导致崩溃。研究强调保留原始数据的重要性,并提出社区合作和技术手段来区分合成数据和真实数据。论文地址:https://www.nature.com/articles/s41586-024-07566-y
69 2
|
1月前
|
人工智能 自然语言处理 算法
政务培训|LLM大模型在政府/公共卫生系统的应用
本课程是TsingtaoAI公司面向某卫生统计部门的政府职员设计的大模型技术应用课程,旨在系统讲解大语言模型(LLM)的前沿应用及其在政府业务中的实践落地。课程涵盖从LLM基础知识到智能化办公、数据处理、报告生成、智能问答系统构建等多个模块,全面解析大模型在卫生统计数据分析、报告撰写和决策支持等环节中的赋能价值。
58 2
|
2月前
|
存储 人工智能 前端开发
前端大模型应用笔记(三):Vue3+Antdv+transformers+本地模型实现浏览器端侧增强搜索
本文介绍了一个纯前端实现的增强列表搜索应用,通过使用Transformer模型,实现了更智能的搜索功能,如使用“番茄”可以搜索到“西红柿”。项目基于Vue3和Ant Design Vue,使用了Xenova的bge-base-zh-v1.5模型。文章详细介绍了从环境搭建、数据准备到具体实现的全过程,并展示了实际效果和待改进点。
169 2
|
1月前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
114 2
|
2月前
|
机器学习/深度学习 人工智能 运维
企业内训|LLM大模型在服务器和IT网络运维中的应用-某日企IT运维部门
本课程是为某在华日资企业集团的IT运维部门专门定制开发的企业培训课程,本课程旨在深入探讨大型语言模型(LLM)在服务器及IT网络运维中的应用,结合当前技术趋势与行业需求,帮助学员掌握LLM如何为运维工作赋能。通过系统的理论讲解与实践操作,学员将了解LLM的基本知识、模型架构及其在实际运维场景中的应用,如日志分析、故障诊断、网络安全与性能优化等。
84 2

热门文章

最新文章