大语言模型 LLM 管理功能特点解析

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介: 大语言模型领域正快速发展,涵盖技术革新、跨领域应用及行业影响。随着技术进步,更多创新性AI应用和服务涌现。Botnow加速迭代AI应用开发平台,赋能各行各业。新发布的模型管理功能包括模型仓库和模型服务,支持模型文件托管、部署及推理服务,提升使用效率,降低成本。模型服务具备本地推理和接入外部模型的能力,满足中大型企业对大语言模型自主可控的需求。

大语言模型领域正处于快速发展阶段,涉及技术革新、跨领域应用以及行业影响等多个方面。随着技术的进步,我们预计会看到更多创新性的AI应用和服务涌现出来。为此,Botnow 正在加速迭代 AI 应用开发平台,赋能千行百业的 AI 应用落地。


近日,Botnow 正式发布模型管理功能,包含模型仓库和模型服务两部分:


模型仓库


模型仓库支持模型文件托管,用户可以通过上传本地模型文件,也可以从魔搭(ModelScope)或HuggingFace上拉群模型文件并保存在模型仓库,模型仓库帮助用户免去了频繁下载远程模型文件,节省了运维和资源成本,提升了用户使用大语言模型的效率,同时方便用户将大语言模型部署并发布模型推理服务,供业务中使用。


下面让我们详细了解一下模型仓库的功能特点:

新增模型

左侧菜单选择“模型管理” -> “模型仓库”,点击“创建模型”,即可进行新增模型操作。平台支持模型来源包括:魔搭社区、Hugging Face、本地模型



新建完成后,点击”确定“,即可保存模型信息。

  • 魔搭社区:需要录入模型文件的地址以及对应的分支。当创建完成时,平台会自动根据填写的模型地址、分支自动获取模型文件。
  • Hugging Face:需要录入模型文件的地址、对应的分支,以及 Token(非必填)。当创建完成时,平台会自动根据填写的模型地址、分支自动获取模型文件。
  • 本地模型:需要上传本地文件。当创建完成时,需要您手动上传本地模型文件。


模型详情


用户可在模型详情页面查看模型介绍以及模型文件:




其他功能


  • 模型部署。在模型列表以及详情页面中,支持本地模型快捷部署操作,点击“部署”按钮,即可跳转至 “模型服务 / 新增模型服务” 页面。
  • 编辑模型。支持编辑模型基本信息与接入信息。
  • 模型文件管理。如果是模型来源是本地模型,在详情页面中,支持对模型文件进行管理操作,包含:上传文件、删除文件。
  • 删除模型仓库


模型服务


模型服务具备本地模型推理和接入外部模型的能力。本地模型推理服务旨在为用户提供开箱即用的模型推理加速引擎,它大幅降低大型模型的部署成本,本地模型推理服务具备简单易用、易于扩展、性能优化等特点,并支持Llama系列模型、Qwen、Embedding、Reranking模型等。外部模型服务支持无缝接入第三方模型服务API,支持Qwen、Moonshot、OpenAI、Gemini、Zhipu、DeepSeek等第三方模型服务。


新增模型服务

进入模型服务页面,点击 “新增模型服务” 按钮,进入新增模型服务页面。新增模型服务时 ,需要填写服务基本信息,以及选择模型来源,来源包括:本地模型、外部模型。


本地模型推理服务部署

部署本地模型服务时,需要配置的内容如下:


  • 选择要部署的模型文件
  • 配置服务规格:配置服务规格时,支持选择指定的节点。



  • 高级配置:模型推理服务支持 vLLM 推理加速和分布式多 GPU 调度能力



接入外部模型服务


部署本地模型服务时,需要配置的内容如下:

  • 输入模型服务名称,例如 “OpenAI”。
  • 输入模型服务别名,例如 “OpenAI GPT-4o 模型服务”。
  • 模型来源选择 “外部模型”
  • 填写描述,例如 “OpenAI GPT-4o 模型服务”。
  • 选择模型服务供应商



  • 填写对应的 Token
  • 完成填写后,点击【确定】按钮,即可完成创建操作。


模型服务详情


点击模型服务卡片,可进入模型服务详情页面,查看模型服务详情。


  • 外部模型服务



  • 本地模型服务


其他功能

  • 上线 / 下线(仅本地模型服务支持)。本地模型服务部署成功后,支持上线 / 下线操作。下线之后,将停止提供服务
  • 编辑模型服务。本地模型服务支持编辑模型以及服务规格;外部模型服务支持编辑基本信息以及外部服务配置。
  • 删除模型服务


应用场景


中大型企业大多要求对大语言模型自主可控,主要体现在两方面的使用场景:


  • 接入第三方大模型服务的API,这类场景一般是数据不敏感的业务,且对模型回答的质量有较高的要求,是一般开源大模型或微调大模型无法达到的效果。
  • 本地部署开源模型或经微调后的模型,这类场景企业基本可以实现端到端的管理大模型,从模型文件的管理 -> 模型部署推理 -> 接入智能体 Bot -> AI 加持的业务上线运营 -> 产生效益。这是企业落地大模型较理想的形态,兼具了成本和自主可控的特点。


Botnow 模型管理能力的推出,加上 Botnow 已具备的强大的智能体编排能力,能较好得满足上述企业用户的需求和使用场景。

相关文章
|
14天前
|
数据可视化 数据挖掘 BI
团队管理者必读:高效看板类协同软件的功能解析
在现代职场中,团队协作的效率直接影响项目成败。看板类协同软件通过可视化界面,帮助团队清晰规划任务、追踪进度,提高协作效率。本文介绍看板类软件的优势,并推荐五款优质工具:板栗看板、Trello、Monday.com、ClickUp 和 Asana,助力团队实现高效管理。
39 2
|
2月前
|
人工智能 自然语言处理 前端开发
基于RAG和LLM的水利知识大语言模型系统开发有感
在数字化时代,水利行业的智能化管理尤为重要。本文介绍了基于大语言模型(LLM)和检索增强生成(RAG)技术的水利知识问答系统的开发过程。该系统结合了前沿AI技术和水利专业知识,通过构建全面的水利知识库,优化用户体验,确保系统的灵活性和可扩展性。项目展示了AI技术在垂直领域的巨大潜力,为水利行业的智能化发展贡献力量。
|
6天前
|
设计模式 XML Java
【23种设计模式·全精解析 | 自定义Spring框架篇】Spring核心源码分析+自定义Spring的IOC功能,依赖注入功能
本文详细介绍了Spring框架的核心功能,并通过手写自定义Spring框架的方式,深入理解了Spring的IOC(控制反转)和DI(依赖注入)功能,并且学会实际运用设计模式到真实开发中。
【23种设计模式·全精解析 | 自定义Spring框架篇】Spring核心源码分析+自定义Spring的IOC功能,依赖注入功能
|
17天前
|
开发框架 人工智能 安全
Promptic:轻量级 LLM 应用开发框架,提供完善的底层功能,使开发者更专注于构建上层功能
Promptic 是一个轻量级的 LLM 应用开发框架,支持通过一行代码切换不同的 LLM 服务提供商。它提供了类型安全的输出、流式支持、内置对话记忆、错误处理和重试等功能,帮助开发者专注于构建功能,而不是底层的复杂性。
56 6
Promptic:轻量级 LLM 应用开发框架,提供完善的底层功能,使开发者更专注于构建上层功能
|
1月前
|
安全 Java 测试技术
🎉Java零基础:全面解析枚举的强大功能
【10月更文挑战第19天】本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
121 60
|
10天前
|
小程序 安全 搜索推荐
陪玩小程序的搭建解析与功能需求
陪玩小程序是为玩家提供专业陪玩服务的应用,嵌入社交或游戏平台,具备智能匹配、实时聊天、预约服务等功能,支持便捷高效的游戏体验。源码交付时需提供详细文档、技术支持及定制开发服务,确保客户能顺利维护和升级。选择陪玩小程序时应关注功能需求、用户体验、安全性和成本效益,以确保最佳使用效果。
36 0
|
1月前
|
人工智能 自然语言处理 物联网
LLM2CLIP:使用大语言模型提升CLIP的文本处理,提高长文本理解和跨语言能力
LLM2CLIP 为多模态学习提供了一种新的范式,通过整合 LLM 的强大功能来增强 CLIP 模型。
68 3
LLM2CLIP:使用大语言模型提升CLIP的文本处理,提高长文本理解和跨语言能力
|
27天前
|
存储 安全 数据安全/隐私保护
深入解析iOS 14隐私保护功能:用户数据安全的新里程碑
随着数字时代的到来,个人隐私保护成为全球关注的焦点。苹果公司在最新的iOS 14系统中引入了一系列创新的隐私保护功能,旨在为用户提供更透明的数据使用信息和更强的控制权。本文将深入探讨iOS 14中的几项关键隐私功能,包括App跟踪透明性、简化的隐私设置以及增强的系统安全性,分析它们如何共同作用以提升用户的隐私保护水平。
80 3
|
1月前
|
机器学习/深度学习 存储 人工智能
政务部门人工智能OCR智能化升级:3大技术架构与4项核心功能解析
本项目针对政务服务数字化需求,建设智能文档处理平台,利用OCR、信息抽取和深度学习技术,实现文件自动解析、分类、比对与审核,提升效率与准确性。平台强调本地部署,确保数据安全,解决低质量扫描件、复杂表格等痛点,降低人工成本与错误率,助力智慧政务发展。
|
2月前
|
Web App开发 前端开发 测试技术
Selenium 4新特性解析:关联定位器及其他创新功能
【10月更文挑战第6天】Selenium 是一个强大的自动化测试工具,广泛用于Web应用程序的测试。随着Selenium 4的发布,它引入了许多新特性和改进,使得编写和维护自动化脚本变得更加容易。本文将深入探讨Selenium 4的一些关键新特性,特别是关联定位器(Relative Locators),以及其他一些重要的创新功能。
247 2

热门文章

最新文章

推荐镜像

更多