Gradient 由 Google、Netflix 和 Splunk 的 AI 团队前负责人创立,致力于帮助企业创建高性能、经济高效的定制 AI 应用程序。Gradient 为企业提供了一个可以构建、自定义和部署定制 AI 解决方案的平台,帮助企业利用 Accelerator Block 以最快的方式开发 AI。
Gradient Accelerator Block 是专为 AI 使用案例设计的、完全托管的综合构建块,可减少开发者的工作量,帮助企业在极短的时间内实现目标。每个块都可以按原样使用(例如实体提取、文档摘要等),也可以组合使用,以创建更强大、更复杂的解决方案(例如投资自动驾驶、客户聊天机器人等),并且这些解决方案无需大量代码,使用同类最佳技术,可提供一流的性能。
Gradient 最新的 Accelerator Block 专注于通过检索增强生成 (RAG) 来提高模型的性能和准确性。Accelerator Block 不仅使用了 Gradient 先进的 LLM 和嵌入功能,还整合了 MongoDB Atlas Vector Search与 LlamaIndex,前者用于存储、索引和检索高维向量数据,后者则用于数据集成。
Atlas Vector Search 和 LlamaIndex 可共同为基础模型实时提供最新的企业专有数据。Gradient 设计的 Accelerator Block for RAG 无需基础设施和设置,亦无需用户深入了解检索架构,可将开发速度提升高达 10 倍。它还整合了文档分块、重新排序和高级检索策略方面的最佳实践。
正如 Gradient 工程副总裁 Tiffany Peng 解释的那样:“想要构建定制 AI 应用程序的用户可以利用 Gradient 的 Accelerator Block for RAG 在几秒钟内设置 RAG。用户只需将数据上传到我们的 UI,剩下的交给 Gradient。这样,用户就可以利用 RAG 的所有优点,而无需编写任何代码或担心设置问题。”
Gradient 工程副总裁 Tiffany Peng
想要构建定制 AI 应用程序的用户可以利用 Gradient 的 Accelerator Block for RAG 在几秒钟内设置 RAG。用户只需将数据上传到我们的 UI,剩下的交给 Gradient。这样,用户就可以利用 RAG 的所有优点,而无需编写任何代码或担心设置问题。
借助 MongoDB,开发者可以存储任何结构的数据,然后使用单一查询 API 和驱动程序将这些数据用于 OLTP、文本搜索和向量搜索处理。通过这种统一,开发者就拥有了他们需要的核心数据服务,来构建依赖于实时运行数据的 AI 应用程序。例如,跨关键字和向量搜索应用程序的查询可以过滤元数据,并融合结果集,以快速识别和返回所需的具体上下文,以便模型生成可靠、准确的输出。其他系统很难做到这一点。这是因为开发者必须面对将独立的向量数据库连接到单独的 OLTP 数据库和搜索引擎时的复杂性,还要让这些单独的系统保持同步。
提供进一步的定制服务和行业优势
在Gradient的平台上,除了充分利用 Gradient Accelerator Block 的优势,企业还可以根据自己的需要进一步构建、定制和部署 AI。
Gradient 与 AI 生态系统中的主要供应商和社区合作,为开发者和企业提供一流的技术。包括 Llama-2 和 Mistral LLM(即将推出更多选项)以及 BGE 嵌入模型和 Langchain、LlamaIndex 和 Haystack 框架。MongoDB Atlas 是 Gradient 平台中可用堆栈的核心部分。
虽然任何企业都可以利用其平台,但 Gradient 专为金融服务和医疗保健打造的模型为这些领域的企业带来了独特的优势。例如,在金融服务领域,Gradient 模型通常用于风险管理、KYC、反洗钱 (AML) 和机器人顾问以及预测和分析等场景。在医疗保健领域,Gradient 使用案例包括筛查前和就诊后总结、临床研究、计费、福利金和报销审核。
金融服务和医疗保健的共同点是,这两个行业都受到全面监管,且用户隐私是监管的关键所在。凭借 Gradient 及其先进的开源大语言模型 (LLM) 和嵌入模型,企业可保持对其数据和 AI 系统的完全所有权。开发者可以在 Gradient 的 AI 云上运行的私有环境中训练、调整和部署他们的模型,该公司声称,模型的性能比基础模型高出 7 倍,而成本却仅为超大规模云提供商的十分之一。