Spring AI 实战|Spring AI入门之DeepSeek调用

简介: 本文介绍了Spring AI框架如何帮助Java开发者轻松集成和使用大模型API。文章从Spring AI的初探开始,探讨了其核心能力及应用场景,包括手动与自动发起请求、流式响应实现打字机效果,以及兼容不同AI服务(如DeepSeek、通义千问)的方法。同时,还详细讲解了如何在生产环境中添加监控以优化性能和成本管理。通过Spring AI,开发者可以简化大模型调用流程,降低复杂度,为企业智能应用开发提供强大支持。最后,文章展望了Spring AI在未来AI时代的重要作用,鼓励开发者积极拥抱这一技术变革。

引言:当Spring遇上AI,会擦出怎样的火花?

作为一名Java开发者,是否曾经眼红Python阵营那些花里胡哨的AI应用?是否在对接各种大模型API时,被五花八门的接口规范搞得头大?好消息是,Spring家族的新成员——Spring AI,正在用Java开发者最熟悉的方式,为我们打开AI应用开发的新世界大门。


一、Spring AI初探 - 你的AI管家

1.1 为什么需要Spring AI?

场景假设

  • 你的老板说:"我们要做个智能客服,先用OpenAI,下个月换Claude,年底可能用Gemini..."
  • 产品经理要求:"这个AI回答要能直接转成我们的领域对象"
  • 运维大哥抱怨:"AI调用太慢了,能不能给个监控看板?"

解决方案

将Spring AI框架集成到应用当中,它是一个专注于AI工程的应用框架;旨在将Spring生态的设计原则(如可移植性、模块化)引入AI领域,简化企业数据或者API服务与大模型的集成,将大模型的调用通过普通Java对象来封装,降低开发复杂度‌,从而高效构建企业智能应用。

// 不管底层是哪个AI服务,调用方式都一样
String joke = aiClient.generate("讲个程序员笑话");

1.2 核心能力

二、实战DeepSeek - 从手动到自动

2.1 手动执行请求

API-KEY的获取

进入DeepSeek开放平台 https://platform.deepseek.com/usage,完成账号的注册与充值(开发学习时可以少充一点费用),点击 API keys创建个人专属API key 并保存下来。

curl手动执行

填写上正确的Key后执行curl发起Http请求,快速得到响应结果。

curl https://api.deepseek.com/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer <DeepSeek API Key>" \
  -d '{
        "model": "deepseek-chat",
        "messages": [
          {"role": "system", "content": "You are a helpful assistant."},
          {"role": "user", "content": "讲一个笑话"}
        ],
        "stream": false
      }'
{
  "id": "0e8dd4b9-694e-417b-888a-7be54a77633f",
  "object": "chat.completion",
  "created": 1742744584,
  "model": "deepseek-chat",
  "choices":
  [
    {
      "index": 0,
      "message":
      {
        "role": "assistant",
        "content": "当然!这是一个经典的笑话:\n\n有一天,小明去面试。面试官问他:“你有什么特长吗?”\n\n小明想了想,认真地说:“我会预测未来。”\n\n面试官笑了笑:“那你预测一下,你什么时候能被录用?”\n\n小明淡定地回答:“这个嘛……我预测我不会被录用。”\n\n面试官愣了一下,笑着说:“你被录用了!我们需要你这样的人才!”\n\n😄"
      },
      "logprobs": null,
      "finish_reason": "stop"
    }
  ],
  "usage":
  {
    "prompt_tokens": 12,
    "completion_tokens": 74,
    "total_tokens": 86,
    "prompt_tokens_details":
    {
      "cached_tokens": 0
    },
    "prompt_cache_hit_tokens": 0,
    "prompt_cache_miss_tokens": 12
  },
  "system_fingerprint": "fp_3a5770e1b4_prod0225"
}

返回数据以JSON格式,解析格式中的content内容得到为大模型给我们讲的笑话。

2.2 代码自动发起

创建第一个Spring AI工程

访问 https://start.spring.io/按截图所示勾选依赖,生成代码框架。

Spring Boot 3.x

JDK 17+

spring-ai-openai-starter(是的,它能兼容DeepSeek)

将生成的代码导入到IDEA中,启动应用。

很遗憾,竟然没有启动起来,出现一个OpenAI API key must be set. Use the connection property: spring.ai.openai.api-key or spring.ai.openai.chat.api-key property的错误。

很明显是没有配置对应的API key,打开application.properties进入参数配置后发现启动成功。

配置application.properties

spring.application.name=hello

spring.ai.openai.api-key=换成个人的DeepSeek API key

spring.ai.openai.base-url=https://api.deepseek.com

spring.ai.openai.chat.options.model=deepseek-chat

编写Controller

@RestController
publicclassHelloController {

    private ChatClient chatClient;

    publicHelloController(ChatClient.Builder builder){
        this.chatClient = builder.build();
    }
    @GetMapping("/hello")
    public String hello(@RequestParam(value = "input", defaultValue = "讲一个笑话") String input){

        return chatClient.prompt(input).call().content();

    }
}

打开浏览器访问 http://localhost:8080/hello得到结果。

三、流式响应-打字机效果

3.1 Reactor初体验

通常大模型的响应耗时较长,为了优化用户体验,ChatGPT等厂商纷纷采用流式输出;我们可以通过Reactor框架来实现,它是一个响应式编程库,提供构建异步和非阻塞应用程序的能力。

private ExecutorService executor = new ThreadPoolExecutor(1, 1, 0L, TimeUnit.MICROSECONDS, new LinkedBlockingQueue<>(10));

@GetMapping(value = "/mock/stream", produces = "text/html;charset=UTF-8")
public Flux<String> mockStream(){

    Sinks.Many<String> sink = Sinks.many().multicast().onBackpressureBuffer();

    executor.submit(() -> {
        for (int i = 0; i < 100; i++) {

            sink.tryEmitNext(i + " ");
            try {
                Thread.sleep(100);
            } catch (InterruptedException e) {
                thrownew RuntimeException(e);
            }
        }
    });

    return sink.asFlux();
}

Sinks.Many 用于创建多值(Multi-Value)的发布者(Publisher)的一种机制,它允许用户将数据从一个地方发送到多个订阅者,示例中启动异步线程做写入操作,通过asFlux获取Flux对象;启动看效果:

3.2 大模型的流式输出

@GetMapping(value = "/hello/stream", produces = "text/html;charset=UTF-8")
    public Flux<String> helloStream(@RequestParam(value = "input", defaultValue = "讲一个笑话") String input){

        return chatClient.prompt(input).stream().content();

    }

把前面的call方法修改为stream即可,最终返回一个Flux对象,搞定流式输出~

四、OpenAI的starter兼容DeepSeek?

DeepSeek

观察pom.xml文件发现配置的是spring-ai-openai-starter却配置DeepSeek的URL,是不是觉得有点魔幻?

<dependency>
  <groupId>org.springframework.ai</groupId>
  <artifactId>spring-ai-openai-spring-boot-starter</artifactId>
</dependency>

其实这是Spring AI的"障眼法":

1.OpenAI的API规范已成为事实标准;

2.DeepSeek等国内服务兼容这套规范;

3.Spring AI利用"可移植API"设计,实现一套代码多处使用;

就像JDBC驱动可以连接不同数据库,Spring AI的客户端也能适配不同AI服务。

通义千问

类似的,阿里系通义大模型也同样适用OpenAI这套访问规范。

https://bailian.console.aliyun.com/?tab=model#/api-key创建个人专属API-KEY(有免费的额度)。

application.properties修改配置:

spring.ai.openai.api-key=sk-xxx

spring.ai.openai.base-url=https://dashscope.aliyuncs.com/compatible-mode
# 指定模型
spring.ai.openai.chat.options.model=qwen-plus

五、生产环境必备 - 给你的AI装上监控

老板问:"AI花了多少钱?效果怎么样?" ,不用慌,可以通过监控来解决。

添加监控依赖

<dependency>
  <groupId>org.springframework.boot</groupId>
  <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
  <groupId>io.micrometer</groupId>
  <artifactId>micrometer-registry-prometheus</artifactId>
</dependency>

启动监控

management.endpoints.web.exposure.include=health,metrics,prometheus
spring.ai.observability.enabled=true

访问/actuator/prometheus,将看到:(如果配合grafana可视化效果会更加直观)。

结语:未来以来

Spring AI的出现,为Java开发者提供一整套大模型应用研发基础底座,为众多Java生态企业级的应用迈向AI领域开辟一条航向; AI时代已然到来,让我们一起扬帆起航~~~



来源  |  阿里云开发者公众号

作者  |  布乙

相关文章
|
4月前
|
人工智能 Java Nacos
基于 Spring AI Alibaba + Nacos 的分布式 Multi-Agent 构建指南
本文将针对 Spring AI Alibaba + Nacos 的分布式多智能体构建方案展开介绍,同时结合 Demo 说明快速开发方法与实际效果。
3555 74
|
4月前
|
人工智能 测试技术 API
构建AI智能体:二、DeepSeek的Ollama部署FastAPI封装调用
本文介绍如何通过Ollama本地部署DeepSeek大模型,结合FastAPI实现API接口调用。涵盖Ollama安装、路径迁移、模型下载运行及REST API封装全过程,助力快速构建可扩展的AI应用服务。
1286 6
|
4月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
5653 80
|
4月前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
780 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
|
4月前
|
存储 人工智能 JSON
揭秘 Claude Code:AI 编程入门、原理和实现,以及免费替代 iFlow CLI
本文面向对 AI Coding 感兴趣的朋友介绍 Claude Code。通过此次分享,可以让没有体验过的快速体验,体验过的稍微理解其原理,以便后续更好地使用。
1954 18
揭秘 Claude Code:AI 编程入门、原理和实现,以及免费替代 iFlow CLI
|
4月前
|
存储 人工智能 搜索推荐
LangGraph 记忆系统实战:反馈循环 + 动态 Prompt 让 AI 持续学习
本文介绍基于LangGraph构建的双层记忆系统,通过短期与长期记忆协同,实现AI代理的持续学习。短期记忆管理会话内上下文,长期记忆跨会话存储用户偏好与决策,结合人机协作反馈循环,动态更新提示词,使代理具备个性化响应与行为进化能力。
802 10
LangGraph 记忆系统实战:反馈循环 + 动态 Prompt 让 AI 持续学习
|
4月前
|
人工智能 IDE 开发工具
从6人日到1人日:一次AI驱动的客户端需求开发实战
从6人日到1人日:一次AI驱动的客户端需求开发实战
从6人日到1人日:一次AI驱动的客户端需求开发实战
|
4月前
|
数据采集 人工智能 JSON
Prompt 工程实战:如何让 AI 生成高质量的 aiohttp 异步爬虫代码
Prompt 工程实战:如何让 AI 生成高质量的 aiohttp 异步爬虫代码

热门文章

最新文章