deepseek4j 是什么
deepseek4j(https://github.com/pig-mesh/deepseek4j) 是一个专为 Java 开发者打造的 DeepSeek 模型集成框架。通过优雅的 API 设计,只需一行代码,即可实现接入 DeepSeek,并获得以下核心能力:
- 完整思维链保留:完美保留 DeepSeek 模型的推理过程,让 AI 的思考过程可追溯
- 流式输出体验:基于 Reactor 实现的流式响应,带来类 ChatGPT 的打字机效果
// 流式输出,完整保留思维链
@GetMapping(value = "/chat", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public Flux<ChatCompletionResponse> chat(String prompt) {
return deepSeekClient.chatFluxCompletion(prompt);
}
使用 deepseek4j,您可以专注于业务逻辑开发,而无需关心底层细节。
一、v1.3 更新内容
1.1 联网搜索支持
1739118403
新版本最重要的更新是引入了联网搜索能力,这一功能带来三个关键优势:
- 突破时间边界:模型不再受限于预训练数据的时间范围,可以获取和处理最新信息
- 实时信息获取:通过高质量信息源获取实时资讯,提供更精准的问答服务
- 差异化竞争:在大模型同质化严重的当下,联网搜索成为关键的差异化竞争点
@GetMapping(value = "/chat", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public Flux<ChatCompletionResponse> chat(String prompt) {
// 指定联网搜索参数
SearchRequest searchRequest = SearchRequest.builder()
.enable(true)
.freshness(FreshnessEnums.ONE_DAY)// 一天内的数据
.summary(true) // 返回摘要
.count(10) // 返回10条
.page(1) // 第一页
.build();
return deepSeekClient.chatSearchCompletion(prompt,searchRequest);
}
1.2 智能系统提示词
1739118117
系统提示词(System Prompt)是基于模型开发的应用程序内置的指令,让决定了模型在特定上下文中的表现方式、回答风格和功能范围。
为了解决部分渠道模型部署时推理能力不稳定的问题,新版本引入了与 DeepSeek R1 官方版本一致的系统提示词功能:
- 通过精心设计的提示词模板,确保模型输出的一致性和可靠性
- 内置多层级的提示词优化策略,显著提升推理质量
详细可参考:https://raw.githubusercontent.com/pig-mesh/deepseek4j/refs/heads/main/deepseek-spring-boot-starter/src/main/resources/prompts/system.pt
1.3 多渠道整合
新版本显著扩展了支持的渠道范围:
支持平台 | 说明 |
Deepseek4j 接入本地 R1 | 基于 Ollama 的本地部署方案 |
Deepseek4j 接入腾讯 R1 | 腾讯云 AI 平台 |
Deepseek4j 接入硅基流动 R1 | 硅基流动 AI 平台 |
Deepseek4j 接入火山引擎 R1 | 字节火山引擎 |
Deepseek4j 接入 GiteeAI R1 | Gitee AI 平台 |
Deepseek4j 接入阿里 R1 | 阿里云通义千问 |
每个平台的参数获取,具体配置方式请参考:https://javaai.pig4cloud.com/deepseek
1.4 增强的 SSE 调试功能
针对非标准平台,新增了智能化的调试功能:
- 自动处理<think>标签内容
- 智能提取reason_content
- 优化多轮对话的 token 占用
1738864340
二、文档页上线
详细的使用文档已上线:DeepSeek4j 官方文档
https://javaai.pig4cloud.com/deepseek
1739117249
三、未来规划
1739119336
在快速落地大模型应用的过程中,传统方案面临两难选择:Higress、Kong 等 AI Gateway 虽然提供了 API 网关能力,但其复杂的架构和运维成本严重阻碍了快速集成;而 LangChain、Spring AI 等框架虽定位 SDK 层,却未在稳定性保障机制上进行深度设计。
针对当前 DeepSeek-R1 在国内火爆但服务不稳定的现状,计划引入以下特性:
- 轻量级多 API Key 轮询机制,SDK 层面自动切换可用节点
- 基于 Resilience4j 实现请求级熔断降级,确保单用户故障隔离
- 智能流量调度策略,结合 Token 消耗速率动态调整路由
该方案既避免了传统网关的沉重架构,又弥补了现有 AI SDK 在稳定性方面的缺失。