【AI应用开发】基于DeepSeek API的流式对话系统实现：Spring Boot+React打造实时响应体验

06-01 1250阅读

🔥 本文深入讲解如何为DeepSeek AI对话系统增加流式输出功能，在V1版本基础上进行升级完善。完整展示Spring Boot后端和React前端的流式数据处理，呈现一个近乎实时的AI对话体验！

V1版本没看的小伙伴移步请移步：

【实战教程】零基础搭建DeepSeek大模型聊天系统 - Spring Boot+React完整开发指南

📚博主匠心之作，强推专栏：

JAVA集合专栏【夜话集】
JVM知识专栏
数据库sql理论与实战【博主踩坑之道】
小游戏开发【博主强推匠心之作拿来即用无门槛】

文章目录
- - 项目介绍
  - 流式输出功能剖析
  - - 流式输出的核心原理
    - 后端流式处理实现
    - - 1. 扩展数据模型支持流式响应
      - 2. 流式数据处理核心实现
      - 3. 格式完整性保障
      - 4. 服务器发送事件（SSE）接口
      - 前端流式处理实现
      - 1. 使用EventSource建立SSE连接
        2. Markdown格式修复
        3. 流式内容的动态更新
        用户界面优化
        1. 增加显示宽度适合文档输出
        2. 增加消息区域高度
        3. 添加自定义滚动条样式
        4. 优化的响应式布局
        5. 流式/非流式模式切换
        项目运行效果
        1. 非流式输出效果
        2. 流式输出短文本效果
        3. 流式输出长文本效果
        核心挑战与解决方案
        1. Markdown格式破碎问题
        2. 内容分段策略
        3. 流式连接管理
        技术亮点总结
        项目拓展方向
        源码下载
        写在最后
        💌 与博主互动 & 技术支持
        🤝 专业服务
        项目介绍
        
        在AI大模型时代，拥有一个流畅的AI对话助手至关重要。上周我们分享了DeepSeek AI对话系统的V1版本，实现了基础的问答功能。然而，用户反馈表明，他们期望更加流畅的对话体验，就像与真人交流那样实时。
        
        为此，我们推出了V2版本，核心亮点是：
        
        ✨ 流式输出功能：实时显示AI回答过程，让用户无需等待完整回复
        🎯 增强的Markdown格式处理：修复格式问题，确保内容展示美观
        🖼️ 优化的用户界面：更宽的显示区域，优化的滚动条，适合长篇技术解答
        🔄 智能分段策略：通过语义边界和格式完整性判断，优化内容传输
        V2版本大幅提升了用户体验，让AI对话感觉更像与真人交流，而非机械问答。
        
        流式输出功能剖析
        
        流式输出的核心原理
        
        传统的API请求-响应模式下，客户端发送请求后需要等待服务器处理完毕并返回完整响应。这在AI大模型生成长文本时会导致明显的等待时间，影响用户体验。
        
        流式输出（Streaming）采用了不同的方式：
        
        客户端发送请求给服务器
        服务器与AI模型建立连接并开始获取生成内容
        关键点：服务器不等待完整内容生成，而是边接收边推送给客户端
        客户端实时展示接收到的内容片段，营造"打字效果"
        这种方式让用户立即看到部分回答，大幅减少了等待心理，极大提升用户体验。
        
        后端流式处理实现
        
        1. 扩展数据模型支持流式响应
        
        首先，在DeepSeeekResponse.java中添加了Delta类，专门用于处理流式输出：
        
        @Data @Builder public static class Delta { /** * 增量内容 */ private String content; /** * 角色 */ private String role; }
        
        这个类处理来自DeepSeek API的增量内容，使我们能够逐段接收并处理数据。
        
        2. 流式数据处理核心实现
        
        在DeepSeekClient02.java中，我们实现了多项关键优化：
        
        // 设置流式输出参数 private static final int BUFFER_SIZE = 16384; // 16KB private static final int MAX_CONTENT_BUFFER = 800; // 超过800字符触发发送 private static final long MAX_EMIT_INTERVAL = 300; // 最大发送间隔，单位毫秒 // 使用BufferedSource进行流式读取，而不是一次性获取整个响应 BufferedSource source = response.body().source(); StringBuilder lineBuilder = new StringBuilder(); StringBuilder contentBuffer = new StringBuilder();
        
        核心流程包括：
        
        高效缓冲区管理：使用16KB的缓冲区减少系统调用
        智能分段策略：通过正则表达式检测句子边界和Markdown格式完整性
        定时发送机制：即使未检测到自然分段点，也会每300毫秒发送一次内容
        内容累积：将接收到的内容片段智能累积，确保发送的是有意义的单元
        3. 格式完整性保障
        
        流式输出的一大挑战是Markdown格式可能在分段过程中被破坏。例如，**加粗文本**可能被分为**加粗和文本**两部分发送，导致格式错误。
        
        我们实现了复杂的检测和修复机制：
        
        /** * 检查文本是否包含不完整的Markdown标记 */ private boolean hasIncompleteMarkdown(String text) { // 检查不完整的标题 if (INCOMPLETE_HEADING.matcher(text).find()) { return true; } // 检查不完整的加粗标记 int boldCount = 0; int index = -1; while ((index = text.indexOf("**", index + 1)) >= 0) { boldCount++; } if (boldCount % 2 != 0) { return true; } // 更多格式检查... }
        
        4. 服务器发送事件（SSE）接口
        
        在控制器层，我们添加了专门的流式输出接口：
        
        @RequestMapping(value = "/ask/stream", method = RequestMethod.POST) public SseEmitter streamAsk(@RequestBody AskParam askParam) { // 创建SseEmitter，设置超时时间为5分钟 SseEmitter emitter = new SseEmitter(TimeUnit.MINUTES.toMillis(5)); try { // 发送初始连接成功事件 emitter.send(SseEmitter.event() .name("connected") .data("连接成功")); // 使用DeepSeekClient02的流式处理功能 new DeepSeekClient02().getResponse(DeepSeekClient02.API_KEY, askParam.getAskInfo(), true, emitter); } catch (Exception e) { // 错误处理 } return emitter; }
        
        前端流式处理实现
        
        1. 使用EventSource建立SSE连接
        
        askQuestionStream: ( question: string, onChunkCallback: (message: string) => void, onErrorCallback: (error: string) => void, onCompleteCallback: () => void ): () => void => { const eventSource = new EventSource( `${API_BASE_URL}/deepseek/ask/stream?askInfo=${encodeURIComponent(question)}` ); // 设置超时处理、事件监听等... }
        
        2. Markdown格式修复
        
        前端实现了fixStreamingMarkdown函数，处理可能的格式问题：
        
        const fixStreamingMarkdown = (existingContent: string, newChunk: string): string => { let combinedContent = existingContent + newChunk; // 修复标题后缺少空格的问题 // 例如: "#Java" => "# Java" combinedContent = combinedContent.replace(/^(#+)([^#\s])/gm, '$1 $2'); // 修复二级标题格式问题 combinedContent = combinedContent.replace(/# #/g, '##'); // 修复加粗格式问题 combinedContent = combinedContent.replace(/\* \*/g, '**'); // 更多格式修复... return combinedContent; };
        
        3. 流式内容的动态更新
        
        在用户发送消息后，创建一个空的机器人消息，然后通过状态更新逐步填充内容：
        
        // 创建一个新的机器人消息，内容初始为空 const botMessageId = (Date.now() + 1).toString(); botMessageIdRef.current = botMessageId; const botMessage: MessageType = { id: botMessageId, content: '', sender: 'bot', timestamp: new Date().toISOString(), }; setMessages((prev) => [...prev, botMessage]); // 使用流式API eventSourceRef.current = deepSeekService.askQuestionStream( question, // 接收消息分段处理 (contentChunk) => { // 应用Markdown修复，然后累积内容 const fixedContent = fixStreamingMarkdown(accumulatedContentRef.current, contentChunk); accumulatedContentRef.current = fixedContent; // 更新消息 setMessages((prevMessages) => { return prevMessages.map((msg) => { if (msg.id === botMessageId) { return { ...msg, content: fixedContent, }; } return msg; }); }); }, // 错误和完成处理... );
        
        用户界面优化
        
        为了提供更好的用户体验，我们对界面进行了多项优化：
        
        1. 增加显示宽度适合文档输出
        
        const ChatContainer = styled.div` width: 100%; max-width: 1400px; // V1版本为900px // 其他样式... `;
        
        2. 增加消息区域高度
        
        const MessagesContainer = styled.div` height: 65vh; // V1版本为60vh // 其他样式... `;
        
        3. 添加自定义滚动条样式
        
        &::-webkit-scrollbar { width: 8px; } &::-webkit-scrollbar-track { background: #f1f1f1; border-radius: 4px; } &::-webkit-scrollbar-thumb { background: #c1c1c1; border-radius: 4px; } &::-webkit-scrollbar-thumb:hover { background: #a8a8a8; }
        
        4. 优化的响应式布局
        
        @media (max-width: 1400px) { padding: 20px; } @media (max-width: 768px) { padding: 15px; }
        
        5. 流式/非流式模式切换
        
        为方便测试和满足不同需求，我们添加了模式切换功能：
        
        { color: useStreamMode ? '#1890ff' : '#bbb' }} /
        
        项目运行效果
        
        完成所有代码后，我们运行项目并实际测试了不同场景下的表现。下面通过动态演示展示V2版本的真实运行效果，直观感受流式输出的优势：
        
        右上角有个按钮可以切换输出方式为流式还是非流式
        
        1. 非流式输出效果
        
        图1：非流式模式下，用户需要等待AI完成全部内容生成后才能看到回答，整体等待时间较长。
        
        2. 流式输出短文本效果
        
        图2：流式模式下的短文本响应，可以看到AI回答实时显示，类似人类打字的效果，大大提升了交互体验。
        
        3. 流式输出长文本效果
        
        图3：流式模式下的长文本响应，即使是复杂的技术解答也能实时呈现，用户无需等待完整回复，可以边看边思考，体验更加流畅。注意Markdown格式（如代码块、列表等）也能正确渲染。
        
        从以上动态演示可以直观感受到：
        
        流式输出模式大幅减少了用户等待时间，特别是对于长文本回答
        实时显示的内容保持了完整的Markdown格式，包括代码高亮
        优化后的界面宽度和滚动条，提供了更舒适的阅读体验
        无论短文本还是长篇技术解答，流式输出都能保持稳定的性能
        这种近乎实时的交互方式，极大地提升了AI对话的自然感和用户满意度，使AI助手更像一个真实的对话伙伴。
        
        核心挑战与解决方案
        
        1. Markdown格式破碎问题
        
        挑战：流式传输容易导致Markdown格式标记被分割，例如#Java而不是标准的# Java。
        
        解决方案：
        
        后端：实现formatMarkdownContent方法处理常见格式问题
        前端：添加fixStreamingMarkdown函数修复接收到的内容
        正则表达式检测不完整格式，避免发送破碎内容
        2. 内容分段策略
        
        挑战：何时发送内容是个平衡问题，太频繁会导致网络开销，太少则影响实时性。
        
        解决方案：
        
        基于语义和格式完整性智能判断发送点
        设置最大缓冲区大小（800字符）
        设置最大发送间隔（300毫秒）
        检测句子结束和段落边界
        3. 流式连接管理
        
        挑战：如何管理长时间的SSE连接，处理超时和错误。
        
        解决方案：
        
        设置合理的超时时间（5分钟）
        完善的错误处理和恢复机制
        使用AtomicBoolean避免重复错误处理
        资源释放和清理
        技术亮点总结
        
        高效的流式处理：使用BufferedSource进行流式读取，减少内存占用
        智能的内容分段：基于语义和格式完整性动态决定发送时机
        完善的Markdown处理：双端格式修复确保内容展示完美
        响应式UI优化：适配不同屏幕尺寸，提供流畅的用户体验
        资源管理：合理的资源分配和释放，避免内存泄漏
        错误处理：全面的错误捕获和恢复机制，提高系统稳定性
        项目拓展方向
        
        V2版本虽然已经实现了流式输出功能，但仍有多个方向可以进一步拓展：
        
        流式历史记录：保存流式会话历史，实现多轮对话
        打字机效果优化：进一步优化前端动画，模拟更真实的打字效果
        内容分块优化：基于语义和上下文进行更智能的内容分块
        并发请求处理：优化后端并发能力，支持更多用户同时使用
        预热缓存：对常见问题预先生成部分回答，进一步提升响应速度
        源码下载
        
        为方便读者快速上手，完整项目源码已打包上传，包含：
        
        DeepSeekExtProject（Java后端项目）
        
        完整的Spring Boot项目结构
        流式处理的核心实现
        Markdown格式处理逻辑
        
        DeepSeekExtWeb（React前端项目）
        
        完整的React+TypeScript项目结构
        流式数据接收与渲染
        优化的UI组件
        源码下载地址：DeepSeek AI流式对话系统完整源码
        
        使用说明：
        
        下载并解压源码包
        按照README中的步骤分别启动前后端项目
        修改后端DeepSeekClient02.java中的API_KEY为您自己的密钥
        注意：使用前请确保已安装Java 8+、Maven、Node.js 14+环境。
        
        写在最后
        
        🎉 通过本文的指导，你已经了解了如何为AI对话系统实现流式输出功能，极大提升用户体验。期待大家基于这个项目进行更多创新！
        
        V1版本没看的小伙伴移步请移步：
        【实战教程】零基础搭建DeepSeek大模型聊天系统 - Spring Boot+React完整开发指南
        
        📚 推荐几篇很有趣的文章：
        
        DeepSeek详解：探索下一代语言模型
        算法模型从入门到起飞系列——递归（探索自我重复的奇妙之旅）
        📚博主匠心之作，强推专栏：
        
        JAVA集合专栏【夜话集】
        JVM知识专栏
        数据库sql理论与实战【博主踩坑之道】
        小游戏开发【博主强推匠心之作拿来即用无门槛】
        💌 与博主互动 & 技术支持
        
        👋 读到这里，不妨留下你的想法和问题，博主会第一时间回复！
        
        ❓ 遇到技术难题？
        
        文章内容有疑问？
        项目开发遇到瓶颈？
        学习路径需要指导？
        作业&实验需要帮助？
        📮 欢迎私信我！作为一名已工作多年资深开发者，我很乐意与你分享我的经验和见解。
        
        🤝 专业服务
        
        作为一名技术专家，我可以为您提供以下专业服务：
        
        ① 🛠️ 技术咨询与问题解答：Java/Python/前后端/数据库/算法等各领域问题
        
        ② 🚀 项目开发与合作：
        
        前端开发：Web应用、响应式设计、交互体验优化
        后端开发：Java/Python/Node.js微服务、API设计
        移动应用：H5、小程序、公众号开发
        全栈解决方案：从需求分析到部署维护
        ③ 📝 代码审查与优化：性能调优、架构改进、最佳实践建议
        
        ④ 📚 学习指导与作业辅导：为在校学生提供编程作业指导和学习路径规划
        
        🔍 如有合作需求，欢迎私信联系，期待与您共创价值！
        
        如果觉得有帮助的话，别忘了点个赞 👍 收藏 ⭐ 关注 🔖 哦！
        
        🎯 我是果冻~，一个热爱技术、乐于分享的开发者
        📚 更多精彩内容，请关注我的博客
        🌟 我们下期再见！

免责声明：我们致力于保护作者版权，注重分享，被刊用文章因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明：本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度，360，搜狗等多加搜索引擎自动关键词搜索配图，如有侵权的图片，请第一时间联系我们。

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【AI应用开发】基于DeepSeek API的流式对话系统实现：Spring Boot+React打造实时响应体验

文章目录

项目介绍

流式输出功能剖析

流式输出的核心原理

后端流式处理实现

1. 扩展数据模型支持流式响应

2. 流式数据处理核心实现

3. 格式完整性保障

4. 服务器发送事件（SSE）接口

前端流式处理实现

1. 使用EventSource建立SSE连接

2. Markdown格式修复

3. 流式内容的动态更新

用户界面优化

1. 增加显示宽度适合文档输出

2. 增加消息区域高度

3. 添加自定义滚动条样式

4. 优化的响应式布局

5. 流式/非流式模式切换

项目运行效果

1. 非流式输出效果

2. 流式输出短文本效果

3. 流式输出长文本效果

核心挑战与解决方案

1. Markdown格式破碎问题

2. 内容分段策略

3. 流式连接管理

技术亮点总结

项目拓展方向

源码下载

写在最后

💌 与博主互动 & 技术支持

🤝 专业服务

相关阅读

Linux Shell异常处理，常见问题与解决方案？Shell脚本报错怎么解决？Shell脚本报错如何快速解决？

Linux中高效复制多级目录与文件的技巧与方法？如何快速复制Linux多级目录？Linux多级目录如何快速复制？

IDA Pro监听Linux进程，逆向工程中的动态调试技术？IDA如何动态调试Linux进程？IDA如何逆向调试Linux进程？

Linux下按pip安装与管理Python包指南？Linux如何用pip管理Python包？Linux下pip怎么管理Python包？

目录[+]