分享开发技术

基于WebSocket的大模型对话功能

发表于 2025-09-26 更新于 2025-09-27
本文字数： 17k 阅读时长 ≈ 16 分钟

下面是基于WebSocket实现的大模型对话功能。

发表于 2025-09-23
本文字数： 2.4k 阅读时长 ≈ 2 分钟

开发基于大模型的RAG应用时，文本拆分是一个非常基础的功能。在拆分一个大文本时我们往往会要求拆分效率高并且拆分后的chunk语义完整，完整的语义对后面检索出精确的内容非常有意义。

发表于 2025-09-12
本文字数： 12k 阅读时长 ≈ 11 分钟

UTCP是一个工具调用协议，全称是 Universal Tool Calling Protocol，相比于前段时间火热的MCP（Model Context Protocol）协议，它提供了更简单灵活的工具调用方式，它使 AI 代理和应用程序能够使用其本机协议直接发现和调用工具而无需封装成服务器。

发表于 2025-09-10
本文字数： 8.5k 阅读时长 ≈ 8 分钟

在基于大模型的聊天应用中，会话取消或者中断是一个基本功能，下面是基于 asyncio.Event() 实现的会话取消/中断功能。

发表于 2025-09-07
本文字数： 7.7k 阅读时长 ≈ 7 分钟

SGLang是一个针对大语言模型和视觉语言模型的快速高效的服务框架，它的功能与vllm类似，用于部署开源模型，并提高模型的推理速度。

发表于 2025-04-09 更新于 2025-04-13
本文字数： 19k 阅读时长 ≈ 18 分钟

下面是使用Python实现的一个基于sse协议的mcp server和mcp client.

发表于 2025-03-15 更新于 2025-03-21
本文字数： 4.6k 阅读时长 ≈ 4 分钟

opneai发布了一款agent框架openai-agents，它是一个轻量但功能强大的多智能体框架，这边文章介绍下它的使用。

发表于 2025-03-05
本文字数： 746 阅读时长 ≈ 1 分钟

ango 是一个用于创建多模态 agent 应用的轻量 python 库，可以构建处理文本、图像、音频和视频的 agent 应用，在需要时也可以向 ango 构建的应用中添加记忆、知识库、工具等模块。

发表于 2024-07-15 更新于 2024-08-25
本文字数： 8.5k 阅读时长 ≈ 8 分钟

下面是基于通义千问大模型实现的一个 ReAct Agent demo，它的功能是可以调用多个工具并返回结果，就类似于调用大模型接口时传入 tools 参数.

发表于 2024-05-10 更新于 2024-05-11
本文字数： 3.2k 阅读时长 ≈ 3 分钟

之前的博客中总结了使用 LangChain、LangGraph 等 Python 库开发 AI Agent 的相关代码，这篇博客总结了如何开发一个 AI Agent 应用，包括一个 Agent 应用应该有哪些功能模块和服务端架构。