下面是基于通义千问大模型实现的一个 ReAct Agent demo,它的功能是可以调用多个工具并返回结果,就类似于调用大模型接口时传入 tools 参数.
如何开发一个AI Agent应用
本文字数: 3.2k 阅读时长 ≈ 3 分钟
之前的博客中总结了使用 LangChain、LangGraph 等 Python 库开发 AI Agent 的相关代码,这篇博客总结了如何开发一个 AI Agent 应用,包括一个 Agent 应用应该有哪些功能模块和服务端架构。
使用PEFT和LoRA技术微调LLM指南
本文字数: 14k 阅读时长 ≈ 12 分钟
这篇博客是一篇译文,汇总了下面两篇文章的主要内容,介绍了常用的大语言模型微调技术,以及如何使用 LoRA 和 QLoRA 等技术微调大语言模型。原文地址为:
https://www.mercity.ai/blog-post/fine-tuning-llms-using-peft-and-lora
https://www.mercity.ai/blog-post/guide-to-fine-tuning-llms-with-lora-and-qlora
LangGraph的介绍和使用
本文字数: 28k 阅读时长 ≈ 25 分钟
LangGraph 是一个使用 LLM 构建有状态、多参与者应用程序的库,它构建在 LangChain 之上,并旨在与 LangChain 一起使用。它扩展了 LangChain,能够以循环方式跨多个计算步骤协调多个链或参与者。今天介绍下它的使用。
使用LangChain开发Agent
本文字数: 35k 阅读时长 ≈ 32 分钟
最近看了一些关于 AI Agent 开发相关的文档和开源项目,包括 AI Agent 的开发流程和步骤以及代码实现,打算分几次总结一下。
用最少的数学和术语解释LLM
本文字数: 13k 阅读时长 ≈ 12 分钟
在 understandingai 上看到了这篇文章《Large language models, explained with a minimum of math and jargon》,文章中用一种更通俗易懂的方式介绍了大语言模型是如何工作的。
PrivateGPT的使用
本文字数: 5.6k 阅读时长 ≈ 5 分钟
PrivateGPT 是一个可投入生产的 AI 项目,可让您利用大型语言模型 (LLM) 的功能提出有关文档的问题,即使在没有联网的情况下也可以使用。今天介绍下如何使用 PrivateGPT 来搭建 AI 应用。
LLM相关应用和开发工具整理
本文字数: 11k 阅读时长 ≈ 10 分钟
最近使用了很多大语言模型(LLM)相关的应用和开发工具,在这篇博客中将它们汇总一下。
《Build a Large Language Model (From Scratch)》第一章
本文字数: 9.7k 阅读时长 ≈ 9 分钟
这篇博客是 《Build a Large Language Model (From Scratch)》第一章的译文,中文书名是《从头开始创建一个大语言模型》。
FastAPI框架的使用
FastAPI 是一个现代、快速(高性能)的 Web 框架,基于标准的 Python 类型提示并使用 Python 3.8+ 构建 API。