AI 智能体开发短期强化学习计划 (4周)
目标:将现有的 LangChain 基础转化为工程化落地能力,补齐 RAG 与 LangGraph 短板,产出具备面试竞争力的完整项目。
📅 第一周:死磕 RAG(检索增强生成)
核心价值:面试必问,企业级 AI 应用落地的绝对高频场景。
🎯 学习重点
- 高级文档分割:掌握
RecursiveCharacterTextSplitter配合HTMLHeaderTextSplitter,解决 PDF/网页切分时的元数据保留问题。 - 检索优化策略:
MultiQueryRetriever:利用 LLM 生成多个角度查询,提高召回率。ContextualCompressionRetriever:对召回文档进行压缩,过滤无关噪音。EnsembleRetriever:混合稀疏(BM25)与稠密(向量)检索。
- 重排序 (Rerank):集成
CohereRerank或BAAI/bge-reranker,亲身体验精度提升。
🛠️ 巩固项目:本地法律/财报智能问答库
- 项目描述:上传一份 PDF 版《劳动法》或上市公司财报,构建高精度问答应用。
- 关键考核点:
- 实现 Parent Document Retriever(父文档检索器)。
- 逻辑:搜索时用小粒度块保证匹配精准度,送入 LLM 上下文时自动扩展为所属的整页内容。
📅 第二周:驾驭 LangGraph
核心价值:从简单的单链条调用升级为复杂的状态机编排,这是构建可靠 Agent 的核心能力。
🎯 学习重点
- 状态管理:理解
StateGraph与TypedDict如何定义节点间的流转数据。 - 条件边与循环:编写逻辑判断,让 Agent 能够根据结果决定是“结束对话”还是“进入下一轮工具调用”。
- 检查点 (Checkpointer):使用
MemorySaver实现对话中断恢复与历史回溯。
🛠️ 巩固项目:带“反思-修正”机制的代码审查助手
- 项目描述:用户输入 Python 代码,Agent 自动审查并自我修复。
- LangGraph 执行流:
Coder(生成/修改代码)Tester(运行单元测试)Reflector(分析报错原因)- 条件边:若测试失败 -> 跳回
Coder节点重新修改。
📅 第三周:工具赋能与系统集成
核心价值:摆脱对现成 API 的依赖,让 Agent 真正拥有控制本地环境与外部服务的能力。
🎯 学习重点
- Pydantic 模型定义:使用
@tool装饰器定义复杂参数结构(例如邮件发送参数)。 - 结构化输出:使用
with_structured_output强制 LLM 返回确定的 JSON 格式。 - 外挂视觉模块:将 ComfyUI 视为黑盒 API,通过
requests调用实现文生图功能。
🛠️ 巩固项目:个人 AI 助理 (CLI 版)
- 项目描述:能操作本地文件系统并生成图片的命令行助手。
- 自定义工具集:
list_files:浏览目录。read_file/write_file:读写文件。generate_image:通过调用本地 ComfyUI API,将描述文字保存为桌面图片。
📅 第四周:整合与交付
核心价值:将前三周的代码封装为有 UI 界面、可追踪、可部署的完整产品。
🎯 学习重点
- 后端服务化:使用 FastAPI + LangServe 将 LangGraph 应用封装为 RESTful API。
- 快速前端搭建:使用 Streamlit 或 Gradio 构建交互界面。
- 可观测性:接入 LangSmith 监控 Token 消耗、延迟与执行轨迹。
🛠️ 最终产出:多模态工作流自动化助手
- 功能演示:用户输入“总结今天的 AI 新闻,配一张插图,然后发邮件给我”。
- 内部调用链展示:
- LangGraph 主控流程。
- 调用 News API 工具获取数据 -> LangChain 摘要生成。
- 调用 ComfyUI API 生成配图。
- 调用 SMTP 工具发送邮件。
- 简历描述:“独立设计基于 LangGraph 的多 Agent 调度系统,集成 ComfyUI 视觉生成模块,通过 RAG 优化使检索准确率提升 30%。”
⚠️ 现阶段避坑指南:关于 ComfyUI
在巩固代码逻辑的短期内,请务必压低 ComfyUI 的学习优先级。
| 建议做法 (✅) | 避免做法 (❌) |
|---|---|
当成 API 后端:开启 ComfyUI 的 --enable-cors 模式,直接在 Python 中用 requests.post 调用 /prompt。 | 深究节点连线:花两周时间研究 KSampler、Upscale 节点参数配置。 |
| 使用现成 JSON:网上找一个已验证过的文生图工作流 JSON 直接复用。 | 从零搭建工作流:试图手搓一套复杂的视频生成管线。 |
原因:AI 应用工程师的核心竞争力在于 LLM 逻辑编排与工具调用,而非图像生成的调参细节。待 LangGraph 项目落成后,再回头学习 ComfyUI 底层原理,会事半功倍。
评论