AI 智能体开发短期强化学习计划 (4周)

Article detail

AI

2026/4/12 · 12 分钟阅读

AI 智能体开发短期强化学习计划 (4周)

目标:将现有的 LangChain 基础转化为工程化落地能力,补齐 RAG 与 LangGraph 短板,产出具备面试竞争力的完整项目。

📅 第一周:死磕 RAG(检索增强生成)

核心价值:面试必问,企业级 AI 应用落地的绝对高频场景。

🎯 学习重点

  • 高级文档分割:掌握 RecursiveCharacterTextSplitter 配合 HTMLHeaderTextSplitter,解决 PDF/网页切分时的元数据保留问题。
  • 检索优化策略
    • MultiQueryRetriever:利用 LLM 生成多个角度查询,提高召回率。
    • ContextualCompressionRetriever:对召回文档进行压缩,过滤无关噪音。
    • EnsembleRetriever:混合稀疏(BM25)与稠密(向量)检索。
  • 重排序 (Rerank):集成 CohereRerankBAAI/bge-reranker,亲身体验精度提升。

🛠️ 巩固项目:本地法律/财报智能问答库

  • 项目描述:上传一份 PDF 版《劳动法》或上市公司财报,构建高精度问答应用。
  • 关键考核点
    • 实现 Parent Document Retriever(父文档检索器)。
    • 逻辑:搜索时用小粒度块保证匹配精准度,送入 LLM 上下文时自动扩展为所属的整页内容。

📅 第二周:驾驭 LangGraph

核心价值:从简单的单链条调用升级为复杂的状态机编排,这是构建可靠 Agent 的核心能力。

🎯 学习重点

  • 状态管理:理解 StateGraphTypedDict 如何定义节点间的流转数据。
  • 条件边与循环:编写逻辑判断,让 Agent 能够根据结果决定是“结束对话”还是“进入下一轮工具调用”。
  • 检查点 (Checkpointer):使用 MemorySaver 实现对话中断恢复与历史回溯。

🛠️ 巩固项目:带“反思-修正”机制的代码审查助手

  • 项目描述:用户输入 Python 代码,Agent 自动审查并自我修复。
  • LangGraph 执行流
    1. Coder (生成/修改代码)
    2. Tester (运行单元测试)
    3. Reflector (分析报错原因)
    4. 条件边:若测试失败 -> 跳回 Coder 节点重新修改。

📅 第三周:工具赋能与系统集成

核心价值:摆脱对现成 API 的依赖,让 Agent 真正拥有控制本地环境与外部服务的能力。

🎯 学习重点

  • Pydantic 模型定义:使用 @tool 装饰器定义复杂参数结构(例如邮件发送参数)。
  • 结构化输出:使用 with_structured_output 强制 LLM 返回确定的 JSON 格式。
  • 外挂视觉模块:将 ComfyUI 视为黑盒 API,通过 requests 调用实现文生图功能。

🛠️ 巩固项目:个人 AI 助理 (CLI 版)

  • 项目描述:能操作本地文件系统并生成图片的命令行助手。
  • 自定义工具集
    • list_files:浏览目录。
    • read_file / write_file:读写文件。
    • generate_image:通过调用本地 ComfyUI API,将描述文字保存为桌面图片。

📅 第四周:整合与交付

核心价值:将前三周的代码封装为有 UI 界面、可追踪、可部署的完整产品。

🎯 学习重点

  • 后端服务化:使用 FastAPI + LangServe 将 LangGraph 应用封装为 RESTful API。
  • 快速前端搭建:使用 StreamlitGradio 构建交互界面。
  • 可观测性:接入 LangSmith 监控 Token 消耗、延迟与执行轨迹。

🛠️ 最终产出:多模态工作流自动化助手

  • 功能演示:用户输入“总结今天的 AI 新闻,配一张插图,然后发邮件给我”。
  • 内部调用链展示
    1. LangGraph 主控流程。
    2. 调用 News API 工具获取数据 -> LangChain 摘要生成。
    3. 调用 ComfyUI API 生成配图。
    4. 调用 SMTP 工具发送邮件。
  • 简历描述:“独立设计基于 LangGraph 的多 Agent 调度系统,集成 ComfyUI 视觉生成模块,通过 RAG 优化使检索准确率提升 30%。”

⚠️ 现阶段避坑指南:关于 ComfyUI

巩固代码逻辑的短期内,请务必压低 ComfyUI 的学习优先级

建议做法 (✅)避免做法 (❌)
当成 API 后端:开启 ComfyUI 的 --enable-cors 模式,直接在 Python 中用 requests.post 调用 /prompt深究节点连线:花两周时间研究 KSampler、Upscale 节点参数配置。
使用现成 JSON:网上找一个已验证过的文生图工作流 JSON 直接复用。从零搭建工作流:试图手搓一套复杂的视频生成管线。

原因:AI 应用工程师的核心竞争力在于 LLM 逻辑编排与工具调用,而非图像生成的调参细节。待 LangGraph 项目落成后,再回头学习 ComfyUI 底层原理,会事半功倍。

评论

动作测试