AI 应用开发
June 8, 2026 · View on GitHub
你好,我是 JavaGuide 的作者。最近这段时间,我一直在补 AI 应用开发、AI 编程实战和 AI 面试这几块内容。
这份开源指南写给所有想系统学习 AI 应用开发与 AI 工程化落地 的同学:后端、前端、测试、架构师、技术管理者、产品技术同学都可以看。你不需要先转算法岗,也不需要一上来就啃训练框架和论文公式;这里重点放在 LLM、Agent、RAG、MCP、Prompt、评测、系统设计、Claude Code、Codex 这些做应用时会真正用到的东西。
如果你本来是 Java / Go 后端,会更容易把高并发、缓存、数据库、消息队列、可观测性这些经验迁移过来;如果你是前端、测试或产品技术方向,也可以从 Prompt、RAG、Agent、AI Coding、评测和系统设计切入,理解一个 AI 功能从 Demo 到上线到底要补哪些环节。
- 项目地址:https://github.com/Snailclimb/AIGuide
- 在线阅读:https://javaguide.cn/ai/
- AI 编程专题:https://javaguide.cn/ai-coding/
目前每篇文章都会尽量配上真实工程场景、关键参数、踩坑点和图解。内容还在持续更新,有帮助的话欢迎 Star,也欢迎提 Issue 一起补充。

发布之后,收到了不少读者朋友的反馈和推荐。感谢大家,我会继续维护。

怎么读
如果你是第一次系统学 AI 应用开发,建议按这个顺序走:
- 先看 大模型基础:把 Token、上下文窗口、采样参数、API 调用、结构化输出和评测搞清楚。
- 再看 RAG:企业知识库问答最常见,坑也最多,文档处理、向量检索、更新链路和评测都得补。
- 接着看 AI Agent:重点理解 Tool Calling、Memory、MCP、Skills、Workflow / Graph / Loop。
- 最后看 AI 系统设计:把 Demo 放进生产环境,处理网关、限流、fallback、成本、观测、安全和灰度。
AI Coding 不是另一条完全独立的线。它更像是日常研发方式的升级,写业务代码、改前端页面、补测试、做重构、查线上问题都能用。建议一边学 AI 应用开发,一边用 Claude Code、Codex、Cursor、Trae 这类工具练起来。
面试题
- AI 应用开发面试指南:把 LLM、RAG、Agent、系统设计这几条线串起来,适合系统复盘。
- 大模型基础面试题总结:Token、上下文窗口、结构化输出、模型调用等高频问题。
- AI Agent 面试题总结:Agent Loop、Tool Calling、Memory、MCP、工作流编排等问题。
- RAG 面试题总结:Embedding、向量数据库、混合检索、Rerank、GraphRAG、RAG 评测。
- AI 系统设计面试题总结:AI 应用架构、模型网关、成本控制、可观测、安全合规。
大模型基础
- LLM 运行机制:Token、上下文窗口与采样参数怎么影响输出:把 Token、上下文窗口、Temperature、Top-p、Max Tokens 这些基础概念讲透。
- 大模型 API 调用工程实践:流式输出、重试、限流与结构化返回:从 Hello World 走到生产可用,重点看 SSE、超时、重试、取消、幂等和异常处理。
- 大模型结构化输出:从 JSON 契约到 Function Calling 落地:JSON Schema、Structured Outputs、Function Calling、MCP Tool 和服务端校验怎么配合。
- AI 应用评测体系:从 Golden Set 构建到线上灰度闭环:不要靠体感上线,学会用 Golden Set、LLM-as-Judge、Trace 回放和 CI 回归评估 AI 功能。
AI Agent
- AI Agent 核心概念:Agent Loop、Plan-and-Execute、A2A、Agentic Workflows、Tools 注册:先搞清 Agent 到底比普通 LLM 调用多了什么。
- AI Agent 记忆系统:短期记忆、长期记忆与记忆演化机制:短期记忆、长期记忆、Markdown 记忆、记忆写入和检索怎么落地。
- 大模型提示词工程(Prompt Engineering)是什么?提示词技巧有哪些?:Prompt 四要素、Few-Shot、CoT、Prompt Injection 防御和结构化输出。
- 上下文工程(Context Engineering) 是什么?和 Prompt Engineering 有什么区别?:重点看上下文组装、Token 预算、动态信息挂载和降级策略。
- Agent Skills 是什么?和 Prompt、MCP 到底差在哪?:理解 Skills 的触发方式、延迟加载、渐进式披露和工程边界。
- 什么是 Model Context Protocol (MCP)?和 Function Calling、Agent 什么关系?:MCP 的 Host、Client、Server、Tools、Resources、Prompts 分别做什么。
- 一文搞懂 Harness Engineering:六层架构、上下文管理与一线团队实战:看 Agent 外面那层工程外壳怎么管上下文、工具、状态、评测和安全。
- AI 工作流中的 Workflow、Graph 与 Loop:从概念到实现:用工作流、图和循环把 Agent 的不确定性关进可控边界里。
RAG(检索增强生成)
- 万字详解 RAG 基础概念:RAG 是什么,为什么需要它,和长上下文、微调、传统搜索怎么选。
- RAG 文档处理与切分策略:从解析、清洗、Chunking 到多模态内容处理:RAG 效果上限经常卡在文档处理,PDF、表格、图片、Chunking 都要处理好。
- 万字详解 RAG 向量索引算法和向量数据库:HNSW、IVFFLAT、pgvector、Milvus、Elasticsearch 等怎么选。
- RAG 知识库文档如何更新:增量更新、版本控制、去重与全量重建:文档变更后怎么同步、去重、回滚、灰度和监控。
- 万字详解 GraphRAG:为什么只靠向量检索撑不起复杂知识问答:实体、关系、社区发现、局部检索、全局检索和 Text2Cypher。
- 万字详解 RAG 优化:从召回、重排到上下文工程的系统调优:Query Rewrite、Hybrid Search、Rerank、上下文压缩、失败样本定位。
AI 系统设计
- AI 应用系统设计:从 Prompt Demo 到生产级架构:把 Prompt Demo 放进真实业务系统,补齐 Prompt 管理、模型网关、RAG、Memory、Tool、评测和安全。
- 大模型网关详解:多模型路由、fallback、限流与成本控制:多供应商适配、模型路由、fallback、限流配额、Token 预算、成本归因和审计。
- AI 语音技术详解:从 ASR、TTS 到实时语音 Agent 的工程化落地:ASR、TTS、VAD、打断处理、低延迟优化和实时语音 Agent。
AI 编程实战
- IDEA + Qoder 插件多场景实战:接口优化与代码重构:JetBrains 用户怎么在 IDEA 里用 AI 做接口优化和代码重构。
- Trae + MiniMax 多场景实战:Redis 故障排查与跨语言重构:用 Trae 接入大模型,处理 Redis 问题和跨语言改造。
- Claude Code 接入第三方模型实战:JVM 智能诊断与慢查询治理:Claude Code 接入 GLM-5.1,做 JVM 诊断和慢 SQL 治理。
- DeepSeek V4 + Claude Code 实战:代码能力深度测评:看 DeepSeek V4 在代码审计、数据库迁移、多模型协作里的表现。
- MiniMax M3 + Claude Code 实战:Redis 故障排查、SCAN 算法复刻与监控面板搭建:用长上下文和编码模型处理更完整的工程任务。
- IDEA 爽用 Claude Code 和 Codex 的终极方案,很丝滑!:JetBrains 里接 Claude Code / Codex GUI 的实践。
AI 编程技巧
- Vibe Coding 实用技巧总结:Git、Spec、上下文管理与多 Agent 协作:从 Git、Spec、上下文、任务拆分和多 Agent 协作几个角度讲怎么少踩坑。
- Claude Code 使用指南:配置、工作流与进阶技巧:Claude Code 的配置、常用工作流、Sub-Agent、多实例协作和上下文管理。
- CLAUDE.md 最佳实践:该写什么、不该写什么、项目变大后怎么拆:把项目规则写给 AI 看,避免每次都从零解释仓库。
- Claude Code 核心命令详解:simplify、code-review、loop、batch、run、verify:常用命令怎么用,适合哪些任务,边界在哪里。
- AI 编程必备 Skills 推荐:TDD、代码审查与网页自动化实战:推荐一批能直接改善 AI 编程体验的 Skills。
- Codex 使用指南:配置、AGENTS.md 与 Agentic 工作流:Codex 的配置、AGENTS.md、任务拆解、验证和安全边界。
- AI 编程选 CLI 还是 IDE?一文帮你彻底搞清楚:Claude Code、Codex、Cursor、Trae、Qoder 这类工具怎么选。
- Claude Code Agent View:多会话并行管理实战:多个 Agent 会话并行时,怎么管理状态、权限确认和任务进度。
- 10 道 AI 编程相关的开放性面试问题:Cursor、Claude Code、Skills、Spec Coding、AI 对开发工作的影响等问题。
- Spec Coding 规范驱动编程实战:从 Vibe Coding 到 AI 代码规范:用 Spec 把需求、约束、验收标准写清楚,再让 AI 动手。