mirror of
https://github.com/sweetwisdom/everything-claude-code-zh.git
synced 2026-03-22 06:20:10 +00:00
203 lines
6.6 KiB
Markdown
203 lines
6.6 KiB
Markdown
---
|
||
name: iterative-retrieval
|
||
description: 用于逐步优化上下文检索以解决子智能体(subagent)上下文问题的模式
|
||
---
|
||
|
||
# 迭代检索模式(Iterative Retrieval Pattern)
|
||
|
||
解决多智能体工作流中的“上下文问题”,即子智能体(subagent)在开始工作前不知道自己需要哪些上下文。
|
||
|
||
## 问题(The Problem)
|
||
|
||
子智能体启动时只有有限的上下文。它们不知道:
|
||
- 哪些文件包含相关的代码
|
||
- 代码库中存在哪些模式(Patterns)
|
||
- 项目使用了哪些术语
|
||
|
||
标准方法往往会失败:
|
||
- **发送所有内容**:超出上下文限制
|
||
- **什么都不发**:智能体(Agent)缺乏关键信息
|
||
- **猜测需要什么**:经常出错
|
||
|
||
## 解决方案:迭代检索(Iterative Retrieval)
|
||
|
||
一个分为 4 个阶段的循环,用于逐步优化上下文:
|
||
|
||
```
|
||
┌─────────────────────────────────────────────┐
|
||
│ │
|
||
│ ┌──────────┐ ┌──────────┐ │
|
||
│ │ DISPATCH │─────▶│ EVALUATE │ │
|
||
│ └──────────┘ └──────────┘ │
|
||
│ ▲ │ │
|
||
│ │ ▼ │
|
||
│ ┌──────────┐ ┌──────────┐ │
|
||
│ │ LOOP │◀─────│ REFINE │ │
|
||
│ └──────────┘ └──────────┘ │
|
||
│ │
|
||
│ 最多 3 个循环,然后继续执行 │
|
||
└─────────────────────────────────────────────┘
|
||
```
|
||
|
||
### 阶段 1:分发(DISPATCH)
|
||
|
||
初始的广泛查询,用于收集候选文件:
|
||
|
||
```javascript
|
||
// 从高层意图开始
|
||
const initialQuery = {
|
||
patterns: ['src/**/*.ts', 'lib/**/*.ts'],
|
||
keywords: ['authentication', 'user', 'session'],
|
||
excludes: ['*.test.ts', '*.spec.ts']
|
||
};
|
||
|
||
// 分发给检索智能体
|
||
const candidates = await retrieveFiles(initialQuery);
|
||
```
|
||
|
||
### 阶段 2:评估(EVALUATE)
|
||
|
||
评估检索到的内容的关联度:
|
||
|
||
```javascript
|
||
function evaluateRelevance(files, task) {
|
||
return files.map(file => ({
|
||
path: file.path,
|
||
relevance: scoreRelevance(file.content, task),
|
||
reason: explainRelevance(file.content, task),
|
||
missingContext: identifyGaps(file.content, task)
|
||
}));
|
||
}
|
||
```
|
||
|
||
评分标准:
|
||
- **高 (0.8-1.0)**:直接实现了目标功能
|
||
- **中 (0.5-0.7)**:包含相关的模式或类型
|
||
- **低 (0.2-0.4)**:有间接关联
|
||
- **无 (0-0.2)**:无关,排除
|
||
|
||
### 阶段 3:优化(REFINE)
|
||
|
||
根据评估结果更新搜索标准:
|
||
|
||
```javascript
|
||
function refineQuery(evaluation, previousQuery) {
|
||
return {
|
||
// 添加在高关联度文件中发现的新模式
|
||
patterns: [...previousQuery.patterns, ...extractPatterns(evaluation)],
|
||
|
||
// 添加在代码库中发现的术语
|
||
keywords: [...previousQuery.keywords, ...extractKeywords(evaluation)],
|
||
|
||
// 排除已确认的无关路径
|
||
excludes: [...previousQuery.excludes, ...evaluation
|
||
.filter(e => e.relevance < 0.2)
|
||
.map(e => e.path)
|
||
],
|
||
|
||
// 针对特定缺口
|
||
focusAreas: evaluation
|
||
.flatMap(e => e.missingContext)
|
||
.filter(unique)
|
||
};
|
||
}
|
||
```
|
||
|
||
### 阶段 4:循环(LOOP)
|
||
|
||
使用优化后的标准重复该过程(最多 3 个循环):
|
||
|
||
```javascript
|
||
async function iterativeRetrieve(task, maxCycles = 3) {
|
||
let query = createInitialQuery(task);
|
||
let bestContext = [];
|
||
|
||
for (let cycle = 0; cycle < maxCycles; cycle++) {
|
||
const candidates = await retrieveFiles(query);
|
||
const evaluation = evaluateRelevance(candidates, task);
|
||
|
||
// 检查我们是否已经拥有足够的上下文
|
||
const highRelevance = evaluation.filter(e => e.relevance >= 0.7);
|
||
if (highRelevance.length >= 3 && !hasCriticalGaps(evaluation)) {
|
||
return highRelevance;
|
||
}
|
||
|
||
// 优化并继续
|
||
query = refineQuery(evaluation, query);
|
||
bestContext = mergeContext(bestContext, highRelevance);
|
||
}
|
||
|
||
return bestContext;
|
||
}
|
||
```
|
||
|
||
## 实践示例
|
||
|
||
### 示例 1:Bug 修复上下文
|
||
|
||
```
|
||
任务:“修复身份验证令牌过期 bug”
|
||
|
||
循环 1:
|
||
分发(DISPATCH):在 src/** 中搜索 "token"、"auth"、"expiry"
|
||
评估(EVALUATE):发现 auth.ts (0.9)、tokens.ts (0.8)、user.ts (0.3)
|
||
优化(REFINE):添加 "refresh"、"jwt" 关键字;排除 user.ts
|
||
|
||
循环 2:
|
||
分发(DISPATCH):搜索优化后的术语
|
||
评估(EVALUATE):发现 session-manager.ts (0.95)、jwt-utils.ts (0.85)
|
||
优化(REFINE):上下文已足够(2 个高关联度文件)
|
||
|
||
结果:auth.ts, tokens.ts, session-manager.ts, jwt-utils.ts
|
||
```
|
||
|
||
### 示例 2:功能实现
|
||
|
||
```
|
||
任务:“为 API 端点添加速率限制(rate limiting)”
|
||
|
||
循环 1:
|
||
分发(DISPATCH):在 routes/** 中搜索 "rate"、"limit"、"api"
|
||
评估(EVALUATE):无匹配项 —— 代码库使用了 "throttle" 术语
|
||
优化(REFINE):添加 "throttle"、"middleware" 关键字
|
||
|
||
循环 2:
|
||
分发(DISPATCH):搜索优化后的术语
|
||
评估(EVALUATE):发现 throttle.ts (0.9)、middleware/index.ts (0.7)
|
||
优化(REFINE):需要路由模式
|
||
|
||
循环 3:
|
||
分发(DISPATCH):搜索 "router"、"express" 模式
|
||
评估(EVALUATE):发现 router-setup.ts (0.8)
|
||
优化(REFINE):上下文已足够
|
||
|
||
结果:throttle.ts, middleware/index.ts, router-setup.ts
|
||
```
|
||
|
||
## 与智能体(Agents)集成
|
||
|
||
在智能体提示词(Prompts)中使用:
|
||
|
||
```markdown
|
||
为此任务检索上下文时:
|
||
1. 从广泛的关键字搜索开始
|
||
2. 评估每个文件的关联度(0-1 评分)
|
||
3. 识别仍缺失的上下文
|
||
4. 优化搜索标准并重复(最多 3 个循环)
|
||
5. 返回关联度 >= 0.7 的文件
|
||
```
|
||
|
||
## 最佳实践
|
||
|
||
1. **先广后窄,逐步收敛** —— 不要过度设定初始查询。
|
||
2. **学习代码库术语** —— 第一个循环通常能揭示命名规范。
|
||
3. **跟踪缺失内容** —— 明确地识别差距(Gap)是优化的动力。
|
||
4. **见好就收** —— 3 个高关联度的文件优于 10 个平庸的文件。
|
||
5. **果断排除** —— 低关联度的文件不会突然变得相关。
|
||
|
||
## 相关资源
|
||
|
||
- [长篇指南(The Longform Guide)](https://x.com/affaanmustafa/status/2014040193557471352) —— 子智能体编排部分
|
||
- `continuous-learning` 技能 —— 用于随时间改进的模式
|
||
- `~/.claude/agents/` 中的智能体定义
|