提示词工程学习笔记
一、核心概念
1.1 注意力机制
注意力机制通过权衡上下文词语的重要性来理解语义,核心逻辑是不断追问”什么上下文能帮助我理解这个词”。
1.2 分词(Tokenization)
人工智能在处理文本前将其分块的方式。
1.3 上下文窗口
人工智能的”工作记忆”,即模型一次能处理的文本总量。
1.4 温度参数(Temperature)
控制生成随机性,取值范围 0-1:
| 温度值 | 效果 | 适用场景 |
|---|---|---|
| 0 | 确定性输出,每次给出最有把握的答案 | 事实性查询、分析任务 |
| 1 | 创造性输出,承担风险生成多样化内容 | 创意写作、头脑风暴 |
建议:事实性任务使用低温,创意任务使用高温。
1.5 幻觉问题(Hallucination)
本质:AI 并不知道什么是真实,它基于文本模式预测下一个可能出现的词。由于事实和虚构都存在”听起来可靠”的文本模式,模型对两者的置信度相同。
应对策略:
- 核实具体说法
- 事实性查询使用较低温度
- 要求模型承认不确定性
- 构建基于真实文档的 RAG 系统
幻觉是结构性问题,而非漏洞,无法通过简单修复彻底解决。
二、模型功能分类与选型
2.1 主流模型特性
| 模型 | 核心优势 | 最佳适用场景 |
|---|---|---|
| Claude Opus 4.5 | 编码性能、营销写作、长文本处理、电子表格分析 | 代码开发、技术写作、商业分析 |
| Gemini 3 Pro | 实时数据访问、海量文档分析、超长上下文窗口 | 需要最新数据的研究、长文档分析 |
| Grok | 实时社交数据分析 | |
| 社交媒体趋势分析、实时舆情监测 | ||
| Nano Banana Pro | 图像生成 | 视觉内容创作 |
| VEO 3.1 / Kling 2.6 | 视频生成 | 视频内容创作 |
2.2 场景化选型速查
编码和技术写作 → Claude
需要最新信息的研究 → Gemini
长文档分析 → Gemini(上下文窗口优势)
营销文案和品牌声音 → Claude
电子表格工作 → Claude(与 Excel 集成)
社交媒体分析 → Grok
图像生成 → Nano Banana Pro
视频生成 → VEO 3.1 或 Kling 2.6
三、提示词编写规范
3.1 模型特定的格式偏好
Claude(XML 标签格式)
Claude 经过 XML 标签训练,对结构化标签响应良好:
<context>
背景信息
</context>
<task>
具体任务指令
</task>
<format>
输出格式要求
</format>
GPT / Gemini(JSON 格式)
需要结构化数据时,使用 JSON 格式效果最佳。
通用格式
- 简单请求:纯文本
- 通用场景:Markdown
XML 标签的作用类似于文档章节标题,能减少歧义,模型根据清晰度给出更好的输出。
3.2 思维链(Chain of Thought)
核心技巧:在复杂问题前加上”让我们一步一步地思考”。
适用场景:
- 数学问题
- 逻辑推理
- 多步骤分析
- 代码调试
四、系统提示公式
4.1 四要素框架
有效的系统提示应包含四个核心要素:
| 要素 | 说明 | 示例 |
|---|---|---|
| 角色 | AI 应该扮演什么角色 | ”你是一位专门从事科技估值的高级财务分析师” |
| 行为 | 它应该如何互动 | ”在做出假设之前提出澄清问题,并在不确定时承认错误” |
| 限制条件 | 它应该避免什么 | ”不要提供具体的投资建议” |
| 输出结构 | 如何格式化回复 | ”先用两句话概括,然后提供支持性分析” |
4.2 情境工程
真正的杠杆在于情境工程:给模型提供清晰的背景信息,它就能做出更好的决策;缺乏背景信息时,它只能靠猜测。
五、上下文管理策略
5.1 四种核心策略
| 策略 | 定义 | 实现方式 |
|---|---|---|
| 写入 | 将上下文保存到活动窗口之外 | 使用临时文件和参考文件供 AI 访问 |
| 选择 | 筛选需要进入上下文的内容 | 通过 RAG 和动态检索选择相关内容 |
| 压缩 | 在包含冗长信息前进行概括 | 对长文本进行摘要处理,而非全部倾倒 |
| 隔离 | 针对不同上下文使用独立线程 | 使用单独的对话线程或子代理,避免上下文混淆 |
六、RAG(检索增强生成)
6.1 基本原理
在回答问题之前,系统先搜索文档查找相关信息,并将其加入上下文。
6.2 核心价值
- 使响应基于实际上传的文档数据,而非模型训练数据
- 显著减少幻觉
- 实现特定领域的专业知识
七、自动化与工具集成
7.1 自动化系统
自动化是指无需人工干预即可运行的系统,能够处理输入并产生输出。
7.2 MCP 工具
MCP(Model Context Protocol)允许 AI 连接到外部工具和数据源,扩展能力边界。
八、学习路线图
第一阶段:基本功
↓ 培养对 AI 能力的直觉理解
第二阶段:提示与上下文工程
↓ 掌握提示词编写和上下文管理
第三阶段:创意和技术工具
↓ 学习各类专业工具的使用
第四阶段:高级集成
→ 将 AI 能力整合到复杂工作流中
九、核心要点总结
- 背景信息决定输出质量:清晰的上下文是获得优质响应的前提
- 模型选型影响效率:根据任务特性选择最适合的模型
- 格式适配提升效果:不同模型对提示词格式有不同偏好
- 幻觉无法根除,只能管理:建立验证机制,使用 RAG 降低风险
- 上下文管理是关键:写入、选择、压缩、隔离四种策略灵活运用