提示词工程学习笔记

一、核心概念

1.1 注意力机制

注意力机制通过权衡上下文词语的重要性来理解语义，核心逻辑是不断追问”什么上下文能帮助我理解这个词”。

1.2 分词（Tokenization）

人工智能在处理文本前将其分块的方式。

1.3 上下文窗口

人工智能的”工作记忆”，即模型一次能处理的文本总量。

1.4 温度参数（Temperature）

控制生成随机性，取值范围 0-1：

温度值	效果	适用场景
0	确定性输出，每次给出最有把握的答案	事实性查询、分析任务
1	创造性输出，承担风险生成多样化内容	创意写作、头脑风暴

建议：事实性任务使用低温，创意任务使用高温。

1.5 幻觉问题（Hallucination）

本质：AI 并不知道什么是真实，它基于文本模式预测下一个可能出现的词。由于事实和虚构都存在”听起来可靠”的文本模式，模型对两者的置信度相同。

应对策略：

核实具体说法
事实性查询使用较低温度
要求模型承认不确定性
构建基于真实文档的 RAG 系统

幻觉是结构性问题，而非漏洞，无法通过简单修复彻底解决。

二、模型功能分类与选型

2.1 主流模型特性

模型	核心优势	最佳适用场景
Claude Opus 4.5	编码性能、营销写作、长文本处理、电子表格分析	代码开发、技术写作、商业分析
Gemini 3 Pro	实时数据访问、海量文档分析、超长上下文窗口	需要最新数据的研究、长文档分析
Grok	实时社交数据分析
社交媒体趋势分析、实时舆情监测
Nano Banana Pro	图像生成	视觉内容创作
VEO 3.1 / Kling 2.6	视频生成	视频内容创作

2.2 场景化选型速查

编码和技术写作        → Claude
需要最新信息的研究    → Gemini
长文档分析            → Gemini（上下文窗口优势）
营销文案和品牌声音    → Claude
电子表格工作          → Claude（与 Excel 集成）
社交媒体分析          → Grok
图像生成              → Nano Banana Pro
视频生成              → VEO 3.1 或 Kling 2.6

三、提示词编写规范

3.1 模型特定的格式偏好

Claude（XML 标签格式）

Claude 经过 XML 标签训练，对结构化标签响应良好：

<context>
背景信息
</context>

<task>
具体任务指令
</task>

<format>
输出格式要求
</format>

GPT / Gemini（JSON 格式）

需要结构化数据时，使用 JSON 格式效果最佳。

通用格式

简单请求：纯文本
通用场景：Markdown

XML 标签的作用类似于文档章节标题，能减少歧义，模型根据清晰度给出更好的输出。

3.2 思维链（Chain of Thought）

核心技巧：在复杂问题前加上”让我们一步一步地思考”。

适用场景：

数学问题
逻辑推理
多步骤分析
代码调试

四、系统提示公式

4.1 四要素框架

有效的系统提示应包含四个核心要素：

要素	说明	示例
角色	AI 应该扮演什么角色	”你是一位专门从事科技估值的高级财务分析师”
行为	它应该如何互动	”在做出假设之前提出澄清问题，并在不确定时承认错误”
限制条件	它应该避免什么	”不要提供具体的投资建议”
输出结构	如何格式化回复	”先用两句话概括，然后提供支持性分析”

4.2 情境工程

真正的杠杆在于情境工程：给模型提供清晰的背景信息，它就能做出更好的决策；缺乏背景信息时，它只能靠猜测。

五、上下文管理策略

5.1 四种核心策略

策略	定义	实现方式
写入	将上下文保存到活动窗口之外	使用临时文件和参考文件供 AI 访问
选择	筛选需要进入上下文的内容	通过 RAG 和动态检索选择相关内容
压缩	在包含冗长信息前进行概括	对长文本进行摘要处理，而非全部倾倒
隔离	针对不同上下文使用独立线程	使用单独的对话线程或子代理，避免上下文混淆

六、RAG（检索增强生成）

6.1 基本原理

在回答问题之前，系统先搜索文档查找相关信息，并将其加入上下文。

6.2 核心价值

使响应基于实际上传的文档数据，而非模型训练数据
显著减少幻觉
实现特定领域的专业知识

七、自动化与工具集成

7.1 自动化系统

自动化是指无需人工干预即可运行的系统，能够处理输入并产生输出。

7.2 MCP 工具

MCP（Model Context Protocol）允许 AI 连接到外部工具和数据源，扩展能力边界。

八、学习路线图

第一阶段：基本功
    ↓ 培养对 AI 能力的直觉理解

第二阶段：提示与上下文工程
    ↓ 掌握提示词编写和上下文管理

第三阶段：创意和技术工具
    ↓ 学习各类专业工具的使用

第四阶段：高级集成
    → 将 AI 能力整合到复杂工作流中

九、核心要点总结

背景信息决定输出质量：清晰的上下文是获得优质响应的前提
模型选型影响效率：根据任务特性选择最适合的模型
格式适配提升效果：不同模型对提示词格式有不同偏好
幻觉无法根除，只能管理：建立验证机制，使用 RAG 降低风险
上下文管理是关键：写入、选择、压缩、隔离四种策略灵活运用