提示词工程学习笔记


一、核心概念

1.1 注意力机制

注意力机制通过权衡上下文词语的重要性来理解语义,核心逻辑是不断追问”什么上下文能帮助我理解这个词”。

1.2 分词(Tokenization)

人工智能在处理文本前将其分块的方式。

1.3 上下文窗口

人工智能的”工作记忆”,即模型一次能处理的文本总量。

1.4 温度参数(Temperature)

控制生成随机性,取值范围 0-1:

温度值效果适用场景
0确定性输出,每次给出最有把握的答案事实性查询、分析任务
1创造性输出,承担风险生成多样化内容创意写作、头脑风暴

建议:事实性任务使用低温,创意任务使用高温。

1.5 幻觉问题(Hallucination)

本质:AI 并不知道什么是真实,它基于文本模式预测下一个可能出现的词。由于事实和虚构都存在”听起来可靠”的文本模式,模型对两者的置信度相同。

应对策略

  • 核实具体说法
  • 事实性查询使用较低温度
  • 要求模型承认不确定性
  • 构建基于真实文档的 RAG 系统

幻觉是结构性问题,而非漏洞,无法通过简单修复彻底解决。


二、模型功能分类与选型

2.1 主流模型特性

模型核心优势最佳适用场景
Claude Opus 4.5编码性能、营销写作、长文本处理、电子表格分析代码开发、技术写作、商业分析
Gemini 3 Pro实时数据访问、海量文档分析、超长上下文窗口需要最新数据的研究、长文档分析
Grok实时社交数据分析
社交媒体趋势分析、实时舆情监测
Nano Banana Pro图像生成视觉内容创作
VEO 3.1 / Kling 2.6视频生成视频内容创作

2.2 场景化选型速查

编码和技术写作        → Claude
需要最新信息的研究    → Gemini
长文档分析            → Gemini(上下文窗口优势)
营销文案和品牌声音    → Claude
电子表格工作          → Claude(与 Excel 集成)
社交媒体分析          → Grok
图像生成              → Nano Banana Pro
视频生成              → VEO 3.1 或 Kling 2.6

三、提示词编写规范

3.1 模型特定的格式偏好

Claude(XML 标签格式)

Claude 经过 XML 标签训练,对结构化标签响应良好:

<context>
背景信息
</context>

<task>
具体任务指令
</task>

<format>
输出格式要求
</format>

GPT / Gemini(JSON 格式)

需要结构化数据时,使用 JSON 格式效果最佳。

通用格式

  • 简单请求:纯文本
  • 通用场景:Markdown

XML 标签的作用类似于文档章节标题,能减少歧义,模型根据清晰度给出更好的输出。

3.2 思维链(Chain of Thought)

核心技巧:在复杂问题前加上”让我们一步一步地思考”。

适用场景

  • 数学问题
  • 逻辑推理
  • 多步骤分析
  • 代码调试

四、系统提示公式

4.1 四要素框架

有效的系统提示应包含四个核心要素:

要素说明示例
角色AI 应该扮演什么角色”你是一位专门从事科技估值的高级财务分析师”
行为它应该如何互动”在做出假设之前提出澄清问题,并在不确定时承认错误”
限制条件它应该避免什么”不要提供具体的投资建议”
输出结构如何格式化回复”先用两句话概括,然后提供支持性分析”

4.2 情境工程

真正的杠杆在于情境工程:给模型提供清晰的背景信息,它就能做出更好的决策;缺乏背景信息时,它只能靠猜测。


五、上下文管理策略

5.1 四种核心策略

策略定义实现方式
写入将上下文保存到活动窗口之外使用临时文件和参考文件供 AI 访问
选择筛选需要进入上下文的内容通过 RAG 和动态检索选择相关内容
压缩在包含冗长信息前进行概括对长文本进行摘要处理,而非全部倾倒
隔离针对不同上下文使用独立线程使用单独的对话线程或子代理,避免上下文混淆

六、RAG(检索增强生成)

6.1 基本原理

在回答问题之前,系统先搜索文档查找相关信息,并将其加入上下文。

6.2 核心价值

  • 使响应基于实际上传的文档数据,而非模型训练数据
  • 显著减少幻觉
  • 实现特定领域的专业知识

七、自动化与工具集成

7.1 自动化系统

自动化是指无需人工干预即可运行的系统,能够处理输入并产生输出。

7.2 MCP 工具

MCP(Model Context Protocol)允许 AI 连接到外部工具和数据源,扩展能力边界。


八、学习路线图

第一阶段:基本功
    ↓ 培养对 AI 能力的直觉理解

第二阶段:提示与上下文工程
    ↓ 掌握提示词编写和上下文管理

第三阶段:创意和技术工具
    ↓ 学习各类专业工具的使用

第四阶段:高级集成
    → 将 AI 能力整合到复杂工作流中

九、核心要点总结

  1. 背景信息决定输出质量:清晰的上下文是获得优质响应的前提
  2. 模型选型影响效率:根据任务特性选择最适合的模型
  3. 格式适配提升效果:不同模型对提示词格式有不同偏好
  4. 幻觉无法根除,只能管理:建立验证机制,使用 RAG 降低风险
  5. 上下文管理是关键:写入、选择、压缩、隔离四种策略灵活运用