Part Four · 提示词工程
09
Use-Case Taxonomy · 用例分类法

用例分类法

每一张要画的图,都先归到一个用例 slug 上。这套分类不是文牍,而是一根贯穿全程的线:它让提示词、引用、校验对齐到同一个名字,也帮你在按下生成键之前,先想清楚——这事到底该不该用生图。

技能文档把所有出图需求归进了两组共 19 个用例标签(slug):生成 11 个、编辑 8 个。它们看上去只是分类名,作用却很实在——一旦你为一个任务定下 slug,提示词的取向、要校验的重点、与样例库的对照,就都被这个名字"锁"住了,不会跑偏。

为什么要先分类:一个 slug 贯穿全程

把 slug 想成一张任务标签:贴上之后,它会一路跟着你走完整个流程,并在三个环节上替你省力。

关键判断 · slug 一致性

从需求到提示词、到引用样例、到最后校验,用同一个 slug 称呼这件事。名字一致,思路才一致。先别急着想"画面长什么样",先想"这属于哪个 slug"——分类对了,后面的字段会自己归位。

分类也有一层"反向"价值:当你试着给需求贴 slug,却发现哪个都不太贴、或它本质是"简单形状 / 图表 / 线框 / 图标"时,这往往是个信号——也许根本不该用生图。这一点我们留到第四节展开。

生成:11 个用例 slug 速查

当用户没给图、或只把图当风格 / 构图 / 氛围参考时,意图就是生成。下表是 11 个生成类 slug、一句说明,以及它在自媒体里典型对应的产物。

slug一句话说明自媒体适用例
photorealistic-natural追求真实感的自然 / 人物 / 场景照片。探店实拍风封面、生活方式配图
product-mockup把产品放进干净或情境化的样机里。带货主图、好物推荐九宫格
ui-mockupApp / 网页界面的视觉稿。"我做了个小工具"演示图、教程截图
infographic-diagram信息图、流程图、数据可视化。干货长图、知识卡片、对比表
scientific-educational科普 / 教学示意,重在解释清楚。科普向图解、原理拆解配图
ads-marketing广告 / 营销主视觉,含卖点表达。活动海报、促销 banner、招募图
productivity-visual面向效率 / 办公的实用视觉。清单模板、周计划图、笔记封面
logo-brandLogo 与品牌标识的探索。个人 IP 头像、账号 logo 草案
illustration-story叙事性插画,有角色与情节。条漫分镜、故事号插图、绘本风
stylized-concept风格化概念图,重氛围与想象。国风 / 赛博封面、世界观概念图
historical-scene历史场景重现,讲究年代与考据感。历史号复原图、古风场景配图

提示:同一条需求有时能套多个 slug——"把产品 P 拍成杂志大片"可以是 product-mockup,也带 photorealistic-natural 的味道。这没关系:选最贴近主要意图的那个当主标签,另一个当心里的辅助提醒。

编辑:8 个用例 slug 速查

当用户要在保留某些部分的前提下改一张已有的图时,意图就是编辑。编辑类 slug 的共同点是都有"不变量"(invariants)要守——下表第三列点出了每类最该盯住的东西。

slug一句话说明最该守住的不变量
text-localization替换 / 翻译图中文字,版式不动。排版、字体观感、非文字区域
identity-preserve改图但保住人物 / 物体的"身份"。五官、特征,仍是同一个对象
precise-object-edit精准增删改某个局部物体。编辑区域之外的一切不受波及
lighting-weather改光线 / 时段 / 天气氛围。构图、主体形态与位置
background-extraction抠主体 / 换背景 / 出透明底。主体边缘完整、不被啃掉
style-transfer换画风 / 媒材,保留内容骨架。构图与主体结构、可识别性
compositing多图合成、把元素融进一张图。透视、光照与比例的一致
sketch-to-render把草图 / 线稿渲染成成品。原稿的构图与线条意图
编辑 slug 的两条共同纪律

其一,每一轮都重述不变量——"保持 X 不变"要写进每次提示词,模型不会自动记住上一轮的约束。其二,一次只改一处再复检:把"换光线"和"改文字"分两轮做,比一句话塞满更稳。这些通用手法第 08 章会细讲,slug 在这里的作用是提醒你哪个不变量最不容有失

生图 还是 代码:一张决策图

分类法最有价值的时刻,往往是它让你停下来不生图。技能文档明确列了几种"不该用生图"的情形——它们的共性是:你要的其实是确定性的、矢量的、可编辑的代码原生输出,而不是一张被"猜"出来的位图。

要做一个视觉资产 ↓ 先问自己 你要的是哪一种? 氛围位图 还是 确定性矢量 → 用 image_gen 要"位图 / 氛围" · 写实照片、人物、场景 · 产品样机、营销主视觉 · 插画、概念图、封面氛围 · 纹理、光影、复杂渐变 判据 像素是被"画"出来的 → 生图 → 用 SVG / 代码 要"确定 / 矢量" · 仓库已有的 SVG / 图标系统 · 简单形状、图表、线框图 · 可编辑原生源的小改动 · 要确定、可复算的输出 判据 像素必须可控可复现 → 代码 分不清时,问:这张图允许"每次都不一样"吗?不允许 → 走右边
图:生图 vs 代码——不是"哪个更高级",而是"你要的是氛围还是确定性"。

用一组对照把界线钉死:

该用生图

需要真实感、纹理、复杂光影、风格氛围——这些靠手写代码极难复现,正是模型的主场。表格里的 19 个 slug,本质都属于这一边。

别用生图

当对象是图标系统 / 简单图形图表线框 / 已是可编辑原生格式的小改动 / 要确定性代码原生输出时,用 SVG · HTML · CSS 更准、更省、可复算——而且不花 API 额度。

关键判断 · 呼应第 15 章"SVG 优先"

遇到要匹配仓库里已有的矢量图标时,正确动作是直接编辑那些 SVG 文件,而不是让模型"画一个像它的图标"——后者既无法对齐既有系统,又把可编辑的矢量降级成了位图。这条"SVG 优先"原则第 15 章会系统展开;在本章,它是分类法的第一道闸门:先判断该不该生图,再谈用哪个 slug。

起手式:每个生成 slug 一句提示词

分类定了,下一步就是落到提示词。这里给 11 个生成 slug 各一句"起手式"——不是成品提示词,而是一个能立刻往上长细节的句子骨架。把 尖括号占位 换成你的内容即可;它们都走内置 image_gen

起手式 · photorealistic-natural内置 image_gen
一张 主体写实照片自然光 / 环境,浅景深,真实质感与肤色 / 材质,无明显 CG 痕迹。
真实感人物 / 场景
起手式 · product-mockup内置 image_gen
产品产品样机,置于 干净 / 情境化背景,柔和棚拍光,突出材质与做工,留出文案区。
带货主图
起手式 · ui-mockup内置 image_gen
App / 网页界面视觉稿浅色 / 深色主题,清晰的栅格与层级,含 关键模块,现代克制的排版。
演示图
起手式 · infographic-diagram内置 image_gen
一张讲清 主题信息图流程 / 对比 / 层级结构,标签清楚、配色克制、信息密度适中。
干货长图
起手式 · scientific-educational内置 image_gen
概念 / 原理科普示意图,重在解释,标注关键部件,准确而不花哨,教科书插图气质。
科普向
起手式 · ads-marketing内置 image_gen
产品 / 活动营销主视觉,传达 核心卖点,视觉中心明确,留出标题区,氛围 情绪基调
海报 / banner
起手式 · productivity-visual内置 image_gen
清单 / 计划 / 笔记实用效率视觉,结构清晰、分区明确、留白充足,适合作为 模板 / 封面
模板
起手式 · logo-brand内置 image_gen
名称 / 意象logo 探索几何 / 字标 / 吉祥物方向,简洁、可缩放、单色也成立。
IP 头像
起手式 · illustration-story内置 image_gen
角色情节场景 中的叙事插画画风,有情绪与故事感,构图引导视线。
条漫 / 插图
起手式 · stylized-concept内置 image_gen
主题风格化概念图国风 / 赛博 / 极简取向,重氛围与想象,强烈而统一的视觉调性。
封面氛围
起手式 · historical-scene内置 image_gen
年代 / 地点历史场景重现,服饰 / 器物 / 建筑符合时代,光线与质感有年代感,考据克制不戏说。
复原图

提示:起手式只是骨架。真正落地时,按第 06 章的 shared prompt schema 把 Subject / Composition / Lighting / Color palette 等字段逐一填实——slug 决定"该强调哪些字段",schema 决定"怎么写满它们"。

本章 TL;DR

用例分类法把所有出图需求归为生成 11 类、编辑 8 类共 19 个 slug。先贴 slug 的好处,是让提示词取向、样例引用、校验重点对齐到同一个名字。更重要的是,分类时若发现需求本质是图标系统 / 简单图形图表线框 / 可编辑原生源的小改动 / 要确定性代码原生输出,就该停手不生图,改用 SVG · HTML · CSS(呼应第 15 章"SVG 优先")。判断该不该生图之后,再用每个 slug 的"起手式"配上 prompt schema 把提示词写实。