小红书图文卡
小红书是一种竖屏、成组、靠首图决生死的内容形态。这一章把它拆成三件可照做的事:认清物料、算准尺寸、出一张松墨纸风的封面,并交给你一套能直接复用的提示词配方。
在小红书上,一篇笔记先被看见的往往不是文字,而是那张方方正正、竖着的首图。读者在信息流里用半秒决定划走还是点开——所以做小红书图文,本质是做一套竖版、成组、首图最抓人的视觉物料。
本章只解决"图怎么出"这一段:先看懂平台对物料的硬性偏好,再把它翻译成图像生成技能能执行的尺寸与提示词。出图全程默认走内置 image_gen,只有在需要精确像素裁切时,才在本地补一把辅助脚本。
小红书物料的三个特点
把平台的"脾气"记成三条,后面所有决策都从这里推导:
- 竖版 3:4。这是小红书图文的标准画幅,比 16:9 更"站得住",在竖屏信息流里占的视觉面积最大。
- 成组 6–9 张。一篇笔记不是一张图,而是一叠卡片:首图负责"勾人点开",后续几张负责"把干货讲完"。
- 首图最抓人。所有留白、所有钩子、所有注意力,都先砸在第一张上;它的留白通常也最多。
用版式占位框直观感受一下"首图"与"内容卡"的分工——左边是封面引导卡(钩子大、留白多),右边是干货内容卡(信息密、可扫读):
三步出一张能上首页的封面
留白会呼吸,钩子才抓人。
三个尺寸要记牢
- 画幅 3:4 竖版
- 成组 6–9 张
- 有效尺寸 1152×1536
@松墨纸 · 划到下一张 →
做小红书物料,先回答一句话:这一张是"封面"还是"内容"?封面的第一目标是被点开——所以留白多、钩子大、核心词高亮;内容卡的目标是被读完——所以信息密、版式稳、可扫读。两者的提示词与配色重心并不相同,别用同一套模板硬套。
尺寸与换算:3:4 怎么落到有效像素
小红书图文的常见画布是 1242×1660 或 1080×1440,比例都接近 3:4。但图像生成模型不接受任意像素——CLI 回退默认的 gpt-image-2 要求两边都是 16 的倍数、长短比不超过 3:1、总像素落在区间内。好消息是:3:4 正好有一个完美落点。
| 平台目标 | 比例 | 有效生成尺寸 | 做法 |
|---|---|---|---|
| 小红书图文(推荐) | 3:4 | 1152 × 1536 | 直接可用——两边皆 16 倍数,比例正好 0.75,无需裁切。 |
| 小红书图文(备选) | 2:3 | 1024 × 1536 | 先按 2:3 出图,再本地裁去顶/底一点点到 3:4。 |
| 导出到精确画布 | ≈3:4 | 1242 × 1660 | 用 1152×1536 出底图,再用 pillow 放大/裁切到精确像素。 |
1242×1660 不是有效生成尺寸(1242 不是 16 的倍数)。所以"在接近比例的有效尺寸出图 → 本地裁切到平台精确像素"是贯穿全书的标准做法,不要试图让模型直接吐出任意像素。内置模式对"精确 宽×高"的控制有限,但对 3:4 这个最常用比例完全够用:让它出 1152×1536 的底图,绝大多数时候直接就能发。只有当你要严丝合缝的 1242×1660、或要做特殊裁切时,才在本地补一刀 pillow;要精确像素或特殊比例,也可在用户点名时改走 CLI 的 --size。
出一张"松墨纸风"封面
下面把一张完整封面的需求,整理成一张结构化配方卡(沿用全书的 shared prompt schema),再给出可直接粘贴的中文提示词与英文风格串。用例归到 illustration-story(编辑感的插画封面);若你的封面更偏营销导流,也可归 ads-marketing。
松墨纸风 · 小红书封面引导卡
① 别堆高饱和。小红书首屏确实卷"扎眼",但松墨纸的气质是克制的纸感——提示词里要显式写"低饱和、无霓虹、无糖果色",否则模型容易自动加艳。要"抓人",靠的是留白对比与钩子标题,不是饱和度。
② 深色块上的文字铁律。当封面里出现深松绿或深褐色块(如金句条、底部色带),其上的文字与链接绝不用深绿 #1C5D53,必须改用奶白 #F3EEE2 或亮铜金 #F2C892。这条对生成图里"模拟的文字"和后期叠加的真实排版都成立。
这一步全程在内置 image_gen 完成,无需 API Key。出图后默认落在 $CODEX_HOME/generated_images/;既然封面是"项目要用的资产",收尾前务必把它 move/copy 进工作区,别只留在默认路径,也别覆盖已有资产(要替换就用版本化兄弟名,如 xhs-cover-v2.png)。要做精确像素,再在本地补一刀:
codex exec 是把这句话交给"装了本技能的 Codex 智能体"去执行的通用方式。智能体收到后自动加载技能、走内置生成、再把图回贴。具体怎么把这句话递进去——飞书机器人、openclaw 等 IM 桥接——因接入方式而异,以你的工具文档为准,这里不臆造各家精确 API。把封面标题交给真实排版(生成图里只留干净留白),而不是让模型"画字",有两个好处:一是字准、可换、可批量——同一底图换不同标题做 A/B;二是对比可控——你能精确保证深色块上用奶白/铜金,符合品牌铁律。若确实需要模型把文字画进图里,记得用 exact text 逐字引用、指定字体与位置,并对棘手词逐字母拼写(详见第 06 章)。
爆款封面的四个要点
把"抓人"从玄学落成四条可检查的标准。出完封面,逐条过一遍:
钩子标题
一句话点破"看完能得到什么"或"不看会错过什么"。结果导向、带数字、给悬念——这是点开率的第一推手。
留白
首图留白最多。让标题"有地方落",让画面"能呼吸"。挤满信息反而显得廉价,留白才是高级感与可读性的来源。
核心词高亮
标题里挑 2–4 个字做强调——用铜色或松绿、或一个 底色块。半秒扫一眼,读者就抓住了重点。
可扫读
字号够大、层级分明、远看也清楚。封面是在小图、信息流里被瞥见的,经不起"凑近才看清"。
抓人的封面
一个结果导向的钩子标题 + 大面积留白 + 2–3 个高亮核心词 + 克制的纸感配色。远看清楚,半秒能读懂。
划走的封面
信息堆满、字小且层级混乱、高饱和糖果色乱撞、没有一个明确钩子。需要凑近才看清——于是没人凑近。
组图一致性:从一张到一套
封面只是 6–9 张里的第一张。真正考验功力的是让整组卡片看起来像一家人:相同的纸色与边距、统一的字体层级、连贯的松绿/铜配色、一致的留白节奏。否则读者划到第三张就"出戏"。
组图是"多个不同资产",不是"同一句提示词的多个变体"。所以不要用 n 去凑——封面、内容页 A、内容页 B 各自有不同的文案与版式,应当各发一次内置 image_gen 调用,并在每次调用里复述同一套不变量(纸色、边距、字体层级、配色),以此锁住一致性。
一致性是一套独立的方法论:固定模板、复述不变量、用版式而非重新生成来承载文字。本章先把"出好第一张"讲透,成组一致性的完整工作流,留到第 13 章展开。
小红书图文 = 竖版 3:4、成组 6–9 张、首图最抓人。尺寸上,3:4 有一个完美落点 1152×1536(内置直接出),要平台精确像素再本地裁/放大到 1242×1660。出"松墨纸风"封面:全程走内置 image_gen(无需 API Key),按配方卡写提示词,低饱和纸感、上方大留白放标题,文字优先后期排版。两条红线:别堆高饱和;深色块上的字只用奶白或亮铜金、绝不用深绿。组图是不同资产,逐张各发一次调用并复述不变量——完整一致性方法见第 13 章。