Part Five · 自媒体实战
10
Xiaohongshu Cards · 小红书图文卡

小红书图文卡

小红书是一种竖屏、成组、靠首图决生死的内容形态。这一章把它拆成三件可照做的事:认清物料算准尺寸出一张松墨纸风的封面,并交给你一套能直接复用的提示词配方。

在小红书上,一篇笔记先被看见的往往不是文字,而是那张方方正正、竖着的首图。读者在信息流里用半秒决定划走还是点开——所以做小红书图文,本质是做一套竖版、成组、首图最抓人的视觉物料。

本章只解决"图怎么出"这一段:先看懂平台对物料的硬性偏好,再把它翻译成图像生成技能能执行的尺寸与提示词。出图全程默认走内置 image_gen,只有在需要精确像素裁切时,才在本地补一把辅助脚本。

小红书物料的三个特点

把平台的"脾气"记成三条,后面所有决策都从这里推导:

用版式占位框直观感受一下"首图"与"内容卡"的分工——左边是封面引导卡(钩子大、留白多),右边是干货内容卡(信息密、可扫读):

小红书 3:4 · 封面引导卡
新手必看 01

三步出一张能上首页的封面

少即是多

留白会呼吸,钩子才抓人。

小红书 3:4 · 干货内容卡
Step · 02 / 内容页

三个尺寸要记牢

  • 画幅 3:4 竖版
  • 成组 6–9
  • 有效尺寸 1152×1536

@松墨纸 · 划到下一张 →

关键判断

做小红书物料,先回答一句话:这一张是"封面"还是"内容"?封面的第一目标是被点开——所以留白多、钩子大、核心词高亮;内容卡的目标是被读完——所以信息密、版式稳、可扫读。两者的提示词与配色重心并不相同,别用同一套模板硬套。

尺寸与换算:3:4 怎么落到有效像素

小红书图文的常见画布是 1242×16601080×1440,比例都接近 3:4。但图像生成模型不接受任意像素——CLI 回退默认的 gpt-image-2 要求两边都是 16 的倍数、长短比不超过 3:1、总像素落在区间内。好消息是:3:4 正好有一个完美落点

平台目标比例有效生成尺寸做法
小红书图文(推荐) 3:4 1152 × 1536 直接可用——两边皆 16 倍数,比例正好 0.75,无需裁切。
小红书图文(备选) 2:3 1024 × 1536 先按 2:3 出图,再本地裁去顶/底一点点到 3:4。
导出到精确画布 ≈3:4 1242 × 1660 1152×1536 出底图,再用 pillow 放大/裁切到精确像素。
提示:1242×1660 不是有效生成尺寸(1242 不是 16 的倍数)。所以"在接近比例的有效尺寸出图 → 本地裁切到平台精确像素"是贯穿全书的标准做法,不要试图让模型直接吐出任意像素。

内置模式对"精确 宽×高"的控制有限,但对 3:4 这个最常用比例完全够用:让它出 1152×1536 的底图,绝大多数时候直接就能发。只有当你要严丝合缝的 1242×1660、或要做特殊裁切时,才在本地补一刀 pillow;要精确像素或特殊比例,也可在用户点名时改走 CLI 的 --size

3:4 物料 · 从生成到落地 ① 内置生成 1152 × 1536 ② 本地裁切/放大 pillow crop · resize ③ 平台精确像素 1242 × 1660
3:4 换算流水线 · 在有效尺寸出底图,本地一刀落到平台像素。

出一张"松墨纸风"封面

下面把一张完整封面的需求,整理成一张结构化配方卡(沿用全书的 shared prompt schema),再给出可直接粘贴的中文提示词与英文风格串。用例归到 illustration-story(编辑感的插画封面);若你的封面更偏营销导流,也可归 ads-marketing

RECIPE

松墨纸风 · 小红书封面引导卡

Use case
illustration-story(封面插画;偏导流可用 ads-marketing)
Asset type
竖版社媒封面卡,3:4
Primary request
一张安静、纸感、可放标题的小红书封面,留出大面积上方留白给文案
Scene / backdrop
米杏色纸面,细微纸纹与压痕,桌面平铺式构图(flat-lay)
Subject
一支铜尖钢笔与一小束松针,斜放在纸卡一角;其余留白
Style / medium
编辑杂志感、纸质工艺感、柔和写实;克制、留白多
Composition
主体压在下三分之一,上方约 55% 留空给标题;竖版 3:4
Lighting / mood
柔和漫射晨光,安静、温润、无强阴影
Color palette
米杏纸色为主,松绿点缀,铜色高光;低饱和、克制
Materials
纸纤维、铜金属反光、松针哑光
Text (verbatim)
留空/不渲染文字——标题后期用排版叠加(封面文字交给版式更可控)
Constraints
上方大面积留白;构图干净可放标题;3:4 竖版
Avoid
高饱和糖果色、霓虹、杂乱堆叠、强投影、水印、乱码文字
提示词 · 松墨纸封面(中文)内置 image_gen
一张竖版 3:4 的小红书封面图。米杏色纸面背景,可见细微纸纹与轻压痕,桌面平铺(flat-lay)俯视构图。画面下三分之一斜放一支铜尖钢笔与一小束松针,其余留白;上方约 55% 区域保持干净留空,以便后期叠加标题文字。柔和漫射晨光,无强投影,氛围安静温润。配色以米杏纸色为主、松绿点缀、铜色高光,整体低饱和、克制、编辑杂志感。不要渲染任何文字、水印或乱码;不要高饱和糖果色、霓虹或杂乱堆叠。出图比例取 3:4(1152×1536)
3:4 竖版留白封面纸感
Style Tokens · 英文风格串append for tone
editorial flat-lay, warm cream paper texture, subtle fibers and soft deboss, copper-nib pen and a sprig of pine needles in the lower third, generous clean negative space in the upper area for title overlay, soft diffused morning light, no harsh shadows, muted earthy palette — cream base, pine green accent, copper highlights, low saturation, calm and refined, magazine-grade — no text, no watermark, no neon, no high-saturation candy colors, no cluttered props
pinemark moodmuted palette
红线 · 配色与对比两条

别堆高饱和。小红书首屏确实卷"扎眼",但松墨纸的气质是克制的纸感——提示词里要显式写"低饱和、无霓虹、无糖果色",否则模型容易自动加艳。要"抓人",靠的是留白对比与钩子标题,不是饱和度。

深色块上的文字铁律。当封面里出现深松绿或深褐色块(如金句条、底部色带),其上的文字与链接绝不用深绿 #1C5D53,必须改用奶白 #F3EEE2 或亮铜金 #F2C892。这条对生成图里"模拟的文字"和后期叠加的真实排版都成立。

这一步全程在内置 image_gen 完成,无需 API Key。出图后默认落在 $CODEX_HOME/generated_images/;既然封面是"项目要用的资产",收尾前务必把它 move/copy 进工作区,别只留在默认路径,也别覆盖已有资产(要替换就用版本化兄弟名,如 xhs-cover-v2.png)。要做精确像素,再在本地补一刀:

terminal
$ codex exec "帮我出一张松墨纸风小红书封面,3:4,上方留白放标题,1152×1536" # 内置生成 → 成品默认落在 $CODEX_HOME/generated_images/ $ mv ~/.codex/generated_images/cover.png ./output/imagegen/xhs-cover-v1.png # 收尾:把"项目要用的资产"搬进工作区,不要只留默认路径 $ python crop.py --in xhs-cover-v1.png --size 1242x1660 # 仅当需要平台精确像素
提示:codex exec 是把这句话交给"装了本技能的 Codex 智能体"去执行的通用方式。智能体收到后自动加载技能、走内置生成、再把图回贴。具体怎么把这句话递进去——飞书机器人、openclaw 等 IM 桥接——因接入方式而异,以你的工具文档为准,这里不臆造各家精确 API。
封面文字,建议后期排版

把封面标题交给真实排版(生成图里只留干净留白),而不是让模型"画字",有两个好处:一是字准、可换、可批量——同一底图换不同标题做 A/B;二是对比可控——你能精确保证深色块上用奶白/铜金,符合品牌铁律。若确实需要模型把文字画进图里,记得用 exact text 逐字引用、指定字体与位置,并对棘手词逐字母拼写(详见第 06 章)。

爆款封面的四个要点

把"抓人"从玄学落成四条可检查的标准。出完封面,逐条过一遍:

  1. 钩子标题

    一句话点破"看完能得到什么"或"不看会错过什么"。结果导向、带数字、给悬念——这是点开率的第一推手。

  2. 留白

    首图留白最多。让标题"有地方落",让画面"能呼吸"。挤满信息反而显得廉价,留白才是高级感与可读性的来源。

  3. 核心词高亮

    标题里挑 2–4 个字做强调——用铜色或松绿、或一个 底色块。半秒扫一眼,读者就抓住了重点。

  4. 可扫读

    字号够大、层级分明、远看也清楚。封面是在小图、信息流里被瞥见的,经不起"凑近才看清"。

抓人的封面

一个结果导向的钩子标题 + 大面积留白 + 2–3 个高亮核心词 + 克制的纸感配色。远看清楚,半秒能读懂。

划走的封面

信息堆满、字小且层级混乱、高饱和糖果色乱撞、没有一个明确钩子。需要凑近才看清——于是没人凑近。

组图一致性:从一张到一套

封面只是 6–9 张里的第一张。真正考验功力的是让整组卡片看起来像一家人:相同的纸色与边距、统一的字体层级、连贯的松绿/铜配色、一致的留白节奏。否则读者划到第三张就"出戏"。

关键判断

组图是"多个不同资产",不是"同一句提示词的多个变体"。所以不要用 n 去凑——封面、内容页 A、内容页 B 各自有不同的文案与版式,应当各发一次内置 image_gen 调用,并在每次调用里复述同一套不变量(纸色、边距、字体层级、配色),以此锁住一致性。

一致性是一套独立的方法论:固定模板、复述不变量、用版式而非重新生成来承载文字。本章先把"出好第一张"讲透,成组一致性的完整工作流,留到第 13 章展开。

本章 TL;DR

小红书图文 = 竖版 3:4、成组 6–9 张、首图最抓人。尺寸上,3:4 有一个完美落点 1152×1536(内置直接出),要平台精确像素再本地裁/放大到 1242×1660。出"松墨纸风"封面:全程走内置 image_gen(无需 API Key),按配方卡写提示词,低饱和纸感、上方大留白放标题,文字优先后期排版。两条红线:别堆高饱和;深色块上的字只用奶白或亮铜金、绝不用深绿。组图是不同资产,逐张各发一次调用并复述不变量——完整一致性方法见第 13 章。