Part Five · 自媒体实战
11
Vertical Covers · 抖音 / 视频号封面

竖屏封面:9:16安全区之战

短视频封面是一场在拇指划过的瞬间就要分出胜负的仗。这一章教你把 1080×1920 的竖屏画布拆成"安全区",用图像 AI 出氛围底图、用排版层叠出真正清晰的大标题,再把它沉淀成一套可复用的系列模板。

短视频封面的核心矛盾只有一个:画面要满屏铺到边,但文字与按钮只能挤在中间那一小块"绝对安全"的区域里。想清楚这件事,后面的尺寸、提示词、模板都是顺水推舟。

抖音、视频号、快手的信息流封面都是竖版 9:16,标准像素 1080×1920。但屏幕四边并不都归你支配——平台会在底部压上文案与作者信息,在右侧叠一列互动按钮。本章先把这块"可用画布"圈出来,再谈怎么把图喂进去。

竖版 9:16 与安全区

把 1080×1920 的封面想成三层叠加:最底层是铺满全屏的图,中间是平台的 UI 遮挡区,最上层才是你真正能放主标题的地方。两块遮挡需要避让:

剩下的"黄金区"是画面中上部、略偏上的居中带。主标题放在这里,既躲开了下方文案,也落在拇指自然停留的视线高度。下面这块手机版式框把三者标了出来:

抖音 9:16 · 1080×1920
3 个动作
救活废片
主标题 · 黄金区(中上居中)
右侧 ≈120px
底部安全区 ≈350px
提示:不同 App、不同机型的遮挡像素会有出入。把 350 / 120 当成"宁可多留、不可压线"的保守边界即可;封面在自己手机上预览一遍,永远值得。
关键判断

封面不是海报。海报追求构图完整,封面追求的是在被遮挡一半的前提下,剩下那块仍然成立。设计时先把安全区框出来,再往里填东西——而不是画完整图,再回头担心被挡。

尺寸换算:为什么不能直接出 1080×1920

这里有一个绕不开的工程细节。底层图像模型 gpt-image-2 对尺寸有硬性约束:两条边都必须是 16 的倍数。而 1080 除以 16 等于 67.5——不是整数。也就是说,1080×1920 并不是一个有效的生成尺寸,你没法让模型直接吐出平台所需的精确像素。

红线 · 别让"1080"骗了你

1080×1920 看着天经地义,却不是 gpt-image-2 的有效尺寸(1080 不是 16 的倍数)。正确做法是:在"最接近目标比例的有效尺寸"上生成,再在本地裁切 / 降采样到平台精确像素。不要为了凑精确尺寸就贸然切到 CLI——内置出底图、本地裁切,已经够用。

对 9:16 来说,最干净的有效尺寸是 1152×2048——它正好是 9:16(1152÷16=72、2048÷16=128),比例分毫不差。先用它出底图,再在本地等比降采样到 1080×1920 即可:

目标平台像素比例有效生成尺寸本地后处理
抖音 / 视频号封面
1080×1920
9:161152×2048等比降采样到 1080×1920
需要更高清留作母版9:162160×3840(4K 竖)降采样到 1080×1920 发布
小红书竖图(顺带提)3:41152×1536已是 3:4,可直接用

降采样这一步用 pillow 就能完成。内置模式对"精确宽×高"的控制有限——它擅长出"接近比例的底图",精确像素交给本地裁切;只有当你确实需要特殊比例或像素级控制、并明确点名走 CLI 回退时,才用它的 size 参数(那是 CLI-only 能力,需要 OPENAI_API_KEY)。

terminal
$ codex exec "帮我出一张竖版短视频封面底图,9:16,画面中上区留白给标题" # 默认走内置 image_gen 出图(落到接近 9:16 的有效尺寸 1152×2048) # 拿到底图后,本地等比降采样到平台精确像素: $ python -c "from PIL import Image; Image.open('cover.png').resize((1080,1920)).save('cover-1080x1920.png')"
为什么不一开始就出 1080×1920?

因为模型并不接受这个尺寸。记住这条换算链:挑一个"正好 9:16 且边长是 16 的倍数"的有效尺寸出图 → 本地降采样到 1080×1920。1152×2048 就是 9:16 这条链里最省心的一环。

两套封面配方:纸底版 与 深松绿反白版

封面有两种最常用的视觉基调:浅色纸底(干净、知识感,适合教程 / 口播)与深松绿反白(沉稳、高级,适合观点 / 盘点)。下面各给一套配方加提示词。先看图像 AI 在其中扮演的角色——这是本章最要紧的一条手艺:

封面 = 两层叠加 ↓ 底层 · 图像 AI 氛围底图 背景、质感、光线、留白 中上区刻意留空给标题 不依赖它渲染大段文字 + 上层 · 排版 / CSS 真实大标题 用代码 / 设计软件叠字 字形清晰、可改、可对齐 落在安全区内,永不变形
分工原则:图像 AI 负责"看着对"的氛围底图,真正要读的大标题用排版层叠上去更清晰。
一条通用最佳实践

生成模型也能渲染文字,但把大号标题交给它并不划算:字形可能糊、可能错字,改一个字就得重出整张图。业内通行的做法是——让 AI 出不含主标题的氛围底图,把要读的大字用排版(HTML/CSS 或设计软件)叠在上层。如此标题清晰、可随时改文案,还能精确卡进安全区。封面里若一定要 AI 出文字,也只用于次要的小字点缀,并逐字给定。

配方 A · 纸底版(教程 / 口播)

RECIPE

纸底版封面 · 浅色知识感

Use case
ads-marketing · 短视频信息流封面(教程 / 口播向)
Asset type
竖版封面底图(不含主标题,标题后期叠)
Primary request
一张干净的浅色竖图,画面中上部留白给标题
Scene-backdrop
米白纸面质感桌面,柔和自然光,少量道具靠下、靠两侧摆放
Composition
竖构图 9:16;上半部大面积留白;视觉重心压在下 1/3
Color palette
米白、暖灰,一点低饱和绿做点缀
Constraints
底部 ≈350px、右侧 ≈120px 内不放重要元素
Avoid
大段文字、水印、杂乱道具、强阴影、满构图不留白
提示词 · 纸底版封面底图内置 image_gen
竖版 9:16 短视频封面底图米白纸面质感桌面,柔和自然顶光,氛围干净安静。少量与「视频主题,如:手冲咖啡」相关的道具,摆在画面下三分之一与两侧画面中上部留出大面积干净留白,用于后期叠加标题。整体低饱和、暖色调,留足呼吸感。不要任何文字、水印、强投影;底部与右侧边缘保持空净,以避让平台 UI。
9:16 底图中上留白无文字

配方 B · 深松绿反白版(观点 / 盘点)

RECIPE

深松绿反白版封面 · 高级沉稳

Use case
ads-marketing · 短视频信息流封面(观点 / 盘点向)
Asset type
竖版封面底图,深色背景待叠反白标题
Primary request
深松绿渐变竖图,中上区暗而干净,便于压亮色大字
Scene-backdrop
深松绿到墨绿的细腻渐变,微弱颗粒质感,单点柔光
Composition
竖构图 9:16;中上部留出大块深色净空;下部可有一道暖铜色光晕
Color palette
深松绿、墨绿,点缀暖铜金光
Text(verbatim)
无(主标题后期排版叠加,用奶白 #F3EEE2 / 亮铜金 #F2C892)
Avoid
花哨纹样、强反光、文字、底部 / 右侧放重元素
English style tokens · 反白版built-in image_gen
vertical 9:16 short-video cover background, deep pine-green gradient (dark forest green to near-black), subtle fine grain, single soft top light, calm and premium mood, large clean dark negative space in the upper-center for headline overlay, faint warm copper glow near the bottom edge, low saturation, no text, no watermark, no harsh reflections, keep bottom and right edges visually empty for platform UI
deep pine gradientcopper glowtext overlay later
红线 · 深底标题的对比铁律

当你在深松绿(或深褐)底图上叠主标题与链接时,绝不使用深松绿 #1C5D53 这类深色——它会糊进背景,几乎不可读。深色底上的文字必须用奶白 #F3EEE2亮铜金 #F2C892。这条规则在封面、在正文、在任何深色容器里都一致。

同时复核安全区:标题与主体落在中上黄金区,底部 ≈350px 与右侧 ≈120px 内不放任何重要文字或元素。

系列封面:固定模板 + 变量

做单张封面是手艺,做一整个系列而风格统一才是壁垒。一个账号的封面如果每张都"重新设计",在信息流里就散成一盘沙;真正抓人的账号,封面之间一眼就能认出是"同一家"。秘诀是把封面拆成不变的模板每期变化的变量

固定模板(每期不变)

9:16 画布与安全区划分、底图基调(纸底 / 深松绿)、标题字体与字号、标题落位、品牌色、角标 / logo 位置、统一的明暗节奏。

每期变量(逐期替换)

主标题文案、底图里的主题道具或关键词、期号或序号、点缀小字。把这些做成"占位",每期只替换占位即可。

落到生成流程上,这意味着底图提示词的骨架固定不动,只替换其中的主题占位。在内置模式下,系列里每一张封面都是一次独立的 image_gen 调用——同一个提示词骨架、不同的主题词,逐张生成。注意:这是"不同资产",要用不同提示词逐次调用,而不是n 凑数(n 只产出"同一句话的变体",不是不同资产)。

提示词 · 系列底图骨架(可复用)内置 image_gen · 逐张调用
竖版 9:16 短视频封面底图,深松绿渐变背景,单点柔光,微弱颗粒,中上部留大块深色净空给标题。本期主题道具:「本期主题,如:第 03 期 · 通勤穿搭」相关的少量元素,摆在下三分之一。底部与右侧留空避让 UI。无文字、无水印—— 整段只改占位,其余每期保持一致。
骨架固定仅换占位逐张调用
关键判断

系列一致性的真正载体,往往不是底图,而是上层那套排版模板——固定的字体、字号、落位、色彩。底图可以随主题变,但只要标题排版层不动,系列感就稳。把这套排版模板沉淀成一个可复用的工程(HTML/CSS 或设计稿组件),才是规模化做号的地基。

提示:系列封面的模板化、变量注入与批量产出,是"工程化做号"的核心命题,第 13 章会专门把它讲透——包括如何把这套"骨架 + 占位"流程接进自动化管线。
本章 TL;DR

抖音 / 视频号封面是竖版 9:16 · 1080×1920,先圈安全区:底 ≈350px、右 ≈120px 不放重要元素,标题落中上黄金区。1080×1920 不是有效生成尺寸——先出 1152×2048(正好 9:16)再本地降采样。封面分两层:图像 AI 出氛围底图,真实大标题用排版层叠更清晰。深底标题铁律——只用奶白 #F3EEE2 或亮铜金 #F2C892。系列封面靠固定模板 + 每期变量,逐张调用而非用 n 凑数(详见第 13 章)。