Floniks
提示词写作

照片提示词的七段式结构:每条强力提示词必备的七个模块

更新于 2026-06-19·9 分钟阅读
核心要点

构建照片提示词的关键是将描述划分为七个独立模块:主体身份、动作或姿态、环境与场景、布光设置、相机与镜头、情绪与氛围,以及后期处理风格。每个模块填补了模型读取的不同感知通道,当七个模块同时在场时,模型生成的图像才能真正做到:一致、有意图、符合品牌调性。本文逐一讲解每个模块、配合实战示例,并指出常见排列错误——即便措辞优美的提示词也会因此落空。

七段式模型:像艺术总监一样写提示词

一条照片提示词不是一个单一的想法,而是一份分层的创作简报。七段式模型对应的正是专业艺术总监给摄影师的简报方式:你不会只说"把产品拍在白色背景上",你会指定产品是什么、怎么摆放、所在环境、如何打光、用什么镜头、想唤起什么感受,以及最终图像应如何修图。AI 模型读取提示词的方式如出一辙。一旦缺少七个模块中的某一个,模型就会用统计平均值来填补空白——这正是没有"相机与镜头"模块的提示词总是生成同款通用"商业摄影感"景深的原因。七个模块分别是:(1)主体与身份,(2)动作或姿态,(3)环境与场景,(4)布光设置,(5)相机与镜头,(6)情绪与氛围,(7)后期处理与风格。不是每条提示词都需要七个模块全部出现——极简风产品图可以完全省略环境——但熟知全部七个模块意味着你是在主动选择省略什么,而不是在无意中遗漏。

第一、二模块——主体与动作

主体模块描述人物、物体或生物,以及其标志性特征:"一位中年尼日利亚男性,蓄着浓密胡须,头发花白且剪得很短,穿着藏蓝色定制西装,白色胸袋巾"。动作模块则描述主体正在做什么:"站在顶层露台的边缘,靠着栏杆,眺望城市天际线,一只手插在外套口袋里"。这两个模块共同构成画面的锚点。常见错误:(a)只描述主体的情绪状态,却没有描述外貌,让模型自行猜测面部——结果往往是泛化的商业图库脸;(b)给出一个泛化动作("站着")而没有赋予形塑姿态的具体语境——"在会议室站着"与"站在悬崖边缘"读出来是截然不同的气质。对于需要跨多图保持一致的内容系列,将主体模块写成固定的"角色卡"并嵌入多个提示词。这正是 Floniks /editor 工作流所支持的模式:一个角色节点的输出流入下游各种不同的场景与布光配置。

第三模块——环境与场景

环境模块描述主体所处的世界:地点、时间、天气、建筑背景,以及任何背景元素。"一座现代高层建筑的顶层露台,俯瞰密集的城市天际线,傍晚时分,暖色城市灯光开始亮起,背景中可见当代玻璃幕墙与钢结构建筑,空气略带薄霾"。没有场景描述,模型默认生成中性棚拍或白色背景环境。场景本身也携带了隐含的光线信息——"阴天拂晓的海滩"自然暗示着漫散、冷调、低调的光线,你在第四步的布光模块中只需添加细节而不必从头定义。对于刻意要求极简背景的抽象图或产品图,同样需要明确描述:"纯白无缝背景,无任何环境干扰"——这依然是在描述环境,只是刻意选择了极简。

第四、五模块——布光与相机

布光设置(第四模块)描述光源、光质、方向和色温。相机与镜头(第五模块)描述焦距、光圈,以及任何带有美学联想的机身型号或胶片型号。这两个模块经常合并描述,因为它们联系紧密:镜头焦距决定视野范围,光圈决定景深,而景深又影响背景中光线的呈现方式。合并后的模块示例:"相机左侧 45 度放置一只大型柔光箱作为主光,右侧有功率更低的辅助补光,色温 4800K 暖调,使用索尼 A7R V 搭配 85mm f/1.4 镜头全开光圈拍摄,浅景深使背景分离,柔和圆形焦外散景"。对于产品摄影,"从正上方俯拍的均匀白色漫射铺光,50mm 镜头"能给模型提供极为精准的几何关系。布光词汇专文提供了可直接复制的布光术语参考清单。

第六、七模块——情绪与后期风格

情绪与氛围(第六模块)通过形容词和情感基调参照传达图像的情感属性:"志存高远又平易近人,内敛的自信,一种读来更像力量而非孤独的独处感"。你也可以借用文化或电影参照:"泰伦斯·马力克深夜电影的氛围——若有所思、节奏徐缓、静静观察"。后期处理风格(第七模块)描述图像离开镜头或渲染引擎后的最终呈现:"电影感调色,哑光橙色,提亮阴影,中间调去饱和,轻微胶片颗粒,淡淡暗角"。最后两个模块是图像从"技术正确"跃升为"刻意的创意声明"的关键所在。在 Floniks 中,你可以将这些模块与 /pro-effects 的后期处理功能结合,对整批图像统一应用一致的色彩分级,让系列作品看起来像来自同一次拍摄。

常见排列错误及纠正方法

最常见的排列错误是在确立主体之前就写风格和情绪:"电影感,戏剧性,忧郁,高对比,黑色电影美学——一个女人"。模型对前面的词元权重更高,因此可能产出一张技术上完美的黑色电影图,但主体却是一个模糊的泛化女性,因为你把对她的描述埋在了结尾。规则:永远先确立主体,再描述氛围。第二个常见错误是把技术参数与艺术语言混杂穿插——例如"f/1.8 美丽情感特写 4K 伦勃朗光线动人心弦"。这读起来像一串无关标签,而不是一个连贯的创作简报,模型会对其进行宽泛的平均化处理。应将技术参数集中放在末尾。第三个错误是过度描述风格,却轻描淡写主体:花 40 个词描述美学,只用 5 个词描述画面中的人是谁。主体是锚点,其他一切都是氛围。颠倒这个权重比例,你的结果会立竿见影。

常见问题

照片提示词应该用逗号分隔的标签还是完整的句子?+

两者都可以,但完整的句子或简短的分句通常优于纯标签列表。"美丽、戏剧性、史诗感"这样的标签缺乏语法语境,每个标签都可能指向不同方向,给模型提供的方向信息极为有限。结构化短句("柔和的窗口侧光,色温 4200K 暖调")将概念绑定在一起,模型读取的是一条连贯指令,而非相互竞争的形容词。

可以省略某些模块让提示词更简洁吗?+

可以。一条极简产品提示词可能只需要主体、环境和布光三个模块。七段式框架是一份检查清单,不是强制剧本。用它来判断你在把哪些空白交给随机性,然后有意识地决定填补还是留白。

如何把七段式结构应用到 AI 视频提示词中?+

Floniks /ai-video 上的 AI 视频提示词遵循同样的结构,只需新增一个模块:描述镜头运动和主体随时间运动的"运动层"。将"动作或姿态"替换为"持续动作",并添加"相机运动"模块(缓慢推拉、静态固定、手持跟拍)。其余模块——环境、布光、情绪、风格——可以直接沿用。

相关指南

在 Floniks 上动手做

图像、视频、数字人与可复用工作流,都在同一画布。注册即送起步积分,无需绑卡。

开始使用 Floniks