提示词写作

照片提示词的七段式结构：每条强力提示词必备的七个模块

更新于 2026-06-19·9 分钟阅读

核心要点

构建照片提示词的关键是将描述划分为七个独立模块：主体身份、动作或姿态、环境与场景、布光设置、相机与镜头、情绪与氛围，以及后期处理风格。每个模块填补了模型读取的不同感知通道，当七个模块同时在场时，模型生成的图像才能真正做到：一致、有意图、符合品牌调性。本文逐一讲解每个模块、配合实战示例，并指出常见排列错误——即便措辞优美的提示词也会因此落空。

AI 图像 AI 视频工作流编辑器

七段式模型：像艺术总监一样写提示词

一条照片提示词不是一个单一的想法，而是一份分层的创作简报。七段式模型对应的正是专业艺术总监给摄影师的简报方式：你不会只说"把产品拍在白色背景上"，你会指定产品是什么、怎么摆放、所在环境、如何打光、用什么镜头、想唤起什么感受，以及最终图像应如何修图。AI 模型读取提示词的方式如出一辙。一旦缺少七个模块中的某一个，模型就会用统计平均值来填补空白——这正是没有"相机与镜头"模块的提示词总是生成同款通用"商业摄影感"景深的原因。七个模块分别是：（1）主体与身份，（2）动作或姿态，（3）环境与场景，（4）布光设置，（5）相机与镜头，（6）情绪与氛围，（7）后期处理与风格。不是每条提示词都需要七个模块全部出现——极简风产品图可以完全省略环境——但熟知全部七个模块意味着你是在主动选择省略什么，而不是在无意中遗漏。

第一、二模块——主体与动作

主体模块描述人物、物体或生物，以及其标志性特征："一位中年尼日利亚男性，蓄着浓密胡须，头发花白且剪得很短，穿着藏蓝色定制西装，白色胸袋巾"。动作模块则描述主体正在做什么："站在顶层露台的边缘，靠着栏杆，眺望城市天际线，一只手插在外套口袋里"。这两个模块共同构成画面的锚点。常见错误：（a）只描述主体的情绪状态，却没有描述外貌，让模型自行猜测面部——结果往往是泛化的商业图库脸；（b）给出一个泛化动作（"站着"）而没有赋予形塑姿态的具体语境——"在会议室站着"与"站在悬崖边缘"读出来是截然不同的气质。对于需要跨多图保持一致的内容系列，将主体模块写成固定的"角色卡"并嵌入多个提示词。这正是 Floniks /editor 工作流所支持的模式：一个角色节点的输出流入下游各种不同的场景与布光配置。

第三模块——环境与场景

环境模块描述主体所处的世界：地点、时间、天气、建筑背景，以及任何背景元素。"一座现代高层建筑的顶层露台，俯瞰密集的城市天际线，傍晚时分，暖色城市灯光开始亮起，背景中可见当代玻璃幕墙与钢结构建筑，空气略带薄霾"。没有场景描述，模型默认生成中性棚拍或白色背景环境。场景本身也携带了隐含的光线信息——"阴天拂晓的海滩"自然暗示着漫散、冷调、低调的光线，你在第四步的布光模块中只需添加细节而不必从头定义。对于刻意要求极简背景的抽象图或产品图，同样需要明确描述："纯白无缝背景，无任何环境干扰"——这依然是在描述环境，只是刻意选择了极简。

第四、五模块——布光与相机

布光设置（第四模块）描述光源、光质、方向和色温。相机与镜头（第五模块）描述焦距、光圈，以及任何带有美学联想的机身型号或胶片型号。这两个模块经常合并描述，因为它们联系紧密：镜头焦距决定视野范围，光圈决定景深，而景深又影响背景中光线的呈现方式。合并后的模块示例："相机左侧 45 度放置一只大型柔光箱作为主光，右侧有功率更低的辅助补光，色温 4800K 暖调，使用索尼 A7R V 搭配 85mm f/1.4 镜头全开光圈拍摄，浅景深使背景分离，柔和圆形焦外散景"。对于产品摄影，"从正上方俯拍的均匀白色漫射铺光，50mm 镜头"能给模型提供极为精准的几何关系。布光词汇专文提供了可直接复制的布光术语参考清单。

第六、七模块——情绪与后期风格

情绪与氛围（第六模块）通过形容词和情感基调参照传达图像的情感属性："志存高远又平易近人，内敛的自信，一种读来更像力量而非孤独的独处感"。你也可以借用文化或电影参照："泰伦斯·马力克深夜电影的氛围——若有所思、节奏徐缓、静静观察"。后期处理风格（第七模块）描述图像离开镜头或渲染引擎后的最终呈现："电影感调色，哑光橙色，提亮阴影，中间调去饱和，轻微胶片颗粒，淡淡暗角"。最后两个模块是图像从"技术正确"跃升为"刻意的创意声明"的关键所在。在 Floniks 中，你可以将这些模块与 /pro-effects 的后期处理功能结合，对整批图像统一应用一致的色彩分级，让系列作品看起来像来自同一次拍摄。

常见排列错误及纠正方法

最常见的排列错误是在确立主体之前就写风格和情绪："电影感，戏剧性，忧郁，高对比，黑色电影美学——一个女人"。模型对前面的词元权重更高，因此可能产出一张技术上完美的黑色电影图，但主体却是一个模糊的泛化女性，因为你把对她的描述埋在了结尾。规则：永远先确立主体，再描述氛围。第二个常见错误是把技术参数与艺术语言混杂穿插——例如"f/1.8 美丽情感特写 4K 伦勃朗光线动人心弦"。这读起来像一串无关标签，而不是一个连贯的创作简报，模型会对其进行宽泛的平均化处理。应将技术参数集中放在末尾。第三个错误是过度描述风格，却轻描淡写主体：花 40 个词描述美学，只用 5 个词描述画面中的人是谁。主体是锚点，其他一切都是氛围。颠倒这个权重比例，你的结果会立竿见影。

常见问题

照片提示词应该用逗号分隔的标签还是完整的句子？+

两者都可以，但完整的句子或简短的分句通常优于纯标签列表。"美丽、戏剧性、史诗感"这样的标签缺乏语法语境，每个标签都可能指向不同方向，给模型提供的方向信息极为有限。结构化短句（"柔和的窗口侧光，色温 4200K 暖调"）将概念绑定在一起，模型读取的是一条连贯指令，而非相互竞争的形容词。

可以省略某些模块让提示词更简洁吗？+

可以。一条极简产品提示词可能只需要主体、环境和布光三个模块。七段式框架是一份检查清单，不是强制剧本。用它来判断你在把哪些空白交给随机性，然后有意识地决定填补还是留白。

如何把七段式结构应用到 AI 视频提示词中？+

Floniks /ai-video 上的 AI 视频提示词遵循同样的结构，只需新增一个模块：描述镜头运动和主体随时间运动的"运动层"。将"动作或姿态"替换为"持续动作"，并添加"相机运动"模块（缓慢推拉、静态固定、手持跟拍）。其余模块——环境、布光、情绪、风格——可以直接沿用。

在 Floniks 上动手做

图像、视频、数字人与可复用工作流，都在同一画布。注册即送起步积分，无需绑卡。

开始使用 Floniks