フォトプロンプトの7つのセグメント:強いプロンプトに必要な構造
フォトプロンプトを構造化するとは、説明を7つの明確なセグメントに分けることを意味します。被写体のアイデンティティ・アクションまたはポーズ・環境と設定・ライティングセットアップ・カメラとレンズ・ムードと雰囲気・ポスト処理スタイルです。各セグメントはモデルが読み取る異なる知覚チャンネルを満たすため、7つが揃うことで一貫性があり意図的でブランドらしい画像が生成されます。このガイドでは実例とともに各セグメントを詳しく解説し、よく仕上がったプロンプトでさえ失敗させる典型的な順序ミスを明らかにします。
7セグメントモデルとは
フォトプロンプトは単一のアイデアではなく、層状のクリエイティブブリーフです。7セグメントモデルは、プロのアートディレクターがカメラマンにブリーフィングする方法に対応しています。「白背景で商品を撮って」とは言いません。商品が何であるか・どう配置するか・どこに置くか・どう照らすか・どのレンズを使うか・どんな感情を引き出したいか・最終的な仕上げはどうするかを詳細に指定します。AIモデルも同じようにプロンプトを読みます。7つのセグメントのいずれかが欠けると、モデルは統計的な平均値でそれを埋めます。カメラとレンズのセグメントがないプロンプトは毎回同じ汎用的な「ストックフォト」的な被写界深度を生成する傾向があります。7つのセグメントは:(1) 被写体とアイデンティティ、(2) アクションまたはポーズ、(3) 環境と設定、(4) ライティングセットアップ、(5) カメラとレンズ、(6) ムードと雰囲気、(7) ポスト処理とスタイル。すべてのプロンプトにすべてのセグメントが必要なわけではありません。ミニマルな商品写真は環境を完全に省略するかもしれません。しかし、7つ全てを知ることで、忘れるのではなく意図的に省略できるようになります。
セグメント1&2 — 被写体とアクション
被写体セグメントは人物・物体・生き物を命名し、その識別特性を記述します。「ひげを蓄えた中年のナイジェリア人男性、白いポケットチーフを添えたネイビースーツ着用、白髪交じりの短い刈り込みヘア」のように。アクションセグメントは次に被写体が何をしているかを記述します。「屋上テラスの端に立ち、手すりにもたれて都市のスカイラインを見渡し、一方の手をジャケットのポケットに入れている」のように。この2つのセグメントが画像のアンカーを確立します。よくあるミス:(a) 被写体の感情は描写しているが外見を描写しておらず、モデルが顔を推測する。(b) 文脈なしに汎用的なアクション(「立っている」)を指定している。会議室で「立っている」のと崖の端で「立っている」のでは全く異なる読まれ方をします。再利用可能なコンテンツシリーズには、被写体セグメントを固定の「キャラクターカード」として記述し、複数のプロンプトにはめ込んでください。Floniksの/editorワークフローがまさにこのパターンをサポートしています。キャラクターノードの出力が下流のさまざまなシーンとライティングの設定にフィードされます。
セグメント3 — 環境と設定
環境セグメントは被写体が存在する世界を記述します。場所・時間帯・天候・建築的な文脈、および背景の要素。「現代の高層ビルの屋上テラス、密集した都市のスカイライン、夕方、暖かな街の灯りが背景を照らし始め、空気に薄いもやがかかり、現代的なガラスとスチールの建築が見える」のように。設定がなければ、モデルはニュートラルなスタジオや白背景の環境をデフォルトにします。設定には暗黙のライティング情報も含まれます。「夜明けの曇りの浜辺」は、拡散した・クールな・ローキーな光を明示せずに示唆しており、ステップ4の明示的なライティングセグメントは一から定義するのではなくニュアンスを加えるだけで済みます。環境が気を散らしない抽象的または商品撮影の場合も、それを指定してください。「純白のインフィニティコーブスタジオ背景、環境的な気散じなし」これも環境を記述していますが、意図的にミニマルなのです。
セグメント4&5 — ライティングとカメラ
ライティングセットアップ(セグメント4)は光源・光質・方向・色温度を指定します。カメラとレンズ(セグメント5)は焦点距離・絞り・美的連想を持つカメラモデルやフィルムストックを指定します。この2つのセグメントはしばしば統合されます。レンズ選択が視野を決定し、絞りが被写界深度を決定し、それが背景への光の落ち方に影響するからです。統合されたセグメントの例:「カメラ左から45度のラージソフトボックス、右からは低いパワーのセカンドフィルライト、暖かい色温度4800K、Sony A7R VとF1.4の85mmレンズで開放、浅い被写界深度で背景から分離、柔らかい円形のボケ」。商品写真では「4方向の白い拡散パネルで頭上フラットレイ照明、真上から50mmレンズで撮影」とすると、モデルに非常に具体的な形状を伝えられます。
セグメント6&7 — ムードとポスト処理スタイル
ムードと雰囲気(セグメント6)は形容詞とトーンのリファレンスを通じて画像の感情的なレジスターを伝えます。「野心的だが親しみやすく、静かな自信、孤独よりも強さとして読まれる孤立感」のように。映画や文化的なリファレンスも使えます。「テレンス・マリック監督作品の深夜の雰囲気 — 思索的でゆっくりと、じっと見ている」のように。ポスト処理スタイル(セグメント7)は画像がカメラやレンダリングエンジンを出た後の仕上がりを指定します。「ミュートされたオレンジとリフトされたブラックとデサチュレートされたミッドトーンのシネマティックカラーグレード、繊細なフィルムグレイン、わずかなビネット」のように。この最後の2つのセグメントが、技術的に正しい画像と意図的なクリエイティブステートメントのように感じられる画像の違いを生みます。Floniksでは、/pro-effectsのプロエフェクトパスと組み合わせることで、シリーズ内のすべての画像に一貫したカラーグレードを適用し、同じ撮影から生まれたような統一感を実現できます。
よくある順序ミスとその修正方法
最も一般的な順序ミスは、被写体を確立する前にスタイルとムードを先に書くことです。「シネマティック、ドラマティック、ムーディー、ハイコントラスト、フィルムノワールの審美眼 — ある女性」。モデルは早いトークンを最も重く読むため、技術的に優れたフィルムノワール画像が生成されても、被写体の記述が最後に埋もれていれば漠然とした汎用的な女性になってしまいます。ルール:常に雰囲気より先に被写体を確立してください。2番目に一般的なミスは、技術的な言語と芸術的な言語を分離せずに混在させることです。例えば「f/1.8 美しい感情的なクローズアップ 4K レンブラント照明 心温まる」。これは一貫したブリーフではなく無関係なタグのリストとして読まれ、モデルはそれらを大雑把に平均化します。技術的なパラメータは最後にまとめてグループ化してください。3番目のミスは、画像内の人物の詳細に費やす言葉よりもスタイルの記述に費やす言葉の方が多くなることです。被写体はアンカーであり、その他すべては雰囲気です。重みを逆転させるだけで結果はすぐに改善されます。
よくある質問
フォトプロンプトではコンマと完全な文章のどちらが良いですか?+
どちらも機能しますが、完全な文章または短いコンマ区切りの節の方がタグリストよりもパフォーマンスが良い傾向があります。「美しい、ドラマティック、壮大」のような文法的な文脈のないタグは、各タグが異なる方向を指す可能性があるためモデルに方向性のシグナルをほとんど与えません。「窓からの柔らかいサイドライト、暖かい色温度4200K」のような構造化された節は、概念を結びつけてモデルが競合する形容詞ではなく一貫した指示として読めるようにします。
よりシンプルなプロンプトのためにセグメントをスキップできますか?+
はい。ミニマルな商品プロンプトは被写体・環境・ライティングのみで十分かもしれません。7セグメントフレームワークはチェックリストであり、必須のスクリプトではありません。どの空白を偶然に任せているかを特定し、それを意図的に埋めるか開けておくかを決めてください。
AI動画プロンプトに7セグメント構造を適用するにはどうすればよいですか?+
Floniksの/ai-videoのAI動画プロンプトは同じ構造に従いますが、追加が一つあります。時間の経過とともにカメラの動きと被写体の動きを記述するモーションレイヤーです。「アクションまたはポーズ」を「継続的なアクション」に置き換え、「カメラモーション」セグメント(スロードリー・スタティックショット・ハンドヘルドフォロー)を追加します。環境・ライティング・ムード・スタイルの他のセグメントはそのまま転用できます。
関連ガイド
Floniks で作ってみる
画像・動画・デジタルヒューマン・再利用できるワークフローをひとつのキャンバスで。登録で初期クレジット付与、カード不要。
Floniks を使ってみる