強いAI画像プロンプトの解剖学
優れたAI画像プロンプトは、一本の長い文章ではなく、明確な「レイヤー」の積み重ねで構成されています。被写体・構図・照明・レンズ・雰囲気・アートスタイル・技術パラメータという7つの層を意識して書くことで、モデルが補完する余地を最小限に抑え、意図した通りの画像が毎回安定して生成できます。このガイドでは各レイヤーを具体的な記述例とともに徹底解説し、Floniksのワークフローに組み込むための実践的なテクニックを紹介します。
構造化が「なんとなくの文章」に勝る理由
弱いプロンプトの多くは、言葉の選択ではなく「被写体しか書かれていない」という構造上の問題が原因です。被写体以外をモデルに任せると、フレーミングはデフォルトになり、照明は統計的な平均値になり、スタイルはリクエストのたびにバラバラになります。構造化されたプロンプトは、この問題を根本から解決します。レイヤーごとに明示することで、モデルには「空白で埋めろ」という指示ではなく、完全なクリエイティブブリーフが渡されます。カメラマンへの撮影依頼に例えると、「女性を撮って」とだけ言う人はいません。場所・光源・レンズ・ムード・衣装を事前に伝えます。AIも同じです。構造化されたプロンプトはイテレーションも容易で、照明だけを「柔らかいゴールデンアワー」から「強い真昼の太陽光」に変えるだけで、他の要素を維持したまま全く異なる雰囲気を生成できます。Floniksでは、/editorのワークフローテンプレートとしてプロンプトを保存すれば、商品カタログやコンテンツシリーズ全体に活用できます。
レイヤー1 — 被写体:すべての起点
被写体レイヤーは「この画像は何を描いているか」に答えます。アイデンティティ・ポーズ・表情・服装・小道具をできる限り具体的に記述してください。曖昧な例:「カフェにいる女性」。強い例:「30代の南アジア系女性、ショートのナチュラルヘア、オーバーサイズのリネンブレザー着用、マーブルのカフェテーブルに座り、両手でセラミックのエスプレッソカップを持ち、わずかに微笑みながらカップを見下ろしている」。追加した詳細の数だけ、モデルがランダムに補完する余白が減ります。商品の場合は物体を正確に記述してください。「シンプルなマットブラックの陶器製マグカップ、ロゴが正面中央に配置され、ハンドルが右向き」のように具体化します。複数のキャラクターを登場させる場合は「被写体1:…被写体2:…」と番号付きで個別に記述し、モデルが特徴を混在させるのを防ぎましょう。Floniksの/editorでは被写体の説明をワークフローノードの固定入力として保存することで、シーンをまたいでキャラクターの一貫性を維持できます。
レイヤー2 — 構図とフレーミング
構図レイヤーは、フレーム内での被写体の配置方法をモデルに伝えます。指定がなければ、モデルはほぼ毎回、中央揃えの安全な縦位置構図を生成します。有効な構図フレーズには、撮影距離(クローズアップ・ミディアムショット・ワイドショット)、アングル(アイレベル・ローアングル・バードアイビュー・ダッチチルト)、構図ルール(三分割法・誘導線・左側のネガティブスペース)が含まれます。具体例:「ミディアムショット、やや低いカメラアングル、被写体をフレームの右三分の一に配置、左側に柔らかいボケで満たしたたっぷりのネガティブスペース」。ショットタイプとアングルの組み合わせで視覚的表現の幅が大きく広がります。同じ被写体でも、ローアングルからはパワフルでヒロイックに、ハイアングルからは小さく繊細に見えます。/learn/cinematographyの映像文法セクションでショットタイプとアングルについて詳しく学べます。重要なルール:照明の前に構図を指定してください。構図が光の落ち方を決定するからです。
レイヤー3 — 照明:感情を変える最強レイヤー
照明は、被写体を変えずに画像の感情的なトーンを最も劇的に変化させるレイヤーです。「柔らかい自然の窓光」と「ドラマチックなキアロスクーロ単光源照明」は、同じカフェにいる同じ女性でも、全く異なるジャンルの作品に仕上げます。最低限、光源(窓・太陽・LEDパネル・キャンドル・ネオンサイン)、光質(柔らかい/拡散 vs. 硬い/直接)、方向(フロントライト・サイドライト・バックライト・リムライト)、色温度(暖かいゴールデン・クールな青白色・ニュートラル)を指定してください。具体的な照明の記述例:「カメラ左側の大型ソフトボックスからのサイドライト、色温度4500K、顔の右半分に柔らかい影、髪に繊細なリムライト」。商品撮影では、照明は被写体の説明よりも重要な場合があります。同じマグカップでも、「柔らかくフラットな拡散光とサブルなグラデーション背景」では高級感が出て、強い真上からの照明では安っぽく見えます。
レイヤー4 — スタイル・媒体・アートディレクション
スタイルレイヤーでは、モデルが参照すべき視覚的な伝統を指定します。写真のリアリズム・イラスト・絵画的表現の違い、そして美学的運動や参照スタイルを具体的に記述します。例:「エディトリアルファッション写真、中判フィルム撮影、Vogue的審美眼」、「シネマティックデジタルスチル、ミュートされたアースカラー、A24フィルムのカラーグレーディング」、「フラットベクターイラスト、パステルパレット、スカンジナビアンミニマリストデザイン」。特定のアート運動を狙う場合は正確に命名してください。「印象派の油絵」は「芸術的」よりはるかに具体的なシグナルです。写真的な仕上がりを望む場合はカメラとフィルムの種類を指定できます:「Kodak Portra 400フィルム、わずかな粒子感、暖かみのある持ち上げられたシャドウ」。FlouniksのAI動画(/ai-video)では、被写体の動きを描写する前にクリップのビジュアル言語(シネマティック・ドキュメンタリー・アニメーション)を指定することが同様のレイヤーとして機能します。
レイヤー5 — 技術パラメータと品質シグナル
技術パラメータは、望む出力の忠実度とフォーマットを伝えます。よく使われるシグナルには、解像度の意図(「8Kディテール」「超シャープ」)、被写界深度(「f/1.8の浅い被写界深度、被写体はシャープ、背景はクリーミーなボケ」)、レンズ特性(「85mmポートレートレンズ、わずかなレンズ圧縮」)、レンダリング品質(「ハイパーリアリスティック、フォトリアリスティック、レイトレーシング照明」)があります。アスペクト比はプロンプト内にテキストで指定することもできますが、Floniksの生成パネルには専用のアスペクト比コントロールがあり、それが優先されます。商品写真には「透かしなし、クリーンな背景、スタジオクオリティ、コマーシャルグレード」を追加してください。芸術的な画像には「絵画的なブラッシュワーク、可視のテクスチャ、美術館品質」でファインアートのレンダリングに誘導できます。技術レイヤーのキーワードはプロンプトの末尾に置き、被写体と構図レイヤーと競合しないようにしてください。
5つのレイヤーを組み合わせる:実例ウォークスルー
5つのレイヤーを1つの本番用プロンプトにまとめるとこうなります。
被写体:「まっすぐな黒髪を持つ30代の日本人女性、構築的なアイボリーのブレザーとシンプルなゴールドジュエリー着用、白いボタニカルフラワーの小さなブーケを持ち、無表情でカメラと直接目線を合わせている」
構図:「ミディアムポートレートショット、アイレベル、わずかなヘッドルームを持つセンターフレーミング、クリーンな背景」
照明:「柔らかいビューティーディッシュのフロントライト、カメラ右からの微妙な暖色フィル、5000Kニュートラルデイライト、両目にキャッチライト、ハードシャドウなし」
スタイル:「ハイエンドエディトリアルファッション写真、ハッセルブラッド中判フォーマット撮影、クリーンでモダンな審美眼」
技術:「f/2.8の浅い被写界深度、目にカミソリのようなシャープなフォーカス、背景は柔らかくぼかす、コマーシャルスタジオクオリティ」
このプロンプトは約90単語、十分に具体的でありながら一貫性を保つのに十分です。Floniksのワークフローテンプレートとして保存し、被写体レイヤーのみを交換することで、一回のバッチでルックブック全体を生成できます。
ステップ・バイ・ステップ
- 1
被写体レイヤーを最初に書く
画像に登場する人物や物体を、アイデンティティ・ポーズ・表情・服装・小道具を含めて具体的に記述します。カメラマンにブリーフィングするのと同じ詳細さを目指してください。
- 2
構図とフレーミングを追加する
撮影距離(クローズアップ・ミディアム・ワイド)、カメラアングル、被写体の配置(三分割法・中央揃え・ネガティブスペースの方向)を選択します。
- 3
照明を具体的に指定する
光源・光質(柔らかい/硬い)・方向(フロント/サイド/バック/リム)・色温度を明記します。このレイヤーだけで、他のどの要素より画像の感情的なトーンが変わります。
- 4
ビジュアルスタイルと媒体を指定する
フィルムストック・アート運動・カメラブランド・ジャンル的審美眼など、参照する写真的または芸術的な伝統を記述します。
- 5
最後に技術パラメータを追加する
被写界深度・レンズタイプ・解像度の意図・品質シグナルをプロンプトの末尾に追加し、コアレイヤーを上書きせずに洗練させます。
よくある質問
AI画像プロンプトは何文字・何単語が適切ですか?+
各レイヤーを一度ずつ記述できる長さが理想で、通常は60〜120単語程度になります。短すぎるとモデルが空白をランダムに補完し、長すぎると前半の詳細が失われる可能性があります。非常に複雑なシーンを描写する必要がある場合は、各ノードが一つの要素を担うFloniksのマルチステップワークフローに分割してください。
すべてのプロンプトに全レイヤーが必要ですか?+
必須ではありません。まずは被写体・構図・照明の3つから始めてください。この3レイヤーが最もばらつきを減らします。スタイルと技術パラメータは、コア画像がうまくできてから洗練のために追加するものです。
レイヤーの順番は重要ですか?+
はい、おおよその順番は重要です。モデルはプロンプトの前半のトークンにより大きな重みを置くため、最も重要な情報を先に書いてください(被写体、次に構図)。技術的な品質シグナルはコアの説明と競合しないよう、最後の仕上げとして配置するのが最も効果的です。
関連ガイド
Floniks で作ってみる
画像・動画・デジタルヒューマン・再利用できるワークフローをひとつのキャンバスで。登録で初期クレジット付与、カード不要。
Floniks を使ってみる