Prompts schreiben

Foto-Prompt strukturieren: Die 7 Segmente, die jeder starke Prompt braucht

Aktualisiert 2026-06-19·9 Min. Lesezeit

Kernaussage

Einen Foto-Prompt zu strukturieren bedeutet, die Beschreibung in sieben klar abgegrenzte Segmente aufzuteilen: Motividentität, Handlung oder Pose, Umgebung und Setting, Licht-Setup, Kamera und Objektiv, Stimmung und Atmosphäre sowie Nachbearbeitungsstil. Jedes Segment füllt einen anderen Wahrnehmungskanal, den das Modell verarbeitet. Wenn alle sieben vorhanden sind, generiert das Modell Bilder, die konsistent, absichtsvoll und markentreu wirken. Diese Anleitung führt durch jedes Segment mit konkreten Beispielen und zeigt typische Reihenfolge-Fehler, die selbst gut formulierte Prompts zum Scheitern bringen.

KI Bildgenerator KI Videogenerator Workflow-Editor

Das Sieben-Segmente-Modell

Ein Foto-Prompt ist keine einzelne Idee, sondern ein strukturiertes kreatives Briefing mit sieben Ebenen. Das Sieben-Segmente-Modell bildet ab, wie ein professioneller Art Director einen Fotografen brieft: Man sagt nicht einfach "fotografiere ein Produkt auf Weiß." Man gibt an, was das Produkt ist, wie es positioniert wird, wo es sich befindet, wie es beleuchtet ist, welches Objektiv verwendet wird, welche Wirkung erzielt werden soll und wie das Ergebnis nachbearbeitet werden soll. KI-Modelle verarbeiten Prompts auf dieselbe Weise. Fehlt eines der sieben Segmente, füllt das Modell es mit einem statistischen Durchschnittswert auf – weshalb Prompts ohne Kamera-und-Objektiv-Segment stets dieselbe generische Schärfentiefe erzeugen. Die sieben Segmente sind: (1) Motiv und Identität, (2) Handlung oder Pose, (3) Umgebung und Setting, (4) Licht-Setup, (5) Kamera und Objektiv, (6) Stimmung und Atmosphäre, (7) Nachbearbeitung und Stil. Nicht jedes Segment muss in jedem Prompt vorkommen – ein minimalistischer Produktshot kann die Umgebung komplett weglassen – aber alle sieben zu kennen bedeutet, dass du bewusst entscheiden kannst, was du weglässt, anstatt es versehentlich zu vergessen.

Segment 1 & 2 – Motiv und Handlung

Das Motivsegment benennt die Person, das Objekt oder das Lebewesen und beschreibt dessen Erkennungsmerkmale: "ein Mann Mitte fünfzig mit vollem Bart und kurzem grauen Haar, trägt einen dunkelblauen Anzug mit weißem Einstecktuch." Das Handlungssegment beschreibt dann, was das Motiv tut: "steht am Rand einer Dachterrasse, lehnt an einem Geländer, blickt über die Skyline der Stadt, eine Hand in der Jacketttasche." Zusammen bilden diese beiden Segmente den Anker des Bildes. Typische Fehler: (a) Die Emotion des Motivs beschreiben, ohne dessen äußeres Erscheinungsbild zu nennen, sodass das Modell das Gesicht erraten muss; (b) eine generische Handlung nennen ("steht"), ohne einen Kontext, der die Pose formt. "Steht" in einem Konferenzraum liest sich ganz anders als "steht am Rand einer Klippe." Für wiederverwendbare Content-Serien schreibe das Motivsegment als feste "Charakterkarte" und setze sie in mehrere Prompts ein. Genau das unterstützt der Floniks /editor-Workflow: ein Charakter-Knoten, dessen Ausgabe in verschiedene Szenen- und Lichtkonfigurationen flussabwärts eingespeist wird.

Segment 3 – Umgebung und Setting

Das Umgebungssegment beschreibt die Welt, in der das Motiv existiert: Ort, Tageszeit, Wetter, architektonischer Kontext und Hintergrundelemente. "Eine Dachterrasse in einem modernen Hochhaus einer dichten Stadtsilhouette, später Abend, warme Stadtlichter beginnen den Hintergrund zu illuminieren, ein leichter Dunst in der Luft, moderne Glas-und-Stahl-Architektur im Hintergrund sichtbar." Ohne Setting verwenden Modelle standardmäßig neutrale Studio- oder Weißhintergrundumgebungen. Das Setting enthält zudem implizite Lichtinformationen – "ein bedeckter Strand in der Morgendämmerung" impliziert diffuses, kühles, tonales Licht, ohne dass du es explizit angeben musst, sodass dein explizites Lichtsegment nur noch Feinheiten hinzufügen muss. Für abstrakte oder Produktaufnahmen, bei denen du keine ablenkende Umgebung willst, gib sie trotzdem an: "reiner weißer Infinity-Cove-Studio-Hintergrund, keine Umgebungsablenkungen" – das beschreibt die Umgebung, nur bewusst minimalistisch.

Segment 4 & 5 – Licht und Kamera

Das Licht-Setup (Segment 4) benennt die Lichtquellen, ihre Qualität, Richtung und Farbtemperatur. Kamera und Objektiv (Segment 5) benennen die Brennweite, Blende und ggf. ein Kameramodell oder einen Filmtyp mit ästhetischen Assoziationen. Diese zwei Segmente werden häufig zusammengeführt, da sie eng miteinander verknüpft sind: die Objektivwahl bestimmt das Bildfeld und die Blende bestimmt die Schärfentiefe, die wiederum beeinflusst, wie das Licht den Hintergrund rendert. Ein kombiniertes Segment könnte lauten: "Beleuchtet von einer großen Softbox links der Kamera im 45-Grad-Winkel, schwächeres Fülllicht rechts der Kamera, warme 4800 Kelvin, aufgenommen auf einer Sony A7R V mit einem 85mm f/1.4-Objektiv bei voller Öffnung, Hintergrund durch flache Schärfentiefe separiert, weiches kreisförmiges Bokeh." Für die Produktfotografie gibt "Aufsicht-Flatlay-Beleuchtung mit weißen diffusen Panels auf allen Seiten, direkt von oben mit einem 50mm-Objektiv" dem Modell eine äußerst spezifische Geometrie zum Reproduzieren. Weitere Lichtvokabular findest du im entsprechenden Artikel dieses Bereichs.

Segment 6 & 7 – Stimmung und Nachbearbeitungsstil

Stimmung und Atmosphäre (Segment 6) kommuniziert den emotionalen Charakter des Bildes durch Adjektive und tonale Referenzen: "Aufstrebend und gleichzeitig zugänglich, stille Souveränität, ein Gefühl von Einsamkeit, das eher als Stärke denn als Isolation wirkt." Du kannst auch kulturelle oder filmische Referenzen nutzen: "die Stimmung eines Terrence-Malick-Spätabendfilms – nachdenklich, langsam, beobachtend." Der Nachbearbeitungsstil (Segment 7) beschreibt, wie das Bild nach dem Verlassen der Kamera oder des Render-Engines aussieht: "Kinematografische Farbgebung mit gedämpften Orangetönen, angehobenen Schwarzwerten, entsättigten Mitteltönen, subtiles Filmkorn, leichte Vignette." Diese letzten zwei Segmente machen den Unterschied zwischen einem technisch korrekten Bild und einem, das sich wie ein bewusstes kreatives Statement anfühlt. In Floniks kannst du diese Segmente mit einem Pro-Effects-Pass in /pro-effects kombinieren, um ein konsistentes Farbgrading über einen Batch hinweg anzuwenden und jedes Bild einer Serie so zu gestalten, als käme es aus demselben Shooting.

Häufige Reihenfolge-Fehler und wie man sie behebt

Der häufigste Reihenfolge-Fehler ist, mit Stil und Stimmung zu beginnen, bevor das Motiv etabliert ist: "kinematografisch, dramatisch, stimmungsvoll, hoher Kontrast, Film-Noir-Ästhetik – eine Frau." Das Modell gewichtet frühe Token stärker, und so kann es ein technisch hervorragendes Film-Noir-Bild erzeugen, dessen Motiv aber eine vage, generische Frau ist, weil ihre Beschreibung am Ende vergraben war. Regel: Etabliere immer das Motiv, bevor du die Atmosphäre beschreibst. Der zweithäufigste Fehler ist das Vermischen technischer und künstlerischer Sprache ohne Trennung – z. B. "f/1.8 wunderschöne emotionale Großaufnahme 4K Rembrandt-Licht herzlich." Das liest sich wie eine Liste zusammenhangloser Tags und das Modell mittelt sie unverbindlich. Halte technische Parameter am Ende gruppiert zusammen. Der dritte Fehler ist das Über-Spezifizieren des Stils auf Kosten der Motivdetails: 40 Wörter zur Ästhetik und 5 Wörter dazu, wer im Bild ist. Das Motiv ist der Anker; alles andere ist Atmosphäre. Kehre die Gewichtung um und deine Ergebnisse werden sich sofort verbessern.

Häufige Fragen

Soll ich in einem Foto-Prompt Kommas oder vollständige Sätze verwenden?+

Beide Varianten funktionieren, aber vollständige Sätze oder kurze durch Kommas getrennte Teilsätze schneiden tendenziell besser ab als reine Tag-Listen. Tags wie "schön, dramatisch, episch" ohne grammatikalischen Kontext geben dem Modell sehr wenig Richtungssignal – jedes Tag kann in verschiedene Richtungen zeigen. Strukturierte Teilsätze ("weiches Seitenlicht durch ein Fenster, warme 4200 Kelvin Farbtemperatur") verbinden die Konzepte so, dass das Modell sie als kohärente Anweisung liest und nicht als konkurrierende Adjektive.

Kann ich Segmente für einen einfacheren Prompt weglassen?+

Ja. Ein minimalistischer Produktprompt braucht vielleicht nur Motiv, Umgebung und Licht. Das Sieben-Segmente-Modell ist eine Checkliste, kein verbindliches Drehbuch. Nutze es, um zu erkennen, welche Lücken du dem Zufall überlässt, und entscheide dann bewusst, ob du sie füllen oder offen lassen willst.

Wie wende ich die Sieben-Segmente-Struktur auf KI-Video-Prompts an?+

KI-Video-Prompts auf Floniks /ai-video folgen derselben Struktur mit einer Ergänzung: einer Bewegungsebene, die Kamerabewegung und Motivbewegung über die Zeit beschreibt. Ersetze "Handlung oder Pose" durch "kontinuierliche Handlung" und füge ein "Kamerabewegung"-Segment hinzu (langsamer Dolly-In, statische Aufnahme, handheld Follow). Die restlichen Segmente – Umgebung, Licht, Stimmung, Stil – übertragen sich direkt.

Bau es auf Floniks

Bild, Video, digitale Menschen und wiederverwendbare Workflows auf einer Leinwand. Mit der Anmeldung gibt es Startguthaben – ohne Karte.

Floniks entdecken