Prompts schreiben

Der Aufbau eines starken KI-Bild-Prompts

Aktualisiert 2026-06-19·8 Min. Lesezeit

Kernaussage

Ein wirkungsvoller KI-Bild-Prompt besteht nicht aus einem einzigen langen Satz, sondern aus klar getrennten Ebenen: Motiv, Komposition, Licht, Kamera und Objektiv, Stimmung, Bildstil und technische Parameter. Wer jede Ebene explizit benennt, überlässt dem Modell weniger Entscheidungsspielraum – die Ergebnisse treffen die eigene Vorstellung und lassen sich über mehrere Sitzungen hinweg reproduzieren. Diese Anleitung seziert jede Ebene mit konkreten Formulierungen zum direkten Kopieren, erklärt welche Ebenen für verschiedene kreative Ziele am wichtigsten sind und zeigt wie strukturierte Prompts nahtlos in wiederverwendbare Floniks-Workflows integriert werden.

KI Bildgenerator Workflow-Editor Studio

Warum Struktur einen Fließtext schlägt

Die meisten schwachen Prompts scheitern nicht an falschen Wörtern, sondern daran, dass sie nur eine einzige Dimension des Bildes beschreiben – meist das Motiv – und alles andere dem Zufall überlassen. Ein Modell, das fehlende Informationen mit statistischen Durchschnittswerten auffüllt, liefert inkonsistentes Framing, beliebige Beleuchtung und einen Stil, der von Generation zu Generation driftet. Struktur beseitigt dieses Problem. Wer einen Prompt in explizite Ebenen gliedert, gibt dem Modell ein vollständiges kreatives Briefing statt eines einzelnen Satzes. Stell es dir vor wie das Beauftragen eines Fotografen: Du würdest nicht sagen "fotografiere eine Frau" und ein Meisterwerk erwarten. Du würdest Ort, Lichtquelle, Objektiv, Stimmung und Kleidung vorgeben. KI-Modelle reagieren genauso. Struktur macht Iteration außerdem günstig – du kannst eine einzige Ebene austauschen (von "weiches goldenes Stundenlicht" zu "hartes Mittagslicht") ohne den gesamten Prompt neu schreiben zu müssen, und der Rest des Bildes bleibt stabil. In Floniks sind strukturierte Prompts besonders wirkungsvoll, weil du sie als Workflow-Vorlagen im /editor speichern und über einen ganzen Produktkatalog oder eine Content-Serie hinweg wiederverwenden kannst.

Ebene 1 – Motiv: Der unverzichtbare Kern

Die Motiv-Ebene beantwortet: Worum geht es in diesem Bild? Beschreibe Identität, Pose, Mimik, Kleidung und alle relevanten Requisiten so konkret wie möglich. Schwach: "eine Frau in einem Café." Stark: "Eine 30-jährige Frau mit kurzen Naturlocken und einem übergroßen Leinenblazer, die an einem Marmortisch sitzt, eine Keramik-Espressotasse mit beiden Händen hält und mit einem kleinen, privaten Lächeln leicht auf die Tasse heruntersieht." Jedes Detail, das du hinzufügst, ist eine Lücke, die das Modell nicht zufällig füllt. Für Produkte benenne das genaue Objekt: "ein minimalistischer mattschwarzer Keramikbecher, Logo zentriert auf der Vorderseite, Henkel nach rechts zeigend." Für Charaktere, die du in vielen Bildern wiederverwenden möchtest, speichere die Motivbeschreibung in einem Floniks-Workflow-Knoten als feste Eingabe – das ist die Grundlage für Charakterkonsistenz. Wenn dein Motiv mehrere Personen umfasst, nummeriere sie und beschreibe jede separat: "Person 1: … Person 2: …", damit das Modell keine Merkmale vermischt.

Ebene 2 – Komposition und Bildausschnitt

Die Komposition gibt dem Modell vor, wie das Motiv im Bild angeordnet sein soll. Ohne diese Angabe entstehen immer wieder zentrierte, sichere Hochformatvarianten. Nützliche Kompositionsbegriffe sind die Aufnahmedistanz (Nahaufnahme, Halbnahe, Totale), der Kamerawinkel (Augenhöhe, Untersicht, Vogelperspektive, niederländischer Winkel) sowie Kompositionsregeln (Drittelregel, Leitlinien, Negativraum links). Eine vollständige Kompositionsebene könnte lauten: "Halbnahe, leicht untersichtige Kameraposition, Motiv im rechten Bilddrittel, großzügiger Negativraum links mit weichem Bokeh." Die Kombination aus Einstellungsgröße und Kamerawinkel erschließt ein breites Spektrum visueller Wirkung – dasselbe Motiv aus der Untersicht wirkt mächtig und heroisch, aus der Aufsicht verletzlich oder klein. Das /learn/cinematography-Kapitel behandelt Einstellungsgrößen und Winkel ausführlich, falls du diese Begriffe vertiefen möchtest. Die wichtigste Regel: Benenne deine Komposition, bevor du dein Licht beschreibst, denn die Komposition beeinflusst, wie das Licht über das Bild fällt.

Ebene 3 – Licht: Der Stimmungsverstärker

Licht ist die einzige Ebene, die den emotionalen Charakter eines Bildes am dramatischsten verändert, ohne das Motiv selbst zu berühren. "Weiches natürliches Fensterlicht" und "dramatisches Chiaroscuro aus einer einzigen Lichtquelle" können dieselbe Frau in demselben Café zeigen und dennoch Bilder erzeugen, die sich wie vollkommen unterschiedliche Genres anfühlen. Benenne mindestens die Lichtquelle (Fenster, Sonne, LED-Panel, Kerze, Neonschild), die Lichtqualität (weich/diffus vs. hart/direkt), die Richtung (frontal, seitlich, Gegenlicht, Randlicht) und die Farbtemperatur (warmes Gold, kühles Blau-Weiß, neutral). Eine konkrete Lichtebene: "Seitenlicht von einer großen Softbox links von der Kamera, warme 4500 Kelvin Farbtemperatur, weicher Schatten auf der rechten Gesichtshälfte, zartes Randlicht im Haar." Bei Produktaufnahmen ist das Licht oft wichtiger als die Motivbeschreibung selbst – derselbe Becher wirkt unter "weichem, diffusem Flächenlicht mit subtil verlaufendem Hintergrund" hochwertig und unter hartem Deckenlicht billig. Im vollständigen Licht-Vokabular-Artikel dieses Kapitels findest du eine Referenzliste, die du direkt in jeden Prompt kopieren kannst.

Ebene 4 – Stil, Medium und Art-Direction

Die Stilebene sagt dem Modell, aus welcher visuellen Tradition es schöpfen soll. Hier gibst du an, ob das Bild fotografisch-realistisch, illustriert oder malerisch sein soll, und nennst die ästhetische Strömung oder Referenz. Beispiele: "Editorial-Modefotografie, aufgenommen auf Mittelformat-Film, Vogue-Ästhetik" oder "filmisches Digital-Standbild, gedeckte Erdtöne, A24-Filmlook" oder "flache Vektorillustration, Pastellpalette, skandinavisches Minimalismus-Design." Wenn du auf eine bestimmte Kunstrichtung abzielst, benenne sie präzise: "impressionistisches Ölgemälde" gibt dem Modell deutlich mehr Orientierung als "künstlerisch." Du kannst auch Kamera- und Filmtypen für einen fotografischen Look angeben: "Kodak Portra 400, leichtes Korn, warme, angehobene Schatten." Für KI-Video auf Floniks /ai-video entspricht die Äquivalentebene der visuellen Sprache des Clips – kinematografisch, dokumentarisch oder animiert – bevor du die Handlung beschreibst.

Ebene 5 – Technische Parameter und Qualitätssignale

Technische Parameter kommunizieren die gewünschte Ausgabequalität und das Format. Gebräuchliche Signale sind die Auflösungsabsicht ("8K Detail", "ultrascharf"), die Schärfentiefe ("Blende f/1.8, flache Schärfentiefe, Motiv scharf, Hintergrund cremiges Bokeh"), die Objektivcharakteristik ("85-mm-Porträtobjektiv, leichte Kompression") und die Renderqualität ("hyperrealistisch, fotorealistisch, Octane Render, Raytracing"). Du kannst das Seitenverhältnis auch im Prompt angeben, falls das Modell textbasierte Hinweise versteht – die Floniks-Generierungsfelder haben jedoch dedizierte Seitenverhältnis-Steuerungen, die das ergänzen oder überschreiben. Für Produktfotografie ergänze "kein Wasserzeichen, sauberer Hintergrund, Studioqualität, kommerzielle Güte." Für künstlerische Bilder steuern "malerischer Pinselduktus, sichtbare Textur, Museumsqualität" in Richtung Feinstkunst. Platziere technische Begriffe am Ende deines Prompts, damit sie verfeinern statt mit Motiv- und Kompositionsebenen zu konkurrieren.

Alles zusammensetzen: Ein vollständiges Beispiel

So verbinden sich die fünf Ebenen zu einem produktionsfertigen Prompt:

Motiv: "30-jährige japanische Frau mit glattem schwarzem Haar, strukturiertem Elfenbein-Blazer und minimalem Goldschmuck, hält einen kleinen Strauß weißer Pfingstrosen, neutraler Ausdruck, direkter Blickkontakt zur Kamera"

Komposition: "Halbnahe Porträtaufnahme, Augenhöhe, zentriertes Framing mit leichtem Headroom, sauberer Hintergrund"

Licht: "Weiches Beautylicht frontal mit zartem warmem Fülllicht von rechts, 5000 Kelvin Tageslicht, Catchlights in beiden Augen, keine harten Schatten"

Stil: "Hochwertige Editorial-Modefotografie, aufgenommen auf Hasselblad Mittelformat, clean und modern"

Technik: "Blende f/2.8, flache Schärfentiefe, rasiermesserscharfer Fokus auf Augen, Hintergrund weich verschwommen, kommerzielle Studioqualität"

Kombiniert ergibt sich ein Prompt von etwa 90 Wörtern – präzise genug, um spezifisch zu sein, kurz genug, um kohärent zu bleiben. Speichere ihn als Floniks-Workflow-Vorlage und tausche die Motiv-Ebene aus, um ein ganzes Lookbook in einem Durchgang zu generieren.

Schritt für Schritt

1
Zuerst die Motiv-Ebene schreiben
Beschreibe, wer oder was im Bild zu sehen ist: Identität, Pose, Mimik, Kleidung und Requisiten. Sei so konkret, als würdest du einen Fotografen briefen.
2
Komposition und Bildausschnitt hinzufügen
Wähle eine Aufnahmedistanz (Nahaufnahme, Halbnahe, Totale), einen Kamerawinkel und eine Motivplatzierung (Drittelregel, Zentrierung, Negativraum-Richtung).
3
Das Licht spezifizieren
Benenne Lichtquelle, Qualität (weich/hart), Richtung (frontal/seitlich/Gegen-/Randlicht) und Farbtemperatur. Diese einzelne Ebene verändert den emotionalen Charakter des Bildes stärker als jede andere.
4
Visuellen Stil und Medium benennen
Referenziere die fotografische oder künstlerische Tradition: Filmemulsion, Kunststil, Kameramarke oder Genre-Ästhetik.
5
Technische Parameter am Ende ergänzen
Füge Schärfentiefe, Objektivtyp, Auflösungsabsicht und Qualitätssignale am Ende ein, damit sie verfeinern, ohne die Kernebenen zu überschreiben.

Häufige Fragen

Wie lang sollte ein KI-Bild-Prompt sein?+

Lang genug, um jede Ebene einmal zu benennen. Das ergibt typischerweise zwischen 60 und 120 Wörter. Kürzere Prompts lassen zu viele Lücken, die das Modell zufällig füllt; längere Prompts können dazu führen, dass das Modell frühere Details aus den Augen verliert. Wenn du eine sehr komplexe Szene beschreiben musst, gliedere sie in einen mehrstufigen Floniks-Workflow, bei dem jeder Knoten ein Element übernimmt.

Brauche ich jede Ebene in jedem Prompt?+

Nein – beginne mit Motiv, Komposition und Licht. Diese drei Ebenen eliminieren die meiste Varianz. Stil und technische Parameter sind Verfeinerungen, die du hinzufügst, sobald das Grundbild stimmt.

Spielt die Reihenfolge der Ebenen eine Rolle?+

Ja, grob gesagt. Platziere die wichtigsten Informationen zuerst (Motiv, dann Komposition), denn Modelle gewichten frühere Token stärker. Technische Qualitätssignale funktionieren am besten am Ende als abschließende Anweisungen, anstatt mit der Kernbeschreibung zu konkurrieren.

Bau es auf Floniks

Bild, Video, digitale Menschen und wiederverwendbare Workflows auf einer Leinwand. Mit der Anmeldung gibt es Startguthaben – ohne Karte.

Floniks entdecken

Warum Struktur einen Fließtext schlägt

Ebene 1 – Motiv: Der unverzichtbare Kern

Ebene 2 – Komposition und Bildausschnitt

Ebene 3 – Licht: Der Stimmungsverstärker

Ebene 4 – Stil, Medium und Art-Direction

Ebene 5 – Technische Parameter und Qualitätssignale

Alles zusammensetzen: Ein vollständiges Beispiel

Schritt für Schritt

Zuerst die Motiv-Ebene schreiben

Komposition und Bildausschnitt hinzufügen

Das Licht spezifizieren

Visuellen Stil und Medium benennen

Technische Parameter am Ende ergänzen

Häufige Fragen

Verwandte Leitfäden

Bau es auf Floniks