Cara Menyusun Prompt Foto: 7 Segmen yang Dibutuhkan Setiap Prompt Berkualitas
Menyusun prompt foto berarti membagi deskripsi Anda menjadi tujuh segmen yang berbeda: identitas subjek, aksi atau pose, lingkungan dan setting, setup pencahayaan, kamera dan lensa, suasana dan atmosfer, serta gaya pasca-proses. Setiap segmen mengisi saluran perseptual berbeda yang dibaca oleh model, sehingga ketika ketujuhnya hadir, model menghasilkan gambar yang konsisten, bertujuan, dan sesuai brand. Panduan ini menelusuri setiap segmen dengan contoh kerja nyata dan kesalahan urutan yang umum yang menyebabkan bahkan prompt yang tertulis baik sekalipun meleset dari sasaran.
Model Tujuh Segmen
Prompt foto bukan sekadar satu ide — melainkan sebuah brief kreatif yang berlapis. Model tujuh segmen memetakan cara seorang art director profesional memberi briefing kepada fotografer: Anda tidak hanya berkata "foto produk di atas putih." Anda menentukan apa produknya, bagaimana posisinya, di mana letaknya, bagaimana pencahayaannya, lensa apa yang Anda gunakan, perasaan apa yang ingin Anda bangkitkan, dan bagaimana gambar akhir harus di-retouch. Model AI membaca prompt dengan cara yang sama persis. Ketika salah satu dari tujuh segmen tidak ada, model mengisinya dengan rata-rata statistik — itulah mengapa prompt yang tidak memiliki segmen kamera dan lensa cenderung menghasilkan depth of field "foto stok" generik yang sama setiap saat. Ketujuh segmen tersebut adalah: (1) Subjek dan identitas, (2) Aksi atau pose, (3) Lingkungan dan setting, (4) Setup pencahayaan, (5) Kamera dan lensa, (6) Suasana dan atmosfer, (7) Pasca-proses dan gaya. Anda tidak membutuhkan semua segmen di setiap prompt — foto produk minimalis mungkin melewatkan lingkungan sama sekali — tetapi mengetahui ketujuhnya berarti Anda bisa memilih secara sengaja apa yang ingin dihilangkan, bukan melupakannya begitu saja.
Segmen 1 & 2 — Subjek dan Aksi
Segmen subjek menyebutkan orang, objek, atau makhluk beserta ciri-ciri identifikasinya: "pria Nigeria paruh baya dengan jenggot lebat dan rambut abu-abu pendek, mengenakan setelan navy gelap, pocket square putih." Segmen aksi kemudian mendeskripsikan apa yang sedang dilakukan subjek: "berdiri di tepi teras rooftop, bersandar di pagar, menatap ke luar ke skyline kota, satu tangan di saku jaket." Bersama-sama, kedua segmen ini membangun jangkar gambar. Kesalahan umum: (a) Mendeskripsikan emosi subjek tetapi bukan penampilan fisiknya, membuat model menebak wajahnya; (b) Menyebutkan aksi generik ("berdiri") tanpa konteks yang membentuk pose — "berdiri" di ruang rapat terbaca berbeda dari "berdiri di tepi tebing." Untuk seri konten yang bisa digunakan berulang, tulis segmen subjek Anda sebagai "kartu karakter" tetap dan masukkan ke dalam berbagai prompt. Inilah yang persis didukung oleh workflow /editor Floniks: node karakter yang outputnya mengalir ke berbagai konfigurasi adegan dan pencahayaan di hilir.
Segmen 3 — Lingkungan dan Setting
Segmen lingkungan mendeskripsikan dunia yang dihuni subjek: lokasi, waktu dalam sehari, cuaca, konteks arsitektur, dan elemen latar belakang apa pun. "Teras rooftop di gedung pencakar langit modern di tengah skyline kota yang padat, menjelang malam, lampu kota hangat mulai menerangi latar belakang, sedikit kabut di udara, arsitektur kaca-dan-baja kontemporer terlihat." Tanpa setting, model akan default ke lingkungan studio netral atau latar putih. Setting juga membawa informasi pencahayaan implisit — "pantai mendung saat fajar" menyiratkan cahaya difus, dingin, dan low-key tanpa Anda harus menyatakannya secara eksplisit, yang berarti segmen pencahayaan eksplisit Anda di langkah 4 hanya perlu menambahkan nuansa, bukan mendefinisikan dari nol. Untuk bidikan abstrak atau produk di mana Anda tidak ingin lingkungan yang mengganggu, tentukan saja: "latar belakang infinity cove studio putih bersih, tanpa gangguan lingkungan" — ini tetap mendeskripsikan lingkungan, hanya saja secara minimalis yang disengaja.
Segmen 4 & 5 — Pencahayaan dan Kamera
Setup pencahayaan (segmen 4) menyebutkan sumber cahaya, kualitas, arah, dan suhu warnanya. Kamera dan lensa (segmen 5) menyebutkan panjang fokal, aperture, dan model kamera atau stok film apa pun yang membawa asosiasi estetis. Kedua segmen ini sering digabungkan karena saling berkaitan: pilihan lensa menentukan field of view, dan aperture menentukan depth of field yang berinteraksi dengan cara cahaya merender latar belakang. Segmen gabungan bisa berbunyi: "diterangi oleh softbox besar di kiri kamera pada sudut 45 derajat, fill light sekunder dengan daya lebih rendah dari kanan kamera, hangat 4800K, diambil dengan Sony A7R V menggunakan lensa 85mm f/1.4 terbuka lebar, latar belakang terpisah dengan depth of field dangkal, bokeh melingkar lembut." Untuk foto produk, "pencahayaan flat lay overhead dengan panel difus putih di semua sisi, diambil langsung dari atas dengan lensa 50mm" memberi model geometri yang sangat spesifik untuk direproduksi. Lihat artikel kosakata pencahayaan di pilar ini untuk daftar referensi istilah pencahayaan yang bisa langsung disalin.
Segmen 6 & 7 — Suasana dan Gaya Pasca-Proses
Suasana dan atmosfer (segmen 6) mengkomunikasikan nuansa emosional gambar melalui kata sifat dan referensi tonal: "inspiratif tapi mudah didekati, kepercayaan diri yang tenang, rasa kesendirian yang terbaca sebagai kekuatan bukan kesepian." Anda juga bisa menggunakan referensi budaya atau sinematik: "suasana film Terrence Malick tengah malam — penuh perenungan, lambat, mengamati." Gaya pasca-proses (segmen 7) menentukan seperti apa gambar setelah meninggalkan kamera atau render engine: "color grade sinematik dengan oranye yang diredam, blacks yang terangkat, mid-tones yang didesaturasi, grain film halus, sedikit vignette." Dua segmen terakhir ini adalah perbedaan antara gambar yang secara teknis benar dan gambar yang terasa seperti pernyataan kreatif yang disengaja. Di Floniks, Anda bisa memasangkan segmen-segmen ini dengan pass pro-effects di /pro-effects untuk menerapkan color grading yang konsisten di seluruh batch, membuat setiap gambar dalam satu seri terasa seperti berasal dari pemotretan yang sama.
Kesalahan Urutan yang Umum dan Cara Memperbaikinya
Kesalahan urutan yang paling umum adalah memimpin dengan gaya dan suasana sebelum membangun subjek: "sinematik, dramatis, moody, kontras tinggi, estetika film noir — seorang wanita." Model membaca token awal dengan bobot paling tinggi, sehingga mungkin menghasilkan gambar film noir yang secara teknis sangat baik tetapi subjeknya adalah wanita samar-samar dan generik karena Anda memendam deskripsinya di akhir. Aturan: selalu bangun subjek sebelum atmosfer. Kesalahan paling umum kedua adalah mencampurkan bahasa teknis dan artistik tanpa pemisahan — misalnya "f/1.8 close-up emosional indah 4K pencahayaan Rembrandt penuh perasaan." Ini terbaca sebagai daftar tag yang tidak terhubung, bukan brief yang koheren, dan model merata-ratakannya secara longgar. Kelompokkan parameter teknis bersama-sama di akhir. Kesalahan ketiga adalah terlalu mendetailkan gaya dengan mengorbankan detail subjek: menghabiskan 40 kata untuk estetika dan hanya 5 kata untuk siapa yang ada dalam gambar. Subjek adalah jangkar; semua yang lain adalah atmosfer. Balikkan bobotnya dan hasilnya akan langsung membaik.
Pertanyaan umum
Haruskah saya menggunakan koma atau kalimat lengkap dalam prompt foto?+
Keduanya bisa, tetapi kalimat lengkap atau klausa pendek yang dipisah koma cenderung bekerja lebih baik daripada daftar tag. Tag seperti "indah, dramatis, epik" tanpa konteks gramatikal memberi model sangat sedikit sinyal arah — setiap tag bisa menunjuk ke arah yang berbeda. Klausa terstruktur ("pencahayaan samping lembut dari jendela, suhu warna hangat 4200K") mengikat konsep-konsep bersama sehingga model membacanya sebagai instruksi yang koheren, bukan kata sifat yang bersaing.
Bisakah saya melewatkan segmen untuk prompt yang lebih sederhana?+
Ya. Prompt produk minimalis mungkin hanya memerlukan subjek, lingkungan, dan pencahayaan. Kerangka tujuh segmen adalah checklist, bukan skrip wajib. Gunakan untuk mengidentifikasi celah mana yang Anda serahkan kepada keberuntungan, lalu putuskan secara sengaja apakah akan mengisinya atau membiarkannya terbuka.
Bagaimana cara menerapkan struktur tujuh segmen ke prompt video AI?+
Prompt video AI di Floniks /ai-video mengikuti struktur yang sama dengan satu tambahan: lapisan motion atau aksi yang mendeskripsikan gerakan kamera dan subjek seiring waktu. Ganti "aksi atau pose" dengan "aksi berkelanjutan" dan tambahkan segmen "gerakan kamera" (slow dolly in, static shot, handheld follow). Segmen lainnya — lingkungan, pencahayaan, suasana, gaya — dapat diterapkan langsung tanpa perubahan.
Panduan terkait
Buat di Floniks
Gambar, video, manusia digital, dan alur kerja yang dapat dipakai ulang dalam satu kanvas. Daftar dan dapatkan kredit awal, tanpa kartu.
Jelajahi Floniks