Menulis prompt

Anatomi Prompt Gambar AI yang Kuat

Diperbarui 2026-06-19·8 mnt baca

Poin utama

Prompt gambar AI yang efektif dibangun dari lapisan-lapisan yang berbeda, bukan satu kalimat panjang yang berbelit: subjek, komposisi, pencahayaan, lensa dan kamera, suasana hati, gaya seni, serta parameter teknis. Menyebut setiap lapisan secara eksplisit memberi model lebih sedikit celah untuk mengisi kekosongan secara acak, sehingga hasil sesuai dengan niat Anda dan tetap konsisten di setiap sesi. Panduan ini mengupas setiap lapisan dengan frasa konkret yang bisa langsung disalin dan dimodifikasi, menjelaskan lapisan mana yang paling berpengaruh untuk berbagai tujuan kreatif, serta menunjukkan cara menggabungkan prompt berlapis ke dalam workflow Floniks yang bisa digunakan berulang kali.

AI Image Workflow Editor Studio

Mengapa Struktur Lebih Unggul dari Kalimat Panjang

Kebanyakan prompt yang lemah gagal bukan karena bahasanya salah, melainkan karena hanya mendeskripsikan satu dimensi gambar — biasanya subjek — dan membiarkan sisanya diserahkan kepada keberuntungan. Model yang mengisi kekosongan secara acak akan menghasilkan framing yang tidak konsisten, pencahayaan yang sembarangan, dan estetika yang berubah-ubah dari satu generasi ke generasi berikutnya. Struktur memperbaiki ini semua. Ketika Anda memecah prompt menjadi lapisan yang eksplisit, Anda memberikan model sebuah brief kreatif yang lengkap, bukan hanya satu kalimat. Bayangkan seperti mempekerjakan seorang fotografer: Anda tidak akan berkata "tolong foto seorang wanita" dan berharap mendapat mahakarya. Anda akan menentukan lokasi, sumber cahaya, lensa, suasana, dan pakaian. Model AI merespons dengan cara yang sama persis. Struktur juga membuat iterasi menjadi murah — Anda bisa mengganti satu lapisan (misalnya mengubah pencahayaan dari "cahaya emas sore hari" menjadi "sinar matahari terik tengah hari") tanpa menulis ulang seluruh prompt, dan bagian gambar lainnya tetap stabil. Di Floniks, prompt terstruktur sangat powerful karena Anda bisa menyimpannya sebagai template workflow di /editor dan menggunakannya kembali untuk seluruh katalog produk atau seri konten.

Lapisan 1 — Subjek: Inti yang Tidak Bisa Diabaikan

Lapisan subjek menjawab pertanyaan: tentang siapa atau apa gambar ini? Jelaskan identitas, pose, ekspresi, pakaian, dan props secara spesifik. Kurang spesifik: "seorang wanita di kafe." Kuat: "seorang wanita Asia Selatan berusia 30 tahun dengan rambut pendek alami, mengenakan blazer linen oversize, duduk di meja kafe berlapis marmer, memegang cangkir espresso keramik dengan kedua tangan, memandang sedikit ke bawah dengan senyum tipis yang intim." Setiap detail yang Anda tambahkan adalah satu celah yang tidak perlu diisi model secara acak. Untuk produk, sebut objeknya secara tepat: "mug keramik matte hitam minimalis, logo tepat di tengah bagian depan, pegangan mengarah ke kanan." Untuk karakter yang ingin Anda gunakan berulang kali di banyak gambar, simpan deskripsi subjek di node workflow Floniks sebagai input tetap — inilah fondasi konsistensi karakter. Jika subjek Anda melibatkan beberapa orang, nomori dan deskripsikan masing-masing secara terpisah: "Subjek 1: … Subjek 2: …" agar model tidak mencampuradukkan fitur mereka.

Lapisan 2 — Komposisi dan Framing

Komposisi memberi tahu model cara mengatur subjek dalam frame. Tanpa komposisi, Anda akan selalu mendapatkan hasil yang terpusat, aman, dan berorientasi potret. Frasa komposisi yang berguna meliputi jarak bidikan (close-up, medium shot, wide establishing shot), sudut (eye-level, low-angle, bird's-eye view, Dutch tilt), dan aturan komposisi (rule of thirds, leading lines, ruang negatif di sisi kiri). Contoh lapisan komposisi lengkap: "medium shot, sudut kamera sedikit rendah, subjek diposisikan di sepertiga kanan frame, ruang negatif luas di kiri berisi bokeh halus." Kombinasi jenis bidikan dengan sudut membuka kosakata visual yang sangat kaya — subjek yang sama difoto dari sudut rendah terasa kuat dan heroik; dari sudut tinggi terasa rapuh atau kecil. Pilar /learn/cinematography membahas jenis bidikan dan sudut secara mendalam jika Anda ingin memahami istilah-istilah ini lebih lanjut. Aturan utama: tentukan komposisi sebelum menentukan pencahayaan, karena komposisi menentukan bagaimana cahaya jatuh di seluruh frame.

Lapisan 3 — Pencahayaan: Pengganda Suasana

Pencahayaan adalah lapisan tunggal yang paling dramatis mengubah nuansa emosional sebuah gambar tanpa menyentuh subjek sama sekali. "Cahaya alami lembut dari jendela" dan "cahaya chiaroscuro dramatis dari satu sumber" bisa mendeskripsikan wanita yang sama di kafe yang sama namun menghasilkan gambar yang terasa seperti genre yang sama sekali berbeda. Sebutkan minimal: sumber cahaya (jendela, matahari, panel LED, lilin, papan neon), kualitas (lembut/difus vs. keras/langsung), arah (front-lit, side-lit, back-lit, rim-lit), dan suhu warna (hangat keemasan, biru-putih dingin, netral). Contoh lapisan pencahayaan konkret: "side-lit oleh satu softbox besar di kiri kamera, suhu warna hangat 4500K, bayangan lembut jatuh di sisi kanan wajah, sedikit rim light di rambut." Untuk foto produk, pencahayaan bisa dibilang lebih penting dari deskripsi subjek — mug yang sama terlihat premium di bawah "cahaya difus datar lembut dengan latar gradien halus" dan terlihat murahan di bawah cahaya keras dari atas. Baca artikel kosakata pencahayaan lengkap di pilar ini untuk daftar referensi yang bisa langsung Anda salin ke prompt apa pun.

Lapisan 4 — Gaya, Medium, dan Arahan Visual

Lapisan gaya memberi tahu model tradisi visual mana yang harus dijadikan acuan. Di sinilah Anda menentukan apakah gambar bersifat realistis fotografis, ilustrasi, atau bergaya lukisan, dan menyebutkan gerakan estetika atau referensi tertentu. Contoh: "fotografi fashion editorial, diambil dengan kamera medium format film, estetika majalah Vogue," atau "still sinematik digital, nada earth tones yang diredam, color grading film A24," atau "ilustrasi vektor flat, palet pastel, desain minimalis Skandinavia." Saat menarget gerakan seni tertentu, sebutkan dengan presisi: "lukisan cat minyak impresionis" memberi model jauh lebih banyak sinyal dibandingkan sekadar "artistik." Anda juga bisa mereferensikan jenis kamera dan film untuk tampilan fotografis: "film stock Kodak Portra 400, sedikit grain, bayangan hangat yang terangkat." Untuk video AI di Floniks /ai-video, lapisan setara adalah menentukan bahasa visual klip — sinematik, dokumenter, animasi — sebelum mendeskripsikan aksi.

Lapisan 5 — Parameter Teknis dan Sinyal Kualitas

Parameter teknis mengkomunikasikan fidelitas dan format output yang diinginkan. Sinyal umum meliputi intensitas resolusi ("detail 8K," "ultra-sharp"), depth of field ("f/1.8 depth of field dangkal, subjek tajam, latar belakang bokeh creamy"), karakteristik lensa ("lensa potret 85mm, sedikit lens compression"), dan kualitas render ("hyperrealistis, fotorealistis, octane render, ray-traced lighting"). Anda juga bisa menentukan rasio aspek dalam prompt itu sendiri jika model menerima petunjuk rasio berbasis teks, meski panel generasi Floniks memiliki kontrol rasio aspek khusus yang menggantikan atau melengkapi hal ini. Untuk foto produk, tambahkan "tanpa watermark, latar bersih, kualitas studio, grade komersial" untuk menandakan kelas output yang diinginkan. Untuk gambar artistik, "sapuan kuas painterly, tekstur terlihat, kualitas museum" mengarahkan ke rendering seni rupa. Tempatkan istilah lapisan teknis di akhir prompt agar berfungsi sebagai penyempurnaan, bukan bersaing dengan lapisan subjek dan komposisi.

Menggabungkan Semua Lapisan: Contoh Kerja Nyata

Berikut cara kelima lapisan digabungkan menjadi satu prompt siap produksi:

Subjek: "wanita Jepang berusia 30 tahun dengan rambut hitam lurus, mengenakan blazer krem terstruktur dan perhiasan emas minimal, memegang seikat kecil bunga peony putih, ekspresi netral, kontak mata langsung dengan kamera"

Komposisi: "medium portrait shot, eye-level, framing terpusat dengan sedikit headroom, latar belakang bersih"

Pencahayaan: "cahaya beauty dish lembut dari depan dengan fill hangat halus dari kanan kamera, daylight netral 5000K, catchlight terlihat di kedua mata, tidak ada bayangan keras"

Gaya: "fotografi fashion editorial kelas atas, diambil dengan Hasselblad medium format, estetika bersih dan modern"

Teknis: "f/2.8 depth of field dangkal, fokus tajam seperti silet pada mata, latar belakang blur lembut, kualitas studio komersial"

Digabungkan, prompt ini sekitar 90 kata — cukup panjang untuk spesifik, cukup pendek untuk tetap koheren. Simpan sebagai template workflow Floniks dan ganti lapisan subjek untuk menghasilkan seluruh lookbook dalam satu batch.

Langkah demi langkah

1
Tulis lapisan subjek terlebih dahulu
Deskripsikan siapa atau apa yang ada dalam gambar dengan identitas, pose, ekspresi, pakaian, dan props. Sespesifik mungkin, seolah-olah Anda sedang memberi briefing kepada fotografer profesional.
2
Tambahkan komposisi dan framing
Pilih jarak bidikan (close-up, medium, wide), sudut kamera, dan penempatan komposisi (rule of thirds, terpusat, arah ruang negatif).
3
Tentukan pencahayaan Anda
Sebutkan sumber cahaya, kualitas (lembut/keras), arah (depan/samping/belakang/rim), dan suhu warna. Lapisan tunggal ini mengubah nuansa emosional gambar lebih dari lapisan mana pun.
4
Namai gaya visual dan medium
Referensikan tradisi fotografi atau artistik: stok film, gerakan seni, merek kamera, atau estetika genre tertentu.
5
Tutup dengan parameter teknis
Tambahkan depth of field, jenis lensa, intensitas resolusi, dan sinyal kualitas di bagian akhir agar menyempurnakan tanpa menimpa lapisan inti.

Pertanyaan umum

Seberapa panjang idealnya sebuah prompt gambar AI?+

Cukup panjang untuk menyebut setiap lapisan sekali. Biasanya antara 60 hingga 120 kata. Prompt yang terlalu pendek meninggalkan terlalu banyak celah bagi model untuk diisi secara acak; yang terlalu panjang bisa membuat model kehilangan detail yang disebutkan sebelumnya. Jika Anda perlu mendeskripsikan adegan yang sangat kompleks, pecah menjadi workflow multi-langkah di Floniks di mana setiap node menangani satu elemen.

Apakah saya harus menggunakan setiap lapisan di setiap prompt?+

Tidak — mulailah dengan subjek, komposisi, dan pencahayaan. Ketiga lapisan ini menghilangkan varians terbanyak. Gaya dan parameter teknis adalah penyempurnaan yang Anda tambahkan setelah inti gambar terlihat tepat.

Apakah urutan lapisan penting?+

Ya, secara umum. Tempatkan informasi terpenting di awal (subjek, lalu komposisi) karena model memberikan bobot lebih besar pada token yang lebih awal. Sinyal kualitas teknis bekerja paling baik di akhir sebagai instruksi penyelesaian, bukan bersaing dengan deskripsi inti.

Panduan terkait

Cara Menyusun Prompt Foto: 7 Segmen yang Dibutuhkan Setiap Prompt Berkualitas

Buat di Floniks

Gambar, video, manusia digital, dan alur kerja yang dapat dipakai ulang dalam satu kanvas. Daftar dan dapatkan kredit awal, tanpa kartu.

Jelajahi Floniks

Mengapa Struktur Lebih Unggul dari Kalimat Panjang

Lapisan 1 — Subjek: Inti yang Tidak Bisa Diabaikan

Lapisan 2 — Komposisi dan Framing

Lapisan 3 — Pencahayaan: Pengganda Suasana

Lapisan 4 — Gaya, Medium, dan Arahan Visual

Lapisan 5 — Parameter Teknis dan Sinyal Kualitas

Menggabungkan Semua Lapisan: Contoh Kerja Nyata

Langkah demi langkah

Tulis lapisan subjek terlebih dahulu

Tambahkan komposisi dan framing

Tentukan pencahayaan Anda

Namai gaya visual dan medium

Tutup dengan parameter teknis

Pertanyaan umum

Panduan terkait

Buat di Floniks