Cách Cấu Trúc Prompt Ảnh: 7 Phân Đoạn Mọi Prompt Chất Lượng Đều Cần
Cấu trúc hoá một prompt ảnh có nghĩa là chia mô tả của bạn thành bảy phân đoạn riêng biệt: danh tính chủ thể, hành động hoặc tư thế, môi trường và bối cảnh, thiết lập ánh sáng, máy ảnh và ống kính, tâm trạng và khí quyển, và phong cách hậu kỳ. Mỗi phân đoạn lấp đầy một kênh nhận thức khác nhau mà mô hình đọc, vì vậy khi cả bảy đều hiện diện, mô hình tạo ra hình ảnh nhất quán, có chủ đích và đúng thương hiệu. Hướng dẫn này đi qua từng phân đoạn với ví dụ thực tế và các lỗi sắp xếp phổ biến khiến ngay cả những prompt được diễn đạt tốt cũng không đạt mục tiêu.
Mô hình bảy phân đoạn
Một prompt ảnh không phải là một ý tưởng duy nhất — đó là một bản tóm tắt sáng tạo nhiều lớp. Mô hình bảy phân đoạn ánh xạ theo cách một art director chuyên nghiệp brief cho nhiếp ảnh gia: bạn không chỉ nói "chụp sản phẩm trên nền trắng." Bạn chỉ định sản phẩm là gì, nó được định vị thế nào, nó sống ở đâu, nó được chiếu sáng thế nào, bạn đang dùng ống kính gì, cảm xúc bạn muốn gợi lên là gì, và hình ảnh cuối cùng nên được chỉnh sửa thế nào. Các mô hình AI đọc prompt theo cách tương tự. Khi bất kỳ phân đoạn nào trong bảy phân đoạn bị thiếu, mô hình tự điền bằng giá trị trung bình thống kê — đó là lý do tại sao các prompt không có phân đoạn máy ảnh và ống kính thường tạo ra cùng độ sâu trường ảnh "ảnh stock" chung chung mỗi lần. Bảy phân đoạn là: (1) Chủ thể và danh tính, (2) Hành động hoặc tư thế, (3) Môi trường và bối cảnh, (4) Thiết lập ánh sáng, (5) Máy ảnh và ống kính, (6) Tâm trạng và khí quyển, (7) Hậu kỳ và phong cách. Bạn không cần mọi phân đoạn trong mọi prompt — một ảnh sản phẩm tối giản có thể bỏ qua môi trường hoàn toàn — nhưng biết cả bảy có nghĩa là bạn có thể cố ý chọn những gì cần bỏ qua thay vì quên nó.
Phân đoạn 1 & 2 — Chủ thể và hành động
Phân đoạn chủ thể đặt tên người, vật thể hoặc sinh vật và mô tả các đặc điểm nhận dạng của nó: "một người đàn ông Nigeria trung niên với bộ râu đầy đặn và tóc muối tiêu cắt ngắn, mặc vest xanh navy đậm, khăn túi trắng." Phân đoạn hành động sau đó mô tả những gì chủ thể đang làm: "đứng ở rìa sân thượng mái nhà, dựa vào lan can, nhìn ra toàn cảnh thành phố, một tay trong túi áo khoác." Cùng nhau, hai phân đoạn này thiết lập neo của hình ảnh. Các lỗi phổ biến: (a) Mô tả trạng thái cảm xúc của chủ thể nhưng không mô tả ngoại hình vật lý của họ, để mô hình đoán khuôn mặt; (b) Đặt tên một hành động chung chung ("đứng") mà không có bối cảnh định hình tư thế — "đứng" trong phòng họp đọc khác với "đứng ở rìa vách đá." Với chuỗi nội dung có thể tái sử dụng, hãy viết phân đoạn chủ thể của bạn như một "thẻ nhân vật" cố định và cắm vào nhiều prompt. Đây chính xác là những gì workflow /editor của Floniks hỗ trợ: một node nhân vật có đầu ra cấp dữ liệu cho các cấu hình cảnh và ánh sáng khác nhau ở phía sau.
Phân đoạn 3 — Môi trường và bối cảnh
Phân đoạn môi trường mô tả thế giới mà chủ thể sinh sống: địa điểm, thời gian trong ngày, thời tiết, bối cảnh kiến trúc và bất kỳ yếu tố nền nào. "Một sân thượng trong tòa nhà cao tầng hiện đại trong một đường chân trời thành phố dày đặc, tối muộn, đèn thành phố ấm áp bắt đầu chiếu sáng nền, không khí hơi mờ, kiến trúc kính và thép hiện đại có thể nhìn thấy." Không có bối cảnh, các mô hình mặc định thành môi trường studio trung tính hoặc nền trắng. Bối cảnh cũng mang thông tin ánh sáng ngụ ý — "một bãi biển u ám lúc bình minh" ngụ ý ánh sáng khuếch tán, mát, thấp mà không cần bạn nêu rõ, có nghĩa là phân đoạn ánh sáng rõ ràng của bạn ở bước 4 chỉ cần thêm sắc thái thay vì xác định từ đầu. Với ảnh trừu tượng hoặc sản phẩm mà bạn không muốn có môi trường gây phân tâm, hãy chỉ định nó: "nền studio infinity cove trắng tinh, không có yếu tố môi trường gây phân tâm" — đây vẫn là mô tả môi trường, chỉ là có chủ đích tối giản.
Phân đoạn 4 & 5 — Ánh sáng và máy ảnh
Thiết lập ánh sáng (phân đoạn 4) đặt tên các nguồn sáng, chất lượng, hướng và nhiệt độ màu của chúng. Máy ảnh và ống kính (phân đoạn 5) đặt tên tiêu cự, khẩu độ và bất kỳ model máy ảnh hoặc loại phim nào mang các liên kết thẩm mỹ. Hai phân đoạn này thường được hợp nhất vì chúng liên quan mật thiết: lựa chọn ống kính xác định trường nhìn và khẩu độ xác định độ sâu trường ảnh, tương tác với cách ánh sáng kết xuất nền. Một phân đoạn kết hợp có thể đọc: "được chiếu sáng bởi một softbox lớn bên trái máy ở 45 độ, đèn fill phụ công suất thấp hơn từ bên phải máy, ấm 4800K, chụp trên Sony A7R V với ống kính 85mm f/1.4 mở hoàn toàn, nền được tách bằng độ sâu trường ảnh nông, bokeh tròn mềm." Với ảnh sản phẩm, "ánh sáng flat lay trên cao với các bảng khuếch tán trắng ở tất cả các phía, chụp từ trực tiếp ở trên với ống kính 50mm" cho mô hình một hình học rất cụ thể để tái tạo. Xem bài viết từ vựng ánh sáng trong pillar này để có danh sách tham khảo có thể sao chép các thuật ngữ ánh sáng.
Phân đoạn 6 & 7 — Tâm trạng và phong cách hậu kỳ
Tâm trạng và khí quyển (phân đoạn 6) truyền đạt cảm xúc của hình ảnh thông qua các tính từ và tham chiếu giọng điệu: "khát vọng nhưng dễ tiếp cận, niềm tin yên tĩnh, cảm giác cô đơn đọc như sức mạnh thay vì cô đơn." Bạn cũng có thể dùng các tham chiếu văn hóa hoặc điện ảnh: "tâm trạng của một bộ phim Terrence Malick đêm khuya — trầm tư, chậm rãi, quan sát." Phong cách hậu kỳ (phân đoạn 7) chỉ định hình ảnh trông như thế nào sau khi rời khỏi máy ảnh hoặc engine kết xuất: "chỉnh màu điện ảnh với màu cam muted, blacks nâng, mid-tones desaturated, hạt phim tinh tế, vignette nhẹ." Hai phân đoạn cuối này là sự khác biệt giữa một hình ảnh trông đúng về mặt kỹ thuật và một hình ảnh cảm thấy như một tuyên bố sáng tạo có chủ đích. Trên Floniks, bạn có thể kết hợp các phân đoạn này với một lượt xử lý pro-effects trong /pro-effects để áp dụng chỉnh màu nhất quán trên một batch, làm cho mọi hình ảnh trong một chuỗi cảm thấy như được chụp trong cùng một shoot.
Các lỗi sắp xếp phổ biến và cách khắc phục
Lỗi sắp xếp phổ biến nhất là dẫn đầu bằng phong cách và tâm trạng trước khi thiết lập chủ thể: "điện ảnh, kịch tính, u ám, tương phản cao, phong cách film noir — một người phụ nữ." Mô hình đọc các token đầu với trọng lượng cao nhất, vì vậy nó có thể tạo ra một hình ảnh film noir xuất sắc về mặt kỹ thuật với chủ thể là người phụ nữ mờ nhạt, chung chung vì bạn đã chôn vùi mô tả của cô ấy ở cuối. Quy tắc: luôn thiết lập chủ thể trước khí quyển. Lỗi phổ biến thứ hai là xen kẽ ngôn ngữ kỹ thuật và nghệ thuật mà không phân tách — ví dụ "f/1.8 đẹp cảm xúc close-up 4K ánh sáng Rembrandt chân thành." Điều này đọc như một danh sách các tag không liên quan thay vì một brief mạch lạc. Hãy giữ các thông số kỹ thuật được nhóm lại với nhau ở cuối. Lỗi thứ ba là quá mức xác định phong cách với chi phí của chi tiết chủ thể: dành 40 từ cho thẩm mỹ và 5 từ cho người trong ảnh. Chủ thể là neo; mọi thứ khác là khí quyển. Đảo ngược trọng lượng đó và kết quả của bạn sẽ được cải thiện ngay lập tức.
Câu hỏi thường gặp
Tôi nên dùng dấu phẩy hay câu đầy đủ trong prompt ảnh?+
Cả hai đều hoạt động, nhưng câu đầy đủ hoặc mệnh đề ngắn được phân tách bằng dấu phẩy có xu hướng hoạt động tốt hơn danh sách tag. Các tag như "đẹp, kịch tính, hoành tráng" không có ngữ cảnh ngữ pháp cho mô hình rất ít tín hiệu định hướng — mỗi tag có thể chỉ ra các hướng khác nhau. Các mệnh đề có cấu trúc như "ánh sáng bên mềm từ cửa sổ, nhiệt độ màu ấm 4200K" gắn kết các khái niệm lại với nhau để mô hình đọc chúng như một hướng dẫn mạch lạc thay vì các tính từ cạnh tranh.
Tôi có thể bỏ qua các phân đoạn để có prompt đơn giản hơn không?+
Có. Một prompt sản phẩm tối giản có thể chỉ cần chủ thể, môi trường và ánh sáng. Khung bảy phân đoạn là một checklist, không phải kịch bản bắt buộc. Dùng nó để xác định những khoảng trống bạn đang để cho sự may mắn, sau đó quyết định có chủ đích có nên lấp đầy chúng hay để mở.
Làm thế nào để áp dụng cấu trúc bảy phân đoạn cho prompt video AI?+
Prompt video AI trên Floniks /ai-video tuân theo cùng cấu trúc với một bổ sung: lớp chuyển động hoặc hành động mô tả chuyển động máy ảnh và chuyển động chủ thể theo thời gian. Thay thế "hành động hoặc tư thế" bằng "hành động liên tục" và thêm phân đoạn "chuyển động máy" (dolly chậm vào, shot tĩnh, handheld theo). Các phân đoạn còn lại — môi trường, ánh sáng, tâm trạng, phong cách — chuyển sang trực tiếp.
Hướng dẫn liên quan
Bắt tay làm trên Floniks
Ảnh, video, người kỹ thuật số và quy trình tái sử dụng trên cùng một canvas. Đăng ký nhận tín dụng khởi đầu, không cần thẻ.
Khám phá Floniks