Escrita de prompts

Como Estruturar um Prompt de Foto: Os 7 Segmentos que Todo Prompt Forte Precisa

Atualizado 2026-06-19·9 min de leitura

Ponto-chave

Estruturar um prompt de foto significa dividi-lo em sete segmentos distintos: identidade do sujeito, ação ou pose, ambiente e cenário, setup de iluminação, câmera e lente, atmosfera e mood, e estilo de pós-processamento. Cada segmento preenche um canal perceptivo diferente que o modelo lê — quando todos os sete estão presentes, o modelo gera imagens consistentes, intencionais e alinhadas à marca. Este guia percorre cada segmento com exemplos práticos e erros comuns de ordenação que fazem até prompts bem escritos errarem o alvo.

IA de Imagem IA de Vídeo Editor de Workflow

O modelo de sete segmentos

Um prompt de foto não é uma única ideia — é um briefing criativo em camadas. O modelo dos sete segmentos espelha a forma como um diretor de arte profissional passa uma orientação para um fotógrafo: você não diz simplesmente "fotografe um produto no branco". Você especifica o que é o produto, como ele está posicionado, onde ele existe, como está iluminado, qual lente você está usando, que sentimento quer evocar e como a imagem final deve ser retocada. Modelos de IA leem prompts da mesma forma. Quando algum dos sete segmentos está ausente, o modelo o preenche com uma média estatística — é por isso que prompts sem segmento de câmera e lente tendem a produzir sempre a mesma profundidade de campo genérica de "foto de banco de imagens". Os sete segmentos são: (1) Sujeito e identidade, (2) Ação ou pose, (3) Ambiente e cenário, (4) Setup de iluminação, (5) Câmera e lente, (6) Mood e atmosfera, (7) Pós-processamento e estilo. Você não precisa de todos os segmentos em cada prompt — uma foto de produto minimalista pode omitir o ambiente completamente — mas conhecer os sete significa que você pode deliberadamente escolher o que omitir, em vez de simplesmente esquecer.

Segmentos 1 e 2 — Sujeito e ação

O segmento de sujeito nomeia a pessoa, objeto ou criatura e descreve suas características identificadoras: "um homem nigeriano de meia-idade com barba cheia e cabelo grisalho cortado rente, usando um terno azul-marinho, lenço branco no bolso." O segmento de ação descreve então o que o sujeito está fazendo: "parado na beira de uma terraço, apoiado no corrimão, olhando para o horizonte da cidade, uma mão no bolso do paletó." Juntos, esses dois segmentos estabelecem a âncora da imagem. Erros comuns: (a) Descrever a emoção do sujeito, mas não sua aparência física, deixando o modelo adivinhar o rosto; (b) Nomear uma ação genérica ("parado") sem um contexto que molde a pose — "parado" numa sala de reuniões é diferente de "parado à beira de um precipício." Para séries de conteúdo reutilizáveis, escreva seu segmento de sujeito como um "cartão de personagem" fixo e encaixe-o em múltiplos prompts. É exatamente isso que o workflow do Floniks /editor suporta: um nó de personagem cuja saída alimenta configurações variadas de cena e iluminação nos nós seguintes.

Segmento 3 — Ambiente e cenário

O segmento de ambiente descreve o mundo que o sujeito habita: localização, hora do dia, clima, contexto arquitetônico e quaisquer elementos de fundo. "Uma terraço no topo de um arranha-céu moderno em um centro urbano denso, fim de tarde, luzes quentes da cidade começando a iluminar o fundo, leve neblina no ar, arquitetura contemporânea de vidro e aço visível." Sem um cenário, os modelos padrão para ambientes neutros de estúdio ou fundo branco. O cenário também carrega informação implícita de iluminação — "uma praia encoberta ao amanhecer" implica luz difusa, fria e de baixa intensidade sem que você precise declará-la explicitamente, o que significa que seu segmento explícito de iluminação só precisa adicionar nuances, não definir tudo do zero. Para fotos abstratas ou de produto onde você não quer um ambiente distrator, especifique-o mesmo assim: "fundo de estúdio infinity cove branco puro, sem distrações ambientais" — isso ainda descreve o ambiente, apenas de forma intencionalmente minimalista.

Segmentos 4 e 5 — Iluminação e câmera

O setup de iluminação (segmento 4) nomeia as fontes de luz, sua qualidade, direção e temperatura de cor. Câmera e lente (segmento 5) nomeia a distância focal, a abertura e qualquer modelo de câmera ou película que carregue associações estéticas. Esses dois segmentos são frequentemente mesclados porque estão intimamente relacionados: a escolha da lente determina o campo de visão, e a abertura determina a profundidade de campo, que interage com a forma como a luz renderiza o fundo. Um segmento combinado pode ser: "iluminado por um grande softbox à esquerda da câmera em 45 graus, preenchimento secundário em potência menor à direita da câmera, quente 4800 K, filmado em Sony A7R V com lente 85mm f/1.4 totalmente aberta, fundo separado por profundidade de campo rasa, bokeh circular suave." Para fotografia de produtos, "iluminação flat lay de cima com painéis brancos difusos em todos os lados, filmado diretamente de cima com lente 50mm" dá ao modelo uma geometria extremamente específica para recriar. Consulte o artigo de vocabulário de iluminação neste pilar para uma lista de referência copiável de termos.

Segmentos 6 e 7 — Mood e estilo de pós-processamento

Mood e atmosfera (segmento 6) comunica o registro emocional da imagem por meio de adjetivos e referências de tom: "aspiracional mas acessível, confiança tranquila, uma sensação de solidão que se lê como força, não como tristeza." Você também pode usar referências culturais ou cinematográficas: "o clima de um filme de Terrence Malick de madrugada — pensativo, lento, observador." O estilo de pós-processamento (segmento 7) especifica como a imagem fica depois de sair da câmera ou do motor de render: "gradação de cor cinematográfica com laranjas amortecidos, pretos levantados, meios-tons dessaturados, granulação sutil de filme, leve vinheta." Esses dois últimos segmentos fazem a diferença entre uma imagem tecnicamente correta e uma que pareça uma declaração criativa deliberada. No Floniks, você pode combinar esses segmentos com um passe de efeitos especiais em /pro-effects para aplicar gradação de cor consistente em um lote inteiro, fazendo com que cada imagem de uma série pareça ter saído do mesmo shoot.

Erros comuns de ordenação e como corrigi-los

O erro de ordenação mais comum é começar com estilo e mood antes de estabelecer o sujeito: "cinematográfico, dramático, melancólico, alto contraste, estética noir — uma mulher." O modelo lê os tokens iniciais com mais peso, então pode produzir uma excelente imagem noir tecnicamente, mas cuja protagonista é uma mulher vaga e genérica, porque você enterrou a descrição dela no final. Regra: sempre estabeleça o sujeito antes da atmosfera. O segundo erro mais comum é intercalar linguagem técnica e artística sem separação — por exemplo, "f/1.8 belo close emocional 4K iluminação Rembrandt tocante." Isso se lê como uma lista de tags não relacionadas em vez de um briefing coerente, e o modelo as media vagamente. Mantenha os parâmetros técnicos agrupados no final. O terceiro erro é super-especificar o estilo à custa do detalhe do sujeito: gastar 40 palavras na estética e 5 palavras em quem está na imagem. O sujeito é a âncora; todo o resto é atmosfera. Inverta a proporção e seus resultados vão melhorar imediatamente.

Perguntas frequentes

Devo usar vírgulas ou frases completas num prompt de foto?+

Ambos funcionam, mas frases completas ou cláusulas curtas separadas por vírgulas tendem a ter melhor desempenho do que listas de tags. Tags como "bonito, dramático, épico" sem contexto gramatical dão ao modelo pouquíssimo sinal direcional — cada tag pode apontar em direções diferentes. Cláusulas estruturadas ("luz lateral suave de uma janela, temperatura de cor quente de 4200 K") unem os conceitos para que o modelo os leia como uma instrução coerente em vez de adjetivos concorrentes.

Posso pular segmentos para prompts mais simples?+

Sim. Um prompt minimalista de produto pode precisar apenas de sujeito, ambiente e iluminação. O framework de sete segmentos é uma lista de verificação, não um roteiro obrigatório. Use-o para identificar quais lacunas você está deixando ao acaso, depois decida deliberadamente se vai preenchê-las ou deixá-las abertas.

Como aplico a estrutura de sete segmentos a prompts de vídeo IA?+

Os prompts de vídeo IA no Floniks /ai-video seguem a mesma estrutura com um acréscimo: uma camada de movimento ou ação que descreve o movimento da câmera e do sujeito ao longo do tempo. Substitua "ação ou pose" por "ação contínua" e adicione um segmento de "movimento de câmera" (dolly lento para dentro, plano estático, follow handheld). Os demais segmentos — ambiente, iluminação, mood, estilo — se transferem diretamente.

Guias relacionados

A Anatomia de um Prompt de Imagem IA Poderoso

Crie no Floniks

Imagem, vídeo, humanos digitais e fluxos de trabalho reutilizáveis em uma só tela. Ao se cadastrar você ganha créditos iniciais, sem cartão.

Explorar o Floniks