A Anatomia de um Prompt de Imagem IA Poderoso
Um prompt de imagem IA de qualidade não é uma única frase corrida: ele é construído em camadas distintas — sujeito, composição, iluminação, lente e câmera, atmosfera, estilo artístico e parâmetros técnicos. Nomear cada camada explicitamente reduz as lacunas que o modelo preenche aleatoriamente, tornando os resultados mais fiéis à sua intenção e reproduzíveis entre sessões. Este guia desmonta cada camada com frases concretas que você pode copiar e adaptar, explica quais camadas importam mais para diferentes objetivos criativos e mostra como prompts em camadas se encaixam naturalmente em um fluxo de trabalho reutilizável no Floniks.
Por que estrutura vence frase corrida
A maioria dos prompts fracos falha não porque a linguagem está errada, mas porque descreve apenas uma dimensão da imagem — geralmente o sujeito — e deixa todo o resto ao acaso. Quando o modelo preenche lacunas aleatoriamente, você recebe enquadramentos inconsistentes, iluminação arbitrária e uma estética que muda de geração em geração. A estrutura resolve isso. Quando você divide um prompt em camadas explícitas, entrega ao modelo um briefing criativo completo em vez de uma única frase. Pense como um fotógrafo sendo contratado: você não diria "tire uma foto de uma mulher" e esperaria uma obra-prima. Você especificaria o local, a fonte de luz, a lente, a atmosfera, o figurino. Modelos de IA respondem da mesma forma. A estrutura também torna a iteração barata — você pode trocar uma camada (mudar a iluminação de "luz dourada do pôr do sol" para "sol duro do meio-dia") sem reescrever o prompt inteiro, e o restante da imagem permanece estável. No Floniks, prompts estruturados são especialmente poderosos porque você pode salvá-los como templates de workflow no /editor e reutilizá-los em todo um catálogo de produtos ou série de conteúdos.
Camada 1 — Sujeito: o núcleo inegociável
A camada do sujeito responde: sobre quem ou o quê é essa imagem? Seja específico quanto à identidade, pose, expressão, vestimenta e objetos de cena. Fraco: "uma mulher num café." Forte: "uma mulher brasileira de 30 anos, cabelo natural cacheado curto, usando um blazer de linho oversized, sentada numa mesa de mármore de café, segurando uma xícara de espresso de cerâmica com as duas mãos, olhando levemente para baixo com um sorriso íntimo e discreto." Cada detalhe que você adiciona é uma lacuna que o modelo não preenche aleatoriamente. Para produtos, nomeie o objeto com precisão: "uma caneca de cerâmica fosca preta minimalista, logo centralizado na frente, alça apontando para a direita." Para personagens que você reutilizará em muitas imagens, salve a descrição do sujeito em um nó de workflow do Floniks como entrada fixa — esta é a base da consistência do personagem. Se o sujeito inclui múltiplas pessoas, enumere e descreva cada uma separadamente: "Sujeito 1: ... Sujeito 2: ..." para evitar que o modelo mescle os traços.
Camada 2 — Composição e enquadramento
A composição diz ao modelo como organizar o sujeito no quadro. Sem ela, você receberá resultados centralizados, seguros e em orientação retrato todas as vezes. Frases úteis de composição incluem distância de tomada (close, plano médio, plano aberto estabelecedor), ângulo (nível dos olhos, ângulo baixo, visão de pássaro, inclinação holandesa) e regras composicionais (regra dos terços, linhas guias, espaço negativo à esquerda). Uma camada de composição completa pode ser: "plano médio, ângulo de câmera levemente baixo, sujeito posicionado no terço direito do quadro, espaço negativo generoso à esquerda preenchido com bokeh suave." Combinar tipo de tomada com ângulo desbloqueia uma vasta gramática visual — o mesmo sujeito fotografado de um ângulo baixo parece poderoso e heroico; de um ângulo alto parece vulnerável ou pequeno. O pilar /learn/cinematography aborda tipos de tomada e ângulos em profundidade. Regra fundamental: nomeie a composição antes de nomear a iluminação, porque a composição define como a luz incide sobre o quadro.
Camada 3 — Iluminação: o multiplicador de atmosfera
A iluminação é a camada que muda de forma mais dramática o registro emocional de uma imagem sem tocar no sujeito. "Luz natural suave de janela" e "iluminação dramática chiaroscuro de fonte única" podem descrever a mesma mulher no mesmo café e produzir imagens que parecem gêneros completamente diferentes. No mínimo, nomeie a fonte de luz (janela, sol, painel LED, vela, letreiro de néon), a qualidade (suave/difusa versus dura/direta), a direção (frontal, lateral, contra-luz, rim light) e a temperatura de cor (dourado quente, azul-branco frio, neutro). Uma camada de iluminação concreta: "luz lateral de um grande softbox à esquerda da câmera, temperatura de cor quente de 4500 K, sombra suave caindo no lado direito do rosto, rim light delicado no cabelo." Para fotos de produtos, a iluminação é sem dúvida mais importante que a descrição do sujeito — a mesma caneca parece premium sob "luz difusa suave e plana com fundo gradiente sutil" e ordinária sob luz dura vinda de cima.
Camada 4 — Estilo, meio e direção de arte
A camada de estilo diz ao modelo de qual tradição visual ele deve extrair. É aqui que você especifica realismo fotográfico versus ilustração versus pintura, e nomeia o movimento estético ou referência. Exemplos: "fotografia editorial de moda, shot em película de médio formato, estética Vogue," ou "still cinematográfico digital, tons terrosos apagados, gradação de cor estilo filmes A24," ou "ilustração vetorial flat, paleta pastel, design minimalista escandinavo." Ao mirar um movimento artístico específico, nomeie-o com precisão: "pintura a óleo impressionista" dá ao modelo muito mais sinal do que "artístico". Você também pode referenciar câmeras e películas para um visual fotográfico: "película Kodak Portra 400, leve granulação, sombras quentes e suaves". Para vídeo IA no Floniks /ai-video, a camada equivalente é especificar a linguagem visual do clipe — cinematográfico, documental, animado — antes de descrever a ação.
Camada 5 — Parâmetros técnicos e sinais de qualidade
Parâmetros técnicos comunicam a fidelidade e o formato desejados para o resultado. Sinais comuns incluem intenção de resolução ("detalhe 8K", "ultra-nítido"), profundidade de campo ("f/1.8 profundidade de campo rasa, sujeito nítido, fundo bokeh cremoso"), características de lente ("lente de retrato 85mm, leve compressão de lente") e qualidade de render ("hiperrealista, fotorrealista, render Octane, iluminação ray-tracing"). Você também pode especificar a intenção de proporção no próprio prompt, embora os painéis de geração do Floniks tenham controles dedicados de proporção que complementam isso. Para fotografia de produto, adicione "sem marca d'água, fundo limpo, qualidade de estúdio, padrão comercial" para sinalizar a classe de output. Para imagens artísticas, "pinceladas pictóricas, textura visível, qualidade de museu" orienta em direção à renderização de belas-artes. Mantenha os termos técnicos ao final do seu prompt para que refiném em vez de competirem com as camadas de sujeito e composição.
Juntando tudo: um exemplo trabalhado
Veja como as cinco camadas se combinam em um único prompt pronto para produção:
Sujeito: "Mulher japonesa de 30 anos com cabelo liso e preto, usando um blazer estruturado cor marfim e joias de ouro discretas, segurando um pequeno buquê de peônias brancas, expressão neutra, contato visual direto com a câmera"
Composição: "Plano médio de retrato, nível dos olhos, enquadramento centralizado com leve espaço acima da cabeça, fundo limpo"
Iluminação: "Luz principal beauty dish suave à frente com preenchimento quente sutil à direita da câmera, 5000 K luz do dia neutra, catchlights visíveis nos dois olhos, sem sombras duras"
Estilo: "Fotografia editorial de alta moda, shot em Hasselblad de médio formato, estética limpa e moderna"
Técnico: "f/2.8 profundidade de campo rasa, foco extremamente nítido nos olhos, fundo suavemente desfocado, qualidade de estúdio comercial"
Combinado, o prompt fica com aproximadamente 90 palavras — longo o suficiente para ser específico, curto o suficiente para permanecer coerente. Salve-o como template de workflow no Floniks e troque apenas a camada do sujeito para gerar um lookbook inteiro em um único lote.
Passo a passo
- 1
Escreva primeiro a camada do sujeito
Descreva quem ou o quê aparece na imagem com identidade, pose, expressão, vestimenta e objetos de cena. Seja tão específico quanto seria ao dar um briefing a um fotógrafo profissional.
- 2
Adicione composição e enquadramento
Escolha uma distância de tomada (close, médio, aberto), ângulo de câmera e posicionamento composicional (regra dos terços, centralizado, direção do espaço negativo).
- 3
Especifique a iluminação
Nomeie a fonte de luz, a qualidade (suave ou dura), a direção (frontal, lateral, contra-luz ou rim) e a temperatura de cor. Essa única camada muda o registro emocional da imagem mais do que qualquer outra.
- 4
Nomeie o estilo visual e o meio
Referencie a tradição fotográfica ou artística: tipo de película, movimento artístico, marca de câmera ou estética de gênero.
- 5
Feche com parâmetros técnicos
Adicione profundidade de campo, tipo de lente, intenção de resolução e sinais de qualidade ao final, para que refiném sem sobrepor as camadas principais.
Perguntas frequentes
Qual deve ser o tamanho de um prompt de imagem IA?+
Longo o suficiente para nomear cada camada uma vez. Isso costuma resultar em algo entre 60 e 120 palavras. Prompts mais curtos deixam lacunas demais para o modelo preencher aleatoriamente; mais longos podem fazer o modelo perder o fio de detalhes mencionados antes. Se você precisar descrever uma cena muito complexa, divida em um workflow de múltiplas etapas no Floniks onde cada nó cuida de um elemento.
Preciso usar todas as camadas em todos os prompts?+
Não — comece com sujeito, composição e iluminação. Essas três camadas eliminam a maior parte da variância. Estilo e parâmetros técnicos são refinamentos que você adiciona quando a imagem principal já está com a cara certa.
A ordem das camadas importa?+
Sim, aproximadamente. Coloque as informações mais importantes primeiro (sujeito, depois composição), porque os modelos pesam mais os tokens iniciais. Sinais de qualidade técnica funcionam melhor ao final como instruções de acabamento, em vez de competir com a descrição principal.
Guias relacionados
Crie no Floniks
Imagem, vídeo, humanos digitais e fluxos de trabalho reutilizáveis em uma só tela. Ao se cadastrar você ganha créditos iniciais, sem cartão.
Explorar o Floniks