Escritura de prompts

Cómo estructurar un prompt fotográfico: los 7 segmentos que todo prompt potente necesita

Actualizado 2026-06-19·9 min de lectura

Idea clave

Estructurar un prompt fotográfico significa dividir la descripción en siete segmentos diferenciados: identidad del sujeto, acción o pose, entorno y escenario, configuración de iluminación, cámara y óptica, atmósfera y estado de ánimo, y estilo de postproducción. Cada segmento rellena un canal perceptual distinto que el modelo lee, de modo que cuando los siete están presentes el modelo genera imágenes consistentes, intencionales y alineadas con tu marca. Esta guía recorre cada segmento con ejemplos reales y los errores de orden más comunes que hacen fallar incluso a los prompts mejor redactados.

Imagen IA Vídeo IA Editor de Workflows

El modelo de siete segmentos

Un prompt fotográfico no es una sola idea: es un briefing creativo por capas. El modelo de siete segmentos refleja exactamente cómo un director de arte profesional hace el briefing a un fotógrafo: no dices simplemente "fotografía el producto sobre blanco." Especificas qué es el producto, cómo está posicionado, en qué entorno se encuentra, cómo está iluminado, qué óptica usas, qué sensación quieres evocar y cómo debe retocarse la imagen final. Los modelos de IA leen los prompts de la misma manera. Cuando falta cualquiera de los siete segmentos, el modelo lo rellena con un promedio estadístico — por eso los prompts sin segmento de cámara y óptica producen sistemáticamente la misma profundidad de campo genérica de "foto de banco de imágenes". Los siete segmentos son: (1) Sujeto e identidad, (2) Acción o pose, (3) Entorno y escenario, (4) Configuración de iluminación, (5) Cámara y óptica, (6) Atmósfera y estado de ánimo, (7) Postproducción y estilo. No necesitas todos en cada prompt —un producto minimalista sobre fondo blanco puede omitir el entorno completamente— pero conocerlos todos significa que puedes elegir deliberadamente qué omitir en lugar de olvidarlo por accidente.

Segmentos 1 y 2 — Sujeto y acción

El segmento del sujeto nombra a la persona, objeto o criatura y describe sus características identificativas: "un hombre nigeriano de mediana edad con barba poblada y cabello gris muy corto, vestido con un traje azul marino oscuro, pañuelo blanco en el bolsillo." El segmento de acción describe luego lo que el sujeto hace: "de pie en el borde de una terraza en azotea, apoyado en una barandilla, mirando hacia el horizonte de la ciudad, una mano en el bolsillo de la chaqueta." Juntos, estos dos segmentos establecen el ancla de la imagen. Errores comunes: (a) describir el estado emocional del sujeto pero no su apariencia física, dejando al modelo que adivine el rostro; (b) nombrar una acción genérica sin un contexto que moldee la pose — "de pie" en una sala de juntas se lee de manera muy distinta que "de pie al borde de un acantilado". Para series de contenido reutilizables, escribe el segmento del sujeto como una "ficha de personaje" fija y encájala en múltiples prompts de escena y configuración de luz. Esto es exactamente lo que soporta el workflow de /editor de Floniks: un nodo de personaje cuya salida alimenta a diversas configuraciones de escena e iluminación en etapas posteriores.

Segmento 3 — Entorno y escenario

El segmento de entorno describe el mundo que habita el sujeto: ubicación, hora del día, clima, contexto arquitectónico y cualquier elemento de fondo. "Una terraza en lo alto de un rascacielos moderno en un horizonte urbano denso, al anochecer, las luces cálidas de la ciudad empezando a iluminar el fondo, ligera neblina en el aire, arquitectura contemporánea de cristal y acero visible." Sin un escenario, los modelos recurren a entornos de estudio neutros o fondos blancos por defecto. El escenario también lleva información de iluminación implícita: "una playa nublada al amanecer" implica luz difusa, fría y de baja intensidad sin que lo tengas que indicar explícitamente, lo que significa que tu segmento de iluminación explícita en el paso 4 solo necesita añadir matices en lugar de definirlo desde cero. Para tomas abstractas o de producto donde no quieres un entorno que distraiga, especifícalo igual de forma deliberada: "fondo de estudio blanco infinito, sin distracciones ambientales" — también estás describiendo el entorno, solo que intencionadamente minimalista.

Segmentos 4 y 5 — Iluminación y cámara

La configuración de iluminación (segmento 4) nombra las fuentes de luz, su calidad, dirección y temperatura de color. La cámara y óptica (segmento 5) nombra la distancia focal, la apertura y cualquier modelo de cámara o película que lleve asociaciones estéticas. Estos dos segmentos se mezclan con frecuencia porque están íntimamente relacionados: la elección de la óptica determina el campo de visión, y la apertura determina la profundidad de campo, que interactúa con cómo la luz renderiza el fondo. Un segmento combinado podría leerse: "iluminado por un softbox grande a cámara izquierda a 45 grados, luz de relleno secundaria a menor potencia desde cámara derecha, temperatura cálida de 4800K, captado en una Sony A7R V con objetivo de 85mm f/1.4 totalmente abierto, fondo separado por poca profundidad de campo, bokeh circular suave." Para fotografía de producto, "iluminación flat-lay cenital con paneles difusores blancos en todos los lados, captado desde directamente arriba con objetivo de 50mm" le da al modelo una geometría extremadamente específica para reproducir. Consulta el artículo de vocabulario de iluminación en este pilar para obtener una lista de referencia copiable de términos de iluminación.

Segmentos 6 y 7 — Atmósfera y estilo de postproducción

La atmósfera y el estado de ánimo (segmento 6) comunica el registro emocional de la imagen mediante adjetivos y referencias tonales: "aspiracional pero accesible, confianza tranquila, un sentido de soledad que se lee como fortaleza más que como soledad." También puedes usar referencias culturales o cinematográficas: "el ambiente de una película tardía de Terrence Malick: pensativo, lento, contemplativo." El estilo de postproducción (segmento 7) especifica el aspecto de la imagen después de que abandona la cámara o el motor de renderizado: "gradación de color cinematográfica con naranjas apagados, negros levantados, tonos medios desaturados, grano de película sutil, viñeta ligera." Estos dos últimos segmentos marcan la diferencia entre una imagen técnicamente correcta y una que parece una declaración creativa deliberada. En Floniks, puedes combinar estos segmentos con un pase de efectos especiales en /pro-effects para aplicar una gradación de color consistente en un lote, haciendo que cada imagen de una serie parezca sacada de la misma sesión fotográfica.

Errores de orden comunes y cómo corregirlos

El error de orden más común es encabezar con el estilo y la atmósfera antes de establecer el sujeto: "cinematográfico, dramático, sombrío, alto contraste, estética de cine negro — una mujer." El modelo lee con mayor peso los tokens iniciales, por lo que podría producir una imagen técnicamente excelente de cine negro cuyo sujeto es una mujer vaga y genérica porque enterraste su descripción al final. Regla fundamental: establece siempre el sujeto antes que la atmósfera. El segundo error más común es intercalar lenguaje técnico y artístico sin separación — por ejemplo, "f/1.8 hermoso primer plano emocional 4K iluminación Rembrandt emotivo." Esto se lee como una lista de etiquetas sin relación en lugar de un briefing coherente, y el modelo las promedia de forma vaga. Mantén los parámetros técnicos agrupados al final. El tercer error es sobre-especificar el estilo a expensas del detalle del sujeto: gastar 40 palabras en la estética y solo 5 en quién aparece en la imagen. El sujeto es el ancla; todo lo demás es atmósfera. Invierte la ponderación y tus resultados mejorarán de inmediato.

Preguntas frecuentes

¿Debo usar comas o frases completas en un prompt fotográfico?+

Ambas funcionan, pero las frases completas o cláusulas breves separadas por comas suelen rendir mejor que las listas de etiquetas. Etiquetas como "hermoso, dramático, épico" sin contexto gramatical le dan al modelo muy poca señal direccional: cada etiqueta podría apuntar en direcciones diferentes. Las cláusulas estructuradas ("iluminación lateral suave desde una ventana, temperatura de color cálida de 4200K") vinculan los conceptos para que el modelo los lea como una instrucción coherente en lugar de adjetivos en competencia.

¿Puedo omitir segmentos para un prompt más sencillo?+

Sí. Un prompt de producto minimalista puede necesitar solo sujeto, entorno e iluminación. El marco de siete segmentos es una lista de verificación, no un guion obligatorio. Úsalo para identificar qué huecos estás dejando al azar y decide deliberadamente si rellenarlos o dejarlos abiertos.

¿Cómo aplico la estructura de siete segmentos a los prompts de vídeo IA?+

Los prompts de vídeo IA en Floniks /ai-video siguen la misma estructura con una adición: una capa de movimiento o acción que describe el movimiento de cámara y del sujeto a lo largo del tiempo. Sustituye "acción o pose" por "acción continua" y añade un segmento de "movimiento de cámara" (travelling lento de entrada, plano estático, seguimiento en mano). El resto de los segmentos — entorno, iluminación, atmósfera, estilo — se transfieren directamente.

Guías relacionadas

Anatomía de un prompt de imagen IA efectivo

Créalo en Floniks

Imagen, vídeo, humanos digitales y flujos de trabajo reutilizables en un solo lienzo. Al registrarte recibes créditos iniciales, sin tarjeta.

Explorar Floniks