Anatomía de un prompt de imagen IA efectivo
Un prompt de imagen IA potente se construye por capas diferenciadas, no como una frase genérica: sujeto, composición, iluminación, óptica y cámara, atmósfera, estilo artístico y parámetros técnicos. Nombrar cada capa de forma explícita reduce al mínimo las variables que el modelo rellena al azar, de modo que los resultados reflejan tu intención y se pueden reproducir de una sesión a otra. Esta guía disecciona cada capa con frases concretas que puedes copiar y adaptar, explica cuáles capas pesan más según el objetivo creativo y muestra cómo encajan de forma natural en una plantilla reutilizable de Floniks.
Por qué la estructura supera a la frase suelta
La mayoría de los prompts débiles no fallan por usar palabras incorrectas, sino porque describen una sola dimensión de la imagen —normalmente el sujeto— y dejan todo lo demás al azar. Un modelo que rellena huecos al azar produce encuadres inconsistentes, iluminación arbitraria y una estética que varía de generación en generación. La estructura soluciona esto. Cuando divides el prompt en capas explícitas, le entregas al modelo un briefing creativo completo en lugar de una sola frase. Imagina que estás contratando a un fotógrafo: no le dirías "saca una foto de una mujer" esperando una obra maestra. Le especificarías la locación, la fuente de luz, la óptica, el estado de ánimo, el vestuario. Los modelos de IA responden exactamente igual. La estructura también hace que la iteración sea económica: puedes cambiar una capa —pasar de "luz dorada de atardecer" a "sol duro al mediodía"— sin reescribir el prompt completo, y el resto de la imagen permanece estable. En Floniks, los prompts estructurados son especialmente potentes porque puedes guardarlos como plantillas de workflow en /editor y reutilizarlos en todo un catálogo de productos o una serie de contenidos.
Capa 1 — Sujeto: el núcleo innegociable
La capa del sujeto responde: ¿de quién o de qué trata esta imagen? Sé específico sobre la identidad, la pose, la expresión, la ropa y cualquier accesorio. Vago: "una mujer en una cafetería." Potente: "una mujer latinoamericana de 30 años con cabello corto natural, vestida con una blazer de lino oversize, sentada frente a una mesa de mármol, sosteniendo una taza de espresso con ambas manos, mirando levemente hacia abajo con una sonrisa discreta y privada." Cada detalle que añades es un hueco que el modelo no rellena al azar. Para productos, nombra el objeto de forma precisa: "una taza de cerámica mate negra y minimalista, logotipo centrado al frente, asa apuntando hacia la derecha." Para personajes que planeas reutilizar en múltiples imágenes, guarda la descripción del sujeto en un nodo de workflow de Floniks como entrada fija; esta es la base de la consistencia de personaje. Si tu sujeto incluye varias personas, númeralas y descríbelas por separado: "Sujeto 1: … Sujeto 2: …" para evitar que el modelo mezcle sus rasgos.
Capa 2 — Composición y encuadre
La composición le indica al modelo cómo organizar el sujeto dentro del plano. Sin ella, obtendrás resultados centrados, seguros y en orientación vertical de forma predeterminada. Frases útiles de composición incluyen la distancia del plano (primer plano, plano medio, plano general), el ángulo (nivel de ojos, ángulo bajo, ángulo picado, inclinación holandesa) y las reglas compositivas (regla de los tercios, líneas de guía, espacio negativo a la izquierda). Una capa de composición completa podría ser: "plano medio, ángulo de cámara ligeramente bajo, sujeto posicionado en el tercio derecho del encuadre, amplio espacio negativo a la izquierda con bokeh suave." Combinar el tipo de plano con el ángulo desbloquea una enorme variedad de gramática visual: el mismo sujeto fotografiado desde un ángulo bajo transmite poder y heroísmo; desde un ángulo picado resulta vulnerable o pequeño. El pilar /learn/cinematography profundiza en tipos de plano y ángulos si quieres dominar estos conceptos. La regla clave: nombra la composición antes que la iluminación, porque la composición determina cómo cae la luz en el plano.
Capa 3 — Iluminación: el multiplicador del estado de ánimo
La iluminación es la capa que más cambia el registro emocional de una imagen sin tocar el sujeto. "Luz natural suave de ventana" y "luz dramática de claroscuro con una sola fuente" pueden describir a la misma mujer en la misma cafetería y producir imágenes que pertenecen a géneros completamente distintos. Como mínimo, nombra la fuente de luz (ventana, sol, panel LED, vela, letrero de neón), la calidad (suave o difusa vs. dura o directa), la dirección (frontal, lateral, trasera, de borde) y la temperatura de color (dorado cálido, azul frío, neutro). Una capa de iluminación concreta: "iluminado desde el lateral por un único softbox grande a la izquierda de cámara, temperatura de color cálida de 4500K, sombra suave que cruza el lado derecho del rostro, suave luz de borde en el cabello." Para fotografía de productos, la iluminación es probablemente más importante que la descripción del sujeto: la misma taza parece premium bajo "luz difusa suave y plana con fondo degradado sutil" y barata bajo una luz cenital dura. Consulta el artículo de vocabulario de iluminación en este pilar para una lista de referencia que puedes copiar en cualquier prompt.
Capa 4 — Estilo, medio y dirección artística
La capa de estilo le dice al modelo de qué tradición visual nutrirse. Aquí especificas si quieres fotografía hiperrealista, ilustración o pintura, y nombras el movimiento estético o la referencia. Ejemplos: "fotografía de moda editorial, captada en película de formato medio, estética Vogue," o "imagen digital cinematográfica, tonos tierra apagados, gradación de color de cine indie tipo A24," o "ilustración vectorial plana, paleta pastel, diseño minimalista escandinavo." Para apuntar a un movimiento artístico específico, nómbralo con precisión: "pintura al óleo impresionista" da al modelo mucha más señal que "artístico." También puedes referenciar tipos de cámara y de película para lograr una apariencia fotográfica: "película Kodak Portra 400, ligero grano, sombras cálidas levantadas." Para vídeo IA en Floniks /ai-video, la capa equivalente es especificar el lenguaje visual del clip —cinematográfico, documental, animado— antes de describir la acción.
Capa 5 — Parámetros técnicos y señales de calidad
Los parámetros técnicos comunican la fidelidad y el formato de salida deseados. Las señales más comunes incluyen la intención de resolución ("detalle 8K", "nitidez extrema"), la profundidad de campo ("f/1.8 profundidad de campo reducida, sujeto nítido, fondo con bokeh cremoso"), las características ópticas ("objetivo retrato 85mm, ligera compresión óptica") y la calidad de renderizado ("hiperrealista, fotorrealista, renderizado Octane, iluminación de trazado de rayos"). También puedes especificar la relación de aspecto directamente en el prompt si el modelo acepta pistas textuales de proporción, aunque los paneles de generación de Floniks tienen controles de relación de aspecto dedicados que complementan o prevalecen sobre esto. Para fotografía de productos, añade "sin marca de agua, fondo limpio, calidad de estudio, grado comercial" para indicar la clase de resultado esperado. Para imágenes artísticas, "pincelada pictórica, textura visible, calidad de museo" orienta hacia un renderizado de bellas artes. Mantén los términos de la capa técnica al final del prompt para que refinen sin competir con las capas de sujeto y composición.
Ensamblando todo: un ejemplo completo
Así es como las cinco capas se combinan en un prompt de producción listo para usar:
Sujeto: "Mujer japonesa de 30 años con cabello negro lacio, vistiendo una blazer marfil estructurada y joyería dorada minimalista, sosteniendo un pequeño ramo de peonías blancas, expresión neutra, contacto visual directo con la cámara"
Composición: "Retrato de plano medio, nivel de ojos, encuadre centrado con ligero espacio en la parte superior, fondo limpio"
Iluminación: "Luz frontal suave con un relleno cálido sutil desde la derecha de cámara, temperatura neutra de 5000K, luz diurna, destellos visibles en ambos ojos, sin sombras duras"
Estilo: "Fotografía de moda editorial de alta gama, captada en Hasselblad de formato medio, estética limpia y moderna"
Técnico: "f/2.8 profundidad de campo reducida, enfoque de precisión en los ojos, fondo suavemente desenfocado, calidad de estudio comercial"
Combinado: mujer japonesa de 30 años con cabello negro lacio, blazer marfil estructurada y joyería dorada minimalista, sosteniendo peonías blancas, contacto visual directo. Retrato de plano medio, nivel de ojos, encuadre centrado. Luz frontal suave, relleno cálido desde la derecha de cámara, temperatura neutra de 5000K, destellos en ambos ojos. Fotografía editorial de alta gama, Hasselblad de formato medio. f/2.8 profundidad de campo reducida, calidad de estudio comercial.
Este prompt tiene aproximadamente 90 palabras: suficientemente específico, suficientemente coherente. Guárdalo como plantilla de workflow en Floniks e intercambia la capa del sujeto para generar un lookbook completo en un solo lote.
Paso a paso
- 1
Escribe primero la capa del sujeto
Describe quién o qué aparece en la imagen con identidad, pose, expresión, ropa y accesorios. Sé tan específico como lo serías al hacer el briefing a un fotógrafo profesional.
- 2
Añade composición y encuadre
Elige la distancia del plano (primer plano, plano medio, plano general), el ángulo de cámara y la disposición compositiva (regla de los tercios, encuadre centrado, dirección del espacio negativo).
- 3
Especifica la iluminación
Nombra la fuente de luz, la calidad (suave o dura), la dirección (frontal, lateral, trasera o de borde) y la temperatura de color. Esta capa cambia el registro emocional de la imagen más que cualquier otra.
- 4
Nombra el estilo visual y el medio
Haz referencia a la tradición fotográfica o artística: tipo de película, movimiento artístico, marca de cámara o estética de género.
- 5
Cierra con los parámetros técnicos
Añade profundidad de campo, tipo de óptica, intención de resolución y señales de calidad al final del prompt para que refinen sin anular las capas centrales.
Preguntas frecuentes
¿Qué extensión debe tener un prompt de imagen IA?+
La suficiente para nombrar cada capa una vez. Eso suele quedar entre 60 y 120 palabras. Los prompts más cortos dejan demasiados huecos para que el modelo los rellene al azar; los más largos pueden hacer que el modelo pierda los detalles del inicio. Si necesitas describir una escena muy compleja, divídela en un workflow de varios pasos en Floniks donde cada nodo gestiona un elemento.
¿Necesito todas las capas en cada prompt?+
No. Empieza con sujeto, composición e iluminación. Estas tres capas eliminan la mayor parte de la variabilidad. El estilo y los parámetros técnicos son refinamientos que añades una vez que la imagen base tiene buen aspecto.
¿Importa el orden de las capas?+
Sí, en términos generales. Coloca la información más importante primero —sujeto y luego composición— porque los modelos ponderan más los tokens iniciales. Las señales de calidad técnica funcionan mejor al final, como instrucciones de acabado en lugar de competir con la descripción principal.
Guías relacionadas
Créalo en Floniks
Imagen, vídeo, humanos digitales y flujos de trabajo reutilizables en un solo lienzo. Al registrarte recibes créditos iniciales, sin tarjeta.
Explorar Floniks