Vocabulario básico: texto a imagen con IA


(⏱️ Tiempo de lectura: 4:30 minutos)

Después de la introducción que hicimos en un artículo anterior sobre los tres motores de IA para crear imágenes, traemos unas pinceladas del vocabulario básico que se aplica a la generación de imágenes con IA, porque se usa mucho el idioma inglés, como en casi todo el mundo tecnológico y algunos conceptos son nuevos o tienen nombres nuevos a los que tenemos que acostumbrarnos.

Estilo: Dibujo con acuarela

Estructura de los prompts para generar imágenes

Del mismo modo que hay un modo de redacción adecuado para los prompts que escribimos en ChatGPT, la estructura del prompt para generar imágenes tiene 4 partes:

  1. Personaje
  2. Acción
  3. Entorno
  4. Estilo

Vamos a aplicarlo a un ejemplo:

  1. Una cebra
  2. Andando
  3. Bajo un árbol en la sabana africana
  4. Fotografía realista

👉 Prompt completo: Una cebra caminando bajo un árbol en la sabana africana; estilo realista.

Y, excepto que uses Bing Chat, que funciona muy bien en español, en la mayoría de herramientas se consiguen mejores resultados al usar el prompt en inglés:

👉 Prompt: A zebra walking under a tree in the African savanna; realistic style.

Imagen generada con IA. Una cebra caminando bajo un árbol en la sabana africana; estilo realista.
Imagen generada con IA

🔗​ Para generar las imágenes de este artículo, hemos usado la herramienta Leonardo.ai, que está basada en el motor de Stable Diffusion y tiene muchas prestaciones (aunque no es tan sencilla de usar como Bing Chat y funciona en inglés).

⚠️ ATENCIÓN: Cuando veas los prompts de otras personas, te darás cuenta de que los mejores resultados se obtienen añadiendo al final prompt largas listas de detalles separados por comas que indican todo tipo de características: varios estilos artísticos, iluminación, elección de cámara de fotos, referencias de artistas, paleta de colores, emojis, detalles del fondo, etc. Cuando veas una imagen que te guste, copia el prompt y úsalo con tus temas. Cambia un sólo un elemento y observa cómo afectan a la imagen de salida. Así aprendes y ganas experiencia.


CURSO UDEMY : HERRAMIENTAS DE INTELIGENCIA ARTIFICIAL PARA PROFESORES

✅  En este curso online en la plataforma Udemy se exploran, a lo largo de más de 2 horas de videos, las principales herramientas de Inteligencia Artificial que han surgido y que se pueden aplicar a tareas docentes: chatbots educativos, generación de imágenes, texto a video, redacción de tests y exámenes y muchas otras más.

✅  El precio del curso es de 24,99€ (aunque Udemy tiene frecuentes promociones y descuentos 😉 )


Formato de la imagen (Aspect ratio/AR)

En muchas herramientas (como Bing Chat), el formato por defecto es cuadrado, pero podremos modificarlo a otro que nos interese, eligiendo el Aspect ratio (AR). El primer número indica la dimensión horizontal (ancho) y el segundo número la dimensión vertical (alto), en proporción, no en valor absoluto:

  • 2:3 – 3:4 – 9:16 Imágenes verticales («retrato»), con diferentes relaciones de aspecto. 9:16 es para móviles.
  • 1:1 Imágenes cuadradas.
  • 3:2 – 4:3 – 16:9 Imágenes horizontales («paisaje»). 16:9 es el adecuado para ordenadores y televisores.
AR 4:3
AR 1:1
AR 3:4

Estilo

Modificar el estilo en un prompt es la forma más sencilla y rápida de obtener resultados originales. Podemos considerar el estilo como una gran cantidad de información resumida en una o pocas palabras.

  • Estilos artísticos o arquitectónicos reconocidos: cubista, surrealista, escultura de mármol del Renacimiento…
  • Estilos más descriptivos: fotografía realista, dibujo al carboncillo, acuarela, dibujo para colorear, etc.
  • Nombres propios de artistas famosos: Joan Miró, Andy Wathol, el fotógrafo Ansel Adams, la arquitecta Zara Hadid, etc.
  • Cualquier idea creativa que se te ocurra: origami, collage de periódicos, foto Polaroid, tatuaje, crochet, etc.
Estilo: Ansel Adams
Estilo: Dibujo para colorear
Estilo: Origami
Estilo: Joan Miró

Si te interesa profundizar sobre el tema de los estilos, hay numerosos tutoriales online y muchas listas que los recopilan.

Quiero recibir gratis un par de mailes semanales sobre Inteligencia Artificial y Ahorro de Tiempo para Docentes


Prompt negativo (Negative prompt)

El prompt negativo es una lista de palabras que no queremos que aparezcan en la imagen final. Es útil cuando expresamente queremos eliminar algún elemento que podría aparecer en la imagen.

Por ejemplo, si queremos generar un bodegón con frutas pero no queremos que haya fresas o frutas rojas, añadimos esas palabras (fresa, rojo) al prompt negativo.

Prompt negativo: rojo, fresa

Imagen a imagen (Image to image)

Esta opción nos permite subir una imagen (fotografía real o generada con IA) que nos sirve como modelo y generar una nueva inspirada en ella aportando un prompt escrito. Se diferencia así en inglés de la generación a partir de un promt que ya hemos visto, que se llama text to image.

Imagen generada. Montañas añadidas

Es la tecnología detrás de la creación de avatares personales, en los que subimos una foto nuestra y podemos crear variaciones con muchos estilos diferentes.

En nuestro trabajo docente nos puede servir para transformar una imagen cualquiera en un dibujo en blanco y negro para que lo coloreen los estudiantes.



Reflexión

Ya te estás dando cuenta de que las imágenes generadas con IA son espectaculares.

Sin embargo, así como la redacción de textos con IA puede resultar muy útil en muchas de nuestras tareas docentes, la generación de imágenes tiene un uso mucho más limitado, a menos que seas docente de áreas artísticas, evidentemente.

En consecuencia, antes de lanzarte a usar estas herramientas, sería necesario que valorases si merece la pena dedicar tiempo a aprenderlas en función de los usos que les vayas a dar.

Instagram
YouTube

twitter
Facebook

⚠️  Los enlaces de esta página y de toda la web pueden contener código de afiliados de Amazon o de otras empresas. Esto significa que recibimos una comisión por cada compra de producto o servicio sin que cambie el precio de venta para el comprador.

Deja un comentario

  • Responsable: Guillermo Antón Pardo
  • Finalidad: Gestionar y responder a tus comentarios
  • Derechos: Podrás ejercer tus derechos de acceso, rectificación, limitación y suprimir los datos de este formulario, así como el derecho a presentar una reclamación ante una autoridad de control
  • Información adicional: En nuestra página con la Política de Privacidad encontrarás más información sobre la recopilación y uso de tu información por parte de Profesor Productivo.