El último semestre de 2022 fue el del gran estallido de la Inteligencia Artificial, y 2023 está yendo todavía más rápido. La última novedad anunciada por uno de los pesos pesados de esta guerra, Microsoft, es un generador de imágenes a partir de texto integrado en Bing Chat, utilizando el modelo de DALL·E, de OpenAI, como una extensión del acuerdo de integración anunciado hace unas semanas.
De la misma forma que llegó la integración de GPT-4 al buscador de Microsoft para resucitar a Bing, ahora se añade compatibilidad nativa de este Bing Image Creator específicamente a Edge, una forma básica de aumentar su popularidad y cuota de mercado.
Añade una chimenea
En el comunicado de Microsoft en su blog anunciando esta novedad matizan que no se trata del modelo del DALL·E que conocemos, sino una “versión avanzada”, algo que puede ser importante de cara a competir con quien mejores resultados logra a día de hoy, Midjourney.
La integración con Bing Chat será total y no hará falta ir a otro espacio diferente: bastará con pedirle que genere una imagen además de las indicaciones convenientes, como se ha encargado Microsoft de exhibir en alguna imagen demostrativa.
Para los iniciados que ya hayan generado imágenes con DALL·E u otro modelo, no habrá mucho misterio. Para los neófitos cabe destacar que no solo acepta multitud de estilos fotográficos o artísticos, sino que también es posible pedirle en lenguaje natural modificaciones sobre una imagen ya hecha.
Por ejemplo, pedirle que añada una chimenea a las fotos de un salón que ha generado, o solicitarle que elimine las flores de la ilustración de un jardín. O que varíe el estilo, de una foto tomada con lente de 50 mm al mismo concepto pero en versión ukiyo-e, por ejemplo.
El nuevo Bing Image Creator se puede probar desde su propia web, aunque se irá liberando para los usuarios de Bing que solicitaron el acceso a su nuevo chat desde el día de hoy. De momento, solo en inglés, aunque la empresa ha avanzado que irán añadiendo compatibilidad con más idiomas.
Nosotros hemos hecho alguna prueba rápida, y además de comprobar que efectivamente solo funciona en inglés (pese a que DALL·E sí es políglota), hemos visto qué resultados da a ciertos prompts:
Y una curiosidad: cuando le introdujimos el prompt “Tim Cook hugging Satya Nadella” nos dio un aviso de contenido bloqueado. Curiosamente, con Messi no puso problemas.
Imagen destacada | Mockuuups Studio, Microsoft.
En Xataka | GPT-4 tiene el potencial de afectar a miles de empleos. A los que menos lo esperaban, para ser exactos
–
La noticia Microsoft anuncia Bing Image Creator: generación de imágenes por texto basada en una versión avanzada de DALL·E fue publicada originalmente en Xataka por Javier Lacort .