El generador de texto a imagen Stable Diffusion ahora está disponible para que cualquiera lo pruebe.
Stable Diffusion es desarrollado por Stability AI y se lanzó inicialmente para los investigadores a principios de este mes. El generador de imágenes afirma ofrecer un gran avance en velocidad y calidad que puede ejecutarse en GPU de consumo.
El modelo se basa en el modelo difuso latente creado por CompVis y Runway, pero mejorado con conocimientos de modelos de difusión condicional del desarrollador líder de inteligencia artificial generativa de Stable Diffusion. Katherine CrowsonOpen AI, Google Brain y otros.
“Este modelo se basa en el trabajo de muchos investigadores excelentes y esperamos el efecto positivo de este y otros modelos similares en la sociedad y la ciencia en los próximos años, ya que miles de millones en todo el mundo los utilizan”, dijo Emad Mostaque, director ejecutivo de Stability AI.
El conjunto de datos principal se entrenó en LAION-Aesthetics, un conjunto de datos que filtra los 5850 millones de imágenes en el conjunto de datos LAION-5B en función de cuán “hermosa” era una imagen, basándose en las calificaciones de los evaluadores alfa de Stable Diffusion.
Stable Diffusion se ejecuta en computadoras con menos de 10 GB de VRAM y genera imágenes con una resolución de 512 × 512 píxeles en solo unos segundos.
“Estamos entusiasmados de que los modelos de texto a imagen de última generación se construyan abiertamente y estamos felices de colaborar con CompVis y Stability.ai para lanzar los modelos al público de manera segura y ética y ayudar a democratizar las capacidades de ML. con toda la comunidad”, comentó Apolinário, ingeniero de arte de ML en la comunidad de IA Hugging Face.
Stable Diffusion va cara a cara con otros modelos de texto a imagen, incluidos Midjourney, DALL-E 2 e Imagen.
Se ha creado un espacio interactivo para probar la Difusión Estable aquí.
(Credito de imagen: Fabián Stelzer)

¿Quiere aprender más sobre IA y big data de los líderes de la industria? Echa un vistazo a AI & Big Data Expo que tendrá lugar en Ámsterdam, California y Londres.
Explore otros próximos eventos y seminarios web de tecnología empresarial impulsados por TechForge aquí.
El generador de texto a imagen posterior a Stable Diffusion ya está disponible públicamente y apareció por primera vez en AI News.