El generador de texto a imagen de difusión estable ahora está disponible públicamente

El generador de texto a imagen Stable Diffusion ahora está disponible para que cualquiera lo pruebe.

Stable Diffusion es desarrollado por Stability AI y se lanzó inicialmente para los investigadores a principios de este mes. El generador de imágenes afirma ofrecer un gran avance en velocidad y calidad que puede ejecutarse en GPU de consumo.

El modelo se basa en el modelo difuso latente creado por CompVis y Runway, pero mejorado con conocimientos de modelos de difusión condicional del desarrollador líder de inteligencia artificial generativa de Stable Diffusion. Katherine CrowsonOpen AI, Google Brain y otros.

“Este modelo se basa en el trabajo de muchos investigadores excelentes y esperamos el efecto positivo de este y otros modelos similares en la sociedad y la ciencia en los próximos años, ya que miles de millones en todo el mundo los utilizan”, dijo Emad Mostaque, director ejecutivo de Stability AI.

El conjunto de datos principal se entrenó en LAION-Aesthetics, un conjunto de datos que filtra los 5850 millones de imágenes en el conjunto de datos LAION-5B en función de cuán “hermosa” era una imagen, basándose en las calificaciones de los evaluadores alfa de Stable Diffusion.

Stable Diffusion se ejecuta en computadoras con menos de 10 GB de VRAM y genera imágenes con una resolución de 512 × 512 píxeles en solo unos segundos.

“Estamos entusiasmados de que los modelos de texto a imagen de última generación se construyan abiertamente y estamos felices de colaborar con CompVis y Stability.ai para lanzar los modelos al público de manera segura y ética y ayudar a democratizar las capacidades de ML. con toda la comunidad”, comentó Apolinário, ingeniero de arte de ML en la comunidad de IA Hugging Face.

Stable Diffusion va cara a cara con otros modelos de texto a imagen, incluidos Midjourney, DALL-E 2 e Imagen.

DALL-E 2 vs Midjourney vs StableDiffusion mega thread: fotografía, ilustración, pintores, abstracto

estos sintetizadores de imagen son como instrumentos; es increíble que obtengamos tantos, cada uno con un único "sonido" 🤯

reglas: mismo aviso, relación de aspecto 1:1, sin artistas vivos pic.twitter.com/47syy7uPJJ

— fabians.eth (@fabianstelzer) 20 de agosto de 2022

Se ha creado un espacio interactivo para probar la Difusión Estable aquí.

(Credito de imagen: Fabián Stelzer)

¿Quiere aprender más sobre IA y big data de los líderes de la industria? Echa un vistazo a AI & Big Data Expo que tendrá lugar en Ámsterdam, California y Londres.

Explore otros próximos eventos y seminarios web de tecnología empresarial impulsados por TechForge aquí.

El generador de texto a imagen posterior a Stable Diffusion ya está disponible públicamente y apareció por primera vez en AI News.

TecNoticias, tu portal de información

El generador de texto a imagen de difusión estable ahora está disponible públicamente

ByErica Flores

By Erica Flores

Related Post

Uber utilizará la eSIM de Valid para casos de uso de IoT

Matter Motor Works se asocia con Airtel para habilitar sus bicicletas AERA con soluciones IoT

Serie Samsung Galaxy S24: fecha de lanzamiento, especificaciones, precio y todos los rumores hasta ahora

You missed

Uber utilizará la eSIM de Valid para casos de uso de IoT

Matter Motor Works se asocia con Airtel para habilitar sus bicicletas AERA con soluciones IoT

Escultura de Zelda Guardian rastrea a humanos y mascotas a través de una cámara

Nos encanta este diminuto Wall-E controlado por radio

TecNoticias, tu portal de información