Imágenes

Análisis de resultados sorprendentes y la interacción de la comunidad con la creatividad basada en emoji para DALL-E 3.

Experimento de Generación de Imágenes IA con Prompts de Emojis en r/ChatGPT

Un usuario de r/ChatGPT comparte un experimento de generación de imágenes IA utilizando únicamente prompts de emojis, obteniendo resultados "sorprendentemente buenos". La publicación incluye ejemplos de prompts y la respuesta del AutoModerator con instrucciones para la comunidad.

Descubre cómo Ideogram 4 redefine la generación de imágenes con su nueva interfaz JSON, renderizado multilingüe y controles avanzados.

Ideogram 4: El Modelo de Texto a Imagen de Código Abierto Líder

Ideogram 4 es el primer modelo de texto a imagen de código abierto de Ideogram, entrenado desde cero. Ofrece renderizado de texto multilingüe, comprensión profunda del lenguaje, control de diseño y resolución 2k, superando a otros modelos en benchmarks como Design Arena y ContraLabs.

Descubre el modelo de difusión texto-imagen que comprime el transformer de 7.75 GB a 1.21 GB con pesos ternarios, manteniendo una alta fidelidad visual.

Cómo Bonsai Ternary 4B revoluciona la difusión texto-imagen

Explora Bonsai Image Ternary 4B, un modelo compacto de difusión texto-imagen basado en FLUX.2 Klein 4B. Aprende cómo los pesos ternarios reducen su tamaño 6.4x, mejorando la eficiencia y el rendimiento en diversas plataformas, y su impacto en la frontera calidad-tamaño.

Familia de modelos basada en S3-DiT con variantes optimizadas para calidad, velocidad y bajo consumo de VRAM

Z-Anime: Fine-Tune Completo para Generación Anime sobre Z-Image Base

Z-Anime es un fine-tune completo (no LoRA) de la arquitectura Z-Image Base de Alibaba, adaptado a la generación de estilo anime. Incluye variantes Base, Distill-8-Step y Distill-4-Step en formatos BF16, FP8, GGUF y AIO, con soporte para 8GB VRAM, prompting en lenguaje natural y compatibilidad con LoRA.

Una versión afinada por RunDiffusion para iluminación dramática, textura natural y retratos mejorados

Juggernaut Z: Ajuste cinematográfico de Z-Image Base

Juggernaut Z es un ajuste fino de Z-Image Base, entrenado por KandooAI y publicado por RunDiffusion. Ofrece iluminación más cinematográfica, enfoque nítido, textura de piel refinada y mejor representación étnica. Incluye pesos completos, FP16, FP8 y cuantizaciones GGUF.