Fine Tuning

Page 2 of 2

Una famiglia di modelli completamente addestrati per la generazione di immagini anime, basata sull'architettura S3-DiT con 6 miliardi di parametri.

Z-Anime: Modello Anime con Fine-Tuning Completo su Z-Image Base

Z-Anime è un fine-tuning completo dell'architettura Z-Image Base di Alibaba, non un merge LoRA. Offre qualità elevata, diversità stilistica, supporto per prompt in linguaggio naturale e negative prompt, con varianti BF16, FP8, GGUF e AIO. Compatibile con 8GB VRAM e pronto per training LoRA.

Creato da Team Juggernaut e KandooAI, rilasciato da RunDiffusion: luci, texture e anatomia migliorate per ritratti e scene cinematografiche.

Juggernaut Z: un fine-tuning cinematografico per Z-Image

Juggernaut Z è un fine-tuning di Z-Image Base, ottimizzato per illuminazione drammatica, messa a fuoco nitida, texture della pelle più naturale e miglioramenti nell'anatomia e nella composizione. Include pesi completi, varianti FP16, FP8 e quantizzazioni GGUF. Ideale per lavori editoriali, concettuali e cinematografici.

Strumento open-source per stimare VRAM, verificare la fattibilità e generare ricette di addestramento con LoRA e QLoRA

Can I Finetune This: Guida pratica al fine-tuning LLM su GPU consumer

Scopri come stimare il consumo di VRAM per il fine-tuning di modelli linguistici di grandi dimensioni su GPU consumer. Include benchmark reali, calibrazione automatica e generazione di script di addestramento pronti all'uso con Hugging Face e PEFT.

Addestramento e inferenza efficienti per modelli di diffusione autoregressivi a lunghissimo termine con parallelismo di sequenza e quantizzazione a 4 bit

LongLive-2.0: Infrastruttura Parallela NVFP4 per Video Lunghi

LongLive-2.0 presenta un'infrastruttura parallela basata su NVFP4 per l'intero flusso di addestramento e inferenza nella generazione di video lunghi. Include addestramento AR con parallelismo di sequenza bilanciato (Balanced SP) e quantizzazione NVFP4 per ridurre memoria e accelerare GEMM. Per l'inferenza su GPU Blackwell, supporta W4A4 e cache KV quantizzata, oltre a decodifica VAE asincrona. Raggiunge speedup fino a 2.15x in addestramento e 1.84x in inferenza, con 45.7 FPS per il modello 5B.

Modelli byte-level con diffusione e speculazione per generazione più rapida e riduzione dei costi

Fast Byte Latent Transformer: efficienza e innovazione

Il nuovo Fast Byte Latent Transformer (BLT) introduce BLT Diffusion e Self-speculation per generare byte in parallelo, riducendo fino al 92% la larghezza di banda. Valutato su traduzione e generazione di codice a scale 1B e 3B, mantiene prestazioni competitive con minori risorse computazionali.