Tailored news hub
categoria

Modelos de Lenguaje

Modelos de lenguaje de gran escala — sus lanzamientos, arquitecturas, capacidades y comparativas.

4 articoli
MiniCPM5-1B: Un Modelo de Lenguaje de 1B de Parámetros para Ejecución Local
Descubre cómo MiniCPM5-1B redefine la ejecución de modelos de lenguaje en dispositivos con recursos limitados, ofreciendo rendimiento de vanguardia y versatilidad.

MiniCPM5-1B: Un Modelo de Lenguaje de 1B de Parámetros para Ejecución Local

Explora la arquitectura, variantes y los innovadores modos duales "Think / No Think" de MiniCPM5-1B. Aprende cómo este modelo de 1B de parámetros optimizado para entornos locales puede funcionar como asistente rápido y motor de razonamiento deliberativo, ideal para agentes de codificación y flujos de trabajo con herramientas.

Qwen3.5-35B-A3B-Heretic-V2: Un Modelo de Lenguaje Sin Censura y Eficiente
Descubre cómo esta variante comunitaria de Qwen3.5-35B-A3B combina la libertad de un modelo sin censura con la eficiencia de la Predicción Nativa de Múltiples Tokens.

Qwen3.5-35B-A3B-Heretic-V2: Un Modelo de Lenguaje Sin Censura y Eficiente

Explora las características clave de Qwen3.5-35B-A3B-Heretic-V2, un modelo de lenguaje grande sin censura impulsado por la comunidad. Aprende sobre su arquitectura de mezcla de expertos, la conservación de la predicción de múltiples tokens y los diversos formatos disponibles para su despliegue, desde GPUs en la nube hasta dispositivos personales.

Grok V9-Medium Finaliza Entrenamiento, Lanzamiento en Junio
xAI completa el entrenamiento de su modelo fundacional de 1,5 billones de parámetros, triplicando la escala de su predecesor y enfocándose en programación avanzada.

Grok V9-Medium Finaliza Entrenamiento, Lanzamiento en Junio

Elon Musk confirma la finalización del entrenamiento de Grok V9-Medium, el nuevo modelo de xAI con 1,5 billones de parámetros. Se espera su lanzamiento público en junio de 2026 tras las fases de fine-tuning y aprendizaje por refuerzo, con un fuerte enfoque en capacidades de programación.

Talkie: Guía completa del modelo de lenguaje pre-1931
Análisis detallado del entrenamiento, capacidades, limitaciones y reacciones de la comunidad ante este LM de 13B parámetros

Talkie: Guía completa del modelo de lenguaje pre-1931

Exploramos en profundidad Talkie, un modelo de lenguaje de 13 mil millones de parámetros entrenado exclusivamente con textos anteriores a 1931. Abordamos su corpus de 260 mil millones de tokens, las técnicas de procesamiento de datos, respuestas anacrónicas reportadas, críticas académicas y planes de publicación. Una inmersión en este experimento sobre generalización de modelos lingüísticos.