DeepSeek-V3 Architecture

DeepSeek-V3: La Eficiencia Extrema Llega a los Modelos de Frontera

671B parámetros, pero solo 37B activos. DeepSeek redefine lo que significa entrenar un modelo SOTA con un presupuesto ajustado.

January 3, 2026 · Leandro Latorre