
DeepSeek-V3: La Eficiencia Extrema Llega a los Modelos de Frontera
671B parámetros, pero solo 37B activos. DeepSeek redefine lo que significa entrenar un modelo SOTA con un presupuesto ajustado.

671B parámetros, pero solo 37B activos. DeepSeek redefine lo que significa entrenar un modelo SOTA con un presupuesto ajustado.