加载中...
我们重新构建了 MoE 模型在 Blackwell GPU 上生成令牌的方式,使得推理速度提高了 1.84 倍,输出更准确。
这些改进直接有助于我们训练 Composer,使我们能够更频繁地发布模型改进版本。