又看到说De­e­p­S­e­ek蒸馏Ch­a­t­G­PT的讨论,观点基本全错

玮磊惠卿评体育 2025-07-06 22:05:12

又看到说De­e­p­S­e­ek蒸馏Ch­a­t­G­PT的讨论,观点基本全错,又一个随着英伟达股价涨跌写观点的例子。De­e­p­S­e­ek 的开源策略对全球技术进步的影响依然被严重低估,从来不是他蒸馏Ch­a­t­G­PT,说蒸馏闭源模型的都是外行。反而是De­e­p­S­e­ek 第一个开源了详细的蒸馏步骤,基于0524最新版蒸馏的Qw­en3 大幅超越了原版Qw­en3模型。甚至英伟达在Hu­g­g­i­n­g­F­a­ce上放出了De­e­p­S­e­ek 模型的输入输出数据,省去了很多人部署De­e­p­S­e­ek作为老师模型的麻烦,可以直接基于输入输出对训练学生模型。

0 阅读:3

猜你喜欢

玮磊惠卿评体育

玮磊惠卿评体育

感谢大家的关注