DeepSeek崛起的关键因素有俩。技术上,它性价比无敌。1月20日发布的推理大模型DeepSeek - R1,预训练费用仅557.6万美元,在2048块英伟达H800 GPU集群上运行55天完成,是OpenAI GPT - 4o模型训练成本的不到十分之一。而且在后训练阶段用强化学习技术,在极少标注数据下提升推理能力,使用成本也低,性能还能比肩OpenAI o1模型正式版。 精神层面上,创始人梁文峰有战略眼光和坚定信念,喊出中国AI不能永远做跟随者,带领团队打造创新企业文化,这种文化自信和勇于超越的精神,也是DeepSeek崛起的重要因素。
