(Claude、GPT、GLM)🥇GLM-5.2登顶Artificial Analysis开源第一,全球前三
GLM-5.2 今日发布并开源,在多个第三方权威基准和竞技场上交出扎实的成绩单。
📊 Artificial Analysis 智能指数这是整合了编程、推理、长上下文等多项权威榜单的综合测评。GLM-5.2 拿下 51 分,在所有可用模型中排名前列,比肩 Claude Opus 4.8,位居全球开源模型第一。
🎨 Code Arena专注前端代码生成能力的真实对战竞技场,由用户盲测投票产生 Elo 排名。GLM-5.2以 1,595 分排名全球第二。
🏆 DesignArena聚焦设计与代码结合场景的分类竞技场。GLM-5.2 以 1,360 分位列榜首。
⚙️ FrontierSWE主打"人类能力边界"的软件工程基准,从实现、性能、研究三个维度综合评估工程能力。GLM-5.2 综合排名第三。
💪 从前端开发、设计代码到工程级软件任务,GLM-5.2 在多个真实评测场景中稳定进入第一梯队,持续逼近全球最强模型的水平。我们还将继续努力,追求更高的智能上界。
