图像编辑开源新SOTA大模型行业正步入多模态时间全球AI大模型智能涌现,现在正在

量子位看科技 2025-04-28 16:21:32

图像编辑开源新SOTA大模型行业正步入多模态时间

全球AI大模型智能涌现,现在正在进入“多模态时间”。

一方面,全球业内各式各样的技术进展,都围绕多模态如火如荼展开。

另一方面,AI应用和落地的需求中,多模态也是最重要的能力。没有多模态技术,何谈应用和落地?

实际上,多模态的先锋共识和趋势,把代表性玩家的进展连点成线,也能看出来……

看看行业公认的多模态卷王,阶跃星辰——

刚刚过去的一个月,陆续上新的3款模型,全是多模态,有图生视频开源模型,有多模态推理模型,还有图像编辑开源模型。

模态丰富,上新频繁,性能出色。

之所以把阶跃的这些发布连点成线解读,也是因为阶跃从一开始的强落地和强应用属性。

目前,阶跃已发布的模型里,七成都是多模态。鉴于多模态是Agent的必备要素,今年阶跃化身「落地型玩家」的态势愈发明显:发力智能终端Agent。

过去一个月,卷王卷出了些啥?

据量子位整理回顾,过去一个月,阶跃星辰接连上新了3款模型:

- Step1X-Edit:图像编辑模型

- Step-R1-V-Mini:多模态推理模型

- Step-Video-TI2V:图生视频模型

它们覆盖了当前多模态模型的几大刚需方向,并且其中Step1X-Edit和Step-Video-TI2V已面向开发者开源。

怎么说呢,这很阶跃,也很符合技术流和行业玩家们对“多模态时间”的追逐趋势。

而这三款模型的具体情况,咱们掰开了来看:

0 阅读:2
量子位看科技

量子位看科技

感谢大家的关注