图像编辑开源新SOTA大模型行业正步入多模态时间全球AI大模型智能涌现，现在正在

图像编辑开源新SOTA大模型行业正步入多模态时间

全球AI大模型智能涌现，现在正在进入“多模态时间”。

一方面，全球业内各式各样的技术进展，都围绕多模态如火如荼展开。

另一方面，AI应用和落地的需求中，多模态也是最重要的能力。没有多模态技术，何谈应用和落地？

实际上，多模态的先锋共识和趋势，把代表性玩家的进展连点成线，也能看出来……

看看行业公认的多模态卷王，阶跃星辰——

刚刚过去的一个月，陆续上新的3款模型，全是多模态，有图生视频开源模型，有多模态推理模型，还有图像编辑开源模型。

模态丰富，上新频繁，性能出色。

之所以把阶跃的这些发布连点成线解读，也是因为阶跃从一开始的强落地和强应用属性。

目前，阶跃已发布的模型里，七成都是多模态。鉴于多模态是Agent的必备要素，今年阶跃化身「落地型玩家」的态势愈发明显：发力智能终端Agent。

过去一个月，卷王卷出了些啥？

据量子位整理回顾，过去一个月，阶跃星辰接连上新了3款模型：

- Step1X-Edit：图像编辑模型

- Step-R1-V-Mini：多模态推理模型

- Step-Video-TI2V：图生视频模型

它们覆盖了当前多模态模型的几大刚需方向，并且其中Step1X-Edit和Step-Video-TI2V已面向开发者开源。

怎么说呢，这很阶跃，也很符合技术流和行业玩家们对“多模态时间”的追逐趋势。

而这三款模型的具体情况，咱们掰开了来看：

0 阅读：2

科技概念大全，建议收藏！！！1、端侧AI（硬件）：宇瞳光学、安凯微、广和通2、