多模态推理新突破一、技术背景OpenAI的o3模型突破传统文字思维链，实现图

春蕴评趣事 2025-05-31 15:21:52

多模态推理新突破

一、技术背景

OpenAI的o3模型突破传统文字思维链，实现图像直接融入推理过程，具备“用图思考”能力。小红书与西安交大联合开发DeepEyes模型，通过端到端强化学习复现类似功能，并开源技术细节。

二、核心创新

1. 动态视觉聚焦：模型在推理中自主调用图像信息，实现“边看边想”。

2. 无监督训练：仅通过强化学习激发能力，无需监督微调（SFT）。

3. 工具调用优化：内置视觉定位与裁剪功能，减少依赖外部工具。

三、技术实现

1. 架构设计：基于多模态模型，加入自驱动视觉聚焦机制。

2. 训练策略：采用outcome-based奖励函数，分阶段优化工具使用。

3. 数据集构建：筛选难度适中、工具增益显著的问题样本。

四、性能表现

1. 基准测试：V* Bench准确率达90.1%，超越传统工作流方法。

2. 跨任务能力：在视觉搜索、数学推理等任务中表现优异。

五、优势对比

1. 训练简化：仅需问答对数据，降低门槛。

2. 泛化性强：动态选择推理路径，适应开放任务。

3. 端到端优化：全局联合训练避免次优解。

0 阅读：10

猜你喜欢

华为连夜传来好消息，这回余承东算是真的出名了！尊界S800的销量彻底失控了，这已

华为连夜传来好消息，这回余承东算是真的出名了！尊界S800的销量彻底失控了，这已

【24评论】【11点赞】

华为余承东尊界s800 互联网公司手机行业

鸿蒙NEXT比亚迪不仅销量牛逼，就连APP更新适配鸿蒙系统也牛逼[赞]，鸿蒙

鸿蒙NEXT比亚迪不仅销量牛逼，就连APP更新适配鸿蒙系统也牛逼[赞]，鸿蒙

华为鸿蒙系统比亚迪国产车

历史何其的相似,不出意外的话6月11日华为新品发布很可能又是个王炸!202

历史何其的相似,不出意外的话6月11日华为新品发布很可能又是个王炸!202

【3评论】【1点赞】

华为华为麒麟芯片芯片

华为又搞大事情啦！尊界S800上的智驾ADS4.0已经是实现了高速L3自动驾驶，

华为又搞大事情啦！尊界S800上的智驾ADS4.0已经是实现了高速L3自动驾驶，

自动驾驶华为尊界s800

余承东为何要对小米上火？没办法啊，原来指望支楞起来的智界被小米打残了。

余承东为何要对小米上火？没办法啊，原来指望支楞起来的智界被小米打残了。

【9评论】【2点赞】

小米科技余承东智界s7 鸿蒙智行

曝华为Pura70系列出货量破1300万基于Pura70系列1300万台销量基本

曝华为Pura70系列出货量破1300万基于Pura70系列1300万台销量基本

华为传感器手机行业

余承东已经是华为董事和终端BG董事长了，作为华为的一把手。还经常被任正非挨骂，按

余承东已经是华为董事和终端BG董事长了，作为华为的一把手。还经常被任正非挨骂，按

【9评论】

华为余承东任正非互联网公司手机行业

春蕴评趣事

感谢大家的关注

作者最新文章

1

SSM+扩散模型创新视频世界模型研究背景视频扩散模型作为世界模型存在长期记忆

2

AI与未来就业危机一、问题背景哈佛经济学教授Jason Furman提出AI

3

华为盘古Embedded双系统推理革新华为盘古Embedded模型通过创新的双系

4

多模态推理新突破一、技术背景 OpenAI的o3模型突破传统文字思维链，实现图

5

Xbench基准测试的背景与目标 1. 项目起源与发展 • 2022年底Ch

6

Xbench双轨评估体系解析Xbench 基准测试工具的结构化梳理 01. 项

7

阿里开源MaskSearch框架研究背景阿里通义实验室提出MaskSearc

8

AI意外生成高性能CUDA内核研究背景斯坦福团队意外发现AI生成的CUDA内

9

你是平台的算法数据基数燃料免费道具平台为你提供免费的精神Y片

10

AI巨头英伟达的收入增长预测是2029财年达到3300亿美元，目前为1300亿

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

社会TOP

1

#广州身边事#【#超千岁荔枝树再结硕果#迄今有1024岁，是广州目前树龄最老

2

【#陈光标向贵州捐2000万物资##贵州红十字会回应陈光标捐2000万物资#：属

3

【#山西失联客车找到1名遇难者#】记者从山西省大同市“7·27”抢险救援指挥部了

4

#家庭聚餐后姐弟俩双双中毒#【家庭聚餐后，浙江姐弟俩双双中毒！竟和一锅煮着的红豆

5

6号台风韦帕将登陆我国，酝酿之中的7号台风范斯高也将生成，还要影响我国？这是不是

6

【警方：#南京红老头系38岁男子#】江宁警方：38岁男子假扮女性相约与多名男性发

7

【#荆州张居正故居现海螺化石地砖#，专家：具有一定观赏价值】近日，合肥市民向先生

8

【#台风有望赶走高温天#】在稳定而强盛的副热带高压掌控之下，7月24日，高温高湿

9

【山西河津发生一起交通事故致6死8伤】记者今天（7月27日）从山西省河津市相关部

10

夏日炎炎，又到了我山东省大量吃“享用”蝉的幼虫，俗称知了猴、节流鬼、油子、金蝉封。注意必须是吃蝉的幼

社会最新文章

1

#台风竹节草将在江浙一带登陆#【#台风竹节草预计明日登陆我国#扩散提醒！

2

【#司机等红灯向路人射钢珠致4人受伤#】“就想找点乐子，没想到闯了这么大的祸。”

3

【#雨大雨暴雨大暴雨席卷沪苏浙皖等地#】未来三天（7月28日至30日），华东地区

4

【#山西失联客车找到1名遇难者#】记者从山西省大同市“7·27”抢险救援指挥部了

5

#少林寺主持释永信被查#【#释永信与多名女性保持不正当关系#】据“少林

6

【#释永信与多名女性保持不正当关系#，#释永信育有私生子#】7月27日，少林寺管

7

【山西河津发生一起交通事故致6死8伤】记者今天（7月27日）从山西省河津市相关部

8

#学生溺亡涉事企业已宣布停产#【学生选矿厂溺亡涉事企业曾被行政处罚！安全生产信用

9

【#广东高温持续#今起需防“下开水”】26日，广东继续受到大范围高温天气影响，

10

#少林寺回应释永信被带走接受调查#【#少林寺方丈释永信被曝带走接受调查#，少林寺