让4B小模型逼近235B性能新配方让4B小模型赶超Claude44B模型的数学推

量子位看科技 2025-07-09 11:31:14

让4B小模型逼近235B性能新配方让4B小模型赶超Claude4

4B模型的数学推理能力和顶尖商业大模型差在哪里？

香港大学NLP团队联合字节跳动Seed、复旦大学发布名为Polaris的强化学习训练配方：

通过Scaling RL，Polaris让4B模型的数学推理能力（AIME25上取得79.4，AIME24上取得81.2）超越了一众商业大模型，如Seed-1.5-thinking、Claude-4-Opus和o3-mini-high(25/01/31)。

并且，Polaris-4B的轻量化允许在消费级显卡上部署。

了解更多细节，欢迎点击文章👇

0 阅读：1

量子位看科技

感谢大家的关注

作者最新文章

1

社恐可能是肠道细菌在作怪肠道菌群也能操控人类情绪社恐发作了？可能是肠道微生物在捣

2

用ChatGPT生成故事感插图能生成故事感插图的Prompt有Reddit网友分

3

沉迷AI对话或危害人身安全会计沉迷AI对话每日16小时沉迷AI对话，会出现幻觉、

4

让智能体玩转真实网页环境腾讯新框架突破网页智能体自演进瓶颈让网页智能体自演进突破

5

20瓦运行下一代AI为AI装上人类大脑「西部世界」真的要来了！科学家们正试图为A

6

南极冰层下出现神秘信号科学家在南极发现奇怪信号科学家在南极冰层下，发现了神秘信号

7

Claude成为论文第一作者Claude发论文反驳苹果Claude贴脸开大：AI

8

Meta百亿入股ScaleScale创始人跳槽引客户危机Meta在AI数据领域最

9

百度启动史上最大AI招聘百度扩招60%AI人才百度启动了史上最大规模的AI人才招

10

北大亚马逊团队破解三大数据库AI难题全球首个图中心RDB基础模型在企业系统和科学

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

小米YU7价格25.35万，27.99万，32.99万三个版本，最推荐入门版本，

2

小米又搞大动作啦！6月24日雷军透露小米YU7支持车外小爱语音。车外配备8个麦克

3

小米首款智能眼镜AIGlasses发布，支持拍照录像和超级小爱同学。1999起

4

陈震再次质疑小米YU7到底极限在哪里？到现在为止，他已经连续发了四篇专门的文

5

关于华为Pura80全系芯片的真机实测已经出来了，确认为Mate70同款的麒麟9

6

看来Mate系列才是真旗舰，昨天发布的Pura80系列虽然影像牛的不行，但有一点

7

左边是我花了5499国补价买到的iPhone16Pro，右边是苹果直营店里

8

红米K80至尊版对比K70至尊版，升级点还挺多的，处理器和屏幕可以算为常规升级，

9

不用等了，确定✅了，华为这些高端老机型，将不会推送更新升级原生版鸿蒙系统了

10

新官上任三把火！荣耀MagicV5的火力如何？12+256GB售价8999

科技最新文章

1

荣耀即将在7月15日推出新款千元机X70系列。这款手机最大的看点是塞进了一块83

2

甲亢哥还在用华为！这下轮到谁破防了？之前甲亢哥Speed来深圳的时候买了华为

3

荣耀magic8系列被寄于厚望，尤其在影像以及AI能力还有magicos10的

4

对不起了华为，让同事买了荣耀400Pro他本来想入手华为nova14Pro

5

一加15T和15s配置曝光:屏幕尺寸不变，或新增超广角镜头近日，有外媒曝光

6

荣耀X70这个大电池，8300mAh，今年电池最大的手机，应该就是这款了吧。续航

7

该来的还是来了当荣耀X70曝光那一刻，真替友商捏把汗，这比绝望还绝望！8300

8

荣耀X70这手机太猛了！官宣配备“史上最大”8300mAh青海湖电池，还支持80

9

荣耀X70系列外观曝光？镜头模组设计感觉和之前的没有太大变化，据说这次

10

荣耀最值得期待的X系列X70真的来啦，预计将在本月发布！这次的X70会不