众力资讯网

AI前沿论文速递|2026年5月中旬精选 一、Stream-T1:视频生成告别

AI前沿论文速递|2026年5月中旬精选

一、Stream-T1:视频生成告别翻车
中科大与FrameX.AI团队提出首个专为流式视频设计的推理时扩展框架。传统AI视频生成要么画面断裂、要么算力爆炸,Stream-T1通过遗传优良噪声机制,让每段视频继承前段最佳种子,配合奖励剪枝和记忆沉降,在5秒和30秒基准上全面领先,时间一致性和动作流畅度显著提升。(arXiv:2605.04461)

二、SkillOS:让AI Agent学会管理技能
伊利诺伊大学团队提出基于强化学习的技能策展框架SkillOS。当前AI智能体普遍是一次性选手——做完就忘,无法从经验中积累。SkillOS让Agent自动从历史任务中提炼可复用技能,存入外部SkillRepo,在后续任务中检索调用。实验显示,学习到的策展策略能跨不同模型和任务领域泛化。(arXiv:2605.06614)

三、LoPE:废话也能帮AI变聪明
华盛顿大学团队发现,在GRPO训练中给prompt加上随机Lorem Ipsum伪拉丁文前缀,竟能显著提升LLM推理能力。原理是噪声扰动打破了零优势困境——当所有采样路径都失败时,模型失去训练信号。加上无意义前缀反而能解锁正交推理路径,1.7B到7B模型全面受益。(arXiv:2605.05566)

四、自我进化AI智能体综述发布
集智俱乐部翻译解读了一篇系统综述,提出从离线预训练到多智能体自主演进的四阶段范式,以及安全、卓越、进化的三大定律,为构建真正具备终身学习能力的AI系统提供理论框架。

AI前沿 大模型