众力资讯网

美团发布开源原生多模态大模型 LongCat-Next,让视觉和语音成为 AI

美团发布开源原生多模态大模型 LongCat-Next,让视觉和语音成为 AI 的母语。

简单而言,美团把文字、图像、语音都变成同一种东西 —— 离散 Token。

无论读文字、看图片还是听声音,对 AI 来说都是同一件事:预测下一个 Token 是什么。

美团308_IO