众力资讯网

在WWDC26主题发布会上,Apple正式推出第三代Apple Foundati

在WWDC26主题发布会上,Apple正式推出第三代Apple Foundation Models(Apple基础大模型,简称AFM),整套系列共包含五款模型:部分为端侧本地运行版本,部分为云端版本,其中一款部署在谷歌云服务器、依托英伟达显卡算力运行。

Apple在2024年首次发布自有基础大模型,当时产品线分为两类:一款约30亿参数的设备端语言模型,以及苹果官方描述的依托私有云端计算(Private Cloud Compute)、搭载Apple自研芯片服务器运行的更大规模云端语言模型。

私有云端计算(PCC)是Apple极具前瞻性的项目,核心目标是在提供云端AI能力的同时,维持与设备本地运算同级别的用户隐私保护标准。

为此Apple坚持全链路自研闭环:私有云端计算全部部署于Apple自有数据中心,服务器搭载Apple自研芯片。即便如此,整套隐私防护体系仍可由第三方安全研究人员独立审计核验。

但Apple自研AI落地进度不及预期,因此选择与谷歌达成合作,以谷歌Gemini大模型技术为底层基座搭建全新AI体系,相关成果已于本周WWDC26发布会正式公布。

第三代AFM共五款,分为端侧本地模型与云端服务器模型两大阵营:

1.端侧本地:AFM 3 Core、AFM 3 Core Advanced

2.云端服务:AFM Cloud、ADM 3 Cloud (Image)、AFM 3 Cloud Pro注:ADM 3 Cloud (Image) 中D代表diffusion(扩散模型),即图像生成领域主流技术。

除AFM 3 Cloud Pro以外,其余四款模型均可在搭载Apple自研芯片的设备上运行;而AFM 3 Cloud Pro是唯一特例,部署于谷歌云、依托英伟达GPU提供算力。

Apple首次将私有云端计算(PCC)架构拓展至第三方基础设施,同时官方承诺完整保留Apple严苛的安全与隐私防护体系。

Apple对五款模型的功能定位逐一说明:1.AFM 3 Core:上一代30亿参数稠密大模型的迭代版本,回答质量实现全方位升级。

2.AFM 3 Core Advanced:Apple最强端侧本地大模型,原生支持多模态交互,可实现生动拟人语音、高精准听写等核心功能。该模型基于Apple前沿自研技术打造,共200亿参数,采用稀疏激活架构:单次指令仅激活10亿至40亿参数运算,无需调动全部200亿参数。仅搭载顶级苹果自研芯片的设备可解锁并优化运行该模型。

3.AFM 3 Cloud:云端主力通用模型,针对响应速度、算力效率、综合性能完成深度调优。

4.ADM 3 Cloud (Image):图像生成与编辑专用扩散模型,支撑全新图像创作工具Image Playground及全套专业照片编辑功能。

5.AFM 3 Cloud Pro:Apple云端高阶大模型,承担高负载复杂场景运算,包括智能代理工具调用、多层级深度逻辑推理等需求。

AFM 3 Core Advanced(端侧200亿参数稀疏模型):在终端设备本地搭载200亿参数大模型是行业重大突破。面向大众消费级设备的本地大模型,参数规模普遍仅维持在几十亿级别。

Apple采用稀疏激活架构实现流畅运行:根据用户提示词,单次仅激活最高40亿参数参与运算,区别于传统稠密模型每一次请求都需要完整调动全部参数。

该技术思路与混合专家模型(MoE)有相似之处,但这套选择性参数激活方案源自Apple自研技术,相关细节已于一年前发布论文《面向大语言模型的指令跟随剪枝算法》完整披露。

AFM 3 Cloud Pro(谷歌云英伟达算力高阶云端模型):这是唯一部署在第三方基础设施的模型,Apple安全博客本周发布文章披露了相关技术细节,核心安全设计如下:

Apple与谷歌联合搭建的防护能力,远超传统机密计算部署方案:防护范围不局限于机密虚拟机,可抵御特权侧信道攻击等各类利用系统高权限发起的入侵;固件、宿主机系统、客户虚拟机、应用代码全部纳入可信计算边界,全程满足可审计透明化、无超额特权访问承诺。

供应链攻击风险防控:所有接入PCC体系的谷歌云硬件,均生成加密可核验、仅追加写入的硬件台账记录;若硬件组件遭篡改存在窃取用户数据风险,软件可信认证至少依托两家独立厂商提供的信任根双重校验。

隐私安全前置设计:即便依托机密计算部署,整套推理流程从底层架构起就嵌入隐私防护。谷歌云PCC复用Apple自研芯片私有云的分层安全架构:每条用户请求的初始网络数据解析隔离在独立命名空间进程;共享推理软件设置短生命周期自动销毁机制;加密可信密钥存储于独立隔离的机密虚拟机,隔绝外部访问。

Apple机器学习研究博客表示,五款大模型共享同一套基础预训练底座,后续再针对不同硬件架构、使用场景做专项微调,同步新增音频理解、图像识别、超长上下文推理、高清图像生成等多模态能力。

训练数据源构成包含:公开网络信息、第三方授权商用数据、开源数据集、专项调研采集数据、AI合成数据。苹果着重强调:训练全程不会使用任何用户交互数据;同时网站内容发布方可自主选择退出,拒绝自身内容被用于基础大模型训练。

Apple组织大规模人工评测团队,从指令遵循准确度、事实真实性、文本表达逻辑、图像识别能力多维度对第三代AFM开展打分评测,并与上一代模型横向对照:

通用文本能力:AFM 3 Core、AFM 3 Cloud对比前代模型,在多语言人工盲测中获得更高偏好率。评测覆盖四大全球语言分组,包含通用英语、多组小语种地区,证明模型性能在全球各语种场景下表现稳定。

图像理解能力(英文场景):AFM 3 Core、AFM 3 Cloud图像识别效果显著优于2025版前代模型。

听写转写任务:AFM 3 Core Advanced与Apple现有商用听写系统对比,在七项核心质量维度中综合偏好率全面领先,文本格式、语义理解等细分维度均实现稳定提升。