AI浪潮来袭，全民进入AI时代，你身边的它们都在AI化！

自从ChatGPT横空出世之后，全球引发了一场AI投资新浪潮。

尤其是从春节假期到现在，AI热度更是居高不下。

先有OpenAI公司创始人山姆·奥特曼欲为AI芯片项目寻求5-7万亿美元的资金，后有OpenAI推出引起市场狂潮的视频生成模型“Sora”。

最近更是有消息称，字节也在加大AI研发投资和人员部署，准备all in AI。就连央企也召开了人工智能推进会，要求提升人工智能产业发现，实现产业赋能。

一时之间，感觉就连街边扫地的大妈都知道AI就是下一个时代风口。

不过提起AI，很多朋友都只知道它强、我们需要它，却不知道为什么。

大家比较熟悉的ChatGPT、文心一言等工具，可以进行文本类工作创作，比如写小说、写总结等等。

而扩散模型，则在AI 绘图、视频等领域的应用实现了大幅度的飞跃。基于扩散模型的Midjourney、Stable Diffusion、Ideogram、Runway在创意、设计领域大放异彩，愈发成为创意工作者日常工作中不可或缺的一部分。

在扩散模型的帮助下，创意工作者的思想得以发散，创作作品的品质也实现了大幅度提高。可以说，在不同类型的大模型作用下，人们的工作得以高效完成，生活也更为丰富多样，人生更为精彩。

一直以来作为当代人日常生活重要工具的手机行业，最近AI之风也吹得相当大。

节后第一个工作日，国内知名手机厂商魅族称，将全力进入AI战略布局，停止传统“智能手机”新项目。

基本是同一时间，OPPO公司CEO发布内部信称，AI对手机行业影响，完全可以比肩当年智能手机替代功能机，从行业发展来看，手机行业已进入第三阶段，AI手机元年已经来到。

事实上，OPPO早在多年前就在人工智能领域进行了布局。

2020年，OPPO推出了首个AI大模型，超前布局AI，并不断加大投入。在2023年，OPPO推出自主训练的安第斯大模型（AndesGPT），通过三级大模型部署策略，将Titan超大模型、Turbo大模型、Tiny轻量模型实现端云的联合部署，满足多场景高效适配。

到今年，OPPO也在几天前率先进行了AI手机战略发布会，展望由AI驱动的手机全栈革新和生态重构的趋势，并发布由OPPO AI 超级智能体和 AI Pro 智能体开发平台组成的OPPO 1+N 智能体生态战略，这也标志着OPPO在人工智能领域的深度布局。

绝大多数人对一部AI手机到底应该是什么样子，可能缺乏相应的概念，此次战略发布会上，OPPO分享了新一代AI手机四大能力特征：

1、要能够高效地利用计算资源，以满足 AI 时代下生成式 AI 的计算需要；

2、要能敏锐地感知真实世界，了解用户与环境的复杂信息；

3、要拥有强大的自学习能力；

4、最后，AI 手机还应该具备更充沛的创作能力，为用户提供持续的灵感与知识支持。

总的来说，AI手机的智能体验应该是软硬件的结合，整个交互体验也应从一个简单听取命令的“助手”，变为真正满足用户个性化需求的便捷“管家”。

以被大家认为具备AI手机雏形的OPPO Find X7系列为例，该系列手机端侧搭载70亿大模型，其AI消除、AI通话摘要等智慧性能，都围绕用户个性需求进行展开。

比如AI消除功能，就极大程度解决了小白用户“PS无能”的问题，只需要在照片上框选想要消除的部分， AI 就会帮你消除，还会计算整个图片的场景，自动“补全”被消除的背景，整体画面质感仿佛刚拍出来一样，一点看不出后期痕迹。

打电话时，AI 通话摘要功能则可以帮我们总结归纳通话重点，和客户通话就不用纸笔记录了，电话结束后，AI通话摘要会自动把通话内容以文档的方式输出，并且有主题，有要点，有待办事项，简洁明了一目了然，对于线上沟通比较多的人来说，就很实用。

还有新小布助手，给用户的体验也更趋近真人，可以自动推荐用户“当前该做什么”，也可以帮助用户解决生活问题，比如根据指令生成旅游攻略、工作总结等，相当于工作和生活的全面管家。在这之外，OPPO还将内容识别内置到系统层级，用户在复制（或接收）相关内容时，主动提供一键跳转。

正如上文所说，这些AI功能的升级，总体都以用户个性化需求为主，大模型在和用户的“磨合”过程中不断学习，最终达成手机即“管家”的效果，让用户在AI的帮助下进入全新时代。

而这也是OPPO和各家厂商在近一年来对手机产品升级，加大人工智能投入的根本目的。

目前AI作为人类智能的延伸，正在逐步拓展多模态能力，包括多模态的输入和多模态的输出与生成能力。

而多模态大模型可以处理的任务也更为多样化，比如可以处理应用文字、图片、视频、音频等多模态数据，完成听、说、读、写、看等跨模态领域的任务，这不但符合人类的交互习惯，也让AI更加拟人化。实现了AI与人的高效交流。

比如火爆海外的AI视频生成工具Pika1.0，它的AI模型能生成和编辑 3D 动画、电影等各种风格视频。

谷歌在2023年年底推出的Gemini模型能够分析和理解正在变化的视频，并生成相应的描述，相关描述音频还会有拟人语气的停顿。

相信随着AI技术的进一步发展，多模态能力会更加成熟，到时AI就可能成为真正的“伙伴”，而非简单的工具，

众力资讯网