AI浪潮来袭,全民进入AI时代,你身边的它们都在AI化!

科技晓谈 2024-02-27 19:19:58

自从ChatGPT横空出世之后,全球引发了一场AI投资新浪潮。

尤其是从春节假期到现在,AI热度更是居高不下。

先有OpenAI公司创始人山姆·奥特曼欲为AI芯片项目寻求5-7万亿美元的资金,后有OpenAI推出引起市场狂潮的视频生成模型“Sora”。

最近更是有消息称,字节也在加大AI研发投资和人员部署,准备all in AI。就连央企也召开了人工智能推进会,要求提升人工智能产业发现,实现产业赋能。

一时之间,感觉就连街边扫地的大妈都知道AI就是下一个时代风口。

不过提起AI,很多朋友都只知道它强、我们需要它,却不知道为什么。

大家比较熟悉的ChatGPT、文心一言等工具,可以进行文本类工作创作,比如写小说、写总结等等。

而扩散模型,则在AI 绘图、视频等领域的应用实现了大幅度的飞跃。基于扩散模型的Midjourney、Stable Diffusion、Ideogram、Runway在创意、设计领域大放异彩,愈发成为创意工作者日常工作中不可或缺的一部分。

在扩散模型的帮助下,创意工作者的思想得以发散,创作作品的品质也实现了大幅度提高。可以说,在不同类型的大模型作用下,人们的工作得以高效完成,生活也更为丰富多样,人生更为精彩。

一直以来作为当代人日常生活重要工具的手机行业,最近AI之风也吹得相当大。

节后第一个工作日,国内知名手机厂商魅族称,将全力进入AI战略布局,停止传统“智能手机”新项目。

基本是同一时间,OPPO公司CEO发布内部信称,AI对手机行业影响,完全可以比肩当年智能手机替代功能机,从行业发展来看,手机行业已进入第三阶段,AI手机元年已经来到。

事实上,OPPO早在多年前就在人工智能领域进行了布局。

2020年,OPPO推出了首个AI大模型,超前布局AI,并不断加大投入。在2023年,OPPO推出自主训练的安第斯大模型(AndesGPT),通过三级大模型部署策略,将Titan超大模型、Turbo大模型、Tiny轻量模型实现端云的联合部署,满足多场景高效适配。

到今年,OPPO也在几天前率先进行了AI手机战略发布会,展望由AI驱动的手机全栈革新和生态重构的趋势,并发布由OPPO AI 超级智能体和 AI Pro 智能体开发平台组成的OPPO 1+N 智能体生态战略,这也标志着OPPO在人工智能领域的深度布局。

绝大多数人对一部AI手机到底应该是什么样子,可能缺乏相应的概念,此次战略发布会上,OPPO分享了新一代AI手机四大能力特征:

1、要能够高效地利用计算资源,以满足 AI 时代下生成式 AI 的计算需要;

2、要能敏锐地感知真实世界,了解用户与环境的复杂信息;

3、要拥有强大的自学习能力;

4、最后,AI 手机还应该具备更充沛的创作能力,为用户提供持续的灵感与知识支持。

总的来说,AI手机的智能体验应该是软硬件的结合,整个交互体验也应从一个简单听取命令的“助手”,变为真正满足用户个性化需求的便捷“管家”。

以被大家认为具备AI手机雏形的OPPO Find X7系列为例,该系列手机端侧搭载70亿大模型,其AI消除、AI通话摘要等智慧性能,都围绕用户个性需求进行展开。

比如AI消除功能,就极大程度解决了小白用户“PS无能”的问题,只需要在照片上框选想要消除的部分, AI 就会帮你消除,还会计算整个图片的场景,自动“补全”被消除的背景,整体画面质感仿佛刚拍出来一样,一点看不出后期痕迹。

打电话时,AI 通话摘要功能则可以帮我们总结归纳通话重点,和客户通话就不用纸笔记录了,电话结束后,AI通话摘要会自动把通话内容以文档的方式输出,并且有主题,有要点,有待办事项,简洁明了一目了然,对于线上沟通比较多的人来说,就很实用。

还有新小布助手,给用户的体验也更趋近真人,可以自动推荐用户“当前该做什么”,也可以帮助用户解决生活问题,比如根据指令生成旅游攻略、工作总结等,相当于工作和生活的全面管家。在这之外,OPPO还将内容识别内置到系统层级,用户在复制(或接收)相关内容时,主动提供一键跳转。

正如上文所说,这些AI功能的升级,总体都以用户个性化需求为主,大模型在和用户的“磨合”过程中不断学习,最终达成手机即“管家”的效果,让用户在AI的帮助下进入全新时代。

而这也是OPPO和各家厂商在近一年来对手机产品升级,加大人工智能投入的根本目的。

目前AI作为人类智能的延伸,正在逐步拓展多模态能力,包括多模态的输入和多模态的输出与生成能力。

而多模态大模型可以处理的任务也更为多样化,比如可以处理应用文字、图片、视频、音频等多模态数据,完成听、说、读、写、看等跨模态领域的任务,这不但符合人类的交互习惯,也让AI更加拟人化。实现了AI与人的高效交流。

比如火爆海外的AI视频生成工具Pika1.0,它的AI模型能生成和编辑 3D 动画、电影等各种风格视频。

谷歌在2023年年底推出的Gemini模型能够分析和理解正在变化的视频,并生成相应的描述,相关描述音频还会有拟人语气的停顿。

相信随着AI技术的进一步发展,多模态能力会更加成熟,到时AI就可能成为真正的“伙伴”,而非简单的工具,

0 阅读:17

科技晓谈

简介:分享科技知识,每天更新不同内容