【AI学习】从GPT-4o发布的17个AI应用样例看AI创作海报、漫画、绘本故事等场景如何落地?

跟锅头一起学AI 2024-05-14 21:03:48

▌锅头导读

OpenAI推出GPT-4o,让锅头印象最深刻的不是GPT-4o的模型能力,而是带来的系列应用场景落地的可能性和无限想象。

除了实时视频通话解决翻译、数学、编程等问题,还有视觉处理方面的应用场景也具有很大应用价值。

其中,OpenAI在官方发布的文章里提到了17个应用样例,对锅头的冲击很大。

之前锅头尝试使用AI工具海报设计、儿童绘本制作、漫画故事、图标设计等,但效果都不太好。

这一次,在GPT-4o这里似乎都能得到解决。

下面跟锅头一起看看这些应用样例能达到的效果和应用价值吧。

▌视觉叙事-机器人作家的街区

样例解读

生成的多张图片背景、环境、元素、主体能保持画面的一致性。

图中的文字输入提示文字能精准保持一致。

应用价值

创作海报、创作漫画、儿童绘本、文章插画、有趣的故事会。

▌视觉叙事-邮递员莎莉

样例解读

生成一张人物图片。

基于人物图片,定义角色,并通过文字描述该角色的行为。

连续生成多张图片中,保持人物角色一致性,并表达出描述的行为动作。

应用价值

漫画故事、儿童绘本、以图说话。

▌电影《名侦探》海报创作

样例解读

定义海报有2个角色,并上传角色照片。

描述海报内容场景、角色、画面上的文字,生成海报初稿。

基于海报初稿,优化海报画面内容,生成效果更佳的海报图。

应用价值

海报制作、杂志封面、文章封面、书本封面。

▌角色设计—机器人吉尔里

样例解读

生成一张人物角色图片。

基于人物角色图片,定义角色名称,并通过文字描述该角色的行为。

连续生成多张图片中,保持人物角色一致性,并表达出描述的行为动作。

应用价值

游戏设计、漫画故事、儿童绘本、以图说话。

▌迭代编辑的诗意排版1

样例解读

文生图:一首诗,用清晰而激动的笔迹写在日记上,生成手工插图。

改图:切换为深色模式。

改图:去除纸线。

应用价值

文字转图片、漫画故事、儿童绘本、以图说话。

▌迭代编辑的诗意排版2

样例解读

文生图:一首诗,用清晰而激动的笔迹写在日记上,生成手工插图。

改图:切换为深色模式。

应用价值

文字转图片、漫画故事、儿童绘本、以图说话。

▌GPT-4o纪念币设计

样例解读

描绘徽标矢量图形。

上传参考纪念币图片。

基于徽标矢量图形+参考纪念币图片+新要求描述,生成新的纪念币图片。

应用价值

logo图标设计、徽章设计、海报设计、文字精准修图。

▌照片生成漫画

样例解读

上传照片。

描述照片漫画的内容,生成漫画。

应用价值

不愿露真脸的同学可以生成自己的漫画头像、漫画故事、表情包设计、绘本故事。

▌文字转字体

样例解读

上传字体样式。

描述生成字体要求,生成新字体。

应用价值

字体设计,自己设计使用喜欢的字体,没有字体版权纠纷的顾虑。

▌3D物体合成

样例解读

输入(上传)6个角度的3D视图,3D渲染。

3D重建,生成新3D物体。

应用价值

3D模型设计、游戏设计、动画设计。

▌品牌展示—杯垫上的徽标

样例解读

上传徽标图片+杯垫图片。

描述合成图片要求,并生成新图片。

应用价值

Logo设计、logo在不同实物场景下的设计效果展示、多图创意合成图片设计。

▌诗意的排版

样例解读

文生图:一首诗,用清晰而激动的笔迹写在日记上,生成手工插图。

改图:切换为深色模式。

改图:去除纸线。

应用价值

文字转图片、漫画故事、儿童绘本、以图说话。

▌多线渲染—机器人发短信

样例解读

写短信内容+图片描述。

根据要求生成图片。

应用价值

漫画创作、绘本故事创作、海报创作、文章插图。

▌有多个发言者的会议记录

样例解读

上传多人会议音频。

描述会议记录要求,并生成多人说话内容记录。

应用价值

会议记录、会议总结、声音分析与解读。

▌讲座总结

样例解读

上传讲座视频。

输入讲解内容需求,生成讲解内容。

应用价值

视频解读、演讲总结、会议总结、课程总结、直播总结。

▌变量绑定-立方体堆叠

样例解读

描绘画面物体。

描述物体的堆叠要求。

应用价值

海报设计、创意图片设计、文字精准控制图片、图片优化。

▌具体的诗

样例解读

上传图片。

在图片上按指定要求写字,然后生成图片。

优化图片背景和文本展示方式。

应用价值

海报设计、创意图片设计、文字精准控制图片、图片优化。

▌学习总结

本次GPT-4o一共给了17个应用样例,主要应用场景如下:

图片+文字:海报、画报、绘本故事、漫画故事。

图片+图片:合成图片、创意图片、图标设计。

图片转3D:3D设计、游戏设计、动效设计。

语音+视频:多人会议、演讲总结、视频解读等。

如果后续实测GPT-4o都能达到样例的效果,那么对以上应用场景业务将带来极大的催化反应,AI视觉类创作会快速迎来新的变革。

▌内容来源

[1] OpenAI官方发布文章 https://openai.com/index/hello-gpt-4o/。

0 阅读:0

跟锅头一起学AI

简介:持续学习AI知识和使用技巧,思考如何用AI高效学习办公