OpenAI推出GPT-4o,让锅头印象最深刻的不是GPT-4o的模型能力,而是带来的系列应用场景落地的可能性和无限想象。
除了实时视频通话解决翻译、数学、编程等问题,还有视觉处理方面的应用场景也具有很大应用价值。
其中,OpenAI在官方发布的文章里提到了17个应用样例,对锅头的冲击很大。
之前锅头尝试使用AI工具海报设计、儿童绘本制作、漫画故事、图标设计等,但效果都不太好。
这一次,在GPT-4o这里似乎都能得到解决。
下面跟锅头一起看看这些应用样例能达到的效果和应用价值吧。
▌视觉叙事-机器人作家的街区样例解读
生成的多张图片背景、环境、元素、主体能保持画面的一致性。
图中的文字输入提示文字能精准保持一致。
应用价值
创作海报、创作漫画、儿童绘本、文章插画、有趣的故事会。
▌视觉叙事-邮递员莎莉样例解读
生成一张人物图片。
基于人物图片,定义角色,并通过文字描述该角色的行为。
连续生成多张图片中,保持人物角色一致性,并表达出描述的行为动作。
应用价值
漫画故事、儿童绘本、以图说话。
▌电影《名侦探》海报创作样例解读
定义海报有2个角色,并上传角色照片。
描述海报内容场景、角色、画面上的文字,生成海报初稿。
基于海报初稿,优化海报画面内容,生成效果更佳的海报图。
应用价值
海报制作、杂志封面、文章封面、书本封面。
▌角色设计—机器人吉尔里样例解读
生成一张人物角色图片。
基于人物角色图片,定义角色名称,并通过文字描述该角色的行为。
连续生成多张图片中,保持人物角色一致性,并表达出描述的行为动作。
应用价值
游戏设计、漫画故事、儿童绘本、以图说话。
▌迭代编辑的诗意排版1样例解读
文生图:一首诗,用清晰而激动的笔迹写在日记上,生成手工插图。
改图:切换为深色模式。
改图:去除纸线。
应用价值
文字转图片、漫画故事、儿童绘本、以图说话。
▌迭代编辑的诗意排版2样例解读
文生图:一首诗,用清晰而激动的笔迹写在日记上,生成手工插图。
改图:切换为深色模式。
应用价值
文字转图片、漫画故事、儿童绘本、以图说话。
▌GPT-4o纪念币设计样例解读
描绘徽标矢量图形。
上传参考纪念币图片。
基于徽标矢量图形+参考纪念币图片+新要求描述,生成新的纪念币图片。
应用价值
logo图标设计、徽章设计、海报设计、文字精准修图。
▌照片生成漫画样例解读
上传照片。
描述照片漫画的内容,生成漫画。
应用价值
不愿露真脸的同学可以生成自己的漫画头像、漫画故事、表情包设计、绘本故事。
▌文字转字体样例解读
上传字体样式。
描述生成字体要求,生成新字体。
应用价值
字体设计,自己设计使用喜欢的字体,没有字体版权纠纷的顾虑。
▌3D物体合成样例解读
输入(上传)6个角度的3D视图,3D渲染。
3D重建,生成新3D物体。
应用价值
3D模型设计、游戏设计、动画设计。
▌品牌展示—杯垫上的徽标样例解读
上传徽标图片+杯垫图片。
描述合成图片要求,并生成新图片。
应用价值
Logo设计、logo在不同实物场景下的设计效果展示、多图创意合成图片设计。
▌诗意的排版样例解读
文生图:一首诗,用清晰而激动的笔迹写在日记上,生成手工插图。
改图:切换为深色模式。
改图:去除纸线。
应用价值
文字转图片、漫画故事、儿童绘本、以图说话。
▌多线渲染—机器人发短信样例解读
写短信内容+图片描述。
根据要求生成图片。
应用价值
漫画创作、绘本故事创作、海报创作、文章插图。
▌有多个发言者的会议记录样例解读
上传多人会议音频。
描述会议记录要求,并生成多人说话内容记录。
应用价值
会议记录、会议总结、声音分析与解读。
▌讲座总结样例解读
上传讲座视频。
输入讲解内容需求,生成讲解内容。
应用价值
视频解读、演讲总结、会议总结、课程总结、直播总结。
▌变量绑定-立方体堆叠样例解读
描绘画面物体。
描述物体的堆叠要求。
应用价值
海报设计、创意图片设计、文字精准控制图片、图片优化。
▌具体的诗样例解读
上传图片。
在图片上按指定要求写字,然后生成图片。
优化图片背景和文本展示方式。
应用价值
海报设计、创意图片设计、文字精准控制图片、图片优化。
▌学习总结本次GPT-4o一共给了17个应用样例,主要应用场景如下:
图片+文字:海报、画报、绘本故事、漫画故事。
图片+图片:合成图片、创意图片、图标设计。
图片转3D:3D设计、游戏设计、动效设计。
语音+视频:多人会议、演讲总结、视频解读等。
如果后续实测GPT-4o都能达到样例的效果,那么对以上应用场景业务将带来极大的催化反应,AI视觉类创作会快速迎来新的变革。
▌内容来源[1] OpenAI官方发布文章 https://openai.com/index/hello-gpt-4o/。