[CV]《NextVisualGranularityGeneration》

爱生活爱珂珂 2025-08-25 06:25:40

[CV]《Next Visual Granularity Generation》Y Wang, Z Wang, Z Wu, Q Tao... [Nanyang Technological University & SenseTime Research] (2025)

Next Visual Granularity Generation（NVG）：一种基于多粒度视觉结构的图像生成新框架，突破传统将图像视为无结构数据的局限，带来更自然且可控的生成过程。

• 多粒度结构序列：将图像编码为多级唯一token序列，空间分辨率不变，token数量递减，逐步揭示从细节到整体的层次结构。

• 结构映射驱动：通过数据驱动的聚类构造多阶段结构图，明确展示各粒度token在潜空间的分布，实现粗到细的布局控制。

• 生成流程创新：每阶段先生成结构映射，再基于结构生成内容，支持用户输入结构导引，提升生成的多样性与一致性。

• 结构感知RoPE编码：扩展旋转位置编码，编码层级结构信息，使模型深刻理解层级token间关系，提升预测准确性。

• 内容生成采用残差量化策略：通过学习当前画布与最终图像的差异，逐步细化图像，避免自回归误差累积，融合扩散与自回归优点。

• 实验结果领先：在ImageNet 256×256分类生成任务上，NVG系列模型在FID、Inception Score及召回率上均优于VAR等先进方法，且训练步骤更少，参数规模合理。

• 结构引导生成：支持基于简单几何结构图或参考图像结构生成新图，灵活控制图像布局及细节，展现强大泛化与纠错能力。

• 长远应用潜力：方法天然适配区域感知生成、物理一致的视频生成和层级空间推理，助力设计、科学可视化等多领域发展。

NVG框架揭示了图像生成的层次化本质，通过明确结构控制实现高质量与高自由度并重的视觉创作路径。

论文🔗 arxiv.org/pdf/2508.12811

了解详情🔗 yikai-wang.github.io/nvg

人工智能图像生成计算机视觉深度学习生成模型视觉结构

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

概率与统计速成营，由 Steve Brunton 主讲，助你系统掌握核心概念与实

2

掌握大型语言模型（LLM）运作核心，具备计算机科学基础者，2年内可系统化精通：•

3

CRISP：一种基于稀疏自编码器（SAE）的持久化概念遗忘方法，针对大语言模型（

4

SparseLoCo：面向大规模语言模型（LLM）预训练的通信高效算法，革新了分

5

GPT-5在空间智能领域实现重大突破，但仍未完全达到人类水平：• 首次系统整合8

6

[CV]《Next Visual Granularity Generation》

7

[LG]《Depth-Breadth Synergy in RLVR: Unlo

8

[LG]《Numerical models outperform AI weat

9

[LG]《Virtuous Machines: Towards Artifici

10

早！[太阳] 早安

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

这是iPhone17只看正面时你立马能区分升级的地方：灵动岛变小了

2

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

3

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

4

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

5

臻版回归！荣耀太狠了，这次看来是不准备留情面了！荣耀接下来最重磅的机型毫无疑问

6

李想称希望和产品分割开其实理想在产品方面已经是非常不错的了，狗蛋身边不少家庭首选

7

台积电创始人张忠谋在接受纽约时报专访时说：美国、荷兰、日本、韩国与台湾牢牢控制着

8

同事iphone13pro有几年了，说电池健康度只有70%了，一天到晚的就见他

9

以后不会再给女朋友买iPhone手机，并不是iPhone手机不好，而是她买了一大

10

美团退款好像最近两年没有出现过退款异常的，主要还是2014-2018年囤积的未使

科技最新文章

1

依然特供，英伟达试探中国！当地时间8月22日，黄仁勋造访台积电时透露，正在和美国

2

据说今年的华为Mate80系列参数很猛，可以等一等已经看到有博主开始爆料华为

3

荣耀目前最火爆的三款新手表，怎么选择合适？荣耀Fit，荣耀手表5，荣耀手表5U

4

是谁说国产手机就得看华子...国产芯还得看华为！刚看到爆料，华为Mate

5

首款曲面iPhone如果是真的，我想看看以前那些喷曲面屏的人是怎么吹曲面有多好的

6

荣耀Magic8系列也有小屏旗舰？越来越多厂商发布小屏旗舰，荣耀预计明年上半

7

iPhone15的编织数据线用到崩开了，撕下编织，又是一根新线，划算[并不简单

8

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

9

美团退款好像最近两年没有出现过退款异常的，主要还是2014-2018年囤积的未使

10

Magic7用户又要兴奋了，不过Magic6就要哭一会了，荣耀MagicOS10