传统图像压缩中的一个关键问题是,当我们只想查看图像的特定部分时,往往无法避免处理

酸酸甜甜小苏 2025-06-09 07:24:32

传统图像压缩中的一个关键问题是,当我们只想查看图像的特定部分时,往往无法避免处理整张图像的数据。这就像你去超市只想买一瓶水,却被迫购买整个货架上的商品一样不合理。这个问题的核心在于传统压缩技术在移除图像冗余信息时,会在不同区域之间创建依赖关系。 组间独立变换技术正是为解决这一问题而生。它的基本思想很直观:确保在压缩过程中,图像的不同语义组之间不产生相互依赖。这样,当我们只需要查看特定区域时,就不必担心缺少其他区域的信息会导致重建质量下降。 具体来说,传统的有损图像压缩基于转换编码可分为三个模块化组件:转换、量化和熵编码。虽然量化和熵编码不影响语义结构化比特流的生成和使用,但传统转换应用于整个图像以移除空间冗余不可避免地会在压缩过程中创建组间依赖关系。在选择性传输和重建的情况下,由重组所有组的子集而产生的不完整表示可能会因缺乏组间依赖关系而导致不准确的重建。 为解决这个问题,我们提出了组独立转换的概念。它的实现方式是限制转换只在每个组内进行处理。一种简单直接的方法是使用变换器(Transformer)配合自定义的注意力图,该注意力图与组掩码相对应。但图像压缩与变换器擅长的高级理解任务有很大不同。存在大量复杂的长程依赖关系可能会阻碍收敛并不利于最终性能。 这种设计充分利用了Swin变换器的层次化表示建模能力,在确保组独立性的前提下实现高编码效率。在实际实现中,主要变换以交错方式通过整合上采样/下采样和组独立Swin块来执行。上采样包含像素混洗操作和内核大小为11的卷积层,而下采样包含像素解混洗操作和内核大小为11的卷积层。 组独立变换的实现需要考虑编码和解码两个过程。在编码阶段,给定源图像x和组掩码m,编码器ga将其转换为潜在表示y。从组的角度来看,我们可以定义x和y,并确保转换只在每个组内发生。在解码阶段,解码器gs使用量化后的潜在表示和组掩码重建图像。

0 阅读:0
酸酸甜甜小苏

酸酸甜甜小苏

酸酸甜甜小苏