在线的文生图服务价格太贵?
本地部署的文生图模型又卡又慢?
别再说本地文生图模型不实用了!
今天手把手教你,用LeMiCa加速框架,只需敲几行代码,就能让模型又快又精准。
在SuperCLUE-Image评测中,作为国内第一,世界第四的开源文生图模型ERNIE-Image,仅需24GB显卡即可流畅运行,而这次我们将进一步压榨其潜力。
由联通数据科学与人工智能研究院提出、并入选NeurIPS 2025 Spotlight的LeMiCa加速框架,现已全面支持ERNIE-Image文生图模型。无需重新训练,只需几行代码,即可让ERNIE-Image的生成速度提升2倍以上,同时保持画质几乎无损。
01.
LeMiCa加速框架
▎为什么传统加速容易“翻车”?
主流文生图模型采用扩散模型架构,需要多步迭代“雕琢”出最终图像。此前常见的加速方法是局部贪心缓存——相邻两步变化不大就复用缓存。
这种“走一步看一步”的策略看似每步都省了,但某一步的微小误差会被不断放大,最终导致画面崩坏:脸部变形、物体消失、风格突变……
▎LeMiCa的解法:全局最优路径规划
联通元景大模型团队给出了一套全新思路:缓存加速不是局部决策,而是全局路径优化问题。
他们将生成过程抽象成一张“地图”,自动规划一条最优路径——在保证速度的同时,让每一步的误差都尽可能小且分布均衡,避免“某一段突然崩坏”。
这就好比给文生图配备了一位具备全局视野的智能导演,在提速的同时,确保画面质量、风格与细节的高度一致。

02.
LeMiCa适配ERNIE-Image
让文生图“快且精”
ERNIE-Image是百度自研的文生图模型,文字渲染准、指令遵循强。LeMiCa的加入,让这款优秀模型跑得更快、用得更省。表格给出了详细的测评结果:

▎速度翻倍:从“等待”到“即现”
根据实测结果,LeMiCa可在单张H100上实现约2倍无损加速,最高加速比达到4.57倍,对应生成耗时从约32秒缩短至约7秒,大幅减少用户等待时间,让图像生成体验从“等待出图”升级为“快速即现”。
▎画质几乎无损:告别“加速翻车”
LeMiCa不只是让ERNIE-Image跑得更快,也让加速后的画质保持稳定。从表格结果看,反映图像生成质量的ImageReward、Aesthetic-v2.5、HPSv3三项指标在加速后基本没有明显变化,说明加速并没有破坏模型原有的生成效果。
更关键的是,LeMiCa在画面一致性保持上表现突出,这也是其区别于传统加速方法的核心特色。反映加速结果与原始输出在内容细节上是否一致的LPIPS、SSIM、PSNR三项重构指标显示:在约2x加速时,LPIPS低至0.028;即使在接近3x加速时,LPIPS也仅为0.072。这说明加速后的图像在主体结构、纹理细节和整体观感上都与原始结果高度一致,真正做到了肉眼几乎难以察觉差异的高质量加速。

原图

LeMiCa 2x无损加速
03.
快速上手
最让人心动的是——无需任何模型修改,无需重新训练。
只需在原有ERNIE-Image推理脚本中添加几行代码,即可一键开启加速。同时支持随时关闭,方便对比效果。
▎安装
LeMiCa4ErnieImage复用ERNIE-Image/Diffusers运行环境,无需额外安装:
git clone https://github.com/UnicomAI/LeMiCa.gitcd LeMiCa/LeMiCa4ErnieImage
▎使用示例
python inference_ernieimage.py \--model-path baidu/ERNIE-Image \
--cache medium \
--prompt "A cute panda reading a book in a bamboo forest." \
--height 1024 --width 1024 \
--num-inference-steps 50 \
--guidance-scale 4.0 \
--seed 42
▎调参小贴士
LeMiCa为ERNIE-Image提供三档加速模式:

▎效果展示

把等待的时间,还给创作本身,欢迎大家上手体验。
相关链接:
LeMiCa论文:
arXiv:2511.00090
项目主页:
unicomai.github.io/LeMiCa
代码地址:
https://github.com/UnicomAI/LeMiCa
*实测数据源自联通元景大模型团队公开论文及技术报告,实际效果因硬件和配置而异。
*LeMiCa的作者们均来自由首席科学家廉士国博士领衔的联通数据智能有限公司(联通数据科学与人工智能研究院)元景大模型研发团队