ArXiv 每日精选 · 2026-05-27

📅 本期精选来自 2026-05-27 ArXiv 最新论文,聚焦扩散模型、视频生成、具身AI、3D 生成等核心方向,共 8 篇。 📄 论文精选 MRT: Masked Region Transformer for Layered Image Generation and Editing at Scale 链接: https://arxiv.org/abs/2605.27235 一句话总结: 提出 20B 参数的多层透明图像扩散模型 MRT,统一 text-to-layers、image-to-layers、layers-to-layers 三大任务,在速度和质量上大幅超越商业系统(CVPR 2026)。 ...

2026年5月28日 · 11 分钟 · 5153 字 · elephantflow

ArXiv 每日精选 · 2026-04-19

📅 本期精选来自 2026-04-19 ArXiv 最新论文(含近期重点论文),聚焦扩散模型、Flow Matching 稳定性、相机可控视频生成、文本驱动动作生成、视频编辑评测、3D 布局生成等核心方向,共 8 篇。 ...

2026年4月20日 · 9 分钟 · 4363 字 · elephantflow