ArXiv 每日精选 · 2026-05-31
📅 本期精选来自 2026-05-31 ArXiv 最新论文,聚焦视频生成、扩散模型、世界模型、具身AI等核心方向,共 8 篇。 📄 论文精选 VideoMLA: Low-Rank Latent KV Cache for Minute-Scale Autoregressive Video Diffusion 链接: https://arxiv.org/abs/2605.30351 一句话总结: 将 Multi-Head Latent Attention(MLA)引入视频扩散模型,用低秩潜变量替换每个注意力头的 KV 缓存,显著降低流式视频生成的内存占用,同时维持甚至超越基线质量。 ...