视频生成 | ElephantFlow's Blog

ArXiv 每日精选 · 2026-06-22

📅 本期精选来自 2026-06-22 ArXiv 最新论文，聚焦世界模型、扩散模型、3D生成、具身智能等核心方向，共 8 篇。 📄 论文精选 Current World Models Lack a Persistent State Core 链接： https://arxiv.org/abs/2606.20545 一句话总结：提出 WRBench 基准，首次系统性诊断当前世界模型的核心缺陷——无法维持「离开视野后仍持续演化」的持久状态，揭示了通向 AGI 的关键技术空白。 ...

ArXiv 每日精选 · 2026-06-21

📅 本期精选来自 2026-06-21 ArXiv 最新论文（对应 2026-06-19 提交批次），聚焦世界模型、扩散/流模型、自回归生成、具身 AI 等核心方向，共 7 篇。 📄 论文精选 Current World Models Lack a Persistent State Core 链接： https://arxiv.org/abs/2606.20545 ...

ArXiv 每日精选 · 2026-06-19

📅 本期精选来自 2026-06-19 ArXiv 最新论文，聚焦世界模型、扩散/流匹配模型、视频生成、具身AI等核心方向，共 8 篇。 📄 论文精选 MemoryWAM: Efficient World Action Modeling with Persistent Memory 链接： https://arxiv.org/abs/2606.20562 一句话总结：提出带持久记忆的高效世界-动作模型，通过混合记忆机制解决机器人长视野操控中的非马尔可夫问题，同时保持推理效率。 ...

ArXiv 每日精选 · 2026-06-17

📅 本期精选来自 2026-06-17 ArXiv 最新论文，聚焦世界模型、多模态生成、运动生成、具身AI与机器人策略等核心方向，共 7 篇。 📄 论文精选 FR3D: Future Dynamic 3D Reconstruction: A 3D World Model with Disentangled Ego-Motion 链接： https://arxiv.org/abs/2606.18250 ...

ArXiv 每日精选 · 2026-06-16

📅 本期精选来自 2026-06-16 ArXiv 最新论文，聚焦世界模型、视频生成、具身AI、机器人操控、扩散模型等核心方向，共 8 篇。 📄 论文精选 Qwen-RobotWorld Technical Report: Unifying Embodied World Modeling through Language-Conditioned Video Generation 链接： https://arxiv.org/abs/2606.17030 ...

ArXiv 每日精选 · 2026-06-15

📅 本期精选来自 2026-06-15 ArXiv 最新论文，聚焦扩散模型、视频生成、具身AI、视觉语言模型等核心方向，共 8 篇。 📄 论文精选 RepFusion: Leveraging Multimodal Priors for Denoising in Representation Space 链接： https://arxiv.org/abs/2606.14700 一句话总结：将多模态大语言模型（MLLM）本身作为扩散 transformer 的条件信号，利用 MLLM 在噪声表示空间的输出引导 T2I 去噪过程，实现 LLM prior 的有效复用。 ...

ArXiv 每日精选 · 2026-06-14

📅 本期精选来自 2026-06-14 ArXiv 最新论文，聚焦世界模型、扩散模型、视频生成、具身AI等核心方向，共 8 篇。 📄 论文精选 WEAVER: Better, Faster, Longer — An Effective World Model for Robotic Manipulation 链接： https://arxiv.org/abs/2606.13672 一句话总结： WEAVER 是一个多视角世界模型，通过 flow-matching 损失联合预测未来隐状态与奖励，同时实现高保真度、长时一致性与高效推理，在机器人操控任务上达到 SOTA。 ...

ArXiv 每日精选 · 2026-06-13

📅 本期精选来自 2026-06-13 ArXiv 最新论文，聚焦世界模型、扩散模型、视频生成、具身AI等核心方向，共 8 篇。 📄 论文精选 WEAVER, Better, Faster, Longer: An Effective World Model for Robotic Manipulation 链接： https://arxiv.org/abs/2606.13672 一句话总结： WEAVER 是一个同时满足高保真度、长时序一致性与高效推理三大目标的机器人操作世界模型，在真实机器人上实现 38% 的策略性能提升。 ...

ArXiv 每日精选 · 2026-06-12

📅 本期精选来自 2026-06-12 ArXiv 最新论文，聚焦世界模型、扩散模型、视频生成、具身AI等核心方向，共 8 篇。 📄 论文精选 WEAVER, Better, Faster, Longer: An Effective World Model for Robotic Manipulation 链接： https://arxiv.org/abs/2606.13672 一句话总结：提出 WEAVER 世界模型架构，同时满足高保真度、长时序一致性与推理效率三大需求，在真实机器人操作任务上取得 SOTA 表现。 ...

ArXiv 每日精选 · 2026-06-11

📅 本期精选来自 2026-06-11 ArXiv 最新论文，聚焦世界模型、扩散策略、具身AI、视频生成等核心方向，共 7 篇。 📄 论文精选 World Pilot: Steering Vision-Language-Action Models with World-Action Priors 链接： https://arxiv.org/abs/2606.12403 一句话总结：通过世界动作模型（WAM）生成的"预见"先验，从感知与动作两条路径同时增强 VLA，实现更强的跨域泛化能力。 ...