ArXiv 每日精选 · 2026-07-02

📅 本期精选来自 2026-07-02 ArXiv 最新论文,聚焦世界模型、3D生成、扩散模型、具身AI与机器人学习等核心方向,共 8 篇。 📄 论文精选 World from Motion: Generative Dynamic Gaussian Reconstruction from Monocular Video 链接: https://arxiv.org/abs/2607.01202 一句话总结: NVIDIA 提出 World from Motion,用视频生成模型从单目视频生成可自由渲染的高质量动态 3D Gaussian 场景,实现 4D 重建 SOTA。 ...

2026年7月3日 · 10 分钟 · 4876 字 · elephantflow

ArXiv 每日精选 · 2026-07-01

📅 本期精选来自 2026-07-01 ArXiv 最新论文,聚焦世界模型、视频生成、具身智能、机器人学习、生成模型等核心方向,共 8 篇。 📄 论文精选 DVG-WM: Disentangled Video Generation Enables Efficient Embodied World Model for Robotic Manipulation 链接: https://arxiv.org/abs/2606.32028 ...

2026年7月2日 · 11 分钟 · 5264 字 · elephantflow

ArXiv 每日精选 · 2026-06-30

📅 本期精选来自 2026-06-30 ArXiv 最新论文,聚焦世界模型、视频生成、具身AI与机器人、生成模型理论等核心方向,共 8 篇。 📄 论文精选 Orca: The World is in Your Mind 链接: https://arxiv.org/abs/2606.30534 一句话总结: 提出通用世界基础模型 Orca,通过统一的 Next-State-Prediction 建模范式,在共享的世界潜空间中同时支持文本生成、图像预测和具身动作生成三类下游任务。 ...

2026年7月1日 · 11 分钟 · 5115 字 · elephantflow

ArXiv 每日精选 · 2026-06-29

📅 本期精选来自 2026-06-29 ArXiv 最新论文,聚焦扩散模型、世界模型、视频生成、具身AI等核心方向,共 7 篇。 📄 论文精选 TempAct: Advancing Temporal Plausibility in Autoregressive Video Generation via Planner-Executor RL 链接: https://arxiv.org/abs/2606.28016 一句话总结: 提出 Planner-Executor 强化学习框架,解决自回归视频扩散模型中 chunk-wise 生成的时序指令跟随问题,显著提升长视频的时间一致性。 ...

2026年6月30日 · 10 分钟 · 4823 字 · elephantflow

ArXiv 每日精选 · 2026-06-28

📅 本期精选来自 2026-06-28 ArXiv 最新论文,聚焦世界模型、扩散模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 Hallucination in World Models is Predictable and Preventable 链接: https://arxiv.org/abs/2606.27326 一句话总结: 系统性分析了生成式世界模型中幻觉(hallucination)的成因,提出可预测、可预防的数据覆盖驱动框架,并构建了大规模 MMBench2 基准。 ...

2026年6月29日 · 9 分钟 · 4477 字 · elephantflow

ArXiv 每日精选 · 2026-06-26

📅 本期精选来自 2026-06-26 ArXiv 最新论文,聚焦扩散模型、世界模型、视频生成、具身AI等核心方向,共 7 篇。 📄 论文精选 World Action Models Enable Continual Imitation Learning with Recurrent Generative Replays 链接: https://arxiv.org/abs/2606.27374 一句话总结: 利用世界动作模型(WAM)的视频生成能力合成伪回放轨迹,实现无需存储历史演示数据的持续机器人模仿学习。 ...

2026年6月27日 · 10 分钟 · 4677 字 · elephantflow

ArXiv 每日精选 · 2026-06-23

📅 本期精选来自 2026-06-23 ArXiv 最新论文,聚焦扩散模型、视频生成、动作生成、具身AI等核心方向,共 7 篇。 📄 论文精选 LaST-HD: Learning Latent Physical Reasoning from Scalable Human Data for Robot Manipulation 链接: https://arxiv.org/abs/2606.23685 一句话总结: 提出了一种基于世界模型的人-机器人动作对齐框架,通过在共享隐空间中建立前向动力学一致性,使机器人能够从人类手部演示数据中高效学习物理操作技能。 ...

2026年6月24日 · 10 分钟 · 4937 字 · elephantflow

ArXiv 每日精选 · 2026-06-22

📅 本期精选来自 2026-06-22 ArXiv 最新论文,聚焦世界模型、扩散模型、3D生成、具身智能等核心方向,共 8 篇。 📄 论文精选 Current World Models Lack a Persistent State Core 链接: https://arxiv.org/abs/2606.20545 一句话总结: 提出 WRBench 基准,首次系统性诊断当前世界模型的核心缺陷——无法维持「离开视野后仍持续演化」的持久状态,揭示了通向 AGI 的关键技术空白。 ...

2026年6月23日 · 12 分钟 · 5584 字 · elephantflow

ArXiv 每日精选 · 2026-06-21

📅 本期精选来自 2026-06-21 ArXiv 最新论文(对应 2026-06-19 提交批次),聚焦世界模型、扩散/流模型、自回归生成、具身 AI 等核心方向,共 7 篇。 📄 论文精选 Current World Models Lack a Persistent State Core 链接: https://arxiv.org/abs/2606.20545 ...

2026年6月22日 · 11 分钟 · 5249 字 · elephantflow

ArXiv 每日精选 · 2026-06-20

📅 本期精选来自 2026-06-20 ArXiv 最新论文,聚焦世界模型、扩散模型、自回归生成模型、具身AI等核心方向,共 7 篇。 📄 论文精选 MemoryWAM: Efficient World Action Modeling with Persistent Memory 链接: https://arxiv.org/abs/2606.20562 一句话总结: 提出 MemoryWAM,一种具备持久记忆的高效世界动作模型,通过混合记忆设计解决机器人长时域非马尔可夫操作中的历史遗忘问题。 ...

2026年6月21日 · 9 分钟 · 4299 字 · elephantflow