机器人 | ElephantFlow's Blog

ArXiv 每日精选 · 2026-07-01

📅 本期精选来自 2026-07-01 ArXiv 最新论文，聚焦世界模型、视频生成、具身智能、机器人学习、生成模型等核心方向，共 8 篇。 📄 论文精选 DVG-WM: Disentangled Video Generation Enables Efficient Embodied World Model for Robotic Manipulation 链接： https://arxiv.org/abs/2606.32028 ...

ArXiv 每日精选 · 2026-06-30

📅 本期精选来自 2026-06-30 ArXiv 最新论文，聚焦世界模型、视频生成、具身AI与机器人、生成模型理论等核心方向，共 8 篇。 📄 论文精选 Orca: The World is in Your Mind 链接： https://arxiv.org/abs/2606.30534 一句话总结：提出通用世界基础模型 Orca，通过统一的 Next-State-Prediction 建模范式，在共享的世界潜空间中同时支持文本生成、图像预测和具身动作生成三类下游任务。 ...

ArXiv 每日精选 · 2026-06-29

📅 本期精选来自 2026-06-29 ArXiv 最新论文，聚焦扩散模型、世界模型、视频生成、具身AI等核心方向，共 7 篇。 📄 论文精选 TempAct: Advancing Temporal Plausibility in Autoregressive Video Generation via Planner-Executor RL 链接： https://arxiv.org/abs/2606.28016 一句话总结：提出 Planner-Executor 强化学习框架，解决自回归视频扩散模型中 chunk-wise 生成的时序指令跟随问题，显著提升长视频的时间一致性。 ...

ArXiv 每日精选 · 2026-06-23

📅 本期精选来自 2026-06-23 ArXiv 最新论文，聚焦扩散模型、视频生成、动作生成、具身AI等核心方向，共 7 篇。 📄 论文精选 LaST-HD: Learning Latent Physical Reasoning from Scalable Human Data for Robot Manipulation 链接： https://arxiv.org/abs/2606.23685 一句话总结：提出了一种基于世界模型的人-机器人动作对齐框架，通过在共享隐空间中建立前向动力学一致性，使机器人能够从人类手部演示数据中高效学习物理操作技能。 ...

ArXiv 每日精选 · 2026-06-22

📅 本期精选来自 2026-06-22 ArXiv 最新论文，聚焦世界模型、扩散模型、3D生成、具身智能等核心方向，共 8 篇。 📄 论文精选 Current World Models Lack a Persistent State Core 链接： https://arxiv.org/abs/2606.20545 一句话总结：提出 WRBench 基准，首次系统性诊断当前世界模型的核心缺陷——无法维持「离开视野后仍持续演化」的持久状态，揭示了通向 AGI 的关键技术空白。 ...

ArXiv 每日精选 · 2026-06-21

📅 本期精选来自 2026-06-21 ArXiv 最新论文（对应 2026-06-19 提交批次），聚焦世界模型、扩散/流模型、自回归生成、具身 AI 等核心方向，共 7 篇。 📄 论文精选 Current World Models Lack a Persistent State Core 链接： https://arxiv.org/abs/2606.20545 ...

ArXiv 每日精选 · 2026-06-20

📅 本期精选来自 2026-06-20 ArXiv 最新论文，聚焦世界模型、扩散模型、自回归生成模型、具身AI等核心方向，共 7 篇。 📄 论文精选 MemoryWAM: Efficient World Action Modeling with Persistent Memory 链接： https://arxiv.org/abs/2606.20562 一句话总结：提出 MemoryWAM，一种具备持久记忆的高效世界动作模型，通过混合记忆设计解决机器人长时域非马尔可夫操作中的历史遗忘问题。 ...

ArXiv 每日精选 · 2026-06-18

📅 本期精选来自 2026-06-18 ArXiv 最新论文，聚焦扩散模型、具身智能、VLM、机器人操作等核心方向，共 8 篇。 📄 论文精选 Diffusion-Proof: Recipe for Formal Theorem Proving Beyond Auto-Regressive Generation 链接： https://arxiv.org/abs/2606.19315 一句话总结：首次将扩散语言模型（dLLM）应用于形式化定理证明，通过全证明生成与局部纠错双模型协同，在 MiniF2F-Test 上绝对提升 6.14%，并解决了 DeepSeek-Prover-V2-7B 未能解决的 IMO 题目。 ...

ArXiv 每日精选 · 2026-06-17

📅 本期精选来自 2026-06-17 ArXiv 最新论文，聚焦世界模型、多模态生成、运动生成、具身AI与机器人策略等核心方向，共 7 篇。 📄 论文精选 FR3D: Future Dynamic 3D Reconstruction: A 3D World Model with Disentangled Ego-Motion 链接： https://arxiv.org/abs/2606.18250 ...

ArXiv 每日精选 · 2026-06-16

📅 本期精选来自 2026-06-16 ArXiv 最新论文，聚焦世界模型、视频生成、具身AI、机器人操控、扩散模型等核心方向，共 8 篇。 📄 论文精选 Qwen-RobotWorld Technical Report: Unifying Embodied World Modeling through Language-Conditioned Video Generation 链接： https://arxiv.org/abs/2606.17030 ...