具身智能 | ElephantFlow's Blog

ArXiv 每日精选 · 2026-06-19

📅 本期精选来自 2026-06-19 ArXiv 最新论文，聚焦世界模型、扩散/流匹配模型、视频生成、具身AI等核心方向，共 8 篇。 📄 论文精选 MemoryWAM: Efficient World Action Modeling with Persistent Memory 链接： https://arxiv.org/abs/2606.20562 一句话总结：提出带持久记忆的高效世界-动作模型，通过混合记忆机制解决机器人长视野操控中的非马尔可夫问题，同时保持推理效率。 ...

ArXiv 每日精选 · 2026-06-18

📅 本期精选来自 2026-06-18 ArXiv 最新论文，聚焦扩散模型、具身智能、VLM、机器人操作等核心方向，共 8 篇。 📄 论文精选 Diffusion-Proof: Recipe for Formal Theorem Proving Beyond Auto-Regressive Generation 链接： https://arxiv.org/abs/2606.19315 一句话总结：首次将扩散语言模型（dLLM）应用于形式化定理证明，通过全证明生成与局部纠错双模型协同，在 MiniF2F-Test 上绝对提升 6.14%，并解决了 DeepSeek-Prover-V2-7B 未能解决的 IMO 题目。 ...

ArXiv 每日精选 · 2026-06-17

📅 本期精选来自 2026-06-17 ArXiv 最新论文，聚焦世界模型、多模态生成、运动生成、具身AI与机器人策略等核心方向，共 7 篇。 📄 论文精选 FR3D: Future Dynamic 3D Reconstruction: A 3D World Model with Disentangled Ego-Motion 链接： https://arxiv.org/abs/2606.18250 ...

ArXiv 每日精选 · 2026-06-16

📅 本期精选来自 2026-06-16 ArXiv 最新论文，聚焦世界模型、视频生成、具身AI、机器人操控、扩散模型等核心方向，共 8 篇。 📄 论文精选 Qwen-RobotWorld Technical Report: Unifying Embodied World Modeling through Language-Conditioned Video Generation 链接： https://arxiv.org/abs/2606.17030 ...

ArXiv 每日精选 · 2026-06-15

📅 本期精选来自 2026-06-15 ArXiv 最新论文，聚焦扩散模型、视频生成、具身AI、视觉语言模型等核心方向，共 8 篇。 📄 论文精选 RepFusion: Leveraging Multimodal Priors for Denoising in Representation Space 链接： https://arxiv.org/abs/2606.14700 一句话总结：将多模态大语言模型（MLLM）本身作为扩散 transformer 的条件信号，利用 MLLM 在噪声表示空间的输出引导 T2I 去噪过程，实现 LLM prior 的有效复用。 ...

ArXiv 每日精选 · 2026-06-14

📅 本期精选来自 2026-06-14 ArXiv 最新论文，聚焦世界模型、扩散模型、视频生成、具身AI等核心方向，共 8 篇。 📄 论文精选 WEAVER: Better, Faster, Longer — An Effective World Model for Robotic Manipulation 链接： https://arxiv.org/abs/2606.13672 一句话总结： WEAVER 是一个多视角世界模型，通过 flow-matching 损失联合预测未来隐状态与奖励，同时实现高保真度、长时一致性与高效推理，在机器人操控任务上达到 SOTA。 ...

ArXiv 每日精选 · 2026-06-13

📅 本期精选来自 2026-06-13 ArXiv 最新论文，聚焦世界模型、扩散模型、视频生成、具身AI等核心方向，共 8 篇。 📄 论文精选 WEAVER, Better, Faster, Longer: An Effective World Model for Robotic Manipulation 链接： https://arxiv.org/abs/2606.13672 一句话总结： WEAVER 是一个同时满足高保真度、长时序一致性与高效推理三大目标的机器人操作世界模型，在真实机器人上实现 38% 的策略性能提升。 ...

ArXiv 每日精选 · 2026-06-12

📅 本期精选来自 2026-06-12 ArXiv 最新论文，聚焦世界模型、扩散模型、视频生成、具身AI等核心方向，共 8 篇。 📄 论文精选 WEAVER, Better, Faster, Longer: An Effective World Model for Robotic Manipulation 链接： https://arxiv.org/abs/2606.13672 一句话总结：提出 WEAVER 世界模型架构，同时满足高保真度、长时序一致性与推理效率三大需求，在真实机器人操作任务上取得 SOTA 表现。 ...

ArXiv 每日精选 · 2026-06-11

📅 本期精选来自 2026-06-11 ArXiv 最新论文，聚焦世界模型、扩散策略、具身AI、视频生成等核心方向，共 7 篇。 📄 论文精选 World Pilot: Steering Vision-Language-Action Models with World-Action Priors 链接： https://arxiv.org/abs/2606.12403 一句话总结：通过世界动作模型（WAM）生成的"预见"先验，从感知与动作两条路径同时增强 VLA，实现更强的跨域泛化能力。 ...

ArXiv 每日精选 · 2026-06-10

📅 本期精选来自 2026-06-10 ArXiv 最新论文，聚焦世界模型、扩散模型蒸馏、视频生成、具身 AI 等核心方向，共 10 篇。 📄 论文精选 Next Forcing: Causal World Modeling with Multi-Chunk Prediction 链接： https://arxiv.org/abs/2606.11187 一句话总结：提出多块预测（MCP）训练目标，同时预测多个未来视频块，在加速自回归世界模型训练收敛的同时实现 2x 推理加速，在 RoboTwin 基准达到新 SOTA。 ...