ArXiv 每日精选 · 2026-06-19

📅 本期精选来自 2026-06-19 ArXiv 最新论文,聚焦世界模型、扩散/流匹配模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 MemoryWAM: Efficient World Action Modeling with Persistent Memory 链接: https://arxiv.org/abs/2606.20562 一句话总结: 提出带持久记忆的高效世界-动作模型,通过混合记忆机制解决机器人长视野操控中的非马尔可夫问题,同时保持推理效率。 ...

2026年6月20日 · 11 分钟 · 5219 字 · elephantflow

ArXiv 每日精选 · 2026-06-18

📅 本期精选来自 2026-06-18 ArXiv 最新论文,聚焦扩散模型、具身智能、VLM、机器人操作等核心方向,共 8 篇。 📄 论文精选 Diffusion-Proof: Recipe for Formal Theorem Proving Beyond Auto-Regressive Generation 链接: https://arxiv.org/abs/2606.19315 一句话总结: 首次将扩散语言模型(dLLM)应用于形式化定理证明,通过全证明生成与局部纠错双模型协同,在 MiniF2F-Test 上绝对提升 6.14%,并解决了 DeepSeek-Prover-V2-7B 未能解决的 IMO 题目。 ...

2026年6月19日 · 9 分钟 · 4470 字 · elephantflow

ArXiv 每日精选 · 2026-06-17

📅 本期精选来自 2026-06-17 ArXiv 最新论文,聚焦世界模型、多模态生成、运动生成、具身AI与机器人策略等核心方向,共 7 篇。 📄 论文精选 FR3D: Future Dynamic 3D Reconstruction: A 3D World Model with Disentangled Ego-Motion 链接: https://arxiv.org/abs/2606.18250 ...

2026年6月18日 · 10 分钟 · 4558 字 · elephantflow

ArXiv 每日精选 · 2026-06-16

📅 本期精选来自 2026-06-16 ArXiv 最新论文,聚焦世界模型、视频生成、具身AI、机器人操控、扩散模型等核心方向,共 8 篇。 📄 论文精选 Qwen-RobotWorld Technical Report: Unifying Embodied World Modeling through Language-Conditioned Video Generation 链接: https://arxiv.org/abs/2606.17030 ...

2026年6月17日 · 11 分钟 · 5397 字 · elephantflow

ArXiv 每日精选 · 2026-06-15

📅 本期精选来自 2026-06-15 ArXiv 最新论文,聚焦扩散模型、视频生成、具身AI、视觉语言模型等核心方向,共 8 篇。 📄 论文精选 RepFusion: Leveraging Multimodal Priors for Denoising in Representation Space 链接: https://arxiv.org/abs/2606.14700 一句话总结: 将多模态大语言模型(MLLM)本身作为扩散 transformer 的条件信号,利用 MLLM 在噪声表示空间的输出引导 T2I 去噪过程,实现 LLM prior 的有效复用。 ...

2026年6月16日 · 11 分钟 · 5137 字 · elephantflow

ArXiv 每日精选 · 2026-06-14

📅 本期精选来自 2026-06-14 ArXiv 最新论文,聚焦世界模型、扩散模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 WEAVER: Better, Faster, Longer — An Effective World Model for Robotic Manipulation 链接: https://arxiv.org/abs/2606.13672 一句话总结: WEAVER 是一个多视角世界模型,通过 flow-matching 损失联合预测未来隐状态与奖励,同时实现高保真度、长时一致性与高效推理,在机器人操控任务上达到 SOTA。 ...

2026年6月15日 · 11 分钟 · 5243 字 · elephantflow

ArXiv 每日精选 · 2026-06-13

📅 本期精选来自 2026-06-13 ArXiv 最新论文,聚焦世界模型、扩散模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 WEAVER, Better, Faster, Longer: An Effective World Model for Robotic Manipulation 链接: https://arxiv.org/abs/2606.13672 一句话总结: WEAVER 是一个同时满足高保真度、长时序一致性与高效推理三大目标的机器人操作世界模型,在真实机器人上实现 38% 的策略性能提升。 ...

2026年6月14日 · 10 分钟 · 4909 字 · elephantflow

ArXiv 每日精选 · 2026-06-12

📅 本期精选来自 2026-06-12 ArXiv 最新论文,聚焦世界模型、扩散模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 WEAVER, Better, Faster, Longer: An Effective World Model for Robotic Manipulation 链接: https://arxiv.org/abs/2606.13672 一句话总结: 提出 WEAVER 世界模型架构,同时满足高保真度、长时序一致性与推理效率三大需求,在真实机器人操作任务上取得 SOTA 表现。 ...

2026年6月13日 · 10 分钟 · 4571 字 · elephantflow

ArXiv 每日精选 · 2026-06-11

📅 本期精选来自 2026-06-11 ArXiv 最新论文,聚焦世界模型、扩散策略、具身AI、视频生成等核心方向,共 7 篇。 📄 论文精选 World Pilot: Steering Vision-Language-Action Models with World-Action Priors 链接: https://arxiv.org/abs/2606.12403 一句话总结: 通过世界动作模型(WAM)生成的"预见"先验,从感知与动作两条路径同时增强 VLA,实现更强的跨域泛化能力。 ...

2026年6月12日 · 10 分钟 · 4575 字 · elephantflow

ArXiv 每日精选 · 2026-06-10

📅 本期精选来自 2026-06-10 ArXiv 最新论文,聚焦世界模型、扩散模型蒸馏、视频生成、具身 AI 等核心方向,共 10 篇。 📄 论文精选 Next Forcing: Causal World Modeling with Multi-Chunk Prediction 链接: https://arxiv.org/abs/2606.11187 一句话总结: 提出多块预测(MCP)训练目标,同时预测多个未来视频块,在加速自回归世界模型训练收敛的同时实现 2x 推理加速,在 RoboTwin 基准达到新 SOTA。 ...

2026年6月11日 · 12 分钟 · 5795 字 · elephantflow