ArXiv 每日精选 · 2026-06-22

📅 本期精选来自 2026-06-22 ArXiv 最新论文,聚焦世界模型、扩散模型、3D生成、具身智能等核心方向,共 8 篇。 📄 论文精选 Current World Models Lack a Persistent State Core 链接: https://arxiv.org/abs/2606.20545 一句话总结: 提出 WRBench 基准,首次系统性诊断当前世界模型的核心缺陷——无法维持「离开视野后仍持续演化」的持久状态,揭示了通向 AGI 的关键技术空白。 ...

2026年6月23日 · 12 分钟 · 5584 字 · elephantflow

ArXiv 每日精选 · 2026-06-21

📅 本期精选来自 2026-06-21 ArXiv 最新论文(对应 2026-06-19 提交批次),聚焦世界模型、扩散/流模型、自回归生成、具身 AI 等核心方向,共 7 篇。 📄 论文精选 Current World Models Lack a Persistent State Core 链接: https://arxiv.org/abs/2606.20545 ...

2026年6月22日 · 11 分钟 · 5249 字 · elephantflow

ArXiv 每日精选 · 2026-06-20

📅 本期精选来自 2026-06-20 ArXiv 最新论文,聚焦世界模型、扩散模型、自回归生成模型、具身AI等核心方向,共 7 篇。 📄 论文精选 MemoryWAM: Efficient World Action Modeling with Persistent Memory 链接: https://arxiv.org/abs/2606.20562 一句话总结: 提出 MemoryWAM,一种具备持久记忆的高效世界动作模型,通过混合记忆设计解决机器人长时域非马尔可夫操作中的历史遗忘问题。 ...

2026年6月21日 · 9 分钟 · 4299 字 · elephantflow

ArXiv 每日精选 · 2026-06-19

📅 本期精选来自 2026-06-19 ArXiv 最新论文,聚焦世界模型、扩散/流匹配模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 MemoryWAM: Efficient World Action Modeling with Persistent Memory 链接: https://arxiv.org/abs/2606.20562 一句话总结: 提出带持久记忆的高效世界-动作模型,通过混合记忆机制解决机器人长视野操控中的非马尔可夫问题,同时保持推理效率。 ...

2026年6月20日 · 11 分钟 · 5219 字 · elephantflow

ArXiv 每日精选 · 2026-06-18

📅 本期精选来自 2026-06-18 ArXiv 最新论文,聚焦扩散模型、具身智能、VLM、机器人操作等核心方向,共 8 篇。 📄 论文精选 Diffusion-Proof: Recipe for Formal Theorem Proving Beyond Auto-Regressive Generation 链接: https://arxiv.org/abs/2606.19315 一句话总结: 首次将扩散语言模型(dLLM)应用于形式化定理证明,通过全证明生成与局部纠错双模型协同,在 MiniF2F-Test 上绝对提升 6.14%,并解决了 DeepSeek-Prover-V2-7B 未能解决的 IMO 题目。 ...

2026年6月19日 · 9 分钟 · 4470 字 · elephantflow

ArXiv 每日精选 · 2026-06-17

📅 本期精选来自 2026-06-17 ArXiv 最新论文,聚焦世界模型、多模态生成、运动生成、具身AI与机器人策略等核心方向,共 7 篇。 📄 论文精选 FR3D: Future Dynamic 3D Reconstruction: A 3D World Model with Disentangled Ego-Motion 链接: https://arxiv.org/abs/2606.18250 ...

2026年6月18日 · 10 分钟 · 4558 字 · elephantflow

ArXiv 每日精选 · 2026-06-16

📅 本期精选来自 2026-06-16 ArXiv 最新论文,聚焦世界模型、视频生成、具身AI、机器人操控、扩散模型等核心方向,共 8 篇。 📄 论文精选 Qwen-RobotWorld Technical Report: Unifying Embodied World Modeling through Language-Conditioned Video Generation 链接: https://arxiv.org/abs/2606.17030 ...

2026年6月17日 · 11 分钟 · 5397 字 · elephantflow

ArXiv 每日精选 · 2026-06-15

📅 本期精选来自 2026-06-15 ArXiv 最新论文,聚焦扩散模型、视频生成、具身AI、视觉语言模型等核心方向,共 8 篇。 📄 论文精选 RepFusion: Leveraging Multimodal Priors for Denoising in Representation Space 链接: https://arxiv.org/abs/2606.14700 一句话总结: 将多模态大语言模型(MLLM)本身作为扩散 transformer 的条件信号,利用 MLLM 在噪声表示空间的输出引导 T2I 去噪过程,实现 LLM prior 的有效复用。 ...

2026年6月16日 · 11 分钟 · 5137 字 · elephantflow

ArXiv 每日精选 · 2026-06-14

📅 本期精选来自 2026-06-14 ArXiv 最新论文,聚焦世界模型、扩散模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 WEAVER: Better, Faster, Longer — An Effective World Model for Robotic Manipulation 链接: https://arxiv.org/abs/2606.13672 一句话总结: WEAVER 是一个多视角世界模型,通过 flow-matching 损失联合预测未来隐状态与奖励,同时实现高保真度、长时一致性与高效推理,在机器人操控任务上达到 SOTA。 ...

2026年6月15日 · 11 分钟 · 5243 字 · elephantflow

ArXiv 每日精选 · 2026-06-13

📅 本期精选来自 2026-06-13 ArXiv 最新论文,聚焦世界模型、扩散模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 WEAVER, Better, Faster, Longer: An Effective World Model for Robotic Manipulation 链接: https://arxiv.org/abs/2606.13672 一句话总结: WEAVER 是一个同时满足高保真度、长时序一致性与高效推理三大目标的机器人操作世界模型,在真实机器人上实现 38% 的策略性能提升。 ...

2026年6月14日 · 10 分钟 · 4909 字 · elephantflow