ArXiv 每日精选 · 2026-06-22

📅 本期精选来自 2026-06-22 ArXiv 最新论文,聚焦世界模型、扩散模型、3D生成、具身智能等核心方向,共 8 篇。 📄 论文精选 Current World Models Lack a Persistent State Core 链接: https://arxiv.org/abs/2606.20545 一句话总结: 提出 WRBench 基准,首次系统性诊断当前世界模型的核心缺陷——无法维持「离开视野后仍持续演化」的持久状态,揭示了通向 AGI 的关键技术空白。 ...

2026年6月23日 · 12 分钟 · 5584 字 · elephantflow

ArXiv 每日精选 · 2026-06-21

📅 本期精选来自 2026-06-21 ArXiv 最新论文(对应 2026-06-19 提交批次),聚焦世界模型、扩散/流模型、自回归生成、具身 AI 等核心方向,共 7 篇。 📄 论文精选 Current World Models Lack a Persistent State Core 链接: https://arxiv.org/abs/2606.20545 ...

2026年6月22日 · 11 分钟 · 5249 字 · elephantflow

ArXiv 每日精选 · 2026-06-19

📅 本期精选来自 2026-06-19 ArXiv 最新论文,聚焦世界模型、扩散/流匹配模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 MemoryWAM: Efficient World Action Modeling with Persistent Memory 链接: https://arxiv.org/abs/2606.20562 一句话总结: 提出带持久记忆的高效世界-动作模型,通过混合记忆机制解决机器人长视野操控中的非马尔可夫问题,同时保持推理效率。 ...

2026年6月20日 · 11 分钟 · 5219 字 · elephantflow

ArXiv 每日精选 · 2026-06-17

📅 本期精选来自 2026-06-17 ArXiv 最新论文,聚焦世界模型、多模态生成、运动生成、具身AI与机器人策略等核心方向,共 7 篇。 📄 论文精选 FR3D: Future Dynamic 3D Reconstruction: A 3D World Model with Disentangled Ego-Motion 链接: https://arxiv.org/abs/2606.18250 ...

2026年6月18日 · 10 分钟 · 4558 字 · elephantflow

ArXiv 每日精选 · 2026-06-16

📅 本期精选来自 2026-06-16 ArXiv 最新论文,聚焦世界模型、视频生成、具身AI、机器人操控、扩散模型等核心方向,共 8 篇。 📄 论文精选 Qwen-RobotWorld Technical Report: Unifying Embodied World Modeling through Language-Conditioned Video Generation 链接: https://arxiv.org/abs/2606.17030 ...

2026年6月17日 · 11 分钟 · 5397 字 · elephantflow

ArXiv 每日精选 · 2026-06-15

📅 本期精选来自 2026-06-15 ArXiv 最新论文,聚焦扩散模型、视频生成、具身AI、视觉语言模型等核心方向,共 8 篇。 📄 论文精选 RepFusion: Leveraging Multimodal Priors for Denoising in Representation Space 链接: https://arxiv.org/abs/2606.14700 一句话总结: 将多模态大语言模型(MLLM)本身作为扩散 transformer 的条件信号,利用 MLLM 在噪声表示空间的输出引导 T2I 去噪过程,实现 LLM prior 的有效复用。 ...

2026年6月16日 · 11 分钟 · 5137 字 · elephantflow

ArXiv 每日精选 · 2026-06-14

📅 本期精选来自 2026-06-14 ArXiv 最新论文,聚焦世界模型、扩散模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 WEAVER: Better, Faster, Longer — An Effective World Model for Robotic Manipulation 链接: https://arxiv.org/abs/2606.13672 一句话总结: WEAVER 是一个多视角世界模型,通过 flow-matching 损失联合预测未来隐状态与奖励,同时实现高保真度、长时一致性与高效推理,在机器人操控任务上达到 SOTA。 ...

2026年6月15日 · 11 分钟 · 5243 字 · elephantflow

ArXiv 每日精选 · 2026-06-13

📅 本期精选来自 2026-06-13 ArXiv 最新论文,聚焦世界模型、扩散模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 WEAVER, Better, Faster, Longer: An Effective World Model for Robotic Manipulation 链接: https://arxiv.org/abs/2606.13672 一句话总结: WEAVER 是一个同时满足高保真度、长时序一致性与高效推理三大目标的机器人操作世界模型,在真实机器人上实现 38% 的策略性能提升。 ...

2026年6月14日 · 10 分钟 · 4909 字 · elephantflow

ArXiv 每日精选 · 2026-06-12

📅 本期精选来自 2026-06-12 ArXiv 最新论文,聚焦世界模型、扩散模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 WEAVER, Better, Faster, Longer: An Effective World Model for Robotic Manipulation 链接: https://arxiv.org/abs/2606.13672 一句话总结: 提出 WEAVER 世界模型架构,同时满足高保真度、长时序一致性与推理效率三大需求,在真实机器人操作任务上取得 SOTA 表现。 ...

2026年6月13日 · 10 分钟 · 4571 字 · elephantflow

ArXiv 每日精选 · 2026-06-11

📅 本期精选来自 2026-06-11 ArXiv 最新论文,聚焦世界模型、扩散策略、具身AI、视频生成等核心方向,共 7 篇。 📄 论文精选 World Pilot: Steering Vision-Language-Action Models with World-Action Priors 链接: https://arxiv.org/abs/2606.12403 一句话总结: 通过世界动作模型(WAM)生成的"预见"先验,从感知与动作两条路径同时增强 VLA,实现更强的跨域泛化能力。 ...

2026年6月12日 · 10 分钟 · 4575 字 · elephantflow