ArXiv 每日精选 · 2026-03-10

📅 本期精选来自 2026-03-10 ArXiv 最新论文,聚焦世界模型、视频生成、扩散模型、具身AI等核心方向,共 8 篇。 📄 论文精选 Interactive World Simulator for Robot Policy Training and Evaluation 链接: https://arxiv.org/abs/2603.08546 一句话总结: 基于一致性模型构建的交互式世界模型,能在单张 RTX 4090 上以 15 FPS 稳定运行超过 10 分钟,并支持使用世界模型生成的数据训练出媲美真实数据水平的模仿策略。 ...

2026年3月11日 · 10 分钟 · 4886 字 · elephantflow

ArXiv 每日精选 · 2026-03-08

📅 本期精选来自 2026-03-08 ArXiv 最新论文,聚焦世界模型、扩散模型、视频生成、具身AI等核心方向,共 8 篇。 📄 论文精选 RealWonder: Real-Time Physical Action-Conditioned Video Generation 链接: https://arxiv.org/abs/2603.05449 一句话总结: 首个支持物理动作条件的实时视频生成系统,以物理仿真为桥梁,仅需 4 步扩散即可在 480×832 分辨率下达到 13.2 FPS。 ...

2026年3月9日 · 10 分钟 · 4808 字 · elephantflow

ArXiv 每日精选 · 2026-03-06

📅 本期精选来自 2026-03-06 ArXiv 最新论文,聚焦视频生成、具身AI、机器人运动生成、多模态理解等核心方向,共 8 篇。 📄 论文精选 CalibAtt: Accelerating Text-to-Video Generation with Calibrated Sparse Attention 链接: https://arxiv.org/abs/2603.05503 一句话总结: 提出一种无需训练的稀疏注意力加速方法,在不损失视频质量的前提下,将 Wan 2.1 14B 等主流视频生成模型的推理速度提升至多 1.58 倍。 ...

2026年3月7日 · 11 分钟 · 5222 字 · elephantflow