动作生成 | ElephantFlow's Blog

ArXiv 每日精选 · 2026-03-31

📅 本期精选来自 2026-03-31 ArXiv 最新论文，聚焦扩散模型多样性、双手动作生成、机器人强化学习奖励、端侧生成模型等核心方向，共 7 篇。 📄 论文精选 HandX: Scaling Bimanual Motion and Interaction Generation 链接： https://arxiv.org/abs/2603.28766 ...

ArXiv 每日精选 · 2026-03-30

📅 本期精选来自 2026-03-30 ArXiv 最新论文，聚焦视频生成、扩散模型、动作生成、视觉语言模型等核心方向，共 7 篇。 📄 论文精选 Generation Is Compression: Zero-Shot Video Coding via Stochastic Rectified Flow 链接： https://arxiv.org/abs/2603.26571 一句话总结：将预训练视频生成模型直接用作视频编解码器，无需重训练，在 0.002 bpp 以下实现高质量视频压缩。 ...

ArXiv 每日精选 · 2026-03-22

📅 本期精选来自 2026-03-22 ArXiv 最新论文，聚焦扩散模型、具身智能、动作生成、视频生成与编辑等核心方向，共 8 篇。 📄 论文精选 VEGA-3D: Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding 链接： https://arxiv.org/abs/2603.19235 一句话总结：将预训练视频扩散模型重新定位为"隐式空间编码器"，通过提取其中间层特征增强多模态大模型的几何感知与具身操控能力。 ...

ArXiv 每日精选 · 2026-03-16

📅 本期精选来自 2026-03-16 ArXiv 最新论文，聚焦扩散模型、世界模型、视频生成、具身AI等核心方向，共 8 篇。 📄 论文精选 PhysMoDPO: Physically-Plausible Humanoid Motion with Preference Optimization 链接： https://arxiv.org/abs/2603.13228 一句话总结：提出 PhysMoDPO 框架，将 Direct Preference Optimization 引入扩散模型训练，使文本驱动的人形动作生成在物理可行性和语义保真度上同时达到 SOTA，并在真实 G1 人形机器人上完成零样本迁移部署。 ...

ArXiv 每日精选 · 2026-03-05

📅 本期精选来自 2026-03-05 ArXiv 最新论文，聚焦视频生成、扩散模型、具身AI、3D生成等核心方向，共 7 篇。 📄 论文精选 Helios: Real Real-Time Long Video Generation Model 链接： https://arxiv.org/abs/2603.04379 一句话总结： Helios 是首个在单张 H100 GPU 上以 19.5 FPS 实时生成分钟级视频的 14B 自回归扩散模型，同时保持与强基线相当的生成质量。 ...