Arxiv CV 每日精选 · 2026-03-04

本文精选 2026-03-04 Arxiv 计算机视觉方向高价值论文 16 篇,涵盖 3D 视觉、扩散模型、多模态大模型、视频生成等方向,附核心创新点与工程借鉴价值分析。 📊 方向分布 细分方向 论文数 3D 视觉 5 多模态视觉语言模型 5 视频生成 / 人体动作 3 扩散模型 / 生成模型 1 目标检测 / 异常检测 1 视觉-语言-动作模型 1 🧊 3D 视觉 1. Utonia — 面向所有点云的统一编码器 英文标题: Toward One Encoder for All Point Clouds (Utonia) 发表状态: CVPR 2026 相关项目 论文链接: arxiv.org/abs/2603.03283 ...

2026年3月5日 · 8 分钟 · 3956 字 · elephantflow