跳到主要内容

Sapiens2

2026年5月5日 · 阅读需 1 分钟

GoCoding

Sapiens2: 1K resolution vision transformers pretrained on 1B human images.

for human-centric tasks: pose estimation, body-part segmentation, surface normals, and pointmaps.

Sapiens2: Meta AI 提出的人体中心的视觉基础模型。

10亿张人体图像预训练，参数量 0.1B~5B，原生支持 1K 分辨率（4K 变体支持超高清）
任务：姿态估计、人体部位分割、表面法线、点图

https://github.com/facebookresearch/sapiens2