“分割一切”视频版来了:点几下鼠标,动态的人、物就圈出来了( 三 )


图 7c 展示了 DAVIS 2017 中的这些问题实例,图 9 展示了《降世神通:最后的气宗》片段中的其他实例 。

“分割一切”视频版来了:点几下鼠标,动态的人、物就圈出来了

文章插图
视频实例分割的结果
在相同的遮罩建议下,SAM-PT 明显优于 TAM,尽管 SAM-PT 没有在任何视频分割数据上训练 。TAM 是一个结合了 SAM 和 XMem 的并行方法,其中 XMem 在 BL30K 上进行了预训练,并在 DAVIS 和 YouTube-VOS 上进行了训练,但没有在 UVO 上训练 。
另一方面,SAM-PT 结合了 SAM 和 PIPS 点跟踪方法,这两种方法都没有经过视频分割任务的训练 。
更多详细内容,请参见论文原文 。

【“分割一切”视频版来了:点几下鼠标,动态的人、物就圈出来了】


推荐阅读