SAM模型加速变体EdgeSAM 比原始SAM提速40倍
SAM模型加速变体EdgeSAM 比原始SAM提速40倍
登录
SAM模型加速变体EdgeSAM 比原始SAM提速40倍
SAM模型加速变体EdgeSAM 比原始SAM提速40倍

SAM模型加速变体EdgeSAM 比原始SAM提速40倍

12月14日 消息:EdgeSAM是一个优化过的SAM变体,相比原始SAM实现了40倍的速度提升,对性能的影响较小,可以在iPhone14上以30帧每秒的速度运行。

该方法将原始的基于ViT的SAM图像编码器提炼成纯CNN架构,更适合边缘设备。通过仔细评估各种提炼策略,研究人员证明了任务不可知的编码器提炼无法捕捉SAM所蕴含的全部知识。

SAM模型加速变体EdgeSAM 比原始SAM提速40倍

地址:htt[]ps://m[]mlab-n[]tu.git[]hub.io[]/proje[]ct/edg[]esam/

为了克服这一[]瓶颈,他们在[]提炼过程中包[]括了提示编码[]器和蒙版解码[]器,循环中还[]有框和点提示[],以便提炼模[]型能够准确捕[]捉用户输入和[]蒙版生成之间[]的复杂动态。[]此外,为了减[]轻点提示提炼[]带来的数据集[]偏差问题,研[]究人员在编码[]器中加入了一[]个轻量级模块[]

关键的见解是[]在知识蒸馏过[]程中考虑提示[],以便学生模[]型接收任务特[]定的指导,并[]专注于更难的[]训练目标,比[]如更精细的边[]界。

为此,引入了一种动态提示采样策略,旨在实现三个关键目标:从初始提示(无论是框还是点)动态生成多样化的提示组合,准确识别学生模型在掩模内表现不准确的区域,从而引导其专注于这些特定的部分,并促使教师模型,即SAM,产生更高质量的掩模,以提供更精确的指导。

    版权归属: noBug
    本文链接: https://wucuo.com/post/48
    相关推荐

    评论区

    提示:本文章评论功能已关闭