SAM适配下游任务的探究:SAM Adapter

sam,适配,下游,任务,探究,adapter · 浏览次数 : 26

小编点评

**SAM适配下游任务的探究** **作者:Hint** **摘要** 本文介绍了一个名为SAM Adapter的 adapter 模块,它可以用来在不微调SAM网络的情况下,通过简单而有效的适配器,将领域特定的信息或视觉提示注入到分割网络中,从而提高SAM在特定任务上的性能。 **方法** 作者设计了一个 Adapter 模块,它可以在不微调SAM网络的情况下,通过简单而有效的适配器,将领域特定的信息或视觉提示注入到分割网络中。该方法使用了Adaptor模块,用于引入特殊任务的知识,辅助微调模型。 **实验结果** 作者在多个数据集上进行了广泛的实验,包括ISTD阴影检测数据集、COD10K、CHAMELEON和CAMO伪装物体检测数据集以及kvasir-SEG息肉分割(医学图像分割)数据集。实验结果表明,SAM-Adapter不仅显著提升了SAM的性能,而且在这些任务上达到了最先进的水平。 **结论** SAM-Adapter是一种可以显著提升SAM性能的 adapter 模块,它可以在不微调SAM网络的情况下,通过简单而有效的适配器,将领域特定的信息或视觉提示注入到分割网络中。实验结果表明,该方法的性能在下游任务中达到SOTA效果。 **参考文献** * Kirillov A, Mintun E, Ravi N, et al. Segment anything[J]. arXiv preprint arXiv:2304.02643, 2023. * Chen T, Zhu L, Ding C, et al. SAM Fails to Segment Anything?--SAM-Adapter: Adapting SAM in Underperformed Scenes: Camouflage, Shadow, and More[J]. arXiv preprint arXiv:2304.09148, 2023. 

正文

本文分享自华为云社区《SAM适配下游任务的探究:SAM Adapter》,作者:Hint。

近期大模型的涌现给AI研究带来显著的发展,META的工作Segment Anything(SAM),就是其中一个为图像分割任务设计的基础大模型。SAM是一种交互型的图像分割大模型,通过提供的prompt如点、框、文本描述等粗略的提示,就可以分割出图像中指定的目标,其demo的效果十分惊艳。然而在某些特殊场景的图片上并不会带来如此惊艳的效果,可能是由训练数据的差异性导致,比如阴影检测、伪装目标检测。但SAM强大的分割能力依然可以作为我们微调模型的基础,更好地为下游任务服务。

本文介绍的方法SAM Adapter[2],设计了一个Adapter模,它可以在不微调SAM网络的情况下,通过简单而有效的适配器,将领域特定的信息或视觉提示注入到分割网络中,从而提高SAM在特定任务上的性能。该论文在多个任务和数据集上进行了广泛的实验,包括ISTD阴影检测数据集、COD10K、CHAMELEON和CAMO伪装物体检测数据集,以及kvasir-SEG息肉分割(医学图像分割)数据集。实验结果表明,SAM-Adapter不仅显著提升了SAM的性能,而且在这些任务上达到了最先进的水平。

如上图所示,该模型使用了SAM的Image Encoder和Masked Decoder,其中Image Encoder冻结了参数,Decoder是参与梯度回传的。这样可以有效利用SAM已经预训练好的分割能力,同时Decoder更新参数以适配下游任务。此外作者引入了Adaptor模块,用于引入特殊任务的知识,辅助微调模型。Adaptor的网络结构仅有两层MLP层构成,其输入的知识可以是多种多样的,对于文中的任务,其输入可以是纹理信息或者是频率信息等。各种信息用下面的权重来均衡。

作者在多个数据集上进行实验,从以下的实验结果来看,该方法的性能在下游任务中达到SOTA效果,相比原始的SAM提升效果显著,作者也证明了Adaptor模块的有效性。

[1]Kirillov A, Mintun E, Ravi N, et al. Segment anything[J]. arXiv preprint arXiv:2304.02643, 2023.

[2]Chen T, Zhu L, Ding C, et al. SAM Fails to Segment Anything?--SAM-Adapter: Adapting SAM in Underperformed Scenes: Camouflage, Shadow, and More[J]. arXiv preprint arXiv:2304.09148, 2023.

 

点击关注,第一时间了解华为云新鲜技术~

 

与SAM适配下游任务的探究:SAM Adapter相似的内容:

SAM适配下游任务的探究:SAM Adapter

SAM-Adapter不仅显著提升了SAM的性能,而且在这些任务上达到了最先进的水平。

程序员转做产品第一试--供应链计划

一:供应链开发的背景 1、作者就职的公司在某行业迅猛的发展,为了实现价值链的目标,公司提出了数字化,智能化,智慧化的IT,OT规划。 主线围绕着《基础信息领域》,《产品研发领域》,《供应链领域》,《智能制造领域》四个方面开展。 其中每个领域下有相当多的子系统支撑,我枚举几个主要的系统。 基础信息领域

Schillace 定律 背后的 Sam Schillace

微软semantic-kernel(SK)团队发布了一篇博客文章:Early Lessons From GPT-4: The Schillace Laws[1] ,微软的CVP , Deputy CTO Sam Schillace 根据他在GPT-4方面的经验制定了使用LLM创建软件的九项原则,称之

Meta AI 开源万物可分割 AI 模型(SAM)

4 月 6 日,根据 Meta AI 官方博客,Meta AI 宣布推出了一个 AI 模型 Segment Anything Model(SAM,分割一切模型)。据介绍,该模型能够根据文本指令等方式实现图像分割,而且万物皆可识别和一键抠图。

[转帖]GraphQL及元数据驱动架构在后端BFF中的实践

https://tech.meituan.com/2021/05/06/bff-graphql.html 1 BFF的由来 BFF一词来自Sam Newman的一篇博文《Pattern:Backends For Frontends》,指的是服务于前端的后端。BFF是解决什么问题的呢?据原文描述,随着

[转帖]FTX 宣布申请破产,硅谷风投近 20 亿美元或打水漂

https://www.ithome.com/0/653/348.htm IT之家 11 月 12 日消息,当地时间周五,加密货币交易平台 FTX 宣布,已在美国启动破产程序。 FTX 在一份声明中表示,CEO Sam Bankman-Fried 已经辞职,但将继续留在公司,协助公司有序过渡。此外,

抠图党福音:教你一键分割图像

摘要:输入一个图像,通过Segment Anything模型即可获得图像所有目标的分割点位置,再通过位置将图像进行分割保存。 本文分享自华为云社区《一键分割图像》,作者:雨落无痕 。 Segment Anything Segment Anything Model(SAM)通过点或框等输入提示生成高质