Meta AI 开源万物可分割 AI 模型(SAM)

meta,ai,开源,万物,分割,模型,sam · 浏览次数 : 1163

小编点评

**Segment Anything Model (SAM)** 是一个 AI 模型,可以根据文本指令等方式实现图像分割。它可以将图像分成各种对象,并可用于生成对象蒙版。 **主要特点:** - 可以根据文本指令等方式实现图像分割 - 11 万张图像和 1 亿个掩码数据集的训练 - 零镜头性能,在各种分割任务上具有强大的性能 - 通用的图像分割方法 **使用方法:** 1. 点击 Meta AI 官方网站的体验地址:segment-anything.com/demo 2. 按照说明上传图像 3. 选择物体并进行分割 **注意:** - 所有图像和从中派生的任何数据将在会话结束时删除 - 上传的任何图片均不得违反任何知识产权或 Facebook 社群守则

正文

开始

4 月 6 日,根据 Meta AI 官方博客,Meta AI 宣布推出了一个 AI 模型 Segment Anything Model(SAM,分割一切模型)。据介绍,该模型能够根据文本指令等方式实现图像分割,而且万物皆可识别和一键抠图。

github源码地址:facebookresearch/segment-anything

官方网站体验地址:segment-anything.com/demo

特点

Segment Anything Model (SAM) 根据输入提示(如点或框)生成高质量的对象蒙版,并可用于为图像中的所有对象生成蒙版。它已经在 11 万张图像和 1 亿个掩码的数据集上进行了训练,并且在各种分割任务上具有强大的零镜头性能。说到底是一种通用的图像分割方法。

初体验

进入官网体验地址后:点击同意条款和条件,大概意思是:

  1. 这是一个研究演示,不得用于任何商业目的
  2. 上传的任何图像将仅用于演示分段任何模型。所有图像和从中派生的任何数据将在会话结束时删除。
  3. 上传的任何图片均不得违反任何知识产权或 Facebook 社群守则。

进入上传界面:

点击“Upload an image”,上传自己的图片:(也可以直接使用官方的图片测试)
image

我上传完图片用时3分11秒,图片大小只有50多K。还有一张4M多的用时几乎差不太多,看来跟图片大小关系不是太大

Hover & Click——选取物体

基本操作:左键选择物体,右键移除选取
image

选取完之后,可以使用Cut out object,或则再点击Multi-mask再次点击选择标记点,可多次分割。

选完之后点击“Cut out object”,然后结果就保存再“Cut-Outs”一栏中。

Box——框选物体

基本操作:按住左键选出一个框框范围
image

保存所选区域的方法仍然是点击“Cut out object”。然后结果就保存再“Cut-Outs”一栏中。

Everything——分割所有物体

不用咱们操作了,直接交给AI处理,提取出所有可分割图形物体
image

所有物体的区域都保存在“Cut-Outs”一栏中:

Cut-Outs——结果提取

基本操作:只需要对Cut-Outs一栏的图片右键点击,并在弹出的菜单中选择“将图片另存为”即可。
image

结语

用起来感觉效果不错,毕竟本人不是做ps或者图片处理的,对图片的质量要求不算高,不过Meta开源了segment-anything框架,属实佩服,毕竟连数据集也可以进行下载,下载地址在github主页下方,目前已经21k+star。希望AI可以继续发展,让「玩具」变成工具
公众号

与Meta AI 开源万物可分割 AI 模型(SAM)相似的内容:

Meta AI 开源万物可分割 AI 模型(SAM)

4 月 6 日,根据 Meta AI 官方博客,Meta AI 宣布推出了一个 AI 模型 Segment Anything Model(SAM,分割一切模型)。据介绍,该模型能够根据文本指令等方式实现图像分割,而且万物皆可识别和一键抠图。

欢迎 Llama 3:Meta 的新一代开源大语言模型

介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本,现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋,我们也非常高兴地全力支持此次发布,并实现了与 Hugging Face 生态系统的深度集成。 Llama 3 提供两

微软开源 MS-DOS「GitHub 热点速览」

上周又是被「大模型」霸榜的一周,各种 AI、LLM、ChatGPT、Sora、RAG 的开源项目在 GitHub 上“争相斗艳”。这不 Meta 刚开源 Llama 3 没几天,苹果紧跟着就开源了手机端大模型:CoreNet。 GitHub 地址:github.com/apple/corenet 开

【转帖】千亿参数大模型首次被撬开!Meta复刻GPT-3“背刺”OpenAI,完整模型权重及训练代码全公布

https://cloud.tencent.com/developer/article/1991011 千亿级参数AI大模型,竟然真的能获取代码了?! 一觉醒来,AI圈发生了一件轰动的事情—— Meta AI开放了一个“重达”1750亿参数的大语言模型OPT-175B,不仅参数比GPT-3的3750

【转帖】Meta 推出大型语言模型 LLaMA,比 GPT3.5 性能更高

https://finance.sina.com.cn/wm/2023-02-28/doc-imyihfvp8075151.shtml ChatGPT 的爆火使得大家对 AI 进行了深度的讨论,大厂们也都在向公众展示他们所谓的 "生成性人工智能"已经准备好进入黄金时代。 近日,Meta 宣布推出大型

[转帖]NVIDIA超级AI服务器NVIDIA DGX GH200性能介绍

https://zhuanlan.zhihu.com/p/633219396 2023 年 5 月 28 日NVIDIA宣布推出 NVIDIA DGX GH200,这是首款 100 TB级别的GPU 内存系统。据英伟达称,Meta、微软和谷歌已经部署了这些集群,预计在 2023 年底之前全面上市。

技术速览|Meta Llama 2 下一代开源大型语言模型

Meta Llama 2 旨在与 OpenAI 的 ChatGPT 和 Google Bard 等其他著名语言模型对标,但又具有独特优势。在本文中,我们将聊聊 Llama 2 是什么、它的优势是什么、是如何开发的、以及如何开始上手使用。

HBase Meta 元信息表修复实践

HBase是一款开源高可靠、高可扩展性、高性能的分布式非关系型数据库,广泛应用于大数据处理、实时计算、数据存储和检索等领域。在分布式集群中,硬件故障是一种常态,硬件故障可能导致节点或者集群级别服务中断、meta表损坏、RIT、Region空洞、重叠等问题,如何快速修复故障恢复业务尤其重要,本文章主要...

轻松玩转70亿参数大模型!借助Walrus在AWS上部署Llama2

Llama 2 是 Meta 的下一代开源大语言模型。它是一系列经过预训练和微调的模型,参数范围从 70 亿到 700 亿个。Meta Llama 2 可免费用于研究和商业用途并且提供了一系列具有不同大小和功能的模型,因此一经发布备受关注。在[之前的文章](https://www.cnblogs.c

基于Llama2模型的开源模型

2023年7月18日Meta开源了Llama2,在2万亿个Token上训练,可用于商业和研究,包括从7B到70B模型权重、预训练和微调的代码。相比Llama1,Llama2有较多提升,评估结果如下所示: 基于Llama2模型的开源模型如下所示: 1.WizardCoder Python V1.0 h