視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品-人工智慧-PHP中文網

无需额外训练

One More Thing

首頁

科技週邊

人工智慧

視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品

王林

Apr 12, 2023 pm 05:31 PM

ai 模型

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

现在AI圈确实到了拼手速的时候啊。

这不，Meta的SAM刚刚推出几天，就有国内程序猿来了波buff叠加，把目标检测、分割、生成几大视觉AI功能all in one！

比如基于Stable Diffusion和SAM，就能让照片中的椅子无缝换成沙发：

視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品

换装、换发色也是so easy：

視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品

项目一经发布就让不少人惊呼：手速也太快了吧！

視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品

还有人表示：我和新垣结衣的新结婚照有了。

視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品

如上就是Gounded-SAM带来的效果，项目在GitHub上已揽星1.8k。

简单来说，这就是一个zero-shot视觉应用，只需要输入視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品，就能自动化检测和分割图像。

该研究来自IDEA研究院（粤港澳大湾区数字经济研究院），创始人兼理事长为沈向洋。

无需额外训练

Grounded SAM主要由Grounding DINO和SAM两个模型组成。

其中SAM（Segment Anything）是4天前Meta刚刚推出的零样本分割模型。

它可以为图像/视频中的任何物体生成mask，包括训练过程中没出现过的物体和图像。

通过让SAM对于任何提示都返回有效的mask，能够让模型在即使提示是模糊的或者指向多个对象的情况下，输出也应该是所有可能中一个合理的mask。这一任务用于预训练模型并通过提示解决一般的下游分割任务。

模型框架主要由一个图像编码器、一个提示编码器和一个快速mask解码器组成。在计算图像嵌入后，SAM能够在50毫秒内根据web中的任何提示生成一个分割。

視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品

Grounding DINO是该研究团队已有的成果。

这是一个零样本检测模型，能够生成带有文字描述的物体box和标签。

視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品

二者结合后，可以通过文本描述找到視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品中的任意物体，然后通过SAM强大的分割能力，细粒度地分割出mask.

視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品

在这些能力之上，他们还叠加了Stable Diffusion的能力，也就是开头所展示的可控图像生成。

值得一提的是，Stable Diffusion此前也能够实现类似功能。只要涂抹掉想替换的图像元素，再输入文本提示就可以。

这一回，Grounded SAM能够省去手动选区这个步骤，直接通过文本描述来控制。

另外结合BLIP（Bootstrapping Language-Image Pre-training），生成視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品标题、提取标签，再生成物体box和mask。

目前，还有更多有趣的功能正在开发中。

比如人物方面的一些拓展：更换衣服、发色、肤色等。

視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品

具体食用方法也已在GitHub上给出。项目需要Python 3.8以上版本，pytorch 1.7以上版本，torchvision 0.8以上版本，并要安装相关依赖项。具体内容可看GitHub项目页。

该研究团队来自IDEA研究院（粤港澳大湾区数字经济研究院）。

公开消息显示，该研究院是一所面向人工智能、数字经济产业及前沿科技的国际化创新型研究机构，前微软亚研院首席科学家、前微软全球智行副总裁沈向洋博士担任创始人及理事长。

One More Thing

对于Grounded SAM的未来工作，团队有几点展望：

自动生成图像构成新数据集
具有分割预训练的强大基础模型
和（Chat-）GPT合作
构成一个自动生成图像标签、box和mask的pipeline，并能生成新的图像。

值得一提的是，该项目的团队成员中，有不少都是知乎AI领域活跃的答主，这次也在知乎上自答了关于Grounded SAM的内容，感兴趣的童鞋可以去留言请教~

視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品

以上是視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7541

CakePHP 教程

1381

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

Debian郵件服務器防火牆配置技巧 Apr 13, 2025 am 11:42 AM

配置Debian郵件服務器的防火牆是確保服務器安全性的重要步驟。以下是幾種常用的防火牆配置方法，包括iptables和firewalld的使用。使用iptables配置防火牆安裝iptables（如果尚未安裝）：sudoapt-getupdatesudoapt-getinstalliptables查看當前iptables規則：sudoiptables-L配置

debian readdir如何與其他工具集成 Apr 13, 2025 am 09:42 AM

Debian系統中的readdir函數是用於讀取目錄內容的系統調用，常用於C語言編程。本文將介紹如何將readdir與其他工具集成，以增強其功能。方法一：C語言程序與管道結合首先，編寫一個C程序調用readdir函數並輸出結果：#include#include#includeintmain(intargc,char*argv[]){DIR*dir;structdirent*entry;if(argc!=2){

debian readdir如何實現文件排序 Apr 13, 2025 am 09:06 AM

在Debian系統中，readdir函數用於讀取目錄內容，但其返回的順序並非預先定義的。要對目錄中的文件進行排序，需要先讀取所有文件，再利用qsort函數進行排序。以下代碼演示瞭如何在Debian系統中使用readdir和qsort對目錄文件進行排序：#include#include#include#include//自定義比較函數，用於qsortintcompare(constvoid*a,constvoid*b){returnstrcmp(*(

Debian OpenSSL如何進行數字簽名驗證 Apr 13, 2025 am 11:09 AM

在Debian系統上使用OpenSSL進行數字簽名驗證，可以按照以下步驟操作：準備工作安裝OpenSSL：確保你的Debian系統已經安裝了OpenSSL。如果沒有安裝，可以使用以下命令進行安裝：sudoaptupdatesudoaptinstallopenssl獲取公鑰：數字簽名驗證需要使用簽名者的公鑰。通常，公鑰會以文件的形式提供，例如public_key.pe

Debian郵件服務器SSL證書安裝方法 Apr 13, 2025 am 11:39 AM

在Debian郵件服務器上安裝SSL證書的步驟如下：1.安裝OpenSSL工具包首先，確保你的系統上已經安裝了OpenSSL工具包。如果沒有安裝，可以使用以下命令進行安裝：sudoapt-getupdatesudoapt-getinstallopenssl2.生成私鑰和證書請求接下來，使用OpenSSL生成一個2048位的RSA私鑰和一個證書請求（CSR）：openss

centos關機命令行 Apr 14, 2025 pm 09:12 PM

CentOS 關機命令為 shutdown，語法為 shutdown [選項] 時間 [信息]。選項包括：-h 立即停止系統；-P 關機後關電源；-r 重新啟動；-t 等待時間。時間可指定為立即 (now)、分鐘數 ( minutes) 或特定時間 (hh:mm)。可添加信息在系統消息中顯示。

Debian OpenSSL如何防止中間人攻擊 Apr 13, 2025 am 10:30 AM

在Debian系統中，OpenSSL是一個重要的庫，用於加密、解密和證書管理。為了防止中間人攻擊（MITM），可以採取以下措施：使用HTTPS：確保所有網絡請求使用HTTPS協議，而不是HTTP。 HTTPS使用TLS（傳輸層安全協議）加密通信數據，確保數據在傳輸過程中不會被竊取或篡改。驗證服務器證書：在客戶端手動驗證服務器證書，確保其可信。可以通過URLSession的委託方法來手動驗證服務器

Debian Hadoop日誌管理怎麼做 Apr 13, 2025 am 10:45 AM

在Debian上管理Hadoop日誌，可以遵循以下步驟和最佳實踐：日誌聚合啟用日誌聚合：在yarn-site.xml文件中設置yarn.log-aggregation-enable為true，以啟用日誌聚合功能。配置日誌保留策略：設置yarn.log-aggregation.retain-seconds來定義日誌的保留時間，例如保留172800秒（2天）。指定日誌存儲路徑：通過yarn.n

See all articles

視覺AI能力大一統！自動化影像偵測分割，還能可控文生圖，華人團隊出品

无需额外训练

One More Thing

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題