社群

學習

工具庫

AI工具

休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > 蘋果展示 AI 新模型 MGIE，可一句話精修圖片

蘋果展示 AI 新模型 MGIE，可一句話精修圖片

PHPz

發布： 2024-02-08 11:33:25

轉載

1333 人瀏覽過

苹果展示 AI 新模型 MGIE，可一句话精修图片

2 月8 日訊息，相比較微軟的風生水起，蘋果公司在AI 領域的佈局顯得低調很多，但這並不意味著蘋果在該領域就沒有絲毫建樹。 蘋果公司近日發布了名為「MGIE」的新型開源人工智慧模型，它可以根據自然語言指令編輯圖像。

苹果展示 AI 新模型 MGIE，可一句话精修图片

圖源：VentureBeat 與Midjourney 合作製作

MGIE（MLLM-Guided Image Editing）是一種利用多模態大型語言模型（MLLM）解釋使用者指令並執行像素級操作的技術。它能夠理解使用者的自然語言命令，並進行類似Photoshop的修改、全域照片最佳化和局部編輯等操作。透過MGIE，使用者可以輕鬆地對圖片進行各種編輯，而無需熟悉複雜的影像處理軟體。這項技術在簡化影像編輯流程的同時，也提供了更直觀和高效的編輯方式。

苹果展示 AI 新模型 MGIE，可一句话精修图片

蘋果公司與加州大學聖塔芭芭拉分校的研究人員合作，在2024年國際學習表徵會議（ICLR）上公佈了與MGIE相關的研究成果。 ICLR是人工智慧研究領域中最重要的會議之一。

在介紹 MGIE 之前，本站先來簡單介紹 MLLM（Multimodal Language Learning Model）。 MLLM 是一種強大的人工智慧模型，其獨特之處在於可以同時處理文字和圖像，從而增強了基於指令的圖像編輯能力。 MLLM 在跨模態理解和視覺感知反應生成方面表現出卓越的能力，然而，目前尚未廣泛應用於影像編輯任務。

苹果展示 AI 新模型 MGIE，可一句话精修图片

MGIE 透過兩種方式將 MLLMs 整合到影像編輯過程中：其一，利用 MLLMs 從使用者輸入推導出精確而富有表現力的指令。這些指令既簡潔又明了，為編輯過程提供了清晰的指引。

例如，當輸入「讓天空更藍」時，MGIE 可以產生「將天空區域的飽和度提高 20%」的指令。

其次，它使用 MLLM 產生視覺想像力，即所需編輯的潛在表徵。這項表徵捕捉了編輯的本質，可用來指導像素級操作。 MGIE 採用了一種新穎的端到端訓練方案，可聯合優化指令推導、視覺想像和影像編輯模組。

苹果展示 AI 新模型 MGIE，可一句话精修图片

MGIE 可以處理各種編輯情況，從簡單的顏色調整到複雜的物件操作。該模型還可以根據使用者的偏好執行全域和局部編輯。 MGIE 的部分特性和功能包括：

基於指令的表達式編輯：MGIE 可以產生簡潔明了的說明，有效地指導編輯過程。這不僅能提高編輯質量，還能增強使用者的整體體驗。
Photoshop 風格修改：MGIE 可以執行常見的 Photoshop 風格編輯，例如裁剪、調整大小、旋轉、翻轉和添加濾鏡。該模型還可以應用更高級的編輯，例如更改背景、添加或刪除物件以及混合圖像。
全域照片優化：MGIE 可以優化照片的整體質量，如亮度、對比度、清晰度和色彩平衡。該模型還能應用素描、繪畫和漫畫等藝術效果。
局部編輯：MGIE 可以編輯影像中的特定區域或對象，如臉部、眼睛、頭髮、衣服和配件。模型還可以修改這些區域或物件的屬性，如形狀、大小、顏色、紋理和風格。

苹果展示 AI 新模型 MGIE，可一句话精修图片

MGIE 是 GitHub 上的一個開源項目，使用者可以點擊這裡找到程式碼、資料和預訓練模型。該專案還提供了一個演示筆記本，展示如何使用 MGIE 完成各種編輯任務。

#

以上是蘋果展示 AI 新模型 MGIE，可一句話精修圖片的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

蘋果 ai

上一篇：通義千問再開源，Qwen1.5帶來六種體量模型，表現超越GPT3.5 下一篇：ICLR 2024 | 首個零階優化深度學習框架，MSU聯合LLNL提出DeepZero

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

ASFAFASFASFASFASF

2025-02-28 14:37:10
不受歡迎的意見：成為一名好數據科學家比以往任何時候都更難

2025-02-26 03:55:10
DeepSeek-V3解釋了1：多頭潛在註意力

2025-02-26 03:00:17
如何使用Verifai輕鬆部署本地生成搜索引擎

2025-02-25 23:04:13
了解chatgpt的演變：第2部分＆＃8211; GPT-2和GPT-3

2025-02-25 21:02:11
為什麼在長篇小說模型的時代仍然有意義

2025-02-25 19:31:14
超越因果語言建模

2025-02-25 18:28:09
LLMS合成數據生成

2025-02-25 16:54:10
如何重置YouTube算法

2025-02-24 12:34:11
4個智能用途用於舊的Mac

2025-02-24 12:29:09

最新問題

模板在哪裡呢?

來自於 1970-01-01 08:00:00

0

0

0

如何使用Google Vertext AI Vision API建立一個簡單的網站，將使用者提交的圖片轉換為文字。

來自於 1970-01-01 08:00:00

0

0

0

如何在 Windows/Linux 上使用環境變數..？

來自於 1970-01-01 08:00:00

0

0

0

Reactjs中的UI沒有被更新

來自於 1970-01-01 08:00:00

0

0

0

java - springboot新手學習

來自於 1970-01-01 08:00:00

0

0

0

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1436580
php入門教程之一週學會PHP

4295934
JAVA 初級入門影片教學

2660715
小甲魚零基礎入門學習Python影片教學

516346
PHP 零基礎入門教學

876978

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板