目錄
「prompt 工程」的輸入短語不有趣嗎?
是什麼造成了這種現象?
與藝術 AI 的交流就像一個文字遊戲
首頁 科技週邊 人工智慧 目前prompt工程太像占卜了,與藝術AI溝通就像文字遊戲

目前prompt工程太像占卜了,與藝術AI溝通就像文字遊戲

Apr 11, 2023 pm 08:29 PM
工程

給AI 繪畫工具Midjourney 輸入「吃豆人遊戲介面,吃豆人,鬼魂,墨色,眨眼,克萊德,吃豆迷宮,吃豆,蒙德里安風格,現代藝術,現代主義,綻放」後得到的畫面。

「prompt 工程」的輸入短語不有趣嗎?

當你向AI 繪畫工具(如DALL-E 或Midtravel)輸入文字prompt 以使其產生圖片,或要求自動產生程式碼的AI 工具-Copilot 編寫一些軟體時,它們得到的結果可以稱得上是藝術品。

我們可以將這個過程稱為「工程」,聽起來似乎很精確,也很合乎邏輯。但如果你去Discord 平台上查看人們在Midjourney 應用中輸入的prompt,你會看到這樣的內容:

galaxy arising from a brain, 8k, octane render, micro detailed — upbeta — test — creative

my teeth are yellow, hello world :: would you like me a little better if they were white like yours — s 5000 — q 2 — upbeta — v 3

hg giger lovecraft nightmarish realm where monsters eternally reign terror

#chaos corrupted the once valor knight, transforming them into a##chaos corrupted the once valor knight, transforming them into powerful villian. Horns bursted from their heads, wing and tails grew from their sides, fingers and toes grew into claws. this is what does the void does. this is how life loses….

講道理寫prompt 肯定有一種正確的姿勢,現實是往往寫起來感覺又無跡可尋,就像是使用魔法咒語的時候,不小心就會把魔咒裡的單字放錯了地方,很容易就把事情搞砸了

說得搞笑點,寫 prompt 似乎就像人類試圖哄騙「一隻急切又困惑的馱運動物」來幹活。我們認為它明白我們在說什麼,但溝通方式卻是大喊大叫,亂跑亂跳。

是什麼造成了這種現象?

可以說現在是人工智慧史上一個非常奇怪的時刻。幾十年來,人工智慧在圖靈測試的「陰影」下不斷進步(並非總是如此,但經常如此),圖靈測試認為「聰明」人工智慧的行為和溝通方式與聰明人完全一樣。

根據圖靈的想法,比如說​​,如果一個人工生命體能夠討論當前發生的事件,那麼它就可以被認為是智慧的。近年來,我們將這種清晰、精確、自然的語言期望擴展到日常設備:與蘋果 Siri 和亞馬遜 Alexa 交談,詢問天氣或設定計時器。

但與產生藝術作品的人工智慧「對話」截然不同。 我們試著讓它們創造一些東西。這意味著,如果人工智慧犯了錯誤,後果會嚴重得多。沒人在乎線上聊天機器人聊天的時候突然斷線。如果聊天機器人不是即時直播 NBA,那就沒什麼大不了的。

但如果我們有一個特定的創造需求來讓人工智慧滿足呢?如果我們想讓它寫一篇具有特定內容和風格的部落格文章呢?我們當然需要確保我們能夠與它正確溝通。

這意味著我們必須開始思考人工智慧在想什麼,或者更確切地說,它是怎麼想的。我們必須進一步發展心理學家所說的機器「心智理論」。 「聽起來好像天方夜譚,對吧?」正如 OpenAI 聯合創始人 Andrej Karpathy 在談到 Copilot 時告訴筆者的那樣。 「這不是你過去司空見慣的東西。它不像人類的心智理論。它就像是一個外星人的人工製品,而且是從大規模的優化過程中產生的。」

Andrej Karpathy

筆者並不是說這些人工智慧其實是有意識的、智慧的或其他什麼。 它們只是非常微妙的模式辨識器和序列完成器,內在更像是一片混亂的數學海洋

但是,又因為我們是用語言向它們發出命令,這讓我們陷入了一種奇怪的心理關係 —— 試圖探知裡面發生了什麼。

筆者想起了古希臘人如何與德爾菲神諭(Delphic oracle)互動。德爾菲神諭被認為能通曉過去、現在和未來。提問後的答案可能很奇怪,因為從本質上講,這就好像是在和外國人說話一樣,誰知道你會得到什麼結果?

與藝術 AI 的交流就像一個文字遊戲

研究藝術機器人內部工作的科學家們記錄了一些這些機器奇怪的內部狀態。最近,德州大學奧斯汀分校的兩名研究人員發現,DALL-E 2 產生了明顯的亂七八糟的短語,在模型本身中,這些短語似乎具有某種一致的含義。

他們注意到模型產生了短語“Apoploe vesrreitais”,當他們將其作為 prompt 反饋給 DALL-E 2 時,它畫出的是鳥類。類似地,接受到“Contarra ccetnxniams luryca tanniounons”後會繪製昆蟲或害蟲。用「Wa ch zod ahakes rea」會製作出海鮮的圖片。

這是為什麼呢?模型是如何產生這種奇怪的內部新語言的?科學家對此一無所知,儘管這看起來像是 DALL-E 2 的文本編碼器的對抗性產物。

同樣,prompt 編寫專家們說,不斷重複短語是一種技巧,就像 Michael Taylor 在《Prompt Engineering: From Words to Art》所寫的那樣。

連結:https://www.saxifrage.xyz/post/prompt-engineering

##DALL-E 2、Midtravel 或其他AI 藝術工具在生成影像時需要真正捕捉到重要特性,此時簡單重複的效果出乎意料地好。以這組prompt 為例:「homer simpson, from the simpsons, eating a donut, homer simpson, homer simpson, homer simpson」

感覺好像是我們需要催眠,使人工智慧其專注於我們關心的主題。你也可以在 prompt 編寫者通常使用的大量描述性字詞中看到這一點。看看 Xe Iaso 結合 stable diffusion 產生的圖像:

#不得不說畫面還是有點詩意的。與藝術 AI 的交流感覺就像一個文字遊戲 —— 就像玩 Charades 或 Taboo,你必須透過圍繞一個主題進行對話來觸發 AI 產生正確的結果 #。除此之外,我們的目標是找到正確的咒語,喚醒居住在那座由媒介物組成的聖壇中的靈魂,並召喚它們聽從你的命令。

正如Xe 所說的,「我也不太清楚為什麼人們會把prompt 稱為『工程』,我個人更願意稱它為『占卜』。」

也許,我們需要對prompt 生成模型做一些嚴謹的澄清。因為它要求我們以一種完全瘋狂的方式進行交流,所以它不太像是能滿足圖靈測試的要求,在智力上並不“像”我們。筆者堅信總有一天藝術 AI 是能像我們的!但現在,它們確實真的很奇怪。

以上是目前prompt工程太像占卜了,與藝術AI溝通就像文字遊戲的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1656
14
CakePHP 教程
1415
52
Laravel 教程
1309
25
PHP教程
1257
29
C# 教程
1229
24
ControlNet作者又出爆款!一張圖生成繪畫全過程,兩天狂攬1.4k Star ControlNet作者又出爆款!一張圖生成繪畫全過程,兩天狂攬1.4k Star Jul 17, 2024 am 01:56 AM

同樣是圖生視頻,PaintsUndo走出了不一樣的路線。 ControlNet作者LvminZhang又開始整活了!這次瞄準繪畫領域。新項目PaintsUndo剛上線不久,就收穫1.4kstar(還在瘋狂漲)。項目地址:https://github.com/lllyasviel/Paints-UNDO透過這個項目,用戶輸入一張靜態圖像,PaintsUndo就能自動幫你生成整個繪畫的全過程視頻,從線稿到成品都有跡可循。繪製過程,線條變化多端甚是神奇,最終視頻結果和原始圖像非常相似:我們再來看一個完整的繪

登頂開源AI軟體工程師榜首,UIUC無Agent方案輕鬆解決SWE-bench真實程式設計問題 登頂開源AI軟體工程師榜首,UIUC無Agent方案輕鬆解決SWE-bench真實程式設計問題 Jul 17, 2024 pm 10:02 PM

AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com這篇論文的作者皆來自伊利諾大學香檳分校(UIUC)張令明老師團隊,包括:StevenXia,四年級博士生,研究方向是基於AI大模型的自動代碼修復;鄧茵琳,四年級博士生,研究方

從RLHF到DPO再到TDPO,大模型對齊演算法已經是「token-level」 從RLHF到DPO再到TDPO,大模型對齊演算法已經是「token-level」 Jun 24, 2024 pm 03:04 PM

AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在人工智慧領域的發展過程中,對大語言模型(LLM)的控制與指導始終是核心挑戰之一,旨在確保這些模型既強大又安全地服務人類社會。早期的努力集中在透過人類回饋的強化學習方法(RL

OpenAI超級對齊團隊遺作:兩個大模型博弈一番,輸出更好懂了 OpenAI超級對齊團隊遺作:兩個大模型博弈一番,輸出更好懂了 Jul 19, 2024 am 01:29 AM

如果AI模型給的答案一點也看不懂,你敢用嗎?隨著機器學習系統在更重要的領域中得到應用,證明為什麼我們可以信任它們的輸出,並明確何時不應信任它們,變得越來越重要。獲得對複雜系統輸出結果信任的一個可行方法是,要求系統對其輸出產生一種解釋,這種解釋對人類或另一個受信任的系統來說是可讀的,即可以完全理解以至於任何可能的錯誤都可以被發現。例如,為了建立對司法系統的信任,我們要求法院提供清晰易讀的書面意見,解釋並支持其決策。對於大型語言模型來說,我們也可以採用類似的方法。不過,在採用這種方法時,確保語言模型生

arXiv論文可以發「彈幕」了,史丹佛alphaXiv討論平台上線,LeCun按讚 arXiv論文可以發「彈幕」了,史丹佛alphaXiv討論平台上線,LeCun按讚 Aug 01, 2024 pm 05:18 PM

乾杯!當論文討論細緻到詞句,是什麼體驗?最近,史丹佛大學的學生針對arXiv論文創建了一個開放討論論壇——alphaXiv,可以直接在任何arXiv論文之上發布問題和評論。網站連結:https://alphaxiv.org/其實不需要專門訪問這個網站,只需將任何URL中的arXiv更改為alphaXiv就可以直接在alphaXiv論壇上打開相應論文:可以精準定位到論文中的段落、句子:右側討論區,使用者可以發表問題詢問作者論文想法、細節,例如:也可以針對論文內容發表評論,例如:「給出至

黎曼猜想显著突破!陶哲轩强推MIT、牛津新论文,37岁菲尔兹奖得主参与 黎曼猜想显著突破!陶哲轩强推MIT、牛津新论文,37岁菲尔兹奖得主参与 Aug 05, 2024 pm 03:32 PM

最近,被稱為千禧年七大難題之一的黎曼猜想迎來了新突破。黎曼猜想是數學中一個非常重要的未解決問題,與素數分佈的精確性質有關(素數是那些只能被1和自身整除的數字,它們在數論中扮演著基礎性的角色)。在當今的數學文獻中,已有超過一千個數學命題以黎曼猜想(或其推廣形式)的成立為前提。也就是說,黎曼猜想及其推廣形式一旦被證明,這一千多個命題將被確立為定理,對數學領域產生深遠的影響;而如果黎曼猜想被證明是錯誤的,那麼這些命題中的一部分也將隨之失去其有效性。新的突破來自MIT數學教授LarryGuth和牛津大學

首個基於Mamba的MLLM來了!模型權重、訓練程式碼等已全部開源 首個基於Mamba的MLLM來了!模型權重、訓練程式碼等已全部開源 Jul 17, 2024 am 02:46 AM

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com。引言近年来,多模态大型语言模型(MLLM)在各个领域的应用取得了显著的成功。然而,作为许多下游任务的基础模型,当前的MLLM由众所周知的Transformer网络构成,这种网

LLM用於時序預測真的不行,連推理能力都沒用到 LLM用於時序預測真的不行,連推理能力都沒用到 Jul 15, 2024 pm 03:59 PM

語言模型真的能用於時序預測嗎?根據貝特里奇頭條定律(任何以問號結尾的新聞標題,都能夠用「不」來回答),答案應該是否定的。事實似乎也果然如此:強大如斯的LLM並不能很好地處理時序資料。時序,即時間序列,顧名思義,是指一組依照時間發生先後順序排列的資料點序列。在許多領域,時序分析都很關鍵,包括疾病傳播預測、零售分析、醫療和金融。在時序分析領域,近期不少研究者都在研究如何使用大型語言模型(LLM)來分類、預測和偵測時間序列中的異常。這些論文假設擅長處理文本中順序依賴關係的語言模型也能泛化用於時間序

See all articles