目錄
大型語言模型的科學突破
GPT-4有哪些好的應用?
GPT-4有哪些不好的應用?
GPT-4作為產品
首頁 科技週邊 人工智慧 了解GPT-4應用的相關資訊有哪些?

了解GPT-4應用的相關資訊有哪些?

May 09, 2023 pm 07:43 PM
人工智慧 chatgpt

自從OpenAI公司發布大型語言模型GPT-4以來,人們都在嘗試使用這個令人興奮的應用程式。 GPT-4可以將手繪的網站模型產生HTML程式碼。許多用戶證明,它可以從信用卡交易中找到實體地址,產生訴訟草稿,通過SAT數學考試,幫助教育和培訓,甚至創建第一人稱射擊遊戲。

了解GPT-4應用的相關資訊有哪些?

GPT-4的強大功能確實令人驚嘆,隨著越來越多的用戶訪問其多模式版本,人們可以期待推出更多的大型語言模型。然而,在人們慶祝科學家在大型語言模型領域的進步的同時,也必須注意到它們的限制。

像GPT-4這樣的大型語言模型可以執行許多任務,但它們不一定是完成這些任務的最佳工具。如果他們成功地完成了一項任務,但這並不意味著他們在該領域是更可靠的。

大型語言模型的科學突破

GPT-4在發布之後引發了許多用戶對OpenAI公司的批評,其中許多批評都是有道理的。隨著GPT的每一次發布,它們的技術細節變得越來越不透明。 OpenAI公司在發布GPT-4時發布的技術報告中很少包含該模型的架構、訓練資料和其他重要方面的細節。種種跡象表明,OpenAI公司正逐步從一家人工智慧研究實驗室轉型為一家銷售人工智慧產品的公司。

然而,這並沒有削弱大型語言模型所帶來的引人入勝的技術突破。 OpenAI公司在這些技術發展中發揮了重要作用。在短短幾年的時間中,已經從處理語言任務的最平庸的深度學習模型,發展到可以產生非常像人類的文本的大型語言模型,至少在表面上是如此。

此外,有了足夠的參數、計算能力和訓練數據,Transformer (大型語言模型中使用的架構)可以學習使用單一模型執行多個任務。這一點非常重要,因為直到最近,深度學習模式才被認為只適用於來執一項任務。現在,大型語言模型可以透過零樣本和少量快照學習來執行幾個任務,甚至在擴展時顯示出緊急能力。

ChatGPT充分展示了大型語言模型的最新功能。它可以在一次對話中執行編碼、問答、文字生成和許多其他任務。由於採用訓練技術,從人類回饋中強化學習(RLHF),它在遵循指示方面做得更好。

GPT-4和其他多模式語言模型正在顯示新一波功能,例如在對話中包含圖像和語音訊息。

GPT-4有哪些好的應用?

一旦超越了科學成就,就可以開始考慮像GPT-4這樣的大型語言模型可以提供什麼樣的應用程式。對人們來說,確定大型語言模型是否適合應用的指導原則是它們的機制。

與其他機器學習模型一樣,大型語言模型是預測機器。基於訓練資料中的模式,它們預測接收到的輸入序列中的下一個令牌,它們做得非常有效。

下一個令牌預測對於某些任務(如文字產生)是一個很好的解決方案。當大型語言模型接受RLHF等指令跟隨技術的訓練時,它可以執行語言任務,例如撰寫文章、總結文本、解釋概念和回答問題,並取得驚人的成績。這是大型語言模型目前最準確和最有用的解決方案之一。

然而,大型語言模型在文本生成方面的能力仍然有限。大型語言模型通常會產生幻覺,或編造一些不正確的東西。因此,人們不應該相信他們是知識的來源。這包括GPT-4。例如,在行業專家對ChatGPT的探索中,發現它有時可以對複雜的主題產生非常雄辯的描述,例如深度學習是如何運作的。當他試圖向一個可能不了解某個概念的人解釋這個概念時,這很有幫助,但也發現ChatGPT也可能犯一些事實錯誤。

對於文字生成,產業專家的經驗法則是只在熟悉的領域信任GPT-4,並且可以驗證其輸出。有一些方法可以提高輸出內容的準確性,包括對特定領域知識的模型進行微調,或者透過在提示符前添加相關資訊來為其提供場景。但同樣,這些方法要求人們對該領域有足夠的了解,以便能夠提供額外的知識。因此,不要相信GPT-4產生有關健康、法律建議或科學的文本,除非已經知道這些主題。

程式碼產生是GPT-4的另一個有趣的應用。行業專家已經審查過GitHub Copilot,它是基於GPT-3的微調版本,其名稱為Codex。當程式碼產生整合到其IDE中(例如Copilot),它會變得越來越有效,並且可以使用現有程式碼作為場景來改進大型語言模型輸出。然而,同樣的規則仍然適用。只使用大型語言模型來產生可以完全審查的程式碼。盲目地相信大型語言模型可能會導致無功能和不安全的程式碼。

GPT-4有哪些不好的應用?

對於某些任務,像GPT-4這樣的語言模型並不是理想的解決方案,即使它們可以解決範例。例如,經常討論的主題之一是大型語言模型執行數學的能力。他們已經接受了不同數學基準的測試。據報道,GPT-4在複雜的數學測驗中表現非常好。

然而,值得注意的是,大型語言模型並不像人類一樣一步一步地計算數學方程式。當向GPT-4提供提示「1 1=」時,將為人們提供正確答案。但在幕後,它並沒有執行「新增」和「移動」操作。它執行與所有其他輸入相同的矩陣運算,預測序列中的下一個標記。它給確定性問題一個機率性的答案。這就是GPT-4和其他數學大型語言模型的準確性在很大程度上取決於訓練資料集的原因,並且是在偶然的基礎上工作。人們可能會看到它們在非常複雜的數學題目上取得驚人的成績,但在簡單的初級數學問題上卻失敗了。

這並不意味著GPT-4對數學沒有用。一種方法是使用模型增強技術,例如將大型語言模型與數學求解器結合。大型語言模型從提示符號中提取方程式數據,並將其傳遞給解算器,解算器計算並傳回結果。

GPT-4的另一個有趣用例是可汗學院(Khan Academy)正在做的事情。他們將大型語言模式課程整合到他們的線上學習平台中,作為學習者的導師和教師的助手。由於這是OpenAI公司在GPT-4發佈時宣傳的合作夥伴之一,他們可能已經根據其課程內容對GPT-4進行了微調。該模型還與平台的內容很好地整合在一起,以提供場景並減少錯誤。但值得注意的是,GPT-4並不是為了解決數學問題,而是引導學生和教師學習和教授數學概念。

GPT-4作為產品

一旦使用者決定了GPT-4是否適合其應用,就必須從產品的角度來看待它。 GPT-4產生的每個令牌都是數千億次運算的結果。使用者必須問自己的第一個問題是,「我的應用程式需要這樣的計算嗎?」事實上,在許多情況下,即使GPT-4提供了一個完美的答案,也可能有更簡單、更快、成本更低的解決方案。例如,在許多情況下,正規表示式等簡單的解決方案在提取資訊方面更有效。

事實上,產業專家與ChatGPT進行了一次有趣的對話,在對話中問ChatGPT 「GPT-ify」是什麼意思。 ChatGPT將其描述為「基於GPT(產生預訓練轉換器)架構的語言模型的技術和功能,例如GPT-3或GPT- Neo,應用於特定的任務或問題。」

然後產業專家問GPT-ify是否可以用來嘲笑那些使用GPT做一些不需要它的事情的人。 ChatGPT這樣回答:「是的,GPT-ify當然可以被諷刺或諷刺地用來暗示某人過度使用或濫用GPT來完成不需要如此複雜的語言模型的任務或問題。例如,如果有人使用預訓練的GPT模型來產生一個簡單的購物清單,有人可能會開玩笑說他們已經'GPT化了他們的購物清單'。」

因此,不要在沒有探索其他選擇的情況下對產品進行GPT化。像所有其他技術一樣,應該將GPT-4視為產品工具箱中的眾多工具之一。正如ChatGPT所建議的那樣,「關鍵是要根據當前任務的具體要求和限制,為工作選擇合適的工具。」

以上是了解GPT-4應用的相關資訊有哪些?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它們
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

ChatGPT 現在允許免費用戶使用 DALL-E 3 產生每日限制的圖像 ChatGPT 現在允許免費用戶使用 DALL-E 3 產生每日限制的圖像 Aug 09, 2024 pm 09:37 PM

DALL-E 3 於 2023 年 9 月正式推出,是比其前身大幅改進的車型。它被認為是迄今為止最好的人工智慧圖像生成器之一,能夠創建具有複雜細節的圖像。然而,在推出時,它不包括

位元組跳動剪映推出 SVIP 超級會員:連續包年 499 元,提供多種 AI 功能 位元組跳動剪映推出 SVIP 超級會員:連續包年 499 元,提供多種 AI 功能 Jun 28, 2024 am 03:51 AM

本站6月27日訊息,剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體,依託於抖音平台且基本面向該平台用戶製作短影片內容,並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級,推出全新SVIP,包含多種AI黑科技,例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面,剪映SVIP月費79元,年費599元(本站註:折合每月49.9元),連續包月則為59元每月,連續包年為499元每年(折合每月41.6元) 。此外,剪映官方也表示,為提升用戶體驗,向已訂閱了原版VIP

使用Rag和Sem-Rag提供上下文增強AI編碼助手 使用Rag和Sem-Rag提供上下文增強AI編碼助手 Jun 10, 2024 am 11:08 AM

透過將檢索增強生成和語意記憶納入AI編碼助手,提升開發人員的生產力、效率和準確性。譯自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。雖然基本AI程式設計助理自然有幫助,但由於依賴對軟體語言和編寫軟體最常見模式的整體理解,因此常常無法提供最相關和正確的程式碼建議。這些編碼助手產生的代碼適合解決他們負責解決的問題,但通常不符合各個團隊的編碼標準、慣例和風格。這通常會導致需要修改或完善其建議,以便將程式碼接受到應

微調真的能讓LLM學到新東西嗎:引入新知識可能讓模型產生更多的幻覺 微調真的能讓LLM學到新東西嗎:引入新知識可能讓模型產生更多的幻覺 Jun 11, 2024 pm 03:57 PM

大型語言模型(LLM)是在龐大的文字資料庫上訓練的,在那裡它們獲得了大量的實際知識。這些知識嵌入到它們的參數中,然後可以在需要時使用。這些模型的知識在訓練結束時被「具體化」。在預訓練結束時,模型實際上停止學習。對模型進行對齊或進行指令調優,讓模型學習如何充分利用這些知識,以及如何更自然地回應使用者的問題。但是有時模型知識是不夠的,儘管模型可以透過RAG存取外部內容,但透過微調使用模型適應新的領域被認為是有益的。這種微調是使用人工標註者或其他llm創建的輸入進行的,模型會遇到額外的實際知識並將其整合

為大模型提供全新科學複雜問答基準與評估體系,UNSW、阿貢、芝加哥大學等多家機構共同推出SciQAG框架 為大模型提供全新科學複雜問答基準與評估體系,UNSW、阿貢、芝加哥大學等多家機構共同推出SciQAG框架 Jul 25, 2024 am 06:42 AM

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

SOTA性能,廈大多模態蛋白質-配體親和力預測AI方法,首次結合分子表面訊息 SOTA性能,廈大多模態蛋白質-配體親和力預測AI方法,首次結合分子表面訊息 Jul 17, 2024 pm 06:37 PM

編輯|KX在藥物研發領域,準確有效地預測蛋白質與配體的結合親和力對於藥物篩選和優化至關重要。然而,目前的研究並沒有考慮到分子表面訊息在蛋白質-配體相互作用中的重要作用。基於此,來自廈門大學的研究人員提出了一種新穎的多模態特徵提取(MFE)框架,該框架首次結合了蛋白質表面、3D結構和序列的信息,並使用交叉注意機制進行不同模態之間的特徵對齊。實驗結果表明,該方法在預測蛋白質-配體結合親和力方面取得了最先進的性能。此外,消融研究證明了該框架內蛋白質表面資訊和多模態特徵對齊的有效性和必要性。相關研究以「S

SK 海力士 8 月 6 日將展示 AI 相關新品:12 層 HBM3E、321-high NAND 等 SK 海力士 8 月 6 日將展示 AI 相關新品:12 層 HBM3E、321-high NAND 等 Aug 01, 2024 pm 09:40 PM

本站8月1日消息,SK海力士今天(8月1日)發布博文,宣布將出席8月6日至8日,在美國加州聖克拉拉舉行的全球半導體記憶體峰會FMS2024,展示諸多新一代產品。未來記憶體和儲存高峰會(FutureMemoryandStorage)簡介前身是主要面向NAND供應商的快閃記憶體高峰會(FlashMemorySummit),在人工智慧技術日益受到關注的背景下,今年重新命名為未來記憶體和儲存高峰會(FutureMemoryandStorage),以邀請DRAM和儲存供應商等更多參與者。新產品SK海力士去年在

佈局 AI 等市場,格芯收購泰戈爾科技氮化鎵技術和相關團隊 佈局 AI 等市場,格芯收購泰戈爾科技氮化鎵技術和相關團隊 Jul 15, 2024 pm 12:21 PM

本站7月5日消息,格芯(GlobalFoundries)於今年7月1日發布新聞稿,宣布收購泰戈爾科技(TagoreTechnology)的功率氮化鎵(GaN)技術及智慧財產權組合,希望在汽車、物聯網和人工智慧資料中心應用領域探索更高的效率和更好的效能。隨著生成式人工智慧(GenerativeAI)等技術在數位世界的不斷發展,氮化鎵(GaN)已成為永續高效電源管理(尤其是在資料中心)的關鍵解決方案。本站引述官方公告內容,在本次收購過程中,泰戈爾科技公司工程師團隊將加入格芯,進一步開發氮化鎵技術。 G

See all articles