首頁 科技週邊 人工智慧 NVIDIA RTX顯示卡AI推理提速5倍! RTX PC輕鬆在本地搞定大模型

NVIDIA RTX顯示卡AI推理提速5倍! RTX PC輕鬆在本地搞定大模型

Nov 17, 2023 pm 11:05 PM

在微軟Iginte全球技術大會上,微軟發布了一系列AI相關的全新優化模型和開發工具資源,旨在幫助開發者更充分地發揮硬體性能,擴展AI應用領域

特別是對於當下在AI領域佔據絕對主導地位的NVIDIA來說,微軟這次送上了一份大禮包,無論是面向OpenAI Chat API的TensorRT-LLM封裝接口,還是RTX驅動的效能改進DirectML for Llama 2,以及其他熱門大語言模型(LLM),都可以在NVIDIA硬體上獲得更好的加速和應用。

NVIDIA RTX显卡AI推理提速5倍!RTX PC轻松在本地搞定大模型

其中,TensorRT-LLM是一款用於加速LLM推理的函式庫,可大幅提升AI推理效能,還在持續更以支援越來越多的語言模型,而且它還是開源的。

NVIDIA在10月發布了適用於Windows平台的TensorRT-LLM。對於配備RTX 30/40系列GPU顯示卡的桌上型電腦和筆記型電腦來說,只要顯存達到8GB以上,就能更輕鬆地完成高要求的AI工作負載

現在,Tensor RT-LLM for Windows可以透過全新的封裝接口,與OpenAI 廣受歡迎的聊天API 相容,因此可以在本地直接運行各種相關應用,而不需要連接雲端,有利於在PC 上保留私人和專有數據,防範隱私外洩。

只要是經過TensorRT-LLM優化的大型語言模型,都可以與這個封裝介面配合使用,包括Llama 2、Mistral、NV LLM等等

對於開發者來說,無需繁瑣的程式碼重寫和移植,只需修改一兩行程式碼,就可以讓AI應用程式在本地快速執行。

NVIDIA RTX显卡AI推理提速5倍!RTX PC轻松在本地搞定大模型

↑↑↑基於TensorRT-LLM的微軟Visual Studio程式碼外掛程式-Continue.dev程式設計助理

本月底還會有TensorRT-LLM v0.6.0版本更新,將會在RTX GPU上帶來最多達5倍的推理性能提升,並支援更多熱門的LLM,包括全新的70億參數Mistral、80億參數Nemotron-3,讓桌上型電腦和筆電也能隨時、快速、準確地本地運行LLM。

根據實測數據,RTX 4060顯示卡搭配TenroRT-LLM,推理表現可以跑到每秒319 tokens,相比其他後端的每秒61 tokens提速足足4.2倍。

RTX 4090則可以從每秒tokens加速到每秒829 tokens,提升幅度達2.8倍。

NVIDIA RTX显卡AI推理提速5倍!RTX PC轻松在本地搞定大模型

憑藉著強大的硬體效能、豐富的開發生態和廣泛的應用場景,NVIDIA RTX正在成為本地AI不可或缺的有力助手。同時,隨著最佳化、模型和資源的不斷豐富,AI功能在億萬台RTX PC上的普及也加速推進

目前已經有400多個合作夥伴發布了支援RTX GPU加速的AI應用、遊戲,而隨著模型易用性的不斷提高,相信會有越來越多的AIGC功能出現在Windows PC平台上。

NVIDIA RTX显卡AI推理提速5倍!RTX PC轻松在本地搞定大模型

以上是NVIDIA RTX顯示卡AI推理提速5倍! RTX PC輕鬆在本地搞定大模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它們
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

我嘗試了使用光標AI編碼的Vibe編碼,這太神奇了! 我嘗試了使用光標AI編碼的Vibe編碼,這太神奇了! Mar 20, 2025 pm 03:34 PM

Vibe編碼通過讓我們使用自然語言而不是無盡的代碼行創建應用程序來重塑軟件開發的世界。受Andrej Karpathy等有遠見的人的啟發,這種創新的方法使Dev

2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! 2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! Mar 22, 2025 am 10:58 AM

2025年2月,Generative AI又是一個改變遊戲規則的月份,為我們帶來了一些最令人期待的模型升級和開創性的新功能。從Xai的Grok 3和Anthropic的Claude 3.7十四行詩到Openai的G

如何使用Yolo V12進行對象檢測? 如何使用Yolo V12進行對象檢測? Mar 22, 2025 am 11:07 AM

Yolo(您只看一次)一直是領先的實時對象檢測框架,每次迭代都在以前的版本上改善。最新版本Yolo V12引入了進步,可顯著提高準確性

最佳AI藝術生成器(免費付款)創意項目 最佳AI藝術生成器(免費付款)創意項目 Apr 02, 2025 pm 06:10 PM

本文回顧了AI最高的藝術生成器,討論了他們的功能,對創意項目的適用性和價值。它重點介紹了Midjourney是專業人士的最佳價值,並建議使用Dall-E 2進行高質量的可定製藝術。

Chatgpt 4 o可用嗎? Chatgpt 4 o可用嗎? Mar 28, 2025 pm 05:29 PM

Chatgpt 4當前可用並廣泛使用,與諸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和產生連貫的響應方面取得了重大改進。未來的發展可能包括更多個性化的間

哪個AI比Chatgpt更好? 哪個AI比Chatgpt更好? Mar 18, 2025 pm 06:05 PM

本文討論了AI模型超過Chatgpt,例如Lamda,Llama和Grok,突出了它們在準確性,理解和行業影響方面的優勢。(159個字符)

如何將Mistral OCR用於下一個抹布模型 如何將Mistral OCR用於下一個抹布模型 Mar 21, 2025 am 11:11 AM

MISTRAL OCR:通過多模式文檔理解徹底改變檢索效果 檢索增強的生成(RAG)系統具有明顯高級的AI功能,從而可以訪問大量的數據存儲,以獲得更明智的響應

頂級AI寫作助理來增強您的內容創建 頂級AI寫作助理來增強您的內容創建 Apr 02, 2025 pm 06:11 PM

文章討論了Grammarly,Jasper,Copy.ai,Writesonic和Rytr等AI最高的寫作助手,重點介紹了其獨特的內容創建功能。它認為Jasper在SEO優化方面表現出色,而AI工具有助於保持音調的組成

See all articles