我花300塊組裝的電腦,成功跑通了本地大模型
如果說2023年是大家公認的AI元年,那麼2024年很可能就是AI大模型普及的關鍵一年。
在過去的一年中,大量的AI大模型、大量的AI應用橫空出世,Meta、Google等廠商也開始面向民眾推出自己的在線/本地大模型,類似於“AI人工智能」這樣遙不可及的概念,就這樣突然來到了人們身邊。
如今人們在生活中越來越多地接觸到人工智慧,如果你仔細分辨,你會發現,你所能接觸到的各類AI應用,他們幾乎都部署在「雲端」上。如果想要搭建一臺本地運行大模型的設備,那麼硬體都是售價5000元以上的全新AIPC,對於一般消費者來說並不友善。
(圖片來源:Google)
不過將預算壓縮到極致,然後搭配出一套「能用」的主機,正是每一位DIY玩家的終極樂趣。而現在的問題是,如果真的想弄一台可以本地運行大語音模型的電腦,到底要多少錢?
我的預算是-300元。
儘管近期正經的記憶體/儲存產品有價格上漲的趨勢,但是在洋垃圾這邊其實價格變化倒是不大,甚至一批早年的洋垃圾CPU和礦卡GPU還有價格下跌的趨勢。在現今AI大潮席捲而來的背景下,我甚至不准備拘泥於辦公影音需求,決定挑戰一下用三百塊錢的預算,試著去打造出一套性價比頗高的入門級本地大模型主機。
至於具體該怎麼操作,最終成效是否如意,跟著我一起看下去自然就知道了。
經典的老CPU,礦工級的GPU
在CPU的選擇上,我直接從閒魚上撿了一顆Intel® Core™i3-4170T。
此處理器為二核心四線程,3.2GHz主頻,沒有睿頻能力,具備3MB智慧緩存,採用22nm製程製程的Haswell架構,最大的特點就是擁有一顆HD4400核顯,這也是我選擇它的關鍵。
(圖源:雷科技)
俗話說得好,低價U配低價板嘛,主機板我選的就是一塊華碩工包H81M-V3主機板,只有兩根DDR3內存插槽不說,甚至都沒有HDMI輸出接口,也沒有M2硬碟位,USB 3.0、 SATA III介面都只有兩個,這玩意最大的優點就是超低的二手價格。
這加起來不到80的板U套裝,性價比放在今時今日也是出類拔萃的。
(圖源:淘寶)
這種CPU,散熱就不用太擔心了。
閒魚20包郵寄過來的下壓式風冷散熱,雖然外觀上是醜了一點,簡陋了一點,但是用來壓我這套超低價配置肯定是綽綽有餘了。
(圖源:雷科技)
至於顯卡嘛,近期閒魚上面流出了一大堆P106-090/P106-100礦卡,其中前者的價格普遍在75塊錢左右,後者的價格普遍在120塊錢左右,考慮到我這次的初衷並不是為了遊戲而來,我最終直接選擇了一張索泰P106-090礦卡,這卡因為頻寬問題不適合遊戲,但價格就擺在這裡。
最後,給它簡單配上兩根雜牌DDR3內存,組成內存雙通道,用一個350W長城電源供電,一塊120GB SATA SSD做系統盤,用上次裝置剩下的大水牛矽脂湊合湊合,最後再配上個20塊錢的電腦城小機箱,我們三百元裝機的基礎硬體就到齊了。
(圖源:雷科技)
不服跑分!還算合理的性能表現
裝機完成,點亮機箱!
先做個簡單的性能測試,作為多年服役的老將,Intel® Core™i3-4170T的性能也就那樣,即便是在用TrottlesStop解鎖功耗的情況下,也就差不多相當於行動端酷睿六代、酷睿七代處理器的水平。
(圖源:雷科技)
在實測環節中,CPU-Z測試單核心跑分有319.9分,多核心跑分有881.0分,在CINEBENCH測試標準下,CINEBENCH R20多核心732cb、單核心301cb。這成績當然不算亮眼,但拿來日常辦公、輕度娛樂倒是完全足夠。
(圖源:雷科技)
再看看GPU部分,我們手上這張索泰P106-090採用16nm製程打造,顯示卡核心為GP106,核心頻率為1354MHz,可提升至1531MHz,具有768個著色單元,支援DirectX12,顯存規格為3072MB/192Bit三星GDDR5內存,顯存頻率可達2002MHz。
(來源:雷科技)
值得注意的是,P106-090的介面是PCI-E x4 1.1,而P106-100的介面是PCI-E x16 1.1,這導致二者即便是在相同核心的情況下,依然存在著比較明顯的效能差異,我選擇P106-090這張顯示卡,也只是因為它能在極低的價格下提供CUDA算力的加持罷了。
如圖所示,在評估DX11性能的Fire Strike測試中,P106-90在Extreme測試中取得了3287分的圖形分數;在評估DX12性能的Time Spy測試中,P106-90在基本測試中取得了2251分的圖形分數,這個性能表現和GTX1050差不多,比R5-7640H的核顯性能有一定差距。
(圖源:雷科技)
儲存方面,我們斥資40元購入的這塊雜牌128GB Sata SSD硬碟,順序讀寫速度達到505.28MB/s和400.09MB/s,隨機4K讀寫達到132.35MB/s和244.29MB/s,儘管和M2 SSD硬碟沒得比,但是作為系統啟動盤肯定是綽綽有餘了。
(圖源:雷科技)
至於這對雙通道的DDR3內存,使用AIDA64進行內存緩存測試,測得的讀取速度為20894 MB/s,寫入速度為23629 MB/s,複製速度為20901 MB/s,延遲為67.5ns,給這台電腦用可以說是剛剛好。
(圖源:雷科技)
大模型遊戲,居然都能跑
既然目的是在幾百塊的預算下,打造出一套可用的本地大模型遊戲主機,那麼實際體驗肯定是我們最關注的一環。
先嘗試Koblodcpp,這是一款整合Koblod.AI介面的llamacpp啟動程序,可以運行目前外網流行的GGUF格式本地大模型,甚至可以整合語音大模型和繪圖大模型,實現在對話的同時,產生語音和對應場景的效果。
(來源:雷科技)
遺憾的是,目前在Huggingface上面共享的GGUF格式大模型,其容量大小普遍超過了3GB,即便選用容量大小只有5GB左右的causallm_7b模型,依然會導致顯示卡顯存溢出引發CPU的運算介入,最終導致整個大模型的運行效率降低。
(圖源:雷科技)
姑且測試一下,在這個模式下,Kobold.AI的回覆最長可達了599s(即10分鐘)左右,最短的回覆也需要50s來產生左右,和雲端大模型平均10s就能提供回覆的效果相差甚遠,體驗確實很一般。
既然如此,我們不妨退而求其次,用英特爾AIGC助手來體驗本地大模型,這是一個集成了多種本地大語言模型的演示Demo,致力於在不連接網路的情況下,實現智慧人機對話。
在關閉電腦網路的情況下,除開首次部署大模型時需要一定時間外,後續的提問基本上在5秒內都能獲得答复,不管是回答問題、翻譯還是寫作都非常迅速,雖然在應對一些腦筋急轉彎或算術題時依然會出現邏輯錯誤,但是在這種情況下的整體體驗可比之前強太多了。
(圖源:雷科技)
當然,角色卡、提示詞這些比較高級的功能就肯定用不了了。
再看看AI繪畫,我這裡使用的是bilibili UP主@整合的繪世啟動器,集Stablediffsion WebUI、各種SD插件下載和模型遠端使用於一體,算是相當實用的一體啟動器。
(圖源:雷科技)
考慮到P106- 90只有3GB的運存限制,我選擇了經過剪裁後容量僅2GB的mistoonAnime MIX_v20模型,實測P106-90產生4張128*160的圖片耗時約三分鐘,產生4張240*320的圖片耗時七到八分鐘,而產生1張512*512的圖片則需要六分鐘左右。
(圖源:雷科技)
從實際體驗來看,個人建議在減少提示詞和插件的情況下,從128*160的圖片開始生成,遇到了合適的圖片再進行單張圖片的AI升格重繪,這樣整體的體驗還是挺不錯的,否則用512*512的規格生成圖片,廢圖機率不是一般的高。
(圖源:雷科技,用SD產生的圖片)
#既然本地大模型算是能用,那麼遊戲體驗又怎麼樣呢?
考慮到實際硬體配置,我們先後測試了《孤島驚魂6》《古墓奇兵:暗影》《F1 2020》以及《地平線:零之曙光》四款遊戲在FHD解析度下的體驗,讓我們來看看各自的表現。
在《孤島驚魂6》的效能測試中,在1920*1080最低畫質下,這台電腦的平均幀數為32fps,即便開啟FSR性能檔,最終遊戲幀數也只能在40fps上下波動。
(來源:雷科技)
##總的來說,受到嚴苛的頻寬限制影響,P106-090的實際性能並不如和它跑分相近的GTX1050,最多就是比Iris Xe 96EU核顯略強一些的水平,應付近些年的3A遊戲已經有些捉襟見肘了。
總結:確實能跑大模型,但穩定性欠佳
優點:
#1、成本預算低廉;
2、確實能運行本地大模型。
缺點:
1、二手零件無保障;
2、礦卡驅動非常容易掉,白螢幕問題時有發生。
這檔300元的電腦主機能用嗎?
儘管CPU規格老舊、礦卡表現不穩定,但是這款預算300元的電腦主機確實能完成本地大模型的部署,在文本生成和AI繪圖的體驗上都沒有什麼問題,你甚至能把它當成一台AI PC。
即便運行《孤島驚魂6》這樣的3A大作,這款機子也能在FHD低畫質下保證60幀穩定運行,那麼應付《英雄聯盟》這類網遊應該是綽綽有餘的,也可以當一台入門的網遊主機來用。
(圖源:雷科技)
那麼我對這款電腦主機感到滿意嗎?
答案是否定的,在實際使用的過程中,P106-90這張礦卡多次出現掉驅動導致電腦白屏,需要用DDDU卸載驅動再重裝的情況。如果說這放在測驗裡還只是有點麻煩的話,那麼放在日常使用上肯定是很難讓人接受的。
值得注意的是,目前閒魚上面還有不少和我組裝起來的這台機子配置類似的洋垃圾整機,售價普遍在350- 400元左右,目標受眾很明顯是剛上大學或走出社會的年輕群體,個人建議大夥別去購買這些產品,一分錢一分貨可不是開玩笑的。
歸根究底,撿垃圾有風險,上車前需謹慎。對於玩膩了高階電腦的玩家來說,偶爾玩玩撿垃圾主機還是很有意思的,但這只是為了樂子,並不是真的打算將其作為主力機長期使用,畢竟撿垃圾主機的配件年久失修而且沒有保全,萬一因為它的故障而失去了重要數據,那就得不償失了。
不過,透過用三百塊預算完成能運行本地大模型PC的嘗試,一定程度上說明,硬體效能可能不是限制AI PC發展的主要因素。至少在一般消費者的使用場景中,相比起算力提升,PC廠商更該做的應該是幫助用戶搭建好AI大模型的框架和環境,在系統和軟體上給用戶帶來更好的體驗。換句話說,AI PC應該是用戶拿到手就能用的,而不是像我們自己組裝DIY PC那樣折騰。
以上是我花300塊組裝的電腦,成功跑通了本地大模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

在C 中處理高DPI顯示可以通過以下步驟實現:1)理解DPI和縮放,使用操作系統API獲取DPI信息並調整圖形輸出;2)處理跨平台兼容性,使用如SDL或Qt的跨平台圖形庫;3)進行性能優化,通過緩存、硬件加速和動態調整細節級別來提升性能;4)解決常見問題,如模糊文本和界面元素過小,通過正確應用DPI縮放來解決。

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

如何實現鼠標滾動事件穿透效果?在我們瀏覽網頁時,經常會遇到一些特別的交互設計。比如在deepseek官網上,�...
