大數據架構的幾個關鍵技術
企業IT基礎設施平台的重新建構是一項複雜的任務。重新建構平台通常由一系列變化的關鍵業務驅動因素引發,現在情況正是如此。簡而言之,主導企業IT技術的近30年的平台無法再滿足推動業務發展所需的工作負載的需求。
數位轉型的核心是數據,它已成為商業中最有價值的事務。由於格式不相容,傳統資料庫的局限性,以及無法靈活地合併來自多個來源的數據,組織長期以來一直受到其使用數據的困擾。新興技術的出現有望改變這一切。
改善軟體部署模式是消除資料使用障礙的一個主要面向。更高的「資料靈活性」還需要更靈活的資料庫和更具可擴展性的即時串流平台。實際上,事實上,至少有七種基礎技術可以結合在一起,為企業提供一種靈活的、即時的「資料結構」。
與他們正在取代的技術不同,這七種軟體創新能夠擴展以滿足許多用戶和許多用例的需求。對於企業而言,他們有能力實現更快、更明智的決策,並創造更好的客戶體驗。
1. NoSQL資料庫
RDBMS在資料庫市場上佔據了近30年的主導地位。但是,面對資料量的不斷增長以及資料處理速度的加快,傳統關係資料庫已經顯示出其不足之處。 NoSQL資料庫由於其速度和擴展能力而被接管。就文件資料庫而言,它們從軟體工程的角度提供了一個更簡單的模型。這種更簡單的開發模式可加快產品上市速度,並協助企業更快回應客戶和內部使用者的需求。
2.即時串流平台
即時回應客戶對客戶體驗至關重要。在過去的10年中面向消費者的行業經歷了巨大的顛覆,這並不神秘。這與企業對用戶即時反應的能力有關。轉向即時模型需要事件流。
訊息驅動的應用程式已存在多年。然而,如今的串流媒體平台的規模比以往要大得多,成本也低得多。最近串流媒體技術的進步為許多優化業務的新方式打開了大門。透過為軟體開發和測試團隊提供即時回饋循環,事件流還可以幫助企業提高產品質量,並更快地開發新的軟體。
3. Docker和容器
容器對開發人員和操作人員,以及組織本身都有很大的好處。傳統的基礎架構隔離方法是靜態分割區,也就是為每個工作負載分配一個單獨的固定資源區塊(無論是實體伺服器或虛擬機器)。靜態分區可以更容易排除故障,但是實質未充分利用的硬體成本很高。例如,Web伺服器平均只使用了可用總運算量的10%。
容器技術的巨大好處是它能夠創造一種新的隔離方式。那些最了解容器的人員可能會相信他們可以透過使用Ansible、Puppet或Chef等工具來獲得相同的好處,但實際上這些技術具有很強的互補性。此外,無論企業如何努力,這些自動化工具都無法實現在不同基礎設施和硬體設定之間自由移動工作負載所需的隔離。同一個容器可以在本地資料中心的裸機硬體上或公有雲中的虛擬機器上運行,無需進行任何更改。這是真正的工作負載移動性。
4.容器儲存庫
容器儲存庫對於敏捷性至關重要。如果沒有用於建立容器映像的DevOps進程以及用於儲存它們的回收站,每個容器都必須建立在每一台機器中,以便可以運行。透過儲存庫,可以在讀取該儲存庫的電腦上啟動容器映像。在多個資料中心處理時,這變得更加複雜。如果在一個資料中心內建立一個容器影像,那麼如何將影像移動到另一個資料中心?理想情況下,透過利用融合資料平台,企業將有能力在資料中心之間對儲存庫實現鏡像。
這裡的一個關鍵細節是,內部部署和雲端運算之間的鏡像功能可能與企業的資料中心之間的鏡像功能差異很大。融合資料平台將透過提供這些功能為企業解決這個問題,而不管組織中使用的是資料中心基礎設施還是雲端運算基礎設施。
5.容器編排
每個容器看起來都有它自己的私人作業系統,而不是靜態硬體分割區。與虛擬機器不同,容器不需要計算和記憶體的靜態分區。這使管理員能夠在伺服器上啟動大量容器,而無需擔心大量的記憶體量。有了像Kubernetes這樣的容器編排工具,啟動容器,移動它們並在環境中的其他地方重新啟動容器變得非常容易。
在新的基礎設施元件到位之後,諸如MapR-DB或MongoDB之類的文檔資料庫,MapR-ES或Apache Kafka之類的事件串流平台(諸如Kubernetes之類的編排工具),以及在Docker容器中實作用於建置和部署軟體的DevOps流程之後,人們必須了解應該在這些容器中部署哪些元件的問題。
6.微服務
從歷史上看,微服務的概念並不新鮮。現今的差異在於,啟用技術(NoSQL資料庫、事件流、容器編排)可以隨著數千個微服務的建立而擴展。如果沒有這些資料儲存、事件流和架構編排的新方法,大規模微服務部署將不可能實現。管理大量資料、事件和容器實例所需的基礎設施將無法擴展到所需的層級。
微服務都是與提供敏捷性有關。微服務通常由一個功能或一組功能組成。工作的功能單元越小且越集中,建立、測試和部署服務就越容易。這些服務必須解耦,否則企業將失去敏捷性的微服務承諾。微服務可以依賴其他服務,但通常透過負載平衡的REST API或事件流。透過使用事件流,企業可以利用請求和回應主題輕鬆追蹤事件的歷史記錄。由於整個請求流和請求中的所有資料都可以在任何時間點重播,因此這種方法對故障排除具有重大的益處。
由於微服務封裝了一小部分工作,並且由於它們彼此分離,因此隨著時間的推移更換或幾乎沒有障礙地升級服務。在原有模式下,依賴像RPC這樣的緊密耦合意味著必須關閉所有連接,然後重新建立它們。負載平衡是實現這些的一個大問題,因為人工配置使它們容易出錯。
7.功能即服務
正如人們已經看到微服務在行業中佔據主導地位,所以人們也會看到無伺服器運算的興起或可能更準確地將其稱為功能即服務(FaaS)。 FaaS以這樣一種方式創建微服務,即程式碼可以包裝在輕量級框架中,內置於容器中,按需執行(基於某種觸發器),然後自動進行負載平衡,多虧有了輕量級框架。 FaaS的美妙之處在於它讓開發人員幾乎完全專注於該功能。因此,FaaS看起來是微服務方法的合乎邏輯的結論。
觸發事件是FaaS的關鍵組成部分。沒有它,只有在需要完成工作的情況下,才能呼叫功能和消耗資源。功能的自動呼叫使得FaaS真正有價值。想像一下,每當有人讀取使用者的設定檔時,都會有一個審計事件,這是一個必須運作以通知安全團隊的功能。更具體地說,它可能僅過濾出某些類型的記錄。它可以是具有選擇性的,畢竟它是一個完全可自訂的業務功能。需要注意的是,使用像FaaS這樣的部署模型來完成這樣的工作流程非常簡單。
把事件放在一起
觸發服務背後的魔力其實不過是事件流中的事件。某些類型的事件比其他事件更頻繁地用作觸發器,但是企業如果希望成為觸發器的事件都可能成為觸發器。觸發事件可以是文件更新,對新文件執行OCR過程,然後將OCR過程中的文字加入NoSQL資料庫。如果人們以更有趣的方式思考,每當上傳圖像時,都可以透過機器學習框架進行圖像辨識和評分。這裡沒有根本的限制。如果定義了觸發器事件,則發生了一些事件,該事件觸發該功能,並且該功能完成其工作。
FaaS將成為採用微服務的下一個階段。然而,接近FaaS時必須考慮一個主要因素,那就是供應商鎖定。 FaaS隱藏了特定的儲存機制、特定的硬體基礎架構和編排,這對開發人員來說都是很棒的事情。但由於這種抽象,託管的FaaS產品是IT產業有史以來最大的供應商鎖定機會之一。由於這些API不是標準化的,因此從公有雲中的FaaS產品遷移幾乎是不可能的,不會失去已經完成的近100%的工作。如果透過利用來自融合資料平台的事件以更有條理的方式接近FaaS,那麼在雲端運算提供者之間移動將變得更加容易。

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

StableDiffusion3的论文终于来了!这个模型于两周前发布,采用了与Sora相同的DiT(DiffusionTransformer)架构,一经发布就引起了不小的轰动。与之前版本相比,StableDiffusion3生成的图质量有了显著提升,现在支持多主题提示,并且文字书写效果也得到了改善,不再出现乱码情况。StabilityAI指出,StableDiffusion3是一个系列模型,其参数量从800M到8B不等。这一参数范围意味着该模型可以在许多便携设备上直接运行,从而显著降低了使用AI

這篇論文探討了在自動駕駛中,從不同視角(如透視圖和鳥瞰圖)準確檢測物體的問題,特別是如何有效地從透視圖(PV)到鳥瞰圖(BEV)空間轉換特徵,這一轉換是透過視覺轉換(VT)模組實施的。現有的方法大致分為兩種策略:2D到3D和3D到2D轉換。 2D到3D的方法透過預測深度機率來提升密集的2D特徵,但深度預測的固有不確定性,尤其是在遠處區域,可能會引入不準確性。而3D到2D的方法通常使用3D查詢來採樣2D特徵,並透過Transformer學習3D和2D特徵之間對應關係的注意力權重,這增加了計算和部署的

大數據結構處理技巧:分塊:分解資料集並分塊處理,減少記憶體消耗。生成器:逐一產生資料項,無需載入整個資料集,適用於無限資料集。流:逐行讀取檔案或查詢結果,適用於大檔案或遠端資料。外部儲存:對於超大資料集,將資料儲存在資料庫或NoSQL中。

AEC/O(Architecture,Engineering&Construction/Operation)指在建築業中提供建築設計、工程設計、施工及營運的綜合服務。 2024年,AEC/O產業在技術進步中面臨不斷變化的挑戰。今年預計將整合先進技術,預示著設計、建造和營運的典範轉移。為了因應這些變化,業界正在重新定義工作流程,調整優先級,增強合作,以適應快速變化世界的需求。 AEC/O產業以下五大趨勢將成為2024年的關鍵主題,推薦其邁向更整合、反應迅速且永續的未來:一體化供應鏈、智慧工

一、58畫像平台建置背景首先和大家分享下58畫像平台的建造背景。 1.傳統的畫像平台傳統的想法已經不夠,建立用戶畫像平台依賴數據倉儲建模能力,整合多業務線數據,建構準確的用戶畫像;還需要數據挖掘,理解用戶行為、興趣和需求,提供演算法側的能力;最後,還需要具備數據平台能力,有效率地儲存、查詢和共享用戶畫像數據,提供畫像服務。業務自建畫像平台和中台類型畫像平台主要區別在於,業務自建畫像平台服務單條業務線,按需定制;中台平台服務多條業務線,建模複雜,提供更為通用的能力。 2.58中台畫像建構的背景58的使用者畫像

寫在前面&筆者的個人理解基於圖像的3D重建是一項具有挑戰性的任務,涉及從一組輸入圖像推斷目標或場景的3D形狀。基於學習的方法因其直接估計3D形狀的能力而受到關注。這篇綜述論文的重點是最先進的3D重建技術,包括產生新穎的、看不見的視野。概述了高斯飛濺方法的最新發展,包括輸入類型、模型結構、輸出表示和訓練策略。也討論了尚未解決的挑戰和未來的方向。鑑於該領域的快速進展以及增強3D重建方法的眾多機會,對演算法進行全面檢查似乎至關重要。因此,本研究對高斯散射的最新進展進行了全面的概述。 (大拇指往上滑

23年9月國防科大、京東和北理工的論文「DeepModelFusion:ASurvey」。深度模型整合/合併是一種新興技術,它將多個深度學習模型的參數或預測合併為一個模型。它結合了不同模型的能力來彌補單一模型的偏差和錯誤,以獲得更好的性能。而大規模深度學習模型(例如LLM和基礎模型)上的深度模型整合面臨一些挑戰,包括高運算成本、高維度參數空間、不同異質模型之間的干擾等。本文將現有的深度模型融合方法分為四類:(1)“模式連接”,透過一條損失減少的路徑將權重空間中的解連接起來,以獲得更好的模型融合初

在當今大數據時代,數據處理和分析已成為各行業發展的重要支持。而Go語言作為一種開發效率高、效能優越的程式語言,也逐漸被大數據領域所關注。然而,相較於其他語言如Java、Python等,Go語言在大數據框架上的支援相對不足,這給一些開發者帶來了困擾。本文將探討Go語言大數據框架缺失的主要原因,並提出對應的解決方案,同時結合具體的程式碼範例進行說明。一、Go語