2022 年下半年數據與人工智慧技術預測
根據我們在 2022 年到目前為止的情況,Datanami 有信心在今年餘下的時間裡做出這五個預測。
資料可觀察性持續運行
今年上半年對於資料可觀察性來說意義重大,這讓客戶可以更好地了解資料流的情況並制定相關指標。隨著數據對於決策變得越來越重要,該數據的健康和可用性也變得越來越重要。
我們看到許多數據可觀察性新創公司獲得了數億美元的風險投資,其中包括Cribl(價值1.5 億美元的D 輪融資);蒙地卡羅(D 系列價值1.35 億美元) ;Coralogix(D 系列價值1.42 億美元);和別的。其他製造新聞的公司包括推出元數據指標的Bigeye;StreamSets,被Software AG以 5.8 億美元收購;IBM上個月收購了可觀察性新創公司 Databand 。
這種勢頭將在 2022 年下半年繼續,因為越來越多的數據可觀察性新創公司走出困境,現有的新創公司尋求鞏固其在這個新興市場中的地位。
即時資料彈出
即時資料多年來一直處於次要地位,服務於一些小眾用例,但實際上並未在常規企業中廣泛使用。但是,由於過去幾年的新冠疫情和相關的商業計劃重組,即時數據進入主流科技圈的條件現在已經成熟。
「我認為串流媒體終於發生了,」 Databricks執行長Ali Ghodsi 在最近的Data AI 高峰會上表示,並指出該公司基於雲端的數據平台上的串流媒體工作負載增長了2.5 倍。 「他們有越來越多的 AI 用例需要即時。」
記憶體資料庫和記憶體資料網格也準備從即時復興中受益(如果是這樣的話)。 RocksDB是一個快速分析資料庫,它增強了 Kafka 等基於事件的系統,現在有一個名為 Speedb 的替代品。 SingleStore在一個單一的關係框架中結合了 OLTP 和 OLAP 功能,在上個月的一輪融資中達到了 13 億美元的估值。
還有StarRocks ,它最近獲得了基於Apache Doris的快速新OLAP 資料庫的資助;Imply於5 月完成了1 億美元的D 輪融資,以繼續其基於Apache Druid 的即時分析業務; DataStax將Apache Pulsar 加入其Apache Cassandra 工具包中,籌集了1.15 億美元用於推動即時應用程式開發。 Datanami預計這種對即時數據分析的關注將持續下去。
監管成長
GDPR生效已經四年了,讓大數據用戶受到關注,並加速了資料治理作為負責任資料計畫的必要組成部分的興起。在美國,監管資料存取的任務已經落到各州身上,加州在 CCPA 方面處於領先地位,它在許多方面模仿了 GPDR。但更多的州可能會效仿,這使美國公司的資料隱私等式變得複雜。
但 GDPR 和 CCPA 只是法規的開始。我們也處於第三方 cookie 的消亡之中,這使得公司更難追蹤用戶的線上行為。谷歌決定將其平台上第三方 cookie 的終止時間推遲到 2023 年 1 月 1 日,這給了行銷人員一些額外的時間來適應,但來自 cookie 的資訊將難以複製。
除了資料法規之外,我們還處於關於使用人工智慧的新法規的風口浪尖。歐盟於 2021 年推出了人工智慧法案,專家預測它可能會在 2022 年底或 2023 年初成為法律。
資料表格式之戰
一場經典的科技大戰正在形成新的資料表格式,這將決定資料如何儲存在大數據系統中,誰可以存取它,以及用戶可以用它做什麼。
最近幾個月, Apache Iceberg作為資料表格式的潛在新標準獲得了熱潮。雲端資料倉儲巨頭Snowflake和AWS今年年初出來支援 Iceberg,後者提供交易和其他資料控制,並從 Netflix 和 Apple 的工作中脫穎而出。前 Hadoop 經銷商Cloudera在 6 月也支援了 Iceberg。
但是 Databricks 的人們提供了 Delta Lake 表格式的替代方案,它提供了與 Iceberg 類似的功能。 Apache Spark 支持者最初以專有方式開發了 Delta Lake 表格式,這導致指責 Databricks 為客戶設定鎖定。但在 6 月的資料 AI 高峰會上,該公司宣布將把整個格式都開源,讓任何人都可以使用它。
在洗牌中迷失的是Apache Hudi,它還提供了資料的一致性,因為它位於大數據儲存庫中並且可以被各種計算引擎存取。 Onehouse是一家由 Apache Hudi 的創作者支援的企業,今年稍早推出了一個基於 Hudi 的 Lakehouse 平台。
大數據生態系統喜歡競爭,因此在 2022 年剩餘時間裡觀察這些格式的演變和競爭將會很有趣。
語言 AI 繼續令人驚嘆
人工智慧的前沿逐月變得越來越鋒利,而今天,人工智慧的矛頭是大語言模型,它越來越好。事實上,大型語言模型已經變得如此出色,以至於 6 月的一位Google工程師聲稱該公司的 LaMDA 會話系統已經變得具有感知力。
人工智慧還沒有感知能力,但這並不意味著它們對企業沒有用處。提醒我們,Salesforce有一個名為 CodeGen 的大型語言模型 (LLM) 項目,該項目旨在理解原始程式碼,甚至以不同的程式語言產生自己的程式碼。
上個月,Meta(Facebook 的母公司)推出了一個可以翻譯 200 種語言的大型語言模型。我們也看到了透過 BigScience 大型開放科學開放存取多語言語言模型或BLOOM等計畫使 AI 民主化的努力。
以上是2022 年下半年數據與人工智慧技術預測的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

本站6月27日訊息,剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體,依託於抖音平台且基本面向該平台用戶製作短影片內容,並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級,推出全新SVIP,包含多種AI黑科技,例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面,剪映SVIP月費79元,年費599元(本站註:折合每月49.9元),連續包月則為59元每月,連續包年為499元每年(折合每月41.6元) 。此外,剪映官方也表示,為提升用戶體驗,向已訂閱了原版VIP

透過將檢索增強生成和語意記憶納入AI編碼助手,提升開發人員的生產力、效率和準確性。譯自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。雖然基本AI程式設計助理自然有幫助,但由於依賴對軟體語言和編寫軟體最常見模式的整體理解,因此常常無法提供最相關和正確的程式碼建議。這些編碼助手產生的代碼適合解決他們負責解決的問題,但通常不符合各個團隊的編碼標準、慣例和風格。這通常會導致需要修改或完善其建議,以便將程式碼接受到應

大型語言模型(LLM)是在龐大的文字資料庫上訓練的,在那裡它們獲得了大量的實際知識。這些知識嵌入到它們的參數中,然後可以在需要時使用。這些模型的知識在訓練結束時被「具體化」。在預訓練結束時,模型實際上停止學習。對模型進行對齊或進行指令調優,讓模型學習如何充分利用這些知識,以及如何更自然地回應使用者的問題。但是有時模型知識是不夠的,儘管模型可以透過RAG存取外部內容,但透過微調使用模型適應新的領域被認為是有益的。這種微調是使用人工標註者或其他llm創建的輸入進行的,模型會遇到額外的實際知識並將其整合

想了解更多AIGC的內容,請造訪:51CTOAI.x社群https://www.51cto.com/aigc/譯者|晶顏審校|重樓不同於網路上隨處可見的傳統問題庫,這些問題需要跳脫常規思維。大語言模型(LLM)在數據科學、生成式人工智慧(GenAI)和人工智慧領域越來越重要。這些複雜的演算法提升了人類的技能,並在許多產業中推動了效率和創新性的提升,成為企業保持競爭力的關鍵。 LLM的應用範圍非常廣泛,它可以用於自然語言處理、文字生成、語音辨識和推薦系統等領域。透過學習大量的數據,LLM能夠產生文本

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

蘋果公司最新發布的iOS18、iPadOS18以及macOSSequoia系統為Photos應用程式增添了一項重要功能,旨在幫助用戶輕鬆恢復因各種原因遺失或損壞的照片和影片。這項新功能在Photos應用的"工具"部分引入了一個名為"已恢復"的相冊,當用戶設備中存在未納入其照片庫的圖片或影片時,該相冊將自動顯示。 "已恢復"相簿的出現為因資料庫損壞、相機應用未正確保存至照片庫或第三方應用管理照片庫時照片和視頻丟失提供了解決方案。使用者只需簡單幾步

編輯|KX在藥物研發領域,準確有效地預測蛋白質與配體的結合親和力對於藥物篩選和優化至關重要。然而,目前的研究並沒有考慮到分子表面訊息在蛋白質-配體相互作用中的重要作用。基於此,來自廈門大學的研究人員提出了一種新穎的多模態特徵提取(MFE)框架,該框架首次結合了蛋白質表面、3D結構和序列的信息,並使用交叉注意機制進行不同模態之間的特徵對齊。實驗結果表明,該方法在預測蛋白質-配體結合親和力方面取得了最先進的性能。此外,消融研究證明了該框架內蛋白質表面資訊和多模態特徵對齊的有效性和必要性。相關研究以「S

本站8月1日消息,SK海力士今天(8月1日)發布博文,宣布將出席8月6日至8日,在美國加州聖克拉拉舉行的全球半導體記憶體峰會FMS2024,展示諸多新一代產品。未來記憶體和儲存高峰會(FutureMemoryandStorage)簡介前身是主要面向NAND供應商的快閃記憶體高峰會(FlashMemorySummit),在人工智慧技術日益受到關注的背景下,今年重新命名為未來記憶體和儲存高峰會(FutureMemoryandStorage),以邀請DRAM和儲存供應商等更多參與者。新產品SK海力士去年在
