騰訊發布開源資料元件 Fast-Causal-Inference,支持分散式向量化統計分析和因果推斷
騰訊在其公眾號「騰訊開源」上宣布,旗下的開源分散式資料科學元件專案Fast-Causal-Inference已經在GitHub上公開發布
▲ 圖來源「騰訊開源」公眾號
據悉,這是由騰訊微信研發,採用SQL 互動的,基於分散式向量化的統計分析、因果推斷計算庫,據稱「解決已有統計模型庫(R / Python) 在大數據下的效能瓶頸,提供百億級資料秒級執行的Causal inference 能力,同時透過SQL 語言降低統計模型使用門檻,易用於生產環境中,目前已在微信視訊號碼、微信搜一搜等微信內部多個業務進行了應用。」
#官方介紹:
提供海量資料秒級執行的Causal inference能力
透過利用向量化OLAP執行引擎ClickHouse / StarRocks,可以進一步提升使用者體驗的速度,使其達到極致化程度
極簡的SQL 使用方式
SQLGateway WebServer 透過SQL 語言降低統計模型使用門檻,並在上層提供極簡的SQL 使用方式,透明做引擎相關的SQL 展開和最佳化。
提供基礎算子、高階算子的因果推論能力,及上層的應用封裝
支援ttest, OLS, Lasso, Tree-based model, matching, bootstrap, DML 等。
本站同時得知,官方表示,首個版本已經支援以下特性:
基礎因果推論工具
- 基於deltamethod 的ttest,支援CUPED
- OLS,億行數據,亞秒級
進階因果推斷工具
- #以OLS 為基礎的IV,WLS,以及其他GLS,DID,合成控制,CUPED,mediation 正在孵化
- uplift:千萬數據分鐘級別運算
- bootstrap / permutation 等數據模擬框架,解決沒有顯示解的變異數估計問題
為了保持原意不變,需要將內容改寫成中文。沒有必要出現原句
#以上是騰訊發布開源資料元件 Fast-Causal-Inference,支持分散式向量化統計分析和因果推斷的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

文字標註工作是將標籤或標記與文字中特定內容相對應的工作。其主要目的是為文本提供額外的信息,以便進行更深入的分析和處理,尤其是在人工智慧領域。文字標註對於人工智慧應用中的監督機器學習任務至關重要。用於訓練AI模型,有助於更準確地理解自然語言文本訊息,並提高文本分類、情緒分析和語言翻譯等任務的表現。透過文本標註,我們可以教導AI模型識別文本中的實體、理解上下文,並在出現新的類似數據時做出準確的預測。本文主要推薦一些較好的開源文字標註工具。 1.LabelStudiohttps://github.com/Hu

圖像標註是將標籤或描述性資訊與圖像相關聯的過程,以賦予圖像內容更深層的含義和解釋。這個過程對於機器學習至關重要,它有助於訓練視覺模型以更準確地識別圖像中的各個元素。透過為圖像添加標註,使得電腦能夠理解圖像背後的語義和上下文,從而提高對圖像內容的理解和分析能力。影像標註的應用範圍廣泛,涵蓋了許多領域,如電腦視覺、自然語言處理和圖視覺模型具有廣泛的應用領域,例如,輔助車輛識別道路上的障礙物,幫助疾病的檢測和診斷透過醫學影像識別。本文主要推薦一些較好的開源免費的圖片標註工具。 1.Makesens

5月30日,騰訊宣布旗下混元大模型全面升級,基於混元大模型的App「騰訊元寶」正式上線,蘋果及安卓應用程式商店皆可下載。相較於先前測試階段的混元小程式版本,面向工作效率場景,騰訊元寶提供了AI搜尋、AI總結、AI寫作等核心能力;面向日常生活場景,元寶的玩法也更加豐富,提供了多個特色AI應用,並新增了創建個人智能體等玩法。 「騰訊做大模型不爭一時之先。」騰訊雲副總裁、騰訊混元大模型負責人劉煜宏表示:「過去的一年,我們持續推進騰訊混元大模型的能力爬坡,在豐富、海量的業務場景中打磨技術,同時洞察用戶的真實需求

人臉偵測辨識技術已經是一個比較成熟且應用廣泛的技術。而目前最廣泛的網路應用語言非JS莫屬,在Web前端實現人臉偵測辨識相比後端的人臉辨識有優勢也有弱勢。優點包括減少網路互動、即時識別,大大縮短了使用者等待時間,提高了使用者體驗;弱勢是:受到模型大小限制,其中準確率也有限。如何在web端使用js實現人臉偵測呢?為了實現Web端人臉識別,需要熟悉相關的程式語言和技術,如JavaScript、HTML、CSS、WebRTC等。同時也需要掌握相關的電腦視覺和人工智慧技術。值得注意的是,由於Web端的計

多模態文件理解能力新SOTA!阿里mPLUG團隊發布最新開源工作mPLUG-DocOwl1.5,針對高解析度圖片文字辨識、通用文件結構理解、指令遵循、外部知識引入四大挑戰,提出了一系列解決方案。話不多說,先來看效果。複雜結構的圖表一鍵識別轉換為Markdown格式:不同樣式的圖表都可以:更細節的文字識別和定位也能輕鬆搞定:還能對文檔理解給出詳細解釋:要知道,“文檔理解”目前是大語言模型實現落地的一個重要場景,市面上有許多輔助文檔閱讀的產品,有的主要透過OCR系統進行文字識別,配合LLM進行文字理

论文地址:https://arxiv.org/abs/2307.09283代码地址:https://github.com/THU-MIG/RepViTRepViT在移动端ViT架构中表现出色,展现出显著的优势。接下来,我们将探讨本研究的贡献所在。文中提到,轻量级ViTs通常比轻量级CNNs在视觉任务上表现得更好,这主要归功于它们的多头自注意力模块(MSHA)可以让模型学习全局表示。然而,轻量级ViTs和轻量级CNNs之间的架构差异尚未得到充分研究。在这项研究中,作者们通过整合轻量级ViTs的有效

FP8和更低的浮點數量化精度,不再是H100的「專利」了!老黃想讓大家用INT8/INT4,微軟DeepSpeed團隊在沒有英偉達官方支援的條件下,硬生在A100上跑起FP6。測試結果表明,新方法TC-FPx在A100上的FP6量化,速度接近甚至偶爾超過INT4,而且比後者擁有更高的精度。在此基礎之上,還有端到端的大模型支持,目前已經開源並整合到了DeepSpeed等深度學習推理框架中。這項成果對大模型的加速效果也是立竿見影──在這種框架下用單卡跑Llama,吞吐量比雙卡還要高2.65倍。一名

據了解,騰訊QQ桌面用戶端進行了一系列的大刀闊斧的改革。針對用戶關於高記憶體佔用、超大安裝包、啟動緩慢等問題,QQ技術團隊在記憶體上進行了專案最佳化,取得了階段性進展。日前,QQ技術團隊在InfoQ平台發布了一篇介紹文章,分享了其在記憶體上進行專案優化的階段性進展。據介紹,新版QQ在記憶體上的挑戰主要表現在以下4個面向:產品形態:由1個複雜的大面板(100+複雜程度不等的模組)和一系列獨立功能視窗構成。視窗與渲染進程一一對應,視窗進程數很大程度影響Electron的記憶體佔用。對於那個複雜的大面板,一旦沒有
