目錄
極簡的SQL 使用方式
提供基礎算子、高階算子的因果推論能力,及上層的應用封裝
基礎因果推論工具
進階因果推斷工具
首頁 科技週邊 人工智慧 騰訊發布開源資料元件 Fast-Causal-Inference,支持分散式向量化統計分析和因果推斷

騰訊發布開源資料元件 Fast-Causal-Inference,支持分散式向量化統計分析和因果推斷

Sep 18, 2023 pm 04:57 PM
騰訊 開源

騰訊在其公眾號「騰訊開源」上宣布,旗下的開源分散式資料科學元件專案Fast-Causal-Inference已經在GitHub上公開發布

腾讯发布开源数据组件 Fast-Causal-Inference,支持分布式向量化统计分析和因果推断▲ 圖來源「騰訊開源」公眾號

據悉,這是由騰訊微信研發,採用SQL 互動的,基於分散式向量化的統計分析、因果推斷計算庫,據稱「解決已有統計模型庫(R / Python) 在大數據下的效能瓶頸,提供百億級資料秒級執行的Causal inference 能力,同時透過SQL 語言降低統計模型使用門檻,易用於生產環境中,目前已在微信視訊號碼、微信搜一搜等微信內部多個業務進行了應用。」

#官方介紹:

提供海量資料秒級執行的Causal inference能力 

透過利用向量化OLAP執行引擎ClickHouse / StarRocks,可以進一步提升使用者體驗的速度,使其達到極致化程度

腾讯发布开源数据组件 Fast-Causal-Inference,支持分布式向量化统计分析和因果推断


極簡的SQL 使用方式

SQLGateway WebServer 透過SQL 語言降低統計模型使用門檻,並在上層提供極簡的SQL 使用方式,透明做引擎相關的SQL 展開和最佳化。

腾讯发布开源数据组件 Fast-Causal-Inference,支持分布式向量化统计分析和因果推断

提供基礎算子、高階算子的因果推論能力,及上層的應用封裝

支援ttest, OLS, Lasso, Tree-based model, matching, bootstrap, DML 等。

腾讯发布开源数据组件 Fast-Causal-Inference,支持分布式向量化统计分析和因果推断

本站同時得知,官方表示,首個版本已經支援以下特性:

基礎因果推論工具

  • 基於deltamethod 的ttest,支援CUPED
  • OLS,億行數據,亞秒級

進階因果推斷工具

  • #以OLS 為基礎的IV,WLS,以及其他GLS,DID,合成控制,CUPED,mediation 正在孵化
  • uplift:千萬數據分鐘級別運算
  • bootstrap / permutation 等數據模擬框架,解決沒有顯示解的變異數估計問題

為了保持原意不變,需要將內容改寫成中文。沒有必要出現原句

#

以上是騰訊發布開源資料元件 Fast-Causal-Inference,支持分散式向量化統計分析和因果推斷的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1660
14
CakePHP 教程
1417
52
Laravel 教程
1311
25
PHP教程
1261
29
C# 教程
1234
24
十個推薦開源免費文字標註工具 十個推薦開源免費文字標註工具 Mar 26, 2024 pm 08:20 PM

文字標註工作是將標籤或標記與文字中特定內容相對應的工作。其主要目的是為文本提供額外的信息,以便進行更深入的分析和處理,尤其是在人工智慧領域。文字標註對於人工智慧應用中的監督機器學習任務至關重要。用於訓練AI模型,有助於更準確地理解自然語言文本訊息,並提高文本分類、情緒分析和語言翻譯等任務的表現。透過文本標註,我們可以教導AI模型識別文本中的實體、理解上下文,並在出現新的類似數據時做出準確的預測。本文主要推薦一些較好的開源文字標註工具。 1.LabelStudiohttps://github.com/Hu

15個值得推薦的開源免費圖片標註工具 15個值得推薦的開源免費圖片標註工具 Mar 28, 2024 pm 01:21 PM

圖像標註是將標籤或描述性資訊與圖像相關聯的過程,以賦予圖像內容更深層的含義和解釋。這個過程對於機器學習至關重要,它有助於訓練視覺模型以更準確地識別圖像中的各個元素。透過為圖像添加標註,使得電腦能夠理解圖像背後的語義和上下文,從而提高對圖像內容的理解和分析能力。影像標註的應用範圍廣泛,涵蓋了許多領域,如電腦視覺、自然語言處理和圖視覺模型具有廣泛的應用領域,例如,輔助車輛識別道路上的障礙物,幫助疾病的檢測和診斷透過醫學影像識別。本文主要推薦一些較好的開源免費的圖片標註工具。 1.Makesens

大模型App騰訊元寶上線!混元再升級,打造可隨身攜帶的全能AI助理 大模型App騰訊元寶上線!混元再升級,打造可隨身攜帶的全能AI助理 Jun 09, 2024 pm 10:38 PM

5月30日,騰訊宣布旗下混元大模型全面升級,基於混元大模型的App「騰訊元寶」正式上線,蘋果及安卓應用程式商店皆可下載。相較於先前測試階段的混元小程式版本,面向工作效率場景,騰訊元寶提供了AI搜尋、AI總結、AI寫作等核心能力;面向日常生活場景,元寶的玩法也更加豐富,提供了多個特色AI應用,並新增了創建個人智能體等玩法。 「騰訊做大模型不爭一時之先。」騰訊雲副總裁、騰訊混元大模型負責人劉煜宏表示:「過去的一年,我們持續推進騰訊混元大模型的能力爬坡,在豐富、海量的業務場景中打磨技術,同時洞察用戶的真實需求

建議:優秀JS開源人臉偵測辨識項目 建議:優秀JS開源人臉偵測辨識項目 Apr 03, 2024 am 11:55 AM

人臉偵測辨識技術已經是一個比較成熟且應用廣泛的技術。而目前最廣泛的網路應用語言非JS莫屬,在Web前端實現人臉偵測辨識相比後端的人臉辨識有優勢也有弱勢。優點包括減少網路互動、即時識別,大大縮短了使用者等待時間,提高了使用者體驗;弱勢是:受到模型大小限制,其中準確率也有限。如何在web端使用js實現人臉偵測呢?為了實現Web端人臉識別,需要熟悉相關的程式語言和技術,如JavaScript、HTML、CSS、WebRTC等。同時也需要掌握相關的電腦視覺和人工智慧技術。值得注意的是,由於Web端的計

阿里7B多模態文件理解大模型拿下新SOTA 阿里7B多模態文件理解大模型拿下新SOTA Apr 02, 2024 am 11:31 AM

多模態文件理解能力新SOTA!阿里mPLUG團隊發布最新開源工作mPLUG-DocOwl1.5,針對高解析度圖片文字辨識、通用文件結構理解、指令遵循、外部知識引入四大挑戰,提出了一系列解決方案。話不多說,先來看效果。複雜結構的圖表一鍵識別轉換為Markdown格式:不同樣式的圖表都可以:更細節的文字識別和定位也能輕鬆搞定:還能對文檔理解給出詳細解釋:要知道,“文檔理解”目前是大語言模型實現落地的一個重要場景,市面上有許多輔助文檔閱讀的產品,有的主要透過OCR系統進行文字識別,配合LLM進行文字理

1.3ms耗時!清華最新開源行動裝置神經網路架構 RepViT 1.3ms耗時!清華最新開源行動裝置神經網路架構 RepViT Mar 11, 2024 pm 12:07 PM

论文地址:https://arxiv.org/abs/2307.09283代码地址:https://github.com/THU-MIG/RepViTRepViT在移动端ViT架构中表现出色,展现出显著的优势。接下来,我们将探讨本研究的贡献所在。文中提到,轻量级ViTs通常比轻量级CNNs在视觉任务上表现得更好,这主要归功于它们的多头自注意力模块(MSHA)可以让模型学习全局表示。然而,轻量级ViTs和轻量级CNNs之间的架构差异尚未得到充分研究。在这项研究中,作者们通过整合轻量级ViTs的有效

單卡跑Llama 70B快過雙卡,微軟硬生把FP6搞到A100哩 | 開源 單卡跑Llama 70B快過雙卡,微軟硬生把FP6搞到A100哩 | 開源 Apr 29, 2024 pm 04:55 PM

FP8和更低的浮點數量化精度,不再是H100的「專利」了!老黃想讓大家用INT8/INT4,微軟DeepSpeed團隊在沒有英偉達官方支援的條件下,硬生在A100上跑起FP6。測試結果表明,新方法TC-FPx在A100上的FP6量化,速度接近甚至偶爾超過INT4,而且比後者擁有更高的精度。在此基礎之上,還有端到端的大模型支持,目前已經開源並整合到了DeepSpeed等深度學習推理框架中。這項成果對大模型的加速效果也是立竿見影──在這種框架下用單卡跑Llama,吞吐量比雙卡還要高2.65倍。一名

騰訊QQ NT架構版本記憶體最佳化進展公佈,聊天場景控制在300M內 騰訊QQ NT架構版本記憶體最佳化進展公佈,聊天場景控制在300M內 Mar 05, 2024 pm 03:52 PM

據了解,騰訊QQ桌面用戶端進行了一系列的大刀闊斧的改革。針對用戶關於高記憶體佔用、超大安裝包、啟動緩慢等問題,QQ技術團隊在記憶體上進行了專案最佳化,取得了階段性進展。日前,QQ技術團隊在InfoQ平台發布了一篇介紹文章,分享了其在記憶體上進行專案優化的階段性進展。據介紹,新版QQ在記憶體上的挑戰主要表現在以下4個面向:產品形態:由1個複雜的大面板(100+複雜程度不等的模組)和一系列獨立功能視窗構成。視窗與渲染進程一一對應,視窗進程數很大程度影響Electron的記憶體佔用。對於那個複雜的大面板,一旦沒有

See all articles