五個時間序列預測的深度學習模型比較總結-人工智慧-PHP中文網

2018年M4的結果表明，純粹的「 ML」方法在很大程度上勝過傳統的統計方法，這在當時是出乎意料的。在兩年後的M5[1]中，最的高分是僅有「 ML」方法。而所有前50名基本上都是基於ML的（大部分是樹型模型）。這場比賽看到了LightGBM（用於時間序列預測）以及Amazon's Deepar [2]和N-Beats [3]的首次亮相。 N-Beats模型於2020年發布，並且優於M4比賽的獲勝者3％！

最近的 Ventilator Pressure Prediction比賽展示了使用深度學習方法來應對即時時間序列挑戰的重要性。比賽的目的是預測機械肺內壓力的時間順序。每個訓練實例都是自己的時間序列，因此任務是一個多個時間序列的問題。獲勝團隊提交了多層深度架構，其中包括LSTM網路和Transformer 區塊。

在過去的幾年中，許多著名的架構已經發布，如MQRNN和DSSM。所有這些模型都利用深度學習為時間序列預測領域貢獻了許多新東西。除了贏得Kaggle比賽，也為我們帶來了更多的進步例如：

多功能性：將模型用於不同任務的能力。
MLOP：在生產中使用模型的能力。
解釋性與解釋性：黑盒子模型並不那麼受歡迎。

本文討論了5種專門研究時間序列預測的深度學習體系結構，論文是：

N-BEATS(ElementAI)
DeepAR (Amazon)
Spacetimeformer[4]
Temporal Fusion Transformer or TFT(Google) [5]
TSFormer（時間序列中的MAE）[7]

N-BEATS

這種模式直接來自於(不幸的)短暫的ElementAI公司，該公司是由Yoshua Bengio共同創立的。頂層架構及其主要元件如圖1所示:

五個時間序列預測的深度學習模型比較總結

N-BEATS是一個純粹的深度學習架構，它基於整合前饋網路的深度堆疊，這些網絡也透過正向和反向的相互連接進行堆疊。

每一個區塊只對前一個的backcast所產生的殘差進行建模，然後基於該誤差更新預測。該過程模擬了擬合ARIMA模型時的Box-Jenkins方法。

以下是該模型的主要優勢：

表達性強且易於使用：該模型易於理解，具有模組化結構，它被設計為需要最小的時間序列特徵工程並且不需要對輸入進行縮放。

此模型具有對多個時間序列進行概括的能力。換句話說，分佈略有不同的不同時間序列可以用作輸入。在N-BEATS中是透過元學習實現的。元學習過程包括兩個過程:內部學習過程和外部學習過程。內部學習過程發生在區塊內部，並幫助模型捕捉局部時間特徵。外部學習過程發生在堆疊層，幫助模型學習所有時間序列的全局特徵。

雙重殘差疊加:殘差連接和疊加的想法是非常巧妙的，它幾乎被用於每種類型的深度神經網路。在N-BEATS的實作中應用了相同的原理，但有一些額外的修改:每個區塊有兩個殘差分支，一個運行在回看視窗(稱為backcast)，另一個運行在預測視窗(稱為forecast)。

每一個連續的區塊只對前一個區塊重建的backcast所產生的殘差進行建模，然後基於該誤差更新預測。這有助於模型更好地逼近有用的後推訊號，同時最終的堆疊預測預測被建模為所有部分預測的分層和。就是這個過程模擬了ARIMA模型的Box-Jenkins方法。

可解釋性:模型有兩種變體，通用的和可解釋性的。在通用變體中，網路任意學習每個區塊的全連接層的最終權值。在可解釋的變體中，每個區塊的最後一層被刪除。然後將後推backcast和預測forecast分支乘以模擬趨勢(單調函數)和季節性(週期性循環函數)的特定矩陣。

注意:原始的N-BEATS實作只適用於單變數時間序列。

DeepAR

結合深度學習和自回歸特性的新穎時間序列模型。圖2顯示了DeepAR的頂層架構:

五個時間序列預測的深度學習模型比較總結

以下是該模型的主要優勢：

DeepAR在多個時間序列上工作得非常好:透過使用多個分佈略有不同的時間序列來建構全域模型。也適用於許多現實場景。例如電力公司可能希望為每個客戶推出電力預測服務，每個客戶都有不同的消費模式(這意味著不同的分佈)。

除了歷史數據，DeepAR還允許使用已知的未來時間序列(自回歸模型的一個特點)和額外的靜態屬性。在前面提到的電力需求預測場景中，一個額外的時間變數可以是月份(作為一個整數，值在1-12之間)。假設每個客戶都與一個測量功耗的感測器相關聯，那麼額外的靜態變數將是sensor_id或customer_id之類的東西。

如果莫熟悉使用MLPs和rnn等神經網路架構進行時間序列預測，那麼一個關鍵的預處理步驟是使用標準化或標準化技術對時間序列進行縮放。這在DeepAR中是不需要手動操作的，因為底層的模型對每個時間序列i的自回歸輸入z進行縮放，縮放因子為v_i，即該時間序列的平均值。具體而言，論文基準中使用的比例因子方程式如下:

五個時間序列預測的深度學習模型比較總結

但是在實務中，如果目標時間序列的大小差異很大，那麼在預處理過程中應用自己的縮放還是有必要的。例如，在能源需求預測情境中，資料集可以包含中壓電力客戶(例如小型工廠，按兆瓦單位消耗電力)和低壓客戶(例如家庭，按千瓦單位消耗電力)。

DeepAR進行機率預測，而不是直接輸出未來值。這是以蒙特卡洛樣本的形式完成的。這些預測被用來計算分位數預測，透過使用分位數損失函數。對於不熟悉這種損失類型的人，分位數損失不僅用來計算一個估計，而且用來計算圍繞該值的預測區間。

Spacetimeformer

在單變數時間序列中時間依賴性是最重要的。但在多個時間序列場景中，事情就沒那麼簡單了。例如假設我們有一個天氣預報任務，想要預測五個城市的溫度。讓我們假設這些城市屬於一個國家。鑑於目前所看到的，我們可以使用DeepAR並將每個城市作為外部靜態協變量進行建模。

換句話說，該模型將同時考慮時間和空間關係。這就是Spacetimeformer的核心理念：使用一個模型來利用這些城市/地點之間的空間關係，從而學習額外的有用依賴，因為模型將同時考慮時間和空間關係。

深入研究時空序列

顧名思義，這種模型在內部使用了基於transformers的結構。在使用基於transformers的模型進行時間序列預測時，一種流行的產生時間感知嵌入的技術是透過Time2Vec[6]嵌入層傳遞輸入(對於NLP任務是使用位置編碼向量來取代Time2Vec)。雖然這種技術對於單變量時間序列非常有效，但對於多變量時間輸入卻沒有任何意義。可能是在語言建模中，句子中的每個單字都用嵌入來表示，單字本質上是一個是詞彙表的一部分，而時間序列則沒那麼簡單。

在多元時間序列中，在給定的時間步長t，輸入的形式為x_1,t, x2,t, x_m,t其中x_i,t是特徵i的數值，m是特徵/序列的總數。如果我們將輸入通過一個Time2Vec層，將產生時間嵌入向量。這種嵌入真正代表什麼?答案是它將把整個輸入集合表示為單一實體(令牌)。因此模型將只學習時間步之間的時間動態，但將錯過特徵/變數之間的空間關係。

Spacetimeformer解決了這個問題，它將輸入扁平化為一個大向量，稱為時空序列。如果輸入包含N個變量，組織成T個時間步，則產生的時空序列將具有(NxT)標記。下圖3更好地顯示了這一點:

五個時間序列預測的深度學習模型比較總結

論文指出:「(1)包含時間資訊的多元輸入格式。解碼器輸入缺少(“?”)值，在進行預測時設為零。(2)時間序列透過一個Time2Vec層，產生一個代表週期性輸入模式的頻率嵌入。(3)二進位嵌入表示該值是作為上下文給出的還是需要預測的。(4)將每個時間序列的整數索引映射到一個具有查找表嵌入的「空間」表示。(5)利用前饋層投影每個時間序列的Time2Vec嵌入和變數值。(6)將值和時間，變數和給定的嵌入求和會導致使MSA在時間和可變空間之間以更長的序列作為輸入。

換句話說，最後的序列編碼了一個包含了時間、空間和上下文訊息統一的嵌入。但是這種方法的一個缺點是，序列可能會變得很長導致資源的二次成長。這是因為根據注意機制，每個令牌都要對另一個進行檢查。作者使用了一種更有效的體系結構，稱為Performer注意機制，適用於更大的序列。

Temporal Fusion Transformer

Temporal Fusion Transformer（TFT）是由Google發布的基於Transformer的時間序列預測模型。TFT比以前的模型更加通用。

五個時間序列預測的深度學習模型比較總結

TFT的頂層架構如圖4所示。以下是該模型的主要優勢：

與前面提到的模型一樣，TFT支援在多個異質時間序列上建構模型。

TFT支援三種類型的特徵：i)具有已知的未來輸入的時變資料ii)僅到目前為止已知的時變資料iii)分類/靜態變量，也被稱為時不變特徵。因此TFT比以前的型號更通用。在前面提到的電力需求預測場景中，我們希望使用濕度水平作為時變特徵，這是到目前為止才知道的。這在TFT中是可行的，但在DeepAR中不行。

圖5顯示如何使用所有這些特性的範例:

五個時間序列預測的深度學習模型比較總結

##TFT非常強調可解釋性。具體地說，透過利用Variable Selection組件(如上圖4所示)，模型可以成功地度量每個特性的影響。因此可以說模型學習了特性的重要性。

另一方面，TFT提出了一種新的可解釋的多頭注意機制：該層的注意權重可以揭示在回顧期間哪些時間步是最重要的。這些權重的可視化可以揭示整個數據集中最顯著的季節模式。

預測區間：與DeepAR類似，TFT透過使用分位數迴歸輸出預測區間和預測值。

#綜上所述，深度學習無疑徹底改變了時間序列預測的格局。上述所有模型除了無與倫比的表現之外，還有一個共同點：它們充分利用多重、多元的時間數據，同時它們使用外生信息，將預測性能提高到前所未有的水平。但是在自然語言處理(NLP)任務中多數都利用了預先訓練的模型。 NLP任務的feed大多是人類創造的數據，充滿了豐富而優秀的訊息，幾乎可以看作是一個數據單元。在時間序列預測中，我們可以感覺到缺乏這種預先訓練的模型。為什麼我們不能像在NLP中那樣在時間序列中利用這個優勢呢？

這引出了我們要介紹的最後一個模型TSFormer，該模型考慮了兩個視角，我們講從輸入到輸出將其為四個部分，並且提供Python的實現代碼（官方也提供了），這個模型是剛發布不久的，所以我們才在這裡著重介紹它。

TSFormer

它是一種基於Transformer(TSFormer)的無監督的時間序列預訓練模型，使用了MAE中的訓練策略並且能夠捕捉資料中非常長的依賴關係。

NLP和時間序列：

在某種程度上，NLP資訊和Time Series資料是相同的。它們都是順序資料和局部敏感的，這意味著與它的下一個/以前的資料點有關。但還是有一些區別，在提出我們的預訓練模型時，我們應該考慮兩個差異，就像我們在NLP任務中所做的那樣：

我們需要比NLP資料更長的時間序列資料

TSFormer簡介

TSFormer與MAE的主要體系結構基本類似，數據通過一個編碼器，然後經過一個解碼器，最終的目標是為了重建缺少（人工掩蔽）的資料。

五個時間序列預測的深度學習模型比較總結

我們將他總結為以下4點：

1、掩蔽

作為資料進入編碼器的前一步。輸入序列（Sᶦ）已分佈到P片中，其長度為L。因此，用於預測下一個時間步長的滑動視窗的langth是P XL。

五個時間序列預測的深度學習模型比較總結

遮蔽比率為75％（看著很高，估計是用了MAE一樣的參數）；我們要完成的是一項自監督任務，所以數據越少編碼器的計算速度就越快。

這樣做（掩蔽輸入序列段）的主要原因是：

段（patch）比單點好。
它使使用下游模型變得簡單（STGNN將單元段作為輸入）
可以分解編碼器的輸入大小。

class Patch(nn.Module):<br>def __init__(self, patch_size, input_channel, output_channel, spectral=True):<br>super().__init__()<br>self.output_channel = output_channel<br>self.P = patch_size<br>self.input_channel = input_channel<br>self.output_channel = output_channel<br>self.spectral = spectral<br>if spectral:<br>self.emb_layer = nn.Linear(int(patch_size/2+1)*2, output_channel)<br>else:<br>self.input_embedding = nn.Conv2d(input_channel, output_channel, kernel_size=(self.P, 1), stride=(self.P, 1))<br>def forward(self, input):<br>B, N, C, L = input.shape<br>if self.spectral:<br>spec_feat_ = torch.fft.rfft(input.unfold(-1, self.P, self.P), dim=-1)<br>real = spec_feat_.real<br>imag = spec_feat_.imag<br>spec_feat = torch.cat([real, imag], dim=-1).squeeze(2)<br>output = self.emb_layer(spec_feat).transpose(-1, -2)<br>else:<br>input = input.unsqueeze(-1) # B, N, C, L, 1<br>input = input.reshape(B*N, C, L, 1) # B*N, C, L, 1<br>output = self.input_embedding(input) # B*N, d, L/P, 1<br>output = output.squeeze(-1).view(B, N, self.output_channel, -1)<br>assert output.shape[-1] == L / self.P<br>return output

登入後複製

以下是產生遮蔽的函數：

class MaskGenerator(nn.Module):<br>def __init__(self, mask_size, mask_ratio, distribution='uniform', lm=-1):<br>super().__init__()<br>self.mask_size = mask_size<br>self.mask_ratio = mask_ratio<br>self.sort = True<br>self.average_patch = lm<br>self.distribution = distribution<br>if self.distribution == "geom":<br>assert lm != -1<br>assert distribution in ['geom', 'uniform']<br>def uniform_rand(self):<br>mask = list(range(int(self.mask_size)))<br>random.shuffle(mask)<br>mask_len = int(self.mask_size * self.mask_ratio)<br>self.masked_tokens = mask[:mask_len]<br>self.unmasked_tokens = mask[mask_len:]<br>if self.sort:<br>self.masked_tokens = sorted(self.masked_tokens)<br>self.unmasked_tokens = sorted(self.unmasked_tokens)<br>return self.unmasked_tokens, self.masked_tokens<br>def geometric_rand(self):<br>mask = geom_noise_mask_single(self.mask_size, lm=self.average_patch, masking_ratio=self.mask_ratio) # 1: masked, 0:unmasked<br>self.masked_tokens = np.where(mask)[0].tolist()<br>self.unmasked_tokens = np.where(~mask)[0].tolist()<br># assert len(self.masked_tokens) > len(self.unmasked_tokens)<br>return self.unmasked_tokens, self.masked_tokens<br>def forward(self):<br>if self.distribution == 'geom':<br>self.unmasked_tokens, self.masked_tokens = self.geometric_rand()<br>elif self.distribution == 'uniform':<br>self.unmasked_tokens, self.masked_tokens = self.uniform_rand()<br>else:<br>raise Exception("ERROR")<br>return self.unmasked_tokens, self.masked_tokens

登入後複製

2、編碼

包括了輸入嵌入，位置編碼和Transformer 區塊的。編碼器只能在未遮蔽的patchs上執行（這個也是MAE的方法）。

五個時間序列預測的深度學習模型比較總結

輸入嵌入

使用線性的投影來獲得輸入的嵌入，可將未遮蔽的空間轉換為潛在空間。它的公式可以在下面看到：

五個時間序列預測的深度學習模型比較總結

W和B是可學習的參數，U是維度中的模型輸入向量。

位置編碼

簡單的位置編碼層用於附加新的順序資訊。添加了“可學習”一詞，這有助於表現出比正弦更好的性能。因此可學習的位置嵌入顯示了時間序列的良好結果。

class LearnableTemporalPositionalEncoding(nn.Module):<br>def __init__(self, d_model, dropout=0.1, max_len: int = 1000):<br>super().__init__()<br>self.dropout = nn.Dropout(p=dropout)<br>self.pe = nn.Parameter(torch.empty(max_len, d_model), requires_grad=True)<br>nn.init.uniform_(self.pe, -0.02, 0.02)<br><br>def forward(self, X, index):<br>if index is None:<br>pe = self.pe[:X.size(1), :].unsqueeze(0)<br>else:<br>pe = self.pe[index].unsqueeze(0)<br>X = X + pe<br>X = self.dropout(X)<br>return X<br>class PositionalEncoding(nn.Module):<br>def __init__(self, hidden_dim, dropout=0.1):<br>super().__init__()<br>self.tem_pe = LearnableTemporalPositionalEncoding(hidden_dim, dropout)<br>def forward(self, input, index=None, abs_idx=None):<br>B, N, L_P, d = input.shape<br># temporal embedding<br>input = self.tem_pe(input.view(B*N, L_P, d), index=index)<br>input = input.view(B, N, L_P, d)<br># absolute positional embedding<br>return input

登入後複製

Transformer 區塊

論文使用了4層Transformer ，比電腦視覺和自然語言處理任務中常見的數量低。這裡所使用的Transformer 是最基本的也是在原始論文中提到的結構，如下圖4所示:

五個時間序列預測的深度學習模型比較總結

class TransformerLayers(nn.Module):<br>def __init__(self, hidden_dim, nlayers, num_heads=4, dropout=0.1):<br>super().__init__()<br>self.d_model = hidden_dim<br>encoder_layers = TransformerEncoderLayer(hidden_dim, num_heads, hidden_dim*4, dropout)<br>self.transformer_encoder = TransformerEncoder(encoder_layers, nlayers)<br>def forward(self, src):<br>B, N, L, D = src.shape<br>src = src * math.sqrt(self.d_model)<br>src = src.view(B*N, L, D)<br>src = src.transpose(0, 1)<br>output = self.transformer_encoder(src, mask=None)<br>output = output.transpose(0, 1).view(B, N, L, D)<br>return output

登入後複製

3、解碼

五個時間序列預測的深度學習模型比較總結

此解碼器包含一系列Transformer區塊。它適用於所有的patch（相比之下MAE是沒有位置嵌入，因為他的patch已經有位置資訊），並且層數只有一層，然後使用了簡單的MLP，這使得輸出長度等於每個patch的長度。

4、重建目標

五個時間序列預測的深度學習模型比較總結

對每一個資料點(i)進行遮蔽patch的計算，並選擇mae (Mean-Absolute-Error)作為主序列和重建序列的損失函數。

五個時間序列預測的深度學習模型比較總結

這就是整體的架構了

五個時間序列預測的深度學習模型比較總結

#下面是程式碼實作：

def trunc_normal_(tensor, mean=0., std=1.):<br>__call_trunc_normal_(tensor, mean=mean, std=std, a=-std, b=std)<br>def unshuffle(shuffled_tokens):<br>dic = {}<br>for k, v, in enumerate(shuffled_tokens):<br>dic[v] = k<br>unshuffle_index = []<br>for i in range(len(shuffled_tokens)):<br>unshuffle_index.append(dic[i])<br>return unshuffle_index<br>class TSFormer(nn.Module):<br>def __init__(self, patch_size, in_channel, out_channel, dropout, mask_size, mask_ratio, L=6, distribution='uniform', lm=-1, selected_feature=0, mode='Pretrain', spectral=True):<br>super().__init__()<br>self.patch_size = patch_size<br>self.seleted_feature = selected_feature<br>self.mode = mode<br>self.spectral = spectral<br>self.patch = Patch(patch_size, in_channel, out_channel, spectral=spectral)<br>self.pe = PositionalEncoding(out_channel, dropout=dropout)<br>self.mask = MaskGenerator(mask_size, mask_ratio, distribution=distribution, lm=lm)<br>self.encoder = TransformerLayers(out_channel, L)<br>self.decoder = TransformerLayers(out_channel, 1)<br>self.encoder_2_decoder = nn.Linear(out_channel, out_channel)<br>self.mask_token = nn.Parameter(torch.zeros(1, 1, 1, out_channel))<br>trunc_normal_(self.mask_token, std=.02)<br>if self.spectral:<br>self.output_layer = nn.Linear(out_channel, int(patch_size/2+1)*2)<br>else:<br>self.output_layer = nn.Linear(out_channel, patch_size)<br>def _forward_pretrain(self, input):<br>B, N, C, L = input.shape<br># get patches and exec input embedding<br>patches = self.patch(input) <br>patches = patches.transpose(-1, -2) <br># positional embedding<br>patches = self.pe(patches)<br><br># mask tokens<br>unmasked_token_index, masked_token_index = self.mask()<br>encoder_input = patches[:, :, unmasked_token_index, :] <br># encoder<br>H = self.encoder(encoder_input) <br># encoder to decoder<br>H = self.encoder_2_decoder(H)<br># decoder<br># H_unmasked = self.pe(H, index=unmasked_token_index)<br>H_unmasked = H<br>H_masked = self.pe(self.mask_token.expand(B, N, len(masked_token_index), H.shape[-1]), index=masked_token_index)<br>H_full = torch.cat([H_unmasked, H_masked], dim=-2) # # B, N, L/P, d<br>H = self.decoder(H_full)<br># output layer<br>if self.spectral:<br># output = H<br>spec_feat_H_ = self.output_layer(H)<br>real = spec_feat_H_[..., :int(self.patch_size/2+1)]<br>imag = spec_feat_H_[..., int(self.patch_size/2+1):]<br>spec_feat_H = torch.complex(real, imag)<br>out_full = torch.fft.irfft(spec_feat_H)<br>else:<br>out_full = self.output_layer(H)<br># prepare loss<br>B, N, _, _ = out_full.shape <br>out_masked_tokens = out_full[:, :, len(unmasked_token_index):, :]<br>out_masked_tokens = out_masked_tokens.view(B, N, -1).transpose(1, 2)<br>label_full = input.permute(0, 3, 1, 2).unfold(1, self.patch_size, self.patch_size)[:, :, :, self.seleted_feature, :].transpose(1, 2) # B, N, L/P, P<br>label_masked_tokens = label_full[:, :, masked_token_index, :].contiguous()<br>label_masked_tokens = label_masked_tokens.view(B, N, -1).transpose(1, 2)<br># prepare plot<br>## note that the output_full and label_full are not aligned. The out_full in shuffled<br>### therefore, unshuffle for plot<br>unshuffled_index = unshuffle(unmasked_token_index + masked_token_index)<br>out_full_unshuffled = out_full[:, :, unshuffled_index, :]<br>plot_args = {}<br>plot_args['out_full_unshuffled'] = out_full_unshuffled<br>plot_args['label_full'] = label_full<br>plot_args['unmasked_token_index'] = unmasked_token_index<br>plot_args['masked_token_index'] = masked_token_index<br>return out_masked_tokens, label_masked_tokens, plot_args<br>def _forward_backend(self, input):<br>B, N, C, L = input.shape<br># get patches and exec input embedding<br>patches = self.patch(input) <br>patches = patches.transpose(-1, -2) <br># positional embedding<br>patches = self.pe(patches)<br>encoder_input = patches # no mask when running the backend.<br># encoder<br>H = self.encoder(encoder_input) <br>return H<br>def forward(self, input_data):<br><br>if self.mode == 'Pretrain':<br>return self._forward_pretrain(input_data)<br>else:<br>return self._forward_backend(input_data)

登入後複製

看完這篇論文，我發現這基本上可以說是複製了MAE，或者說是時間序列的MAE，在預測階段也是與MAE類似，使用編碼器的輸出作為特徵，為下游任務提供特徵數據作為輸入，有興趣的可以讀讀原始論文並且看看論文給的代碼。

以上是五個時間序列預測的深度學習模型比較總結的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

AI Hentai Generator

免費產生 AI 無盡。

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7466

CakePHP 教程

1376

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

超越ORB-SLAM3！ SL-SLAM：低光、嚴重抖動和弱紋理場景全搞定 May 30, 2024 am 09:35 AM

寫在前面今天我們探討下深度學習技術如何改善在複雜環境中基於視覺的SLAM（同時定位與地圖建構）表現。透過將深度特徵提取和深度匹配方法相結合，這裡介紹了一種多功能的混合視覺SLAM系統，旨在提高在諸如低光條件、動態光照、弱紋理區域和嚴重抖動等挑戰性場景中的適應性。我們的系統支援多種模式，包括拓展單目、立體、單目-慣性以及立體-慣性配置。除此之外，也分析如何將視覺SLAM與深度學習方法結合，以啟發其他研究。透過在公共資料集和自採樣資料上的廣泛實驗，展示了SL-SLAM在定位精度和追蹤魯棒性方面優

用於時間序列機率預測的分位數迴歸 May 07, 2024 pm 05:04 PM

不要改變原內容的意思，微調內容，重寫內容，不要續寫。「分位數迴歸滿足此需求，提供具有量化機會的預測區間。它是一種統計技術，用於模擬預測變數與反應變數之間的關係，特別是當反應變數的條件分佈命令人感興趣時。⼀組迴歸變數X與被解釋變數Y的分位數之間線性關係的建模⽅法。現有的迴歸模型其實是研究被解釋變數與解釋變數之間關係的一種方法。他們關註解釋變數與被解釋變數之間的關

$突破傳統缺陷檢測的界限，\'Defect Spectrum\'首次實現超高精度豐富語意的工業缺陷檢測。$ 突破傳統缺陷檢測的界限，\'Defect Spectrum\'首次實現超高精度豐富語意的工業缺陷檢測。 Jul 26, 2024 pm 05:38 PM

在現代製造業中，精準的缺陷檢測不僅是確保產品品質的關鍵，更是提升生產效率的核心。然而，現有的缺陷檢測資料集常常缺乏實際應用所需的精確度和語意豐富性，導致模型無法辨識特定的缺陷類別或位置。為了解決這個難題，由香港科技大學廣州和思謀科技組成的頂尖研究團隊，創新地開發了「DefectSpectrum」資料集，為工業缺陷提供了詳盡、語義豐富的大規模標註。如表一所示，相較於其他工業資料集，「DefectSpectrum」資料集提供了最多的缺陷標註（5438張缺陷樣本），最細緻的缺陷分類（125個缺陷類別

英偉達對話模式ChatQA進化到2.0版本，上下文長度提到128K Jul 26, 2024 am 08:40 AM

開放LLM社群正是百花齊放、競相爭鳴的時代，你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1等許多表現優良的模型。但是，相較於以GPT-4-Turbo為代表的專有大模型，開放模型在許多領域仍有明顯差距。在通用模型之外，也有一些專精關鍵領域的開放模型已被開發出來，例如用於程式設計和數學的DeepSeek-Coder-V2、用於視覺-語言任務的InternVL

GoogleAI拿下IMO奧數銀牌，數學推理模型AlphaProof面世，強化學習 is so back Jul 26, 2024 pm 02:40 PM

對AI來說，奧數不再是問題了。本週四，GoogleDeepMind的人工智慧完成了一項壯舉：用AI做出了今年國際數學奧林匹克競賽IMO的真題，並且距拿金牌僅一步之遙。上週剛結束的IMO競賽共有六道賽題，涉及代數、組合學、幾何和數論。谷歌提出的混合AI系統做對了四道，獲得28分，達到了銀牌水準。本月初，UCLA終身教授陶哲軒剛剛宣傳了百萬美元獎金的AI數學奧林匹克競賽（AIMO進步獎），沒想到7月還沒過，AI的做題水平就進步到了這種水平。 IMO上同步做題，做對了最難題IMO是歷史最悠久、規模最大、最負

Nature觀點，人工智慧在醫學上的測試一片混亂，該怎麼做？ Aug 22, 2024 pm 04:37 PM

編輯|ScienceAI基於有限的臨床數據，數百種醫療演算法已被批准。科學家們正在討論由誰來測試這些工具，以及如何最好地進行測試。 DevinSingh在急診室目睹了一名兒科患者因長時間等待救治而心臟驟停，這促使他探索AI在縮短等待時間中的應用。 Singh利用了SickKids急診室的分診數據，與同事們建立了一系列AI模型，用於提供潛在診斷和推薦測試。一項研究表明，這些模型可以加快22.3%的就診速度，將每位需要進行醫學檢查的患者的結果處理速度加快近3小時。然而，人工智慧演算法在研究中的成功只是驗證此

數百萬晶體資料訓練，解決晶體學相位問題，深度學習方法PhAI登Science Aug 08, 2024 pm 09:22 PM

編輯|KX時至今日，晶體學所測定的結構細節和精度，從簡單的金屬到大型膜蛋白，是任何其他方法都無法比擬的。然而，最大的挑戰——所謂的相位問題，仍然是從實驗確定的振幅中檢索相位資訊。丹麥哥本哈根大學研究人員，開發了一種解決晶體相問題的深度學習方法PhAI，利用數百萬人工晶體結構及其相應的合成衍射數據訓練的深度學習神經網絡，可以產生準確的電子密度圖。研究表明，這種基於深度學習的從頭算結構解決方案方法，可以以僅2埃的分辨率解決相位問題，該分辨率僅相當於原子分辨率可用數據的10%到20%，而傳統的從頭算方

為大模型提供全新科學複雜問答基準與評估體系，UNSW、阿貢、芝加哥大學等多家機構共同推出SciQAG框架 Jul 25, 2024 am 06:42 AM

編輯|ScienceAI問答（QA）資料集在推動自然語言處理（NLP）研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型，也可以有效評估大語言模型（LLM）的能力，尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集，涵蓋了醫學、化學、生物等領域，但這些數據集仍有一些不足之處。其一，資料形式較為單一，大多數為多項選擇題（multiple-choicequestions），它們易於進行評估，但限制了模型的答案選擇範圍，無法充分測試模型的科學問題解答能力。相比之下，開放式問答

See all articles

五個時間序列預測的深度學習模型比較總結

N-BEATS

DeepAR

Spacetimeformer

深入研究時空序列

Temporal Fusion Transformer

1、掩蔽

2、編碼

輸入嵌入

位置編碼

Transformer 區塊

3、解碼

4、重建目標

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題