基於凸集上投影(POCS)的聚類演算法
POCS:Projections onto Convex Sets。在數學中,凸集是指其中任兩點間的線段均在該集合內的集合。而投影則是將某個點映射到另一個空間中的某個子空間上的動作。給定一個凸集合和一個點,可以透過找到該點在該凸集合上的投影來進行操作。該投影是離該點最近的凸集內的點,可以透過最小化該點和凸集內任何其他點之間的距離來計算。既然是投影,那麼我們就可以將特徵映射到另一個空間中的凸集合上,這樣就可以進行聚類或降維等操作。
本文綜述了一種基於凸集投影法的聚類演算法,即基於POCS的聚類演算法。原始論文發佈在IWIS2022。
凸集
凸集定義為一個資料點集合,其中連接集合中任兩點x1和x2的線段完全包含在這個集合中。根據凸集的定義,認為空集∅、單集、線段、超平面、歐氏球都被認為是凸集。資料點也被認為是凸集,因為它是單例集(只有一個元素的集合)。這為 POCS 的概念應用於聚類資料點開闢了一條新路徑。
凸集投影(POCS)
POCS方法大致可分為交替式和平行式兩種。
1、交替式poc
從資料空間中的任一點開始,從該點到兩個(或多個)相交凸集的交替投影將收斂到集合交點內的一點,例如下圖:
當凸集不相交時,交替投影將收斂到依賴投影階數的greedy limit cycles。
2、並行式POCS
與交替形式不同,並行的POCS 是從資料點到所有凸集同時進行投影,並且每個投影都有一個重要性權重。對於兩個非空相交凸集,類似於交替式版本,平行投影會收斂到集相交處的一個點。
在凸集不相交的情況下,投影將收斂到一個最小解。基於pocs的聚類演算法的主要想法來自於此特性。
有關POCS的更多細節,可以查看原始論文
#基於pocs的聚類演算法
利用並行POCS方法的收斂性,論文作者提出了一個非常簡單但在一定程度上有效的聚類演算法。該演算法的工作原理與經典的K-Means演算法類似,但在處理每個數據點的方式上存在差異:K-Means演算法對每個數據點的重要性加權相同,但是基於pocs的聚類演算法對每個數據點的重要性加權不同,這與數據點到聚類原型的距離成正比。
演算法的偽代碼如下所示:
實驗結果
作者在一些公共基準資料集上測試了基於pocs的聚類演算法的性能。下表總結了這些資料集的描述。
作者比較了基於pocs的聚類演算法與其他傳統聚類方法的效能,包括k均值和模糊c均值演算法。下表總結了執行時間和聚類錯誤方面的評估。
聚類結果如下圖所示:
pip install pocs-based-clustering
# Import packages import time import matplotlib.pyplot as plt from sklearn.datasets import make_blobs from pocs_based_clustering.tools import clustering # Generate a simple dataset num_clusters = 10 X, y = make_blobs(n_samples=5000, centers=num_clusters, cluster_std=0.5, random_state=0) plt.figure(figsize=(8,8)) plt.scatter(X[:, 0], X[:, 1], s=50) plt.show()
# POSC-based Clustering Algorithm centroids, labels = clustering(X, num_clusters, 100) # Display results plt.figure(figsize=(8,8)) plt.scatter(X[:, 0], X[:, 1], c=labels, s=50, cmap='viridis') plt.scatter(centroids[:, 0], centroids[:, 1], s=100, c='red') plt.show()
总结
我们简要回顾了一种简单而有效的基于投影到凸集(POCS)方法的聚类技术,称为基于POCS的聚类算法。该算法利用POCS的收敛特性应用于聚类任务,并在一定程度上实现了可行的改进。在一些基准数据集上验证了该算法的有效性。
论文的地址如下:https://arxiv.org/abs/2208.08888
作者发布的源代码在这里:https://github.com/tranleanh/pocs-based-clustering
以上是基於凸集上投影(POCS)的聚類演算法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

寫在前面&筆者的個人理解目前,在整個自動駕駛系統當中,感知模組扮演了其中至關重要的角色,行駛在道路上的自動駕駛車輛只有通過感知模組獲得到準確的感知結果後,才能讓自動駕駛系統中的下游規控模組做出及時、正確的判斷和行為決策。目前,具備自動駕駛功能的汽車中通常會配備包括環視相機感測器、光達感測器以及毫米波雷達感測器在內的多種數據資訊感測器來收集不同模態的信息,用於實現準確的感知任務。基於純視覺的BEV感知演算法因其較低的硬體成本和易於部署的特點,以及其輸出結果能便捷地應用於各種下游任務,因此受到工業

C++中機器學習演算法面臨的常見挑戰包括記憶體管理、多執行緒、效能最佳化和可維護性。解決方案包括使用智慧指標、現代線程庫、SIMD指令和第三方庫,並遵循程式碼風格指南和使用自動化工具。實作案例展示如何利用Eigen函式庫實現線性迴歸演算法,有效地管理記憶體和使用高效能矩陣操作。

C++sort函數底層採用歸併排序,其複雜度為O(nlogn),並提供不同的排序演算法選擇,包括快速排序、堆排序和穩定排序。

人工智慧(AI)與執法領域的融合為犯罪預防和偵查開啟了新的可能性。人工智慧的預測能力被廣泛應用於CrimeGPT(犯罪預測技術)等系統,用於預測犯罪活動。本文探討了人工智慧在犯罪預測領域的潛力、目前的應用情況、所面臨的挑戰以及相關技術可能帶來的道德影響。人工智慧和犯罪預測:基礎知識CrimeGPT利用機器學習演算法來分析大量資料集,識別可以預測犯罪可能發生的地點和時間的模式。這些資料集包括歷史犯罪統計資料、人口統計資料、經濟指標、天氣模式等。透過識別人類分析師可能忽視的趨勢,人工智慧可以為執法機構

在Go語言中難以實現類似集合的功能,是困擾許多開發者的問題。相較於其他程式語言如Python或Java,Go語言並沒有內建的集合類型,如set、map等,這給開發者在實作集合功能時帶來了一些挑戰。首先,讓我們來看看為何在Go語言中難以直接實現類似集合的功能。在Go語言中,最常用的資料結構是slice(切片)和map(映射),它們可以完成類似集合的功能,但

01前景概要目前,難以在檢測效率和檢測結果之間取得適當的平衡。我們研究了一種用於高解析度光學遙感影像中目標偵測的增強YOLOv5演算法,利用多層特徵金字塔、多重偵測頭策略和混合注意力模組來提高光學遙感影像的目標偵測網路的效果。根據SIMD資料集,新演算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在偵測結果和速度之間達到了更好的平衡。 02背景&動機隨著遠感技術的快速發展,高解析度光學遠感影像已被用於描述地球表面的許多物體,包括飛機、汽車、建築物等。目標檢測在遠感影像的解釋中

一、58畫像平台建置背景首先和大家分享下58畫像平台的建造背景。 1.傳統的畫像平台傳統的想法已經不夠,建立用戶畫像平台依賴數據倉儲建模能力,整合多業務線數據,建構準確的用戶畫像;還需要數據挖掘,理解用戶行為、興趣和需求,提供演算法側的能力;最後,還需要具備數據平台能力,有效率地儲存、查詢和共享用戶畫像數據,提供畫像服務。業務自建畫像平台和中台類型畫像平台主要區別在於,業務自建畫像平台服務單條業務線,按需定制;中台平台服務多條業務線,建模複雜,提供更為通用的能力。 2.58中台畫像建構的背景58的使用者畫像

寫在前面&筆者的個人理解在自動駕駛系統當中,感知任務是整個自駕系統中至關重要的組成部分。感知任務的主要目標是使自動駕駛車輛能夠理解和感知周圍的環境元素,如行駛在路上的車輛、路旁的行人、行駛過程中遇到的障礙物、路上的交通標誌等,從而幫助下游模組做出正確合理的決策和行為。在一輛具備自動駕駛功能的車輛中,通常會配備不同類型的信息採集感測器,如環視相機感測器、雷射雷達感測器以及毫米波雷達感測器等等,從而確保自動駕駛車輛能夠準確感知和理解周圍環境要素,使自動駕駛車輛在自主行駛的過程中能夠做出正確的決斷。目
