分散式系統唯一ID產生方案匯總-php手册-PHP中文網

首頁

php教程

php手册

分散式系統唯一ID產生方案匯總

坏嘻嘻

Sep 14, 2018 pm 01:39 PM

分散式

系統唯一ID是我們在設計一個系統的時候常常會遇見的問題，也常常為這個問題而糾結。產生ID的方法有很多，適應不同的場景、需求以及效能要求。所以有些比較複雜的系統會有多個ID產生的策略。以下就介紹一些常見的ID產生策略。

一、資料庫自增長序列或欄位

最常見的方式。利用資料庫，全資料庫唯一。

優點：

簡單，程式碼方便，效能可以接受。
數字ID自然排序，對分頁或需要排序的結果很有幫助。

缺點：

#不同資料庫語法和實作不同，資料庫遷移的時候或多資料庫版本支援的時候需要處理。
在單一資料庫或讀寫分離或一主多從的情況下，只有一個主庫可以生成。有單點故障的風險。
在效能無法達到要求的情況下，比較難於擴充。
如果遇見多個系統需要合併或涉及資料遷移會相當痛苦。
分錶分庫的時候會有麻煩。

優化方案：

#針對主函式庫單點，如果有多個Master函式庫，則每個Master庫設定的起始數字不一樣，步長一樣，可以是Master的個數。例如：Master1 生成的是 1，4，7，10，Master2生成的是2,5,8,11 Master3生成的是 3,6,9,12。這樣就可以有效產生叢集中的唯一ID，也可以大幅降低ID產生資料庫操作的負載。

二、UUID 常見的方式。

可以利用資料庫也可以利用程式生成，一般來說全球唯一。

優點：

簡單，程式碼方便。
產生ID效能非常好，基本上不會有效能問題。
全球唯一，在遇見資料遷移，系統資料合併，或資料庫變更等情況下，可以從容應對。

缺點：

#沒有排序，無法保證趨勢遞增。
UUID往往是使用字串存儲，查詢的效率比較低。
。儲存空間比較大，如果是海量資料庫，就需要考慮儲存量的問題。
#傳輸資料量大
#不讀取。

三、Redis產生ID

當使用資料庫來產生ID效能不夠要求的時候，我們可以嘗試使用Redis來產生ID。這主要依賴Redis是單線程的，所以也可以用產生全域唯一的ID。可以用Redis的原子操作 INCR和INCRBY來實現。

可以使用Redis叢集來取得更高的吞吐量。假如一個集群中有5個Redis。可以初始化每台Redis的值分別是1,2,3,4,5，然後步長都是5。各Redis產生的ID為：

A：1,6,11,16,21 B：2,7,12,17,22 C：3,8,13,18,23 D：4, 9,14,19,24 E：5,10,15,20,25

這個，隨便負載到哪個機確定好，未來很難做修改。但是3-5台伺服器基本上能夠滿足器上，都可以獲得不同的ID。但是步長和初始值一定需要事先需要了。使用Redis叢集也可以方式單點故障的問題。

另外，比較適合使用Redis來產生每天從0開始的流水號。例如訂單號碼=日期當日自增長號。可以每天在Redis中產生一個Key，使用INCR進行累積。

優點：

不依賴資料庫，靈活方便，且效能優於資料庫。
數字ID自然排序，對分頁或需要排序的結果很有幫助。

缺點：

#如果系統中沒有Redis，還需要引進新的元件，增加系統複雜度。
需要編碼和設定的工作量比較大。

四、Twitter的snowflake演算法

snowflake是Twitter開源的分散式ID產生演算法，結果是一個long類型的ID。其核心思想是：使用41bit作為毫秒數，10bit作為機器的ID（5個bit是資料中心，5個bit的機器ID），12bit作為毫秒內的流水號（意味著每個節點在每毫秒可以產生4096 個ID），最後還有一個符號位，永遠是0。具體實現的程式碼可以參看：https://github.com/twitter/snowflake

public class IdWorker {
// ==============================Fields===========================================
/** 开始时间截 (2015-01-01) */
private final long twepoch = 1420041600000L;

/** 机器id所占的位数 */
private final long workerIdBits = 5L;

/** 数据标识id所占的位数 */
private final long datacenterIdBits = 5L;

/** 支持的最大机器id，结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数) */
private final long maxWorkerId = -1L ^ (-1L << workerIdBits);

/** 支持的最大数据标识id，结果是31 */
private final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);

/** 序列在id中占的位数 */
private final long sequenceBits = 12L;

/** 机器ID向左移12位 */
private final long workerIdShift = sequenceBits;

/** 数据标识id向左移17位(12+5) */
private final long datacenterIdShift = sequenceBits + workerIdBits;

/** 时间截向左移22位(5+5+12) */
private final long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;

/** 生成序列的掩码，这里为4095 (0b111111111111=0xfff=4095) */
private final long sequenceMask = -1L ^ (-1L << sequenceBits);

/** 工作机器ID(0~31) */
private long workerId;

/** 数据中心ID(0~31) */
private long datacenterId;

/** 毫秒内序列(0~4095) */
private long sequence = 0L;

/** 上次生成ID的时间截 */
private long lastTimestamp = -1L;

//==============================Constructors=====================================
/**
 * 构造函数
 * @param workerId 工作ID (0~31)
 * @param datacenterId 数据中心ID (0~31)
 */
public IdWorker(long workerId, long datacenterId) {
    if (workerId > maxWorkerId || workerId < 0) {
        throw new IllegalArgumentException(String.format("worker Id can&#39;t be greater than %d or less than 0", maxWorkerId));
    }
    if (datacenterId > maxDatacenterId || datacenterId < 0) {
        throw new IllegalArgumentException(String.format("datacenter Id can&#39;t be greater than %d or less than 0", maxDatacenterId));
    }
    this.workerId = workerId;
    this.datacenterId = datacenterId;
}

// ==============================Methods==========================================
/**
 * 获得下一个ID (该方法是线程安全的)
 * @return SnowflakeId
 */
public synchronized long nextId() {
    long timestamp = timeGen();

    //如果当前时间小于上一次ID生成的时间戳，说明系统时钟回退过这个时候应当抛出异常
    if (timestamp < lastTimestamp) {
        throw new RuntimeException(
                String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
    }

    //如果是同一时间生成的，则进行毫秒内序列
    if (lastTimestamp == timestamp) {
        sequence = (sequence + 1) & sequenceMask;
        //毫秒内序列溢出
        if (sequence == 0) {
            //阻塞到下一个毫秒,获得新的时间戳
            timestamp = tilNextMillis(lastTimestamp);
        }
    }
    //时间戳改变，毫秒内序列重置
    else {
        sequence = 0L;
    }

    //上次生成ID的时间截
    lastTimestamp = timestamp;

    //移位并通过或运算拼到一起组成64位的ID
    return ((timestamp - twepoch) << timestampLeftShift) //
            | (datacenterId << datacenterIdShift) //
            | (workerId << workerIdShift) //
            | sequence;
}

/**
 * 阻塞到下一个毫秒，直到获得新的时间戳
 * @param lastTimestamp 上次生成ID的时间截
 * @return 当前时间戳
 */
protected long tilNextMillis(long lastTimestamp) {
    long timestamp = timeGen();
    while (timestamp <= lastTimestamp) {
        timestamp = timeGen();
    }
    return timestamp;
}

/**
 * 返回以毫秒为单位的当前时间
 * @return 当前时间(毫秒)
 */
protected long timeGen() {
    return System.currentTimeMillis();
}

//==============================Test=============================================
/** 测试 */
public static void main(String[] args) {
    IdWorker idWorker = new IdWorker(0, 0);
    for (int i = 0; i < 1000; i++) {
        long id = idWorker.nextId();
        System.out.println(Long.toBinaryString(id));
        System.out.println(id);
    }
}}

登入後複製

snowflake演算法可以根據自身專案的需要進行一定的修改。例如估算未來的資料中心個數，每個資料中心的機器數以及統一毫秒可以能的並發數來調整在演算法中所需的bit數。

優點：

不依賴資料庫，靈活方便，且效能優於資料庫。
ID依照時間在單機上是遞增的。

缺點：

#在單機上是遞增的，但由於涉及分散式環境，每台機器上的時鐘不可能完全同步，也許有時候也會出現不是全域遞增的狀況。

五、利用zookeeper產生唯一ID

zookeeper主要透過其znode資料版本來產生序號，可以產生32位元和64位元的資料版本號，客戶端可以使用這個版本號來作為唯一的序號。

很少會使用zookeeper來產生唯一ID。主要是由於需要依賴zookeeper，並且是多步驟呼叫API，如果在競爭較大的情況下，需要考慮使用分散式鎖定。因此，性能在高並發的分散式環境下，也不甚理想。

六、MongoDB的ObjectId

MongoDB的ObjectId和snowflake演算法類似。它設計成輕量的，不同的機器都能用全域唯一的同種方法方便地產生它。 MongoDB 從一開始就設計用來作為分散式資料庫，處理多個節點是一個核心需求。使其在分片環境中要容易產生得多。其格式如下： [src/main/resources/objectId.png] 這裡寫圖片描述:

分散式系統唯一ID產生方案匯總

前4 個位元組是從標準紀元開始的時間戳，單位為秒。時間戳，與隨後的5 個位元組組合起來，提供了秒級別的唯一性。由於時間戳在前，這意味著ObjectId 大致上會按照插入的順序排列。這對於某些方面很有用，例如將其作為索引提高效率。這4 個位元組也隱含了文件建立的時間。絕大多數客戶端類別庫都會公開一個方法從ObjectId 取得這個資訊。接下來的3 位元組是所在主機的唯一識別碼。通常是機器主機名稱的雜湊值。這樣就可以確保不同主機產生不同的ObjectId，不會產生衝突。為了確保在同一台機器上並發的多個進程產生的ObjectId 是唯一的，接下來的兩個位元組來自產生ObjectId 的進程識別碼（PID）。前9 位元組保證了同一秒鐘不同機器不同進程產生的ObjectId 是唯一的。後3 位元組就是一個自動增加的計數器，確保相同進程同一秒產生的ObjectId 也是不一樣的。同一秒鐘最多允許每個進程擁有2563（16 777 216）個不同的ObjectId。

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

AI Hentai Generator

免費產生 AI 無盡。

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7493

CakePHP 教程

1377

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

如何使用Redis實現分散式資料同步 Nov 07, 2023 pm 03:55 PM

如何使用Redis實現分散式資料同步隨著互聯網技術的發展和應用場景的日益複雜，分散式系統的概念越來越被廣泛採用。在分散式系統中，資料同步是一個重要的問題。 Redis作為一個高效能的記憶體資料庫，不僅可以用來儲存數據，還可以用來實現分散式資料同步。對於分散式資料同步，一般有兩種常見的模式：發布/訂閱（Publish/Subscribe）模式和主從複製（Maste

利用MongoDB實現分散式任務調度與執行的經驗分享 Nov 02, 2023 am 09:39 AM

MongoDB是一個開源的NoSQL資料庫，具有高效能、擴充性和靈活性的特性。在分散式系統中，任務調度與執行是一個關鍵的問題，透過利用MongoDB的特性，可以實現分散式任務調度與執行的方案。一、分散式任務調度的需求分析在分散式系統中，任務調度是將任務分配給不同的節點進行執行的過程。常見的任務排程需求包括：1.任務的請求分發：將任務請求傳送給可用的執行節點。

Redis如何實現分散式會話管理 Nov 07, 2023 am 11:10 AM

Redis如何實現分散式會話管理，需要具體程式碼範例分散式會話管理是當下網路熱門話題之一，面對高並發、大數據量的場景，傳統的會話管理方式逐漸顯得力不從心。 Redis作為一個高效能的鍵值資料庫，提供了分散式會話管理的解決方案。本文將介紹如何使用Redis實現分散式會話管理，並給出具體的程式碼範例。一、Redis作為分散式會話儲存介紹傳統的會話管理方式是將會話信

如何使用Swoole實現分散式定時任務調度 Nov 07, 2023 am 11:04 AM

如何使用Swoole實現分散式定時任務調度引言：在傳統的PHP開發中，我們經常使用cron來實現定時任務調度，但是cron只能在單一伺服器上執行任務，無法應對高並發的場景。而Swoole是一款基於PHP的高效能非同步並發框架，它提供了完善的網路通訊能力和多進程支持，使得我們能夠輕鬆實現分散式定時任務調度。本文將介紹如何使用Swoole來實現分散式定時任務調度

Java開發實戰經驗分享：建構分散式日誌收集功能 Nov 20, 2023 pm 01:17 PM

Java開發實戰經驗分享：建立分散式日誌收集功能引言：隨著網際網路的快速發展和大規模資料的湧現，分散式系統的應用越來越廣泛。在分散式系統中，日誌的收集和分析是非常重要的一環。本文將分享Java開發中建構分散式日誌收集功能的經驗，希望能對讀者有所幫助。一、背景介紹在分散式系統中，每個節點都會產生大量的日誌資訊。這些日誌資訊對於系統的效能監控、故障排查和資料分析都

利用Redis實現分散式快取一致性 Nov 07, 2023 pm 12:05 PM

利用Redis實現分散式快取一致性在現代分散式系統中，快取扮演著非常重要的角色。它可以大大降低系統對資料庫的存取頻率，提高系統的效能和吞吐量。而在分散式系統中，為了確保快取的一致性，我們需要解決多個節點之間的資料同步問題。在本文中，我們將介紹如何利用Redis實現分散式快取一致性，並給出具體的程式碼範例。 Redis是一個高效能的鍵值資料庫，它支援持久化、複製和集

利用Redis實現分散式任務調度 Nov 07, 2023 am 08:15 AM

利用Redis實現分散式任務調度隨著業務的擴展和系統的發展，許多業務都需要實現分散式任務調度，以確保任務能夠在多個節點上同時執行，從而提高系統的穩定性和可用性。而Redis作為一款高效能的記憶體資料儲存產品，具備分散式、高可用、高效能等特點，很適合用於實現分散式任務調度。本文將介紹如何利用Redis實現分散式任務調度，並提供對應的程式碼範例。一、Redis的基

如何利用Redis實現分散式訊息發布與訂閱 Nov 07, 2023 am 09:39 AM

如何利用Redis實現分散式訊息發布與訂閱引言：在分散式系統中，訊息發布與訂閱是一種常見的通訊模式，可以實現不同模組之間的解耦。 Redis作為一種高效能的鍵值對儲存系統，可以用來實現分散式訊息發布與訂閱功能。本文將介紹如何使用Redis來實現這項功能，並提供具體的程式碼範例。一、Redis的發布與訂閱功能Redis的發布與訂閱功能是基於訊息隊列的一種實現方式。

See all articles

分散式系統唯一ID產生方案匯總

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題