分布式系统唯一ID生成方案汇总-php手册-php.cn

Rumah

php教程

php手册

分布式系统唯一ID生成方案汇总

坏嘻嘻

Sep 14, 2018 pm 01:39 PM

diedarkan

系统唯一ID是我们在设计一个系统的时候常常会遇见的问题，也常常为这个问题而纠结。生成ID的方法有很多，适应不同的场景、需求以及性能要求。所以有些比较复杂的系统会有多个ID生成的策略。下面就介绍一些常见的ID生成策略。

一、数据库自增长序列或字段

最常见的方式。利用数据库，全数据库唯一。

优点：

简单，代码方便，性能可以接受。
数字ID天然排序，对分页或者需要排序的结果很有帮助。

缺点：

不同数据库语法和实现不同，数据库迁移的时候或多数据库版本支持的时候需要处理。
在单个数据库或读写分离或一主多从的情况下，只有一个主库可以生成。有单点故障的风险。
在性能达不到要求的情况下，比较难于扩展。
如果遇见多个系统需要合并或者涉及到数据迁移会相当痛苦。
分表分库的时候会有麻烦。

优化方案：

针对主库单点，如果有多个Master库，则每个Master库设置的起始数字不一样，步长一样，可以是Master的个数。比如：Master1 生成的是 1，4，7，10，Master2生成的是2,5,8,11 Master3生成的是 3,6,9,12。这样就可以有效生成集群中的唯一ID，也可以大大降低ID生成数据库操作的负载。

二、UUID 常见的方式。

可以利用数据库也可以利用程序生成，一般来说全球唯一。

优点：

简单，代码方便。
生成ID性能非常好，基本不会有性能问题。
全球唯一，在遇见数据迁移，系统数据合并，或者数据库变更等情况下，可以从容应对。

缺点：

没有排序，无法保证趋势递增。
UUID往往是使用字符串存储，查询的效率比较低。
存储空间比较大，如果是海量数据库，就需要考虑存储量的问题。
传输数据量大
不可读。

三、Redis生成ID

当使用数据库来生成ID性能不够要求的时候，我们可以尝试使用Redis来生成ID。这主要依赖于Redis是单线程的，所以也可以用生成全局唯一的ID。可以用Redis的原子操作 INCR和INCRBY来实现。

可以使用Redis集群来获取更高的吞吐量。假如一个集群中有5台Redis。可以初始化每台Redis的值分别是1,2,3,4,5，然后步长都是5。各个Redis生成的ID为：

A：1,6,11,16,21 B：2,7,12,17,22 C：3,8,13,18,23 D：4,9,14,19,24 E：5,10,15,20,25

这个，随便负载到哪个机确定好，未来很难做修改。但是3-5台服务器基本能够满足器上，都可以获得不同的ID。但是步长和初始值一定需要事先需要了。使用Redis集群也可以方式单点故障的问题。

另外，比较适合使用Redis来生成每天从0开始的流水号。比如订单号=日期+当日自增长号。可以每天在Redis中生成一个Key，使用INCR进行累加。

优点：

不依赖于数据库，灵活方便，且性能优于数据库。
数字ID天然排序，对分页或者需要排序的结果很有帮助。

缺点：

如果系统中没有Redis，还需要引入新的组件，增加系统复杂度。
需要编码和配置的工作量比较大。

四、Twitter的snowflake算法

snowflake是Twitter开源的分布式ID生成算法，结果是一个long型的ID。其核心思想是：使用41bit作为毫秒数，10bit作为机器的ID（5个bit是数据中心，5个bit的机器ID），12bit作为毫秒内的流水号（意味着每个节点在每毫秒可以产生 4096 个 ID），最后还有一个符号位，永远是0。具体实现的代码可以参看：https://github.com/twitter/snowflake

public class IdWorker {
// ==============================Fields===========================================
/** 开始时间截 (2015-01-01) */
private final long twepoch = 1420041600000L;

/** 机器id所占的位数 */
private final long workerIdBits = 5L;

/** 数据标识id所占的位数 */
private final long datacenterIdBits = 5L;

/** 支持的最大机器id，结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数) */
private final long maxWorkerId = -1L ^ (-1L << workerIdBits);

/** 支持的最大数据标识id，结果是31 */
private final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);

/** 序列在id中占的位数 */
private final long sequenceBits = 12L;

/** 机器ID向左移12位 */
private final long workerIdShift = sequenceBits;

/** 数据标识id向左移17位(12+5) */
private final long datacenterIdShift = sequenceBits + workerIdBits;

/** 时间截向左移22位(5+5+12) */
private final long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;

/** 生成序列的掩码，这里为4095 (0b111111111111=0xfff=4095) */
private final long sequenceMask = -1L ^ (-1L << sequenceBits);

/** 工作机器ID(0~31) */
private long workerId;

/** 数据中心ID(0~31) */
private long datacenterId;

/** 毫秒内序列(0~4095) */
private long sequence = 0L;

/** 上次生成ID的时间截 */
private long lastTimestamp = -1L;

//==============================Constructors=====================================
/**
 * 构造函数
 * @param workerId 工作ID (0~31)
 * @param datacenterId 数据中心ID (0~31)
 */
public IdWorker(long workerId, long datacenterId) {
    if (workerId > maxWorkerId || workerId < 0) {
        throw new IllegalArgumentException(String.format("worker Id can&#39;t be greater than %d or less than 0", maxWorkerId));
    }
    if (datacenterId > maxDatacenterId || datacenterId < 0) {
        throw new IllegalArgumentException(String.format("datacenter Id can&#39;t be greater than %d or less than 0", maxDatacenterId));
    }
    this.workerId = workerId;
    this.datacenterId = datacenterId;
}

// ==============================Methods==========================================
/**
 * 获得下一个ID (该方法是线程安全的)
 * @return SnowflakeId
 */
public synchronized long nextId() {
    long timestamp = timeGen();

    //如果当前时间小于上一次ID生成的时间戳，说明系统时钟回退过这个时候应当抛出异常
    if (timestamp < lastTimestamp) {
        throw new RuntimeException(
                String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
    }

    //如果是同一时间生成的，则进行毫秒内序列
    if (lastTimestamp == timestamp) {
        sequence = (sequence + 1) & sequenceMask;
        //毫秒内序列溢出
        if (sequence == 0) {
            //阻塞到下一个毫秒,获得新的时间戳
            timestamp = tilNextMillis(lastTimestamp);
        }
    }
    //时间戳改变，毫秒内序列重置
    else {
        sequence = 0L;
    }

    //上次生成ID的时间截
    lastTimestamp = timestamp;

    //移位并通过或运算拼到一起组成64位的ID
    return ((timestamp - twepoch) << timestampLeftShift) //
            | (datacenterId << datacenterIdShift) //
            | (workerId << workerIdShift) //
            | sequence;
}

/**
 * 阻塞到下一个毫秒，直到获得新的时间戳
 * @param lastTimestamp 上次生成ID的时间截
 * @return 当前时间戳
 */
protected long tilNextMillis(long lastTimestamp) {
    long timestamp = timeGen();
    while (timestamp <= lastTimestamp) {
        timestamp = timeGen();
    }
    return timestamp;
}

/**
 * 返回以毫秒为单位的当前时间
 * @return 当前时间(毫秒)
 */
protected long timeGen() {
    return System.currentTimeMillis();
}

//==============================Test=============================================
/** 测试 */
public static void main(String[] args) {
    IdWorker idWorker = new IdWorker(0, 0);
    for (int i = 0; i < 1000; i++) {
        long id = idWorker.nextId();
        System.out.println(Long.toBinaryString(id));
        System.out.println(id);
    }
}}

Salin selepas log masuk

snowflake算法可以根据自身项目的需要进行一定的修改。比如估算未来的数据中心个数，每个数据中心的机器数以及统一毫秒可以能的并发数来调整在算法中所需要的bit数。

优点：

不依赖于数据库，灵活方便，且性能优于数据库。
ID按照时间在单机上是递增的。

缺点：

在单机上是递增的，但是由于涉及到分布式环境，每台机器上的时钟不可能完全同步，也许有时候也会出现不是全局递增的情况。

五、利用zookeeper生成唯一ID

zookeeper主要通过其znode数据版本来生成序列号，可以生成32位和64位的数据版本号，客户端可以使用这个版本号来作为唯一的序列号。

很少会使用zookeeper来生成唯一ID。主要是由于需要依赖zookeeper，并且是多步调用API，如果在竞争较大的情况下，需要考虑使用分布式锁。因此，性能在高并发的分布式环境下，也不甚理想。

六、MongoDB的ObjectId

MongoDB的ObjectId和snowflake算法类似。它设计成轻量型的，不同的机器都能用全局唯一的同种方法方便地生成它。MongoDB 从一开始就设计用来作为分布式数据库，处理多个节点是一个核心要求。使其在分片环境中要容易生成得多。其格式如下： [src/main/resources/objectId.png] 这里写图片描述:

前4 个字节是从标准纪元开始的时间戳，单位为秒。时间戳，与随后的5 个字节组合起来，提供了秒级别的唯一性。由于时间戳在前，这意味着ObjectId 大致会按照插入的顺序排列。这对于某些方面很有用，如将其作为索引提高效率。这4 个字节也隐含了文档创建的时间。绝大多数客户端类库都会公开一个方法从ObjectId 获取这个信息。接下来的3 字节是所在主机的唯一标识符。通常是机器主机名的散列值。这样就可以确保不同主机生成不同的ObjectId，不产生冲突。为了确保在同一台机器上并发的多个进程产生的ObjectId 是唯一的，接下来的两字节来自产生ObjectId 的进程标识符（PID）。前9 字节保证了同一秒钟不同机器不同进程产生的ObjectId 是唯一的。后3 字节就是一个自动增加的计数器，确保相同进程同一秒产生的ObjectId 也是不一样的。同一秒钟最多允许每个进程拥有2563（16 777 216）个不同的ObjectId。

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7515

Tutorial CakePHP

1378

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Cara menggunakan Redis untuk mencapai penyegerakan data teragih Nov 07, 2023 pm 03:55 PM

Cara menggunakan Redis untuk mencapai penyegerakan data teragih Dengan perkembangan teknologi Internet dan senario aplikasi yang semakin kompleks, konsep sistem teragih semakin diterima pakai secara meluas. Dalam sistem teragih, penyegerakan data merupakan isu penting. Sebagai pangkalan data dalam memori berprestasi tinggi, Redis bukan sahaja boleh digunakan untuk menyimpan data, tetapi juga boleh digunakan untuk mencapai penyegerakan data teragih. Untuk penyegerakan data teragih, biasanya terdapat dua mod biasa: mod terbitkan/langgan (Terbitkan/Langgan) dan replikasi induk-hamba (Master-slave).

Cara Redis melaksanakan pengurusan sesi teragih Nov 07, 2023 am 11:10 AM

Cara Redis melaksanakan pengurusan sesi teragih memerlukan contoh kod khusus Pengurusan sesi teragih adalah salah satu topik hangat di Internet hari ini Dalam menghadapi kesesuaian yang tinggi dan volum data yang besar, kaedah pengurusan sesi tradisional secara beransur-ansur menjadi tidak mencukupi. Sebagai pangkalan data nilai kunci berprestasi tinggi, Redis menyediakan penyelesaian pengurusan sesi teragih. Artikel ini akan memperkenalkan cara menggunakan Redis untuk melaksanakan pengurusan sesi teragih dan memberikan contoh kod khusus. 1. Pengenalan kepada Redis sebagai storan sesi teragih Kaedah pengurusan sesi tradisional adalah untuk menyimpan maklumat sesi

Berkongsi pengalaman menggunakan MongoDB untuk melaksanakan penjadualan dan pelaksanaan tugas teragih Nov 02, 2023 am 09:39 AM

MongoDB ialah pangkalan data NoSQL sumber terbuka dengan prestasi tinggi, berskala dan fleksibiliti. Dalam sistem teragih, penjadualan tugas dan pelaksanaan adalah isu utama Dengan menggunakan ciri-ciri MongoDB, penjadualan tugasan dan penyelesaian pelaksanaan boleh direalisasikan. 1. Analisis Keperluan untuk Penjadualan Tugasan Teragih Dalam sistem teragih, penjadualan tugas ialah proses memperuntukkan tugas kepada nod yang berbeza untuk dilaksanakan. Keperluan penjadualan tugas biasa termasuk: 1. Pengagihan permintaan tugas: Hantar permintaan tugas ke nod pelaksanaan yang tersedia.

Cara menggunakan Swoole untuk melaksanakan penjadualan tugas berjadual teragih Nov 07, 2023 am 11:04 AM

Cara menggunakan Swoole untuk melaksanakan penjadualan tugas berjadual teragih Pengenalan: Dalam pembangunan PHP tradisional, kami sering menggunakan cron untuk melaksanakan penjadualan tugas berjadual, tetapi cron hanya boleh melaksanakan tugas pada pelayan tunggal dan tidak dapat menangani senario konkurensi yang tinggi. Swoole ialah rangka kerja serentak tak segerak berprestasi tinggi berdasarkan PHP Ia menyediakan keupayaan komunikasi rangkaian yang lengkap dan sokongan berbilang proses, membolehkan kami melaksanakan penjadualan tugas berjadual dengan mudah. Artikel ini akan memperkenalkan cara menggunakan Swoole untuk melaksanakan penjadualan tugas berjadual teragih

Perkongsian pengalaman praktikal pembangunan Java: membina fungsi pengumpulan log teragih Nov 20, 2023 pm 01:17 PM

Berkongsi pengalaman praktikal dalam pembangunan Java: Membina fungsi pengumpulan log teragih Pengenalan: Dengan perkembangan pesat Internet dan kemunculan data berskala besar, aplikasi sistem teragih menjadi semakin meluas. Dalam sistem teragih, pengumpulan dan analisis log adalah bahagian yang sangat penting. Artikel ini akan berkongsi pengalaman membina fungsi pengumpulan log teragih dalam pembangunan Java, dengan harapan dapat membantu pembaca. 1. Pengenalan latar belakang Dalam sistem teragih, setiap nod menjana sejumlah besar maklumat log. Maklumat log ini berguna untuk pemantauan prestasi sistem, penyelesaian masalah dan analisis data.

Menggunakan Redis untuk mencapai ketekalan cache yang diedarkan Nov 07, 2023 pm 12:05 PM

Menggunakan Redis untuk mencapai ketekalan cache teragih Dalam sistem teragih moden, cache memainkan peranan yang sangat penting. Ia boleh mengurangkan kekerapan capaian sistem kepada pangkalan data dan meningkatkan prestasi dan daya pemprosesan sistem. Dalam sistem yang diedarkan, untuk memastikan ketekalan cache, kita perlu menyelesaikan masalah penyegerakan data antara berbilang nod. Dalam artikel ini, kami akan memperkenalkan cara menggunakan Redis untuk mencapai ketekalan cache yang diedarkan dan memberikan contoh kod khusus. Redis ialah pangkalan data nilai kunci berprestasi tinggi yang menyokong kegigihan, replikasi dan pengumpulan

Menggunakan Redis untuk melaksanakan penjadualan tugas teragih Nov 07, 2023 am 08:15 AM

Menggunakan Redis untuk melaksanakan penjadualan tugas teragih Dengan pengembangan perniagaan dan pembangunan sistem, banyak perniagaan perlu melaksanakan penjadualan tugas teragih untuk memastikan tugas boleh dilaksanakan pada berbilang nod pada masa yang sama, dengan itu meningkatkan kestabilan dan ketersediaan sistem. Sebagai produk penyimpanan data memori berprestasi tinggi, Redis mempunyai ciri pengedaran, ketersediaan tinggi dan prestasi tinggi, dan sangat sesuai untuk melaksanakan penjadualan tugas teragih. Artikel ini akan memperkenalkan cara menggunakan Redis untuk melaksanakan penjadualan tugas teragih dan menyediakan contoh kod yang sepadan. 1. Pangkalan Redis

Cara menggunakan Redis untuk melaksanakan penerbitan dan langganan mesej yang diedarkan Nov 07, 2023 am 09:39 AM

Cara menggunakan Redis untuk melaksanakan penerbitan dan langganan mesej yang diedarkan Pengenalan: Dalam sistem yang diedarkan, penerbitan dan langganan mesej ialah mod komunikasi biasa yang boleh mencapai penyahgandingan antara modul yang berbeza. Sebagai sistem storan nilai kunci berprestasi tinggi, Redis boleh digunakan untuk melaksanakan fungsi penerbitan dan langganan mesej yang diedarkan. Artikel ini akan memperkenalkan cara menggunakan Redis untuk melaksanakan fungsi ini dan menyediakan contoh kod khusus. 1. Fungsi terbitkan dan langgan Redis Fungsi terbitkan dan langgan Redis ialah kaedah pelaksanaan berdasarkan baris gilir mesej.

See all articles