目录
唯一主键
分表
C端查询
其他端查询
总结
首页 数据库 mysql教程 了解百亿级数据分表后的 分页查询

了解百亿级数据分表后的 分页查询

Nov 09, 2020 pm 05:24 PM
分页查询

mysql视频教程栏目介绍百亿级数据的分页查询。

了解百亿级数据分表后的 分页查询

当业务规模达到一定规模之后,像淘宝日订单量在5000万单以上,美团3000万单以上。数据库面对海量的数据压力,分库分表就是必须进行的操作了。而分库分表之后一些常规的查询可能都会产生问题,最常见的就是比如分页查询的问题。一般我们把分表的字段称作shardingkey,比如订单表按照用户ID作为shardingkey,那么如果查询条件中不带用户ID查询怎么做分页?又比如更多的多维度的查询都没有shardingkey又怎么查询?

唯一主键

一般我们数据库的主键都是自增的,那么分表之后主键冲突的问题就是一个无法避免的问题,最简单的办法就是以一个唯一的业务字段作为唯一的主键,比如订单表的订单号肯定是全局唯一的。

常见的分布式生成唯一ID的方式很多,最常见的雪花算法Snowflake、滴滴Tinyid、美团Leaf。以雪花算法举例来说,一毫秒可以生成4194304多个ID。

第一位不使用,默认都是0,41位时间戳精确到毫秒,可以容纳69年的时间,10位工作机器ID高5位是数据中心ID,低5位是节点ID,12位序列号每个节点每毫秒累加,累计可以达到2^12 4096个ID。

分表

第一步,分表后要怎么保证订单号的唯一搞定了,现在考虑下分表的问题。首先根据自身的业务量和增量来考虑分表的大小。

举个例子,现在我们日单量是10万单,预估一年后可以达到日100万单,根据业务属性,一般我们就支持查询半年内的订单,超过半年的订单需要做归档处理。

那么以日订单100万半年的数量级来看,不分表的话我们订单量将达到100万X180=1.8亿,以这个数据量级部分表的话肯定单表是扛不住的,就算你能扛RT的时间你也根本无法接受吧。根据经验单表几百万的数量对于数据库是没什么压力的,那么只要分256张表就足够了,1.8亿/256≈70万,如果为了保险起见,也可以分到512张表。那么考虑一下,如果业务量再增长10倍达到1000万单每天,分表1024就是比较合适的选择。

通过分表加上超过半年的数据归档之后,单表70万的数据就足以应对大部分场景了。接下来对订单号hash,然后对256取模的就可以落到具体的哪张表了。

那么,因为唯一主键都是以订单号作为依据,以前你写的那些根据主键ID做查询的就不能用了,这就涉及到了历史一些查询功能的修改。不过这都不是事儿对吧,都改成以订单号来查就行了。这都不是问题,问题在我们的标题说的点上。

C端查询

说了半天,总算到了正题了,那么分表之后查询和分页查询的问题怎么解决?

首先说带shardingkey的查询,比如就通过订单号查询,不管你分页还是怎么样都是能直接定位到具体的表来查询的,显然查询是不会有什么问题的。

如果不是shardingkey的话,上面举例说的以订单号作为shardingkey的话,像APP、小程序这种一般都是通过用户ID查询,那这时候我们通过订单号做的sharding怎么办?很多公司订单表直接用用户ID做shardingkey,那么很简单,直接查就完了。那么订单号怎么办,一个很简单的办法就是在订单号上带上用户ID的属性。举个很简单的例子,原本41位的时间戳你觉得用不完,用户ID是10位的,订单号的生成规则带上用户ID,落具体表的时候根据订单号中10位用户ID hash取模,这样无论根据订单号还是用户ID查询效果都是一样的。

当然,这种方式只是举例,具体的订单号生成的规则,多少位,包含哪些因素根据自己的业务和实现机制来决定。

好,那么无论你是订单号还是用户ID作为shardingkey,按照以上的两种方式都可以解决问题了。那么还有一个问题就是如果既不是订单号又不是用户ID查询怎么办?最直观的例子就是来自商户端或者后台的查询,商户端都是以商户或者说卖家的ID作为查询条件来查的,后台的查询条件可能就更复杂了,像我碰到的有些后台查询条件能有几十个,这怎么查???别急,接下来分开说B端和后台的复杂查询。

现实中真正的流量大头都是来自于用户端C端,所以本质上解决了用户端的问题,这个问题就解了大半,剩下来自商户卖家端B端、后台支持运营业务的查询流量并不会很大,这个问题就好解。

其他端查询

针对B端的非shardingkey的查询有两个办法解决。

双写,双写就是下单的数据落两份,C端和B端的各自保存一份,C端用你可以用单号、用户ID做shardingkey都行,B端就用商家卖家的ID作为shardingkey就好了。有些同学会说了,你双写不影响性能吗?因为对于B端来说轻微的延迟是可以接受的,所以可以采取异步的方式去落B端订单。你想想你去淘宝买个东西下单了,卖家稍微延迟个一两秒收到这个订单的消息有什么关系吗?你点个外卖商户晚一两秒收到这个订单有什么太大影响吗?

这是一个解决方案,另外一个方案就是走离线数仓或者ES查询,订单数据落库之后,不管你通过binlog还是MQ消息的都形式,把数据同步到数仓或者ES,他们支持的数量级对于这种查询条件来说就很简单了。同样这种方式肯定是稍微有延迟的,但是这种可控范围的延迟是可以接受的。

而针对管理后台的查询,比如运营、业务、产品需要看数据,他们天然需要复杂的查询条件,同样走ES或者数仓都可以做得到。如果不用这个方案,又要不带shardingkey的分页查询,兄弟,这就只能扫全表查询聚合数据,然后手动做分页了,但是这样查出来的结果是有限制的。

比如你256个片,查询的时候循环扫描所有的分片,每个片取20条数据,最后聚合数据手工分页,那必然是不可能查到全量的数据的。

总结

分库分表后的查询问题,对于有经验的同学来说其实这个问题都知道,但是我相信其实大部分同学做的业务可能都没来到这个数量级,分库分表可能都停留在概念阶段,面试被问到后就手足无措了,因为没有经验不知道怎么办。

分库分表首先是基于现有的业务量和未来的增量做出判断,比如拼多多这种日单量5000万的,半年数据得有百亿级别了,那都得分到4096张表了对吧,但是实际的操作是一样的,对于你们的业务分4096那就没有必要了,根据业务做出合理的选择。

对于基于shardingkey的查询我们可以很简单的解决,对于非shardingkey的查询可以通过落双份数据和数仓、ES的方案来解决,当然,如果分表后数据量很小的话,建好索引,扫全表查询其实也不是什么问题。

相关免费学习推荐:mysql视频教程

以上是了解百亿级数据分表后的 分页查询的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

如何使用PHP数据库连接实现分页查询 如何使用PHP数据库连接实现分页查询 Sep 08, 2023 pm 02:28 PM

如何使用PHP数据库连接实现分页查询在开发web应用中,常常会涉及到对数据库进行查询并进行分页显示的需求。PHP作为一种常用的服务端脚本语言,具备强大的数据库连接功能,可以很方便地实现分页查询。本文将详细介绍如何使用PHP数据库连接实现分页查询,并附上相应的代码示例。准备数据库在开始之前,我们需要准备一个数据库,包含要查询的数据。这里以MySQL数据库为例,

PHP和PDO: 如何进行分页查询和显示数据 PHP和PDO: 如何进行分页查询和显示数据 Jul 29, 2023 pm 04:10 PM

PHP和PDO:如何进行分页查询和显示数据在开发Web应用程序时,分页查询和显示数据是一个非常常见的需求。通过分页,我们可以一次显示一定数量的数据,提高页面加载速度和用户体验。在PHP中,使用PHP数据对象(PDO)库可以轻松实现分页查询和显示数据的功能。本文将介绍如何在PHP中使用PDO进行分页查询和显示数据,并提供相应的代码示例。一、创建数据库和数据表

如何使用Go语言创建高性能的MySQL数据分页查询 如何使用Go语言创建高性能的MySQL数据分页查询 Jun 17, 2023 am 09:09 AM

随着互联网的快速发展,数据处理已经成为了企业应用开发的一项重要技能。在许多应用程序中,MySQL数据库经常是最常用的数据存储之一。在MySQL中,数据分页查询是一项常见的数据检索操作。本文将介绍如何使用Go语言实现高性能的MySQL数据分页查询。一、什么是数据分页查询?数据分页查询是一种常用的数据检索技术,它可以让用户在一页上只浏览少量的数据而不必一次性加载

PHP如何使用MongoDB进行分页查询 PHP如何使用MongoDB进行分页查询 Jul 07, 2023 pm 09:28 PM

PHP如何使用MongoDB进行分页查询概述:MongoDB是一个非关系型数据库,常用于存储大量的文档数据,而PHP是一种流行的服务器端脚本语言。在本文中,将介绍如何使用PHP来连接MongoDB,并且实现分页查询的功能。步骤一:安装MongoDB扩展在PHP中与MongoDB进行交互需要安装MongoDB的扩展。可以通过以下命令来安装MongoDB扩展:p

如何在ThinkPHP6中使用Mysql进行分页查询 如何在ThinkPHP6中使用Mysql进行分页查询 Jun 20, 2023 pm 02:01 PM

随着互联网的快速发展,Web应用程序的开发也越来越复杂。而分页查询是Web应用程序中常见的功能之一。ThinkPHP6是一个web框架,可以帮助开发人员快速开发应用程序。在本文中,我们将讨论如何在ThinkPHP6中使用MySQL进行分页查询。首先,我们需要在ThinkPHP6中创建数据库。在MySQL中创建数据库的语句如下:CREATEDATABASE

PHP和Oracle数据库的分页查询技巧 PHP和Oracle数据库的分页查询技巧 Jul 11, 2023 pm 11:09 PM

PHP和Oracle数据库的分页查询技巧在开发一个动态网页时,如果需要展示大量数据,就需要进行分页查询。分页查询是一种将数据划分为更小的页面,以便用户能够轻松地浏览和导航的技术。在本文中,我们将讨论如何使用PHP和Oracle数据库实现分页查询,并提供相关的代码示例。一、准备工作在开始之前,我们需要确保我们已经安装和配置好了PHP和Oracle数据库。如果还

如何使用thinkorm轻松实现分页查询功能 如何使用thinkorm轻松实现分页查询功能 Jul 31, 2023 pm 10:41 PM

如何使用thinkorm轻松实现分页查询功能概述:在开发网站或应用程序时,常常需要对数据库中的数据进行分页查询,以便在页面上展示部分数据并提供翻页功能。本文将介绍如何使用thinkorm框架轻松实现分页查询功能,并提供相关的代码示例。步骤一:安装thinkorm首先,需要在项目中安装thinkorm框架,可以使用以下命令进行安装:composerrequi

MySql的分页查询:如何处理大数据库分页的性能问题 MySql的分页查询:如何处理大数据库分页的性能问题 Jun 15, 2023 pm 03:28 PM

在现代应用程序中,大部分的数据都需要分页显示。当应用程序需要处理大量数据的时候,这就会给服务器和数据库造成压力,导致查询耗时变长。Mysql是目前最受欢迎的关系型数据库之一,本文将讨论如何优化Mysql分页查询的性能问题。分页原理在开始优化之前,我们必须先了解分页原理。分页查询的主要原理是将表数据分成若干个分页,然后逐个分页地查询数据。例如,如果我们需要在一

See all articles