对单表亿级数据的简单测试-mysql教程-PHP中文网

首页

数据库

mysql教程

对单表亿级数据的简单测试

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 04:41 PM

mysql 数字数据测试简单

本次对mysql做了单表亿级数据量的压测。表的关系简单，只有两个int字段，user_id和company_id，且都增加了索引。通过python脚本，随机向同一个表随机插入100W、500W、1000W-1E数据，并且记录了每次插入数据所耗时间。先来看下写入数据的情况吧： python脚

本次对mysql做了单表亿级数据量的压测。
表的关系简单，只有两个int字段，user_id和company_id，且都增加了索引。
通过python脚本，随机向同一个表随机插入100W、500W、1000W-1E数据，并且记录了每次插入数据所耗时间。
先来看下写入数据的情况吧：
python脚本空转：
空转100W：0.14s
空转1000W：1.74s
单次插入1000W条数据：295.11s
1000W基础上再插入1000W，轮询，直到写入1E数据，记录每次插入所耗的时间。

可以看到，随着数据量的不断增大，每次插入1000W条数据的时间还是比较稳定，上下浮动不大。

我们最终关心的是单表乙级数据量下，查询速度能有多快。

下面是用python客户端脚本模拟对1E条数据进行随机查询，随机用的是python的随机函数；机器资源有限，开发机是公用的，

所以也没太敢占用太大资源来做压测，并发用的Python的线程模块。

本次查询测试采用三种方法：

1、单进程对数据库执行随机查询1000次操作，执行100次，记录每次时间

2、并发1000、2000线程对数据库进行随机查询1000次操作，记录每次时间

3、用mysql官方软件mysqlslap 对数据库进行操作

第一种：

单次查询1000次的结果，跑100次，发现时间浮动还是比较大，这可能跟插入的数据散列情况有关，

user_id相同的数据还是有不少，20-100之间，线上业务出现这种数据的情况不大，所以，这些数据不影响最终结果。

第二种：并发1000线程对数据库进行随机1000次查询，

1000线程：最慢时间8s，处理能力 125/s ；

2000线程：最慢时间10s，处理能力 100/s；

第三种：mysqlslap进行测试

开启2000个线程，执行SELECT * FROM user_company_test_5000 WHERE user_id=7432查询

平均处理时间8.76s，每秒能处理229个查询。

用官方的mysqlslap进行测试，跟python脚本的测试结果偏差较大，

猜测原因有两个：

1：mysqlslap 直接采用socket对Mysql进行连接，所以它除了 mysql处理时间和网络请求时间没有其他影响结果的操作

2：mysqlslap只能指定sql，没有办法随机查询数据，而测试表里面的数据分散不均匀，这也是一个原因。

mysqlslap的数据只能视为最好情况，但第二个python脚本则更接近生产环境，1000次查询数据也是随机查询，

所以第二种能作为生产环境的依据。

再来看看批量查询，IN 语句最多50个值

好吧，我只开了200个线程，最慢时间93s，最快时间46s，简直可以用惨不忍睹来讲。。如果是批量查询，

那就拆成多条语句来查吧。如果用IN ，必然会影响服务。

结论：

跟dba沟通过，理论上每秒能够支持5000次的查询量是比较正常的，但我用mysqlslap对单表100W的数据量进行了

测试，2000个client 每秒处理能力也只有700左右，

从第二种数据上看，当单机client达到2000时，每秒还能处理100次左右的查询，还是不错的。

原文出处:http://www.imsiren.com/archives/995

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

AI Hentai Generator

免费生成ai无尽的。

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7450

CakePHP 教程

1374

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

mysql用户和数据库的关系 Apr 08, 2025 pm 07:15 PM

MySQL 数据库中，用户和数据库的关系通过权限和表定义。用户拥有用户名和密码，用于访问数据库。权限通过 GRANT 命令授予，而表由 CREATE TABLE 命令创建。要建立用户和数据库之间的关系，需创建数据库、创建用户，然后授予权限。

mysql 是否要付费 Apr 08, 2025 pm 05:36 PM

MySQL 有免费的社区版和收费的企业版。社区版可免费使用和修改，但支持有限，适合稳定性要求不高、技术能力强的应用。企业版提供全面商业支持，适合需要稳定可靠、高性能数据库且愿意为支持买单的应用。选择版本时考虑的因素包括应用关键性、预算和技术技能。没有完美的选项，只有最合适的方案，需根据具体情况谨慎选择。

RDS MySQL 与 Redshift 零 ETL 集成 Apr 08, 2025 pm 07:06 PM

数据集成简化：AmazonRDSMySQL与Redshift的零ETL集成高效的数据集成是数据驱动型组织的核心。传统的ETL（提取、转换、加载）流程复杂且耗时，尤其是在将数据库（例如AmazonRDSMySQL）与数据仓库（例如Redshift）集成时。然而，AWS提供的零ETL集成方案彻底改变了这一现状，为从RDSMySQL到Redshift的数据迁移提供了简化、近乎实时的解决方案。本文将深入探讨RDSMySQL零ETL与Redshift集成，阐述其工作原理以及为数据工程师和开发者带来的优势。

MySQL 中的查询优化对于提高数据库性能至关重要，尤其是在处理大型数据集时 Apr 08, 2025 pm 07:12 PM

1.使用正确的索引索引通过减少扫描的数据量来加速数据检索select*fromemployeeswherelast_name='smith';如果多次查询表的某一列，则为该列创建索引如果您或您的应用根据条件需要来自多个列的数据，则创建复合索引2.避免选择*仅选择那些需要的列，如果您选择所有不需要的列，这只会消耗更多的服务器内存并导致服务器在高负载或频率时间下变慢例如，您的表包含诸如created_at和updated_at以及时间戳之类的列，然后避免选择*，因为它们在正常情况下不需要低效查询se

如何针对高负载应用程序优化 MySQL 性能？ Apr 08, 2025 pm 06:03 PM

MySQL数据库性能优化指南在资源密集型应用中，MySQL数据库扮演着至关重要的角色，负责管理海量事务。然而，随着应用规模的扩大，数据库性能瓶颈往往成为制约因素。本文将探讨一系列行之有效的MySQL性能优化策略，确保您的应用在高负载下依然保持高效响应。我们将结合实际案例，深入讲解索引、查询优化、数据库设计以及缓存等关键技术。1.数据库架构设计优化合理的数据库架构是MySQL性能优化的基石。以下是一些核心原则：选择合适的数据类型选择最小的、符合需求的数据类型，既能节省存储空间，又能提升数据处理速度

了解 ACID 属性：可靠数据库的支柱 Apr 08, 2025 pm 06:33 PM

数据库ACID属性详解ACID属性是确保数据库事务可靠性和一致性的一组规则。它们规定了数据库系统处理事务的方式，即使在系统崩溃、电源中断或多用户并发访问的情况下，也能保证数据的完整性和准确性。ACID属性概述原子性(Atomicity):事务被视为一个不可分割的单元。任何部分失败，整个事务回滚，数据库不保留任何更改。例如，银行转账，如果从一个账户扣款但未向另一个账户加款，则整个操作撤销。begintransaction;updateaccountssetbalance=balance-100wh