PostgreSQL vacuum原理一功能与参数-mysql教程-PHP中文网

首页

数据库

mysql教程

PostgreSQL vacuum原理一功能与参数

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 04:00 PM

从上篇ldquo;PostgreSQL MVCC 源码实现【http://www.linuxidc.com/Linux/2015-05/117969.htm】rdquo;中，我们知道，PG并没有像

从上篇“PostgreSQL MVCC 源码实现【】”中，我们知道，PG并没有像Oracle那样的undo来存放旧版本；而是将旧版本直接存放于relation文件中。那么带来的问题就是dead tuple过多，导致relation文件不断增大而带来空间膨胀问题。为了解决这个问题，PG中引入了vacuum后台进程，专门来清理这些dead tuple，并回缩空间。当然vacuum的作用不仅在此，它还有以下其它功能：

一、vacuum的功能

1.回收空间

这个通常是大家最容易想起来的功能。回收空间，将dead tuple清理掉。但是已经分配的空间，一般不会释放掉。除非做vacuum full，但是需要exclusive lock。一般不太建议，因为如果表最终还是会涨到这个高水位上，经常做vacuum full意义不是非常大。一般合理设置vacuum参数，进行常规vacuum也就够了。

2.冻结tuple的xid

PG会在每条记录（tuple）的header中，存放xmin,xmax信息(增删改事务ID)。transactionID的最大值为2的32次，即无符整形来表示。当transactionID超过此最大值后，会循环使用。

这会带来一个问题：就是最新事务的transactionID会小于老事务的transactionID。如果这种情况发生后，PG就没有办法按transactionID来区分事务的先后，也没有办法实现MVCC了。因此PG用vacuum后台进程，按一定的周期和算法触发vacuum动作，将过老的tuple的header中的事务ID进行冻结。冻结事务ID，即将事务ID设置为“2”（“0”表示无效事务ID；“1”表示bootstrap，即初始化；“3”表示最小的事务ID）。PG认为被冻结的事务ID比任何事务都要老。这样就不会出现上面的这种情况了。

3.更新统计信息

vacuum analyze时，会更新统计信息，让PG的planner能够算出更准确的执行计划。autovacuum_analyze_threshold和autovacuum_analyze_scale_factor参数可以控制analyze的触发的频率。

4.更新visibility map

在PG中，有一个visibility map用来标记那些page中是没有dead tuple的。这有两个好处，一是当vacuum进行scan时，直接可以跳过这些page。二是进行index-only scan时，可以先检查下visibility map。这样减少fetch tuple时的可见性判断，从而减少IO操作，提高性能。另外visibility map相对整个relation，还是小很多，可以cache到内存中。

二、vacuum参数介绍

autovacuum有好多参数，用来控制其行为，大致有以下几个：
• autovacuum：默认为on，表示是否开起autovacuum。默认开起。特别的，当需要冻结xid时，尽管此值为off，PG也会进行vacuum。
• autovacuum_naptime：下一次vacuum的时间，默认1min。这个naptime会被vacuum launcher分配到每个DB上。autovacuum_naptime/num of db。
• log_autovacuum_min_duration：记录autovacuum动作到日志文件，当vacuum动作超过此值时。 “-1”表示不记录。“0”表示每次都记录。
• autovacuum_max_workers：最大同时运行的worker数量，，不包含launcher本身。
• autovacuum_vacuum_threshold:默认50。与autovacuum_vacuum_scale_factor配合使用， autovacuum_vacuum_scale_factor默认值为20%。当update,delete的tuples数量超过autovacuum_vacuum_scale_factor*table_size+autovacuum_vacuum_threshold时，进行vacuum。如果要使vacuum工作勤奋点，则将此值改小。
• autovacuum_analyze_threshold:默认50。与autovacuum_analyze_scale_factor配合使用, autovacuum_analyze_scale_factor默认10%。当update,insert,delete的tuples数量超过autovacuum_analyze_scale_factor*table_size+autovacuum_analyze_threshold时，进行analyze。
• autovacuum_freeze_max_age和autovacuum_multixact_freeze_max_age：前面一个200 million,后面一个400 million。离下一次进行xid冻结的最大事务数。
• autovacuum_vacuum_cost_delay：如果为-1，取vacuum_cost_delay值。
• autovacuum_vacuum_cost_limit：如果为-1，到vacuum_cost_limit的值，这个值是所有worker的累加值。

基于代价的vacuum参数:
• vacuum_cost_delay ：计算每个毫秒级别所允许消耗的最大IO，vacuum_cost_limit/vacuum_cost_dely。默认vacuum_cost_delay为20毫秒。
• vacuum_cost_page_hit ：vacuum时，page在buffer中命中时，所花的代价。默认值为1。
• vacuum_cost_page_miss：vacuum时，page不在buffer中，需要从磁盘中读入时的代价默认为10。 vacuum_cost_page_dirty：当vacuum时，修改了clean的page。这说明需要额外的IO去刷脏块到磁盘。默认值为20。
• vacuum_cost_limit：当超过此值时，vacuum会sleep。默认值为200。

把上面每个cost值调整的小点，然后把limit值调的大些，可以延长每次vacuum的时间。这样做，如果在高负载的系统当中，可能IO会有所影响，因vacuum。但是对于表物理存储空间的增长会有所减缓。

在下一篇重点将在源码实现上。见

------------------------------------华丽丽的分割线------------------------------------

CentOS 6.3环境下yum安装PostgreSQL 9.3

PostgreSQL缓存详述

Windows平台编译 PostgreSQL

Ubuntu下LAPP（Linux+Apache+PostgreSQL+PHP)环境的配置与安装

Ubuntu上的phppgAdmin安装及配置

CentOS平台下安装PostgreSQL9.3

PostgreSQL配置Streaming Replication集群

如何在CentOS 7/6.5/6.4 下安装PostgreSQL 9.3 与 phpPgAdmin

------------------------------------华丽丽的分割线------------------------------------

PostgreSQL 的详细介绍：请点这里
PostgreSQL 的下载地址：请点这里

本文永久更新链接地址：

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸！

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7663

CakePHP 教程

1393

C# 教程

1205

steam的账户名称是什么格式

win11激活密钥永久

显示更多

Related knowledge

与MySQL中使用索引相比，全表扫描何时可以更快？ Apr 09, 2025 am 12:05 AM

全表扫描在MySQL中可能比使用索引更快，具体情况包括：1)数据量较小时；2)查询返回大量数据时；3)索引列不具备高选择性时；4)复杂查询时。通过分析查询计划、优化索引、避免过度索引和定期维护表，可以在实际应用中做出最优选择。

说明InnoDB全文搜索功能。 Apr 02, 2025 pm 06:09 PM

InnoDB的全文搜索功能非常强大，能够显着提高数据库查询效率和处理大量文本数据的能力。 1）InnoDB通过倒排索引实现全文搜索，支持基本和高级搜索查询。 2）使用MATCH和AGAINST关键字进行搜索，支持布尔模式和短语搜索。 3）优化方法包括使用分词技术、定期重建索引和调整缓存大小，以提升性能和准确性。

可以在 Windows 7 上安装 mysql 吗 Apr 08, 2025 pm 03:21 PM

是的，可以在 Windows 7 上安装 MySQL，虽然微软已停止支持 Windows 7，但 MySQL 仍兼容它。不过，安装过程中需要注意以下几点：下载适用于 Windows 的 MySQL 安装程序。选择合适的 MySQL 版本（社区版或企业版）。安装过程中选择适当的安装目录和字符集。设置 root 用户密码，并妥善保管。连接数据库进行测试。注意 Windows 7 上的兼容性问题和安全性问题，建议升级到受支持的操作系统。

mysql：简单的概念，用于轻松学习 Apr 10, 2025 am 09:29 AM

MySQL是一个开源的关系型数据库管理系统。1）创建数据库和表：使用CREATEDATABASE和CREATETABLE命令。2）基本操作：INSERT、UPDATE、DELETE和SELECT。3）高级操作：JOIN、子查询和事务处理。4）调试技巧：检查语法、数据类型和权限。5）优化建议：使用索引、避免SELECT*和使用事务。

InnoDB中的聚类索引和非簇索引（次级索引）之间的差异。 Apr 02, 2025 pm 06:25 PM

聚集索引和非聚集索引的区别在于：1.聚集索引将数据行存储在索引结构中，适合按主键查询和范围查询。2.非聚集索引存储索引键值和数据行的指针，适用于非主键列查询。

mysql用户和数据库的关系 Apr 08, 2025 pm 07:15 PM

MySQL 数据库中，用户和数据库的关系通过权限和表定义。用户拥有用户名和密码，用于访问数据库。权限通过 GRANT 命令授予，而表由 CREATE TABLE 命令创建。要建立用户和数据库之间的关系，需创建数据库、创建用户，然后授予权限。

mysql 和 mariadb 可以共存吗 Apr 08, 2025 pm 02:27 PM

MySQL 和 MariaDB 可以共存，但需要谨慎配置。关键在于为每个数据库分配不同的端口号和数据目录，并调整内存分配和缓存大小等参数。连接池、应用程序配置和版本差异也需要考虑，需要仔细测试和规划以避免陷阱。在资源有限的情况下，同时运行两个数据库可能会导致性能问题。

说明不同类型的MySQL索引（B树，哈希，全文，空间）。 Apr 02, 2025 pm 07:05 PM

MySQL支持四种索引类型：B-Tree、Hash、Full-text和Spatial。1.B-Tree索引适用于等值查找、范围查询和排序。2.Hash索引适用于等值查找，但不支持范围查询和排序。3.Full-text索引用于全文搜索，适合处理大量文本数据。4.Spatial索引用于地理空间数据查询，适用于GIS应用。

See all articles

PostgreSQL vacuum原理一功能与参数

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题