MySQL数据库优化的一些笔记_MySQL-mysql教程-PHP中文网

首页

数据库

mysql教程

MySQL数据库优化的一些笔记_MySQL

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 01, 2016 pm 01:49 PM

数据库优化记录

bitsCN.com

　　0. 索引很重要

　　之前列举记录用了下面的语句。state字段为索引。

　　SELECT * FROM feed_urls WHERE state='ok' AND feed_url'' LIMIT N,10

　　当记录数量很大时，有几万之后，这句SQL就很慢了。主要是因为feed_url没有建立索引。后来的解决方法是，把feed_url为空的，设为一个ok以外的state值，就行了。

　　1. 索引不是万能的

　　为了计算记录总数，下面的语句会很慢。

　　mysql> SELECT COUNT(*) FROM feed_urls WHERE state='error';

　　+----------+

　　| COUNT(*) |

　　+----------+

　　| 30715 |

　　+----------+

　　1 row in set (0.14 sec)

　　mysql> EXPLAIN SELECT COUNT(*) FROM feed_urls WHERE state='error'/G

　　*************************** 1. row ***************************

　　id: 1

　　select_type: SIMPLE

　　table: feed_urls

　　type: ref

　　possible_keys: state,page_index

　　key: page_index

　　key_len: 10

　　ref: const

　　rows: 25936

　　Extra: Using where; Using index

　　1 row in set (0.00 sec)

　　state为索引，请求用时140ms。遍历了state='error'索引下的每一条记录。

　　mysql> SELECT state,COUNT(*) FROM feed_urls GROUP BY state;

　　+----------+----------+

　　| state | COUNT(*) |

　　+----------+----------+

　　| error | 30717 |

　　| fetching | 8 |

　　| nofeed | 76461 |

　　| ok | 74703 |

　　| queued | 249681 |

　　+----------+----------+

　　5 rows in set (0.55 sec)

　　mysql> EXPLAIN SELECT state,COUNT(*) FROM feed_urls GROUP BY state/G

　　*************************** 1. row ***************************

　　id: 1

　　select_type: SIMPLE

　　table: feed_urls

　　type: index

　　possible_keys: NULL

　　key: state

　　key_len: 10

　　ref: NULL

　　rows: 431618

　　Extra: Using index

　　1 row in set (0.00 sec)

　　请求用时550ms。遍历了每个state下的每一条记录。

　　改进方法：

　　独立一个表用来计数，使用MySQL的Trigger同步计数：

　　CREATE TRIGGER my_trigger AFTER UPDATE ON feed_urls

　　FOR EACH ROW BEGIN

　　IF OLD.state NEW.state THEN

　　IF NEW.state='ok' THEN

　　UPDATE feed_stat SET count_feed = count_feed + 1;

　　END IF;

　　IF NEW.state IN ('ok', 'error', 'nofeed') THEN

　　UPDATE feed_stat SET count_access = count_access + 1;

　　END IF;

　　END

　　2. 当分页很大时

　　mysql> SELECT * FROM feed_urls LIMIT 230000, 1/G

　　*************************** 1. row ***************************

　　id: 736841f82abb0bc87ccfec7c0fdbd09c30b5a24d

　　link: http://mappemunde.typepad.com/

　　title: Tim Peterson

　　feed_url: NULL

　　update_time: 2012-05-12 11:01:56

　　state: queued

　　http_server: NULL

　　abstract: NULL

　　previous_id: ceea30e0ba609b69198c53ce71c44070d69038c5

　　ref_count: 1

　　error: NULL

　　aid: 230001

　　1 row in set (0.50 sec)

　　mysql> EXPLAIN SELECT * FROM feed_urls LIMIT 230000, 1/G

　　*************************** 1. row ***************************

　　id: 1

　　select_type: SIMPLE

　　table: feed_urls

　　type: ALL

　　possible_keys: NULL

　　key: NULL

　　key_len: NULL

　　ref: NULL

　　rows: 431751

　　Extra:

　　1 row in set (0.00 sec)

　　读取一条记录，耗时500ms，因为表记录是变长的，所以MySQL不能算出目标位置，只能每一条记录的数过去。

　　改进方法：

　　通过索引定位，数索引比数记录要快，因为索引占用的空间比整条记录小很多。

　　mysql> SELECT * FROM (SELECT aid FROM feed_urls ORDER BY aid LIMIT 215000, 1) d JOIN feed_urls u ON d.aid=u.aid/G

　　*************************** 1. row ***************************

　　aid: 215001

　　id: 2e4b1a385c8aae40b3ec2af9153805ca446f2029

　　link: http://ncse.com/

　　title: NCSE

　　feed_url: NULL

　　update_time: 2012-05-12 10:47:15

　　state: queued

　　http_server: NULL

　　abstract: NULL

　　previous_id: 819a6e3c5edc1624a9b8f171d8d3ae269843785f

　　ref_count: 3

　　error: NULL

　　aid: 215001

　　1 row in set (0.06 sec)

　　mysql> EXPLAIN SELECT * FROM (SELECT aid FROM feed_urls ORDER BY aid LIMIT 215000, 1) d JOIN feed_urls u ON d.aid=u.aid/G

　　*************************** 1. row ***************************

　　id: 1

　　select_type: PRIMARY

　　table:

　　type: system

　　possible_keys: NULL

　　key: NULL

　　key_len: NULL

　　ref: NULL

　　rows: 1

　　Extra:

　　*************************** 2. row ***************************

　　id: 1

　　select_type: PRIMARY

　　table: u

　　type: const

　　possible_keys: aid

　　key: aid

　　key_len: 4

　　ref: const

　　rows: 1

　　Extra:

　　*************************** 3. row ***************************

　　id: 2

　　select_type: DERIVED

　　table: feed_urls

　　type: index

　　possible_keys: NULL

　　key: aid

　　key_len: 4

　　ref: NULL

　　rows: 211001

　　Extra: Using index

　　3 rows in set (0.15 sec)

　　耗时60ms，比之前的方法快了将近10倍。如果LIMIT语句里还有WHERE a=1，应该建立一个(a，aid)的索引。

　　话说，MySQL好像还是不能直接算出第21500条索引的位置呀，这种方法还是数了索引了，能算出来就直接0ms了。不过这样的效率，对于百万级的，还能应付吧。如果是千万级的或者像我之前在KS创建的一张上亿条记录的表(120G)，这种方法就肯定不行了。

　　经过上述优化，打开最后一页的速度已经很快了(之前需要800ms，现在则为300ms左右)。

　　膜拜下这Burst.NET最低档次的VPS (30RMB/month)。

　　root@xiaoxia-pc:~/# ping feed.readself.com -n

　　PING app.readself.com (184.82.185.32) 56(84) bytes of data.

　　64 bytes from 184.82.185.32: icmp_req=1 ttl=45 time=161 ms

　　64 bytes from 184.82.185.32: icmp_req=2 ttl=45 time=161 ms

　　64 bytes from 184.82.185.32: icmp_req=3 ttl=45 time=161 ms

　　用同样的方法，优化了搜索引擎的排名算法。即排名过程中选取尽量少的值出来排序，排序后再JOIN一次获取结果的信息。

　　排序过程如下：

　　SELECT u.*, count_level(u.id) lv

　　FROM(

　　SELECT f.id, f.ref_count, MATCH(i.link,i.title) AGAINST (keywords) score

　　FROM feed_index i

　　JOIN feed_urls f ON f.id=i.id

　　WHERE MATCH(i.link,i.title) AGAINST (keywords)

　　ORDER BY score*0.5 + score*0.5*(ref_count/max_ref_count_in_result) DESC

　　LIMIT offset,10

　　) d JOIN feed_urls u ON u.id = d.id

　　目前处理10万记录的全文索引数据，MySQL还是可以满足的，就是不知道上百万之后，还能不能撑下去。撑不下去就依赖第三方的工具了，例如Sphinx

　　3. SELECT里的函数

　　给FeedDB增加了层次的显示。因为本人太懒，所以没有给数据库表增加一个记录深度的字段。所以，直接写了一个MySQL的自定义函数 count_level，用来统计通过parent_id一直找到顶层经过的路径长度(Level)。

　　CREATE DEFINER=`feeddb_rw`@`%` FUNCTION `count_level`(fid char(40)) RETURNS int(11)

　　BEGIN

　　SET @levels = 0;

　　SET @found = false;

　　WHILE NOT @found DO

　　SELECT previous_id INTO @prev_id FROM feed_urls WHERE id=fid;

　　IF @prev_id is null OR @prev_id = '' THEN

　　SET @found = true;

　　ELSE

　　SET @levels = @levels + 1;

　　SET fid = @prev_id;

　　END IF;

　　END WHILE;

　　IF @prev_id is null THEN

　　RETURN null;

　　END IF;

　　RETURN @levels;

　　END

　　在网页显示的时候用了类似下面的SQL语句。

　　mysql> SELECT u.*, count_level(u.id) FROM feed_urls u ORDER BY ref_count DESC LIMIT 12000,1/G

　　*************************** 1. row ***************************

　　id: e42f44b04dabbb9789ccb4709278e881c54c28a3

　　link: http://tetellita.blogspot.com/

　　title: le hamburger et le croissant

　　feed_url: http://www.blogger.com/feeds/7360650/posts/default

　　update_time: 2012-05-15 14:50:53

　　state: ok

　　http_server: GSE

　　abstract: Lepekmezest un épais sirop bordeaux obtenu par réduction dumoût de raisin, une sorte de mélasse de raisin, en somme. Légèrement acidulé, il apporte du pep's aux yaourts et nappe avec bonheur les

　　previous_id: 129cabd96e7099a53b78c7ddeff98658351082e9

　　ref_count: 9

　　error: NULL

　　aid: 174262

　　count_level(u.id): 8

　　1 row in set (4.10 sec)

　　好吧，悲剧了!4100ms。一定对12000个条目都算了一次count_level，然后再进行排序。所以才用上了4秒那么漫长的时间!!!

　　改进方法：

　　先SELECT LIMIT，再在派生的临时表里，计算count_level。

　　mysql> SELECT u.*, count_level(u.id) FROM (

　　SELECT id FROM feed_urls ORDER BY ref_count DESC LIMIT 27521,1

　　) d JOIN feed_urls u ON u.id=d.id/G

　　*************************** 1. row ***************************

　　id: 61df288dda131ffd6125452d20ad0648f38abafd

　　link: http://mynokiamobile.org/

　　title: My Nokia Mobile

　　feed_url: http://mynokiamobile.org/feed/

　　update_time: 2012-05-14 14:06:57

　　state: ok

　　http_server: Apache/2.2.19 (Unix) mod_ssl/2.2.19 OpenSSL/1.0.0-fips mod_auth_passthrough/2.1 mod_bwlimited/1.4 FrontPage/5.0.2.2635

　　abstract: ArchivesSelect MonthMay 2012April 2012March 2012February 2012January 2012December 2011November 2011October 2011September 2011August 2011July 2011June 2011May 2011April 2011March 2011February 2011Janua

　　previous_id: f37af92bb89c08f6d4b69e72eab05d8ab1e2aca4

　　ref_count: 5

　　error: NULL

　　aid: 154996

　　count_level(u.id): 8

　　1 row in set (0.09 sec)

　　如此，优化之后效果好很多了!但是还可以继续优化，例如建立一个字段存储Level的值应该是最好的办法了。

　　初次了解MySQL一些工作机制，欢迎一起探讨!

　　参考文献：

　　http://explainextended.com/2009/10/23/mysql-order-by-limit-performance-late-row-lookups/

　　http://www.mysqlperformanceblog.com/2006/09/01/order-by-limit-performance-optimization/

bitsCN.com

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

AI Hentai Generator

免费生成ai无尽的。

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7403

Java教程

1630

CakePHP 教程

1358

Laravel 教程

1268

PHP教程

1218

显示更多

Related knowledge

拼多多买过的东西在哪里查看记录查看买过的商品记录的方法 Mar 12, 2024 pm 07:20 PM

　　拼多多软件内提供的商品好物非常多，随时随地想买就买，而且每一件商品质量都是严格把关的，件件商品都是正品，不同还有非常多优惠的购物折扣，让大家网购根本停不下来。输入手机号在线登录，在线添加多个收货地址和联系方式，可以随时查看最新的物流动态，不同品类的商品板块都是开放的，搜索上下滑动选购下单，足不出户轻松体验便捷的网购服务，还能查看所有的购买记录，包括自己买过的商品，数十个购物红包、优惠券免费领取使用，现在小编在线详细为拼多多用户们带来查看买过的商品记录的方法。　　1.打开手机，点击拼多多图标，

如何查看和管理 Linux 命令历史记录 Aug 01, 2023 pm 09:17 PM

如何在Linux中查看命令历史记录在Linux中，我们使用history命令来查看所有以前执行的命令的列表。它有一个非常简单的语法：history与历史记录命令配对的一些选项包括：选项描述-c清除当前会话的命令历史记录-w将命令历史记录写入文件-r从历史记录文件重新加载命令历史记录-n限制最近命令的输出数量只需运行history命令即可在Linux终端中查看所有以前执行的命令的列表：除了查看命令历史记录之外，您还可以管理命令历史记录并执行修改先前执行的命令、反向搜索命令历史记录甚至完全删除历史记

如何在iPhone中检查通话记录并将其导出？ Jul 05, 2023 pm 12:54 PM

iPhone中的通话记录经常被低估，并且是iPhone最关键的功能之一。凭借其简单性，此功能具有至关重要的意义，可以提供有关在设备上拨打或接听的呼叫的重要见解。无论是出于工作目的还是法律诉讼，访问通话记录的能力都被证明是无价的。简单来说，通话记录是指每当拨打或接听电话时在iPhone上创建的条目。这些日志包含关键信息，包括联系人的姓名（如果未另存为联系人，则为号码）、时间戳、持续时间和呼叫状态（已拨打、未接或未接听）。它们是您的通信历史记录的简明记录。通话记录包括存储在iPhone上的通话记录条

如何在iPhone上的健康应用程序中查看您的用药日志历史记录 Nov 29, 2023 pm 08:46 PM

iPhone可让您在“健康”App中添加药物，以便跟踪和管理您每天服用的药物、维生素和补充剂。然后，您可以在设备上收到通知时记录已服用或跳过的药物。记录用药后，您可以查看您服用或跳过用药的频率，以帮助您跟踪自己的健康状况。在这篇文章中，我们将指导您在iPhone上的健康应用程序中查看所选药物的日志历史记录。如何在“健康”App中查看用药日志历史记录简短指南：前往“健康”App>浏览“>用药”>用药“>选择一种用药>”选项“&a

Hibernate 如何优化数据库查询性能？ Apr 17, 2024 pm 03:00 PM

优化Hibernate查询性能的技巧包括：使用延迟加载，推迟加载集合和关联对象；使用批处理，组合更新、删除或插入操作；使用二级缓存，将经常查询的对象存储在内存中；使用HQL外连接，检索实体及其相关实体；优化查询参数，避免SELECTN+1查询模式；使用游标，以块的方式检索海量数据；使用索引，提高特定查询的性能。

C#开发建议：日志记录与监控系统 Nov 22, 2023 pm 08:30 PM

C#开发建议：日志记录与监控系统摘要：在软件开发过程中，日志记录与监控系统是至关重要的工具。本文章将介绍C#开发中日志记录与监控系统的作用和实施建议。引言：在大型软件开发项目中，日志记录和监控是必不可少的工具。它们可以帮助我们实时了解程序运行状况，快速发现并解决问题。本文将讨论C#开发中如何使用日志记录和监控系统，以提高软件质量和开发效率。日志记录系统的作用

如何进行Java开发项目的日志记录与监控 Nov 03, 2023 am 10:09 AM

如何进行Java开发项目的日志记录与监控一、背景介绍随着互联网的快速发展，越来越多的企业开始进行Java开发，构建各种类型的应用程序。而在开发过程中，日志记录和监控是一个不可忽视的重要环节。通过日志记录与监控，开发人员可以及时发现和解决问题，保证应用程序的稳定性和安全性。二、日志记录的重要性1.问题追踪：在应用程序出现错误时，日志记录可以帮助我们快速定位问题

如何通过数据库优化提高Python网站的访问速度？ Aug 07, 2023 am 11:29 AM

如何通过数据库优化提高Python网站的访问速度？摘要在构建Python网站时，数据库是一个关键的组成部分。如果数据库访问速度慢，会直接影响网站的性能和用户体验。本文将讨论一些优化数据库的方法，以提高Python网站的访问速度，并附有一些示例代码。引言对于大多数Python网站来说，数据库是存储和检索数据的关键部分。如果不加以优化，数据库可能成为性能瓶颈。本

See all articles

MySQL数据库优化的一些笔记_MySQL

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题