WordPress网站10W+数据,mysql数据库查询优化

94次阅读
没有评论

共计 3015 个字符,预计需要花费 8 分钟才能阅读完成。

WordPress 网站 10W+ 数据,mysql 数据库查询优化。WordPress 在查询 post 列表时,默认会同时把文章数量也查询出来,使用这种方式的有:get_posts、query_posts 和 WP_Query。

get_posts 在 4.6.1+ 已经不用 SQL_CALC_FOUND_ROWS,但是 query_posts 和 WP_Query 还是会用,所以还须优化。

具体语句如下:

SELECT SQL_CALC_FOUND_ROWS wp_posts.ID FROM wp_posts WHERE 1=1 AND wp_posts.post_type =‘post’AND (wp_posts.post_status =‘publish’) ORDER BY wp_posts.post_date DESC LIMIT 0, 20

SELECT FOUND_ROWS()

这在网站数据量小的时候,不会引起什么问题,

但是当 post 数量到 10w+ 的时候,这个就是一条必现的慢查询,

首页、分类、标签、搜索页面,只要用到这几个函数,就都会使用 SQL_CALC_FOUND_ROWS 这个方式。

如何解决?

方法一:

彻底禁用 SQL_CALC_FOUND_ROWS

放在 functions.php 文件即可:

add_action(‘pre_get_posts’,‘wndt_post_filter’);

function wndt_post_filter($query) {

if (is_admin() or !$query->is_main_query()) {

return $query;

}

// 禁止查询 SQL_CALC_FOUND_ROWS

$query->set(‘no_found_rows’, true);

}

方法二:

如果仍然需要查询文章数量,使用更加高效的 EXPLAIN 方式代替 SQL_CALC_FOUND_ROWS

禁用掉 SQL_CALC_FOUND_ROWS 用法,用一种更加高效的方式,

这里我们用 EXPLAIN 方式

具体代码如下,放在 functions.php 文件即可:

if (! function_exists(‘maizi_set_no_found_rows’) ) {

/**

* 设置 WP_Query 的‘no_found_rows’属性为 true,禁用 SQL_CALC_FOUND_ROWS

*

* @param WP_Query $wp_query WP_Query 实例

* @return void

*/

function maizi_set_no_found_rows(\WP_Query $wp_query)

{

$wp_query->set(‘no_found_rows’, true);

}

}

add_filter(‘pre_get_posts’,‘maizi_set_no_found_rows’, 10, 1);

if (! function_exists(‘maizi_set_found_posts’) ) {

/**

* 使用 EXPLAIN 方式重构

*/

function maizi_set_found_posts($clauses, \WP_Query $wp_query)

{

// Don’t proceed if it’s a singular page.

if ($wp_query->is_singular()) {

return $clauses;

}

global $wpdb;

$where = isset($clauses[‘where’]) ? $clauses[‘where’] :”;

$join = isset($clauses[‘join’]) ? $clauses[‘join’] :”;

$distinct = isset($clauses[‘distinct’]) ? $clauses[‘distinct’] :”;

$wp_query->found_posts = (int)$wpdb->get_row(“EXPLAIN SELECT $distinct * FROM {$wpdb->posts} $join WHERE 1=1 $where”)–>rows;

$posts_per_page = (!empty($wp_query->query_vars[‘posts_per_page’]) ? absint($wp_query->query_vars[‘posts_per_page’]) : absint(get_option(‘posts_per_page’)));

$wp_query->max_num_pages = ceil($wp_query->found_posts / $posts_per_page);

return $clauses;

}

}

add_filter(‘posts_clauses’,‘maizi_set_found_posts’, 10, 2);

为什么用 EXPLAIN 而不是 count(*)?

select count(*) 是 MySQL 中用于统计记录行数最常用的方法。

count 方法可以返回表内精确的行数,每执行一次都会进行一次全表扫描,

以避免由于其他连接进行 delete 和 insert 引起结果不精确。

在某些索引下是好事,但是如果表中有主键,count(*) 的速度就会很慢,特别在千万记录以上的大表。

如果用 explain 命令速度会快很多,因为 explain 用并不真正执行查询,而是查询优化器【估算】的行数。

在一个 1500 万条记录的表中测试,用 select count(*) 耗时 15s,而用 explain 耗时 0.08 秒,

两者相差差不多有 200 倍之多 (第一次执行会稍慢,3 秒左右)。

如下是 explain 方式:

mysql> explain select * from posts;

+—-+————-+————-+————+——+—————+——+———+——+———-+———-+——-+

| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |

+—-+————-+————-+————+——+—————+——+———+——+———-+———-+——-+

| 1 | SIMPLE | posts | NULL | ALL | NULL | NULL | NULL | NULL | 12596096 | 100.00 | NULL |

+—-+————-+————-+————+——+—————+——+———+——+———-+———-+——-+

1 row in set, 1 warning (0.08 sec)

注意,这里用的是 select *,不是 select count(*)。

select * 会返回一行数据,包括估算行数 rows,在 PHP 中我们 fetch(),再通过 $result[‘rows’] 就可以拿到这个预估值。

select count(*) 则会在 extra 中有一行 Select tables optimized away,不会拿到函数估算值。

所以,在对数据准确性要求不高,但是对速度要求很苛刻的场合,绝对有必要用这个估算值代替。

你也可以用下面这句,结果和 explain 一模一样:

select TABLE_ROWS FROM INFORMATION_SCHEMA.TABLES where TABLE_NAME=‘posts’;

+————+

| TABLE_ROWS |

+————+

| 12596096 |

+————+

1 row in set (0.04 sec)

根据实际情况任选一个,都是同一个东西。

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-06-14发表,共计3015字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)