如何理解SQL Server SQL性能优化中的参数化

59次阅读
没有评论

共计 2561 个字符,预计需要花费 7 分钟才能阅读完成。

如何理解 SQL Server SQL 性能优化中的参数化,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面丸趣 TV 小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

数据库参数化的模式

数据库的参数化有两种方式,简单(simple)和强制(forced),默认的参数化默认是“简单”,简单模式下,如果每次发过来的 SQL,除非完全一样,否则就重编译它(特殊情况会自动参数化,正是本文想说的重点)

强制模式就是将 adhoc SQL 强制参数化,避免每次运行的时候因为参数值的不同而重编译,这里不详细说明。

这首先要感谢“潇湘隐者”大神的提示,当时也是遇到一个实际问题,发现执行计划对数据行的预估,怎么都不对,有观察到无论怎么改变参数,SQL 语句执行前都没有重编译,疑惑了好一会,这个问题正是简单参数化模式下,对某些 SQL 自动参数化造成执行计划重用引起的,也是本文想表达的重点。

这个问题之前就写过,当时也只是看书上理论上这么说的,没有想到其带来的影响,该参数是一个数据级别的选项,设置情况可以参考下图

什么情况下会自动参数化

简单参数化模式下,对于有且只有一种执行方式的 Adhoc SQL 语句,SQL Server 会自动参数化它,从而达到重用执行计划的目的。

究竟哪些类型的 SQL 会被自动参数化,后面会举例说明。

自动参数化会存在哪些问题

在简单模式下,SQL 对于某些 SQL 会自动参数化他,避免每次都重编译。

SQL Server 自动参数化 SQL 语句的行为,能够避免一些重编译,原本也是出于“好意”,但是这种“好意”往往不一定总是给我们带来好处。

举例说明什么情况下会自动参数化

先造一个简单的测试环境

create table TestAuotParameter ( id int not null, col2 varchar(50) ) GO declare @i int=0 while @i100000 begin insert into TestAuotParameter values (@i, NEWID()) set @i=@i+1 end GO create unique index idx_id on TestAuotParameter(id) GO

之所以自动参数化了 SQL 语句,就是因为 select * from TestAuotParameter where id=33333(66666,99999)这句 SQL 语句,在当前的数据量下和 *** 索引的特点,决定了有且只有一种高效的执行方式(也就是索引查找)这里说有且只有一种方式是表中数据量相对较多,又因为 idx_id 这个索引是 unique 的。如果不是 unique 的,那么情况就不同了,下面来解释什么是有且只有一种高效的执行计划

如下截图:同样的测试,我删除 id 上的 *** 索引,创建为非 *** 索引,再做同样的测试,就会发现执行同样的 SQL 并没有被自动参数化

这里解释一下原因,索引类型怎么跟执行计划缓存扯上了?

对于非 *** 索引,有可能作做引查找是高效的,有可能做全表扫描是高效的(比如某个 ID 的数据分布的特别多)此时执行计划有可能是多样的,不仅仅只有一种方式,所以就不会自动参数化 SQL

自动参数化存在的问题

自动参数化好处并不用多说,因为可以重用缓存的执行计划,避免了每次参数值不一样就重编译的问题。说到执行计划重用,不得不说的一个话题就是 parameter sniff,嘴皮子都磨破的问题了

没错,自动参数化因为不同参数会重用 *** 次编译生成的执行计划,很有可能造成 parameter sniff 问题,以及 parameter sniff 衍生出来的其他问题

同样用一个例子来做演示,该问题是最近在观察执行计划统计信息(statistics)预估问题时遇到的一个问题,让我困惑了好一会,这里再次感谢潇湘隐者。

该问题同样也是因为自动参数化了 SQL 语句,造成执行计划重用,从而造成一个极其简单的 SQL 执行效率在某些情况下较低的情况,为什么自动化参数的原因跟上述类似,都是有且只有一种执行方式(索引查找)的情况下,不同参数执行计划重用造成对数据行的错误预估。测试之前清空一下缓存执行计划,观察不同查询条件下的实际执行计划对数据行的预估

如下查询条件:

1,初始查询条件为:CreateDate rsquo;2016-6-1 prime; and CreateDate

2,将查询条件更新为:CreateDate rsquo;2016-6-1 prime; and CreateDate

3,将查询条件更新为:CreateDate rsquo;2016-6-1 prime; and CreateDate

发现没有,因为查询时间段有变化,实际行数也有变化,但是不管实际行数多少,预估行数总是为 *** 次执行预估的行数。

这肯定不对吧?随便带入什么条件,预估行数都是 37117,当时一下子蒙了,怎么每次执行 SQL 对数据行的预估都是一样的?

其实这个问题跟一开始举例的一样,都是 SQL 语句被自动参数化了,因此造成了执行计划重用,执行计划重用,导致错误地预估实际查询的数据行数。

如何解决自动参数化造成错误地重用执行计划的问题

很多问题找到了真正的原因,解决起来往往并不难,这个问题的原因是执行计划重用造成的,那么我们只需要解决执行计划重用的问题即可。也就是不让他重用执行计划,只需要在 SQL 语句中加一个提示即可,也即:select COUNT(1) from Test20160810 where CreateDate rsquo;2016-6-1 prime; and CreateDateOPTION(RECOMPILE)

原因就在于加上 OPTION(RECOMPILE) 这个查询提示之后,不缓存 SQL 的执行计划缓存,没有了执行计划缓存,也就没得重用了

比如这个查询,在查询语句中加入 OPTION(RECOMPILE) 查询提示,让其执行之前重编译 SQL 语句,他就可以正确地预估数据行了。

通过一个实际案例说明了什么是简单参数模式下的自动化参数,自动化参数会带来哪些问题,以及如何解决,问题本身非常简单,如果不注意还是会偶尔还是会出现困惑的。

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注丸趣 TV 行业资讯频道,感谢您对丸趣 TV 的支持。

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-07-19发表,共计2561字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)