SQLServer中怎样优化多表查询

187次阅读

共计 4014 个字符，预计需要花费 11 分钟才能阅读完成。

今天就跟大家聊聊有关 SQLServer 中怎样优化多表查询，可能很多人都不太了解，为了让大家更加了解，丸趣 TV 小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

SQLServer 多表查询优化方案有哪些

1. 执行路径

ORACLE 的这个功能大大地提高了 SQL 的执行性能并节省了内存的使用: 我们发现, 单表数据的统计比多表统计的速度完全是两个概念. 单表统计可能只要 0.02 秒, 但是 2 张表联合统计就

可能要几十秒了. 这是因为 ORACLE 只对简单的表提供高速缓冲(cachebuffering), 这个功能并不适用于多表连接查询.. 数据库管理员必须在 init.ora 中为这个区域设置合适的参数, 当这个内存区域越大, 就可以保留更多的语句, 当然被共享的可能性也就越大了.

2. 选择最有效率的表名顺序(记录少的放在后面)

ORACLE 的解析器按照从右到左的顺序处理 FROM 子句中的表名, 因此 FROM 子句中写在最后的表 (基础表 drivingtable) 将被最先处理. 在 FROM 子句中包含多个表的情况下, 你必须选择记录条数最少的表作为基础表. 当 ORACLE 处理多个表时, 会运用排序及合并的方式连接它们. 首先, 扫描第一个表 (FROM 子句中最后的那个表) 并对记录进行派序, 然后扫描第二个表(FROM 子句中最后第二个表), 最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并.

例如:

表 TAB116,384 条记录

表 TAB21 条记录

选择 TAB2 作为基础表(最好的方法)

selectcount(*)fromtab1,tab2 执行时间 0.96 秒

选择 TAB2 作为基础表(不佳的方法)

selectcount(*)fromtab2,tab1 执行时间 26.09 秒

假如有 3 个以上的表连接查询, 那就需要选择交叉表 (intersectiontable) 作为基础表, 交叉表是指那个被其他表所引用的表.

例如:EMP 表描述了 LOCATION 表和 CATEGORY 表的交集.

SELECT*FROMLOCATIONL,CATEGORYC,EMPEWHEREE.EMP_NOBETWEEN1000AND2000ANDE.CAT_NO=C.CAT_NOANDE.LOCN=L.LOCN

将比下列 SQL 更有效率

SELECT*FROMEMPE,LOCATIONL,CATEGORYCWHEREE.CAT_NO=C.CAT_NOANDE.LOCN=L.LOCNANDE.EMP_NOBETWEEN1000AND2000

3.WHERE 子句中的连接顺序(条件细的放在后面)

ORACLE 采用自下而上的顺序解析 WHERE 子句, 根据这个原理, 表之间的连接必须写在其他 WHERE 条件之前, 那些可以过滤掉最大数量记录的条件必须写在 WHERE 子句的末尾.

例如:

(低效, 执行时间 156.3 秒)

SELECT…FROMEMPEWHERESAL 50000ANDJOB=‘MANAGER’AND25 (SELECTCOUNT(*)FROMEMPWHEREMGR=E.EMPNO);(高效, 执行时间 10.6 秒)SELECT…FROMEMPEWHERE25 (selectcount(*)fromempwheremgr=e.empno)andsal 50000ANDJOB=‘MANAGER’;

4.SELECT 子句中避免使用 *

当你想在 SELECT 子句中列出所有的 COLUMN 时, 使用动态 SQL 列引用 * 是一个方便的方法. 不幸的是, 这是一个非常低效的方法. 实际上,ORACLE 在解析的过程中, 会将 * 依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 这意味着将耗费更多的时间.

SQLServer 多表查询优化方案有哪些

5. 减少访问数据库的次数

当执行每条 SQL 语句时,ORACLE 在内部执行了许多工作: 解析 SQL 语句, 估算索引的利用率, 绑定变量, 读数据块等等. 由此可见, 减少访问数据库的次数, 就能实际上减少 ORACLE 的工作量.

方法 1(低效)

SELECTEMP_NAME,SALARY,GRADEFROMEMPWHEREEMP_NO=342;SELECTEMP_NAME,SALARY,GRADEFROMEMPWHEREEMP_NO=291;

方法 2(高效)

SELECTA.EMP_NAME,A.SALARY,A.GRADE,B.EMP_NAME,B.SALARY,B.GRADEFROMEMPA,EMPBWHEREA.EMP_NO=342ANDB.EMP_NO=291;

6. 删除重复记录

最高效的删除重复记录方法(因为使用了 ROWID)

DELETEFROMEMPEWHEREE.ROWID (SELECTMIN(X.ROWID)FROMEMPXWHEREX.EMP_NO=E.EMP_NO);

7. 用 TRUNCATE 替代 DELETE

当删除表中的记录时, 在通常情况下, 回滚段 (rollbacksegments) 用来存放可以被恢复的信息. 假如你没有 COMMIT 事务,ORACLE 会将数据恢复到删除之前的状态(准确地说是恢复到执行删除命令之前的状况)，而当运用 TRUNCATE 时, 回滚段不再存放任何可被恢复的信息. 当命令运行后, 数据不能被恢复. 因此很少的资源被调用, 执行时间也会很短.

8. 尽量多使用 COMMIT

只要有可能, 在程序中尽量多使用 COMMIT, 这样程序的性能得到提高, 需求也会因为 COMMIT 所释放的资源而减少:

COMMIT 所释放的资源:

a. 回滚段上用于恢复数据的信息.

b. 被程序语句获得的锁

c.redologbuffer 中的空间

d.ORACLE 为管理上述 3 种资源中的内部花费(在使用 COMMIT 时必须要注意到事务的完整性, 现实中效率和事务完整性往往是鱼和熊掌不可得兼)

9. 减少对表的查询

在含有子查询的 SQL 语句中, 要特别注意减少对表的查询.

例如：

低效：

SELECTTAB_NAMEFROMTABLESWHERETAB_NAME=(SELECTTAB_NAMEFROMTAB_COLUMNSWHEREVERSION=604)AND DB_VER=(SELECTDB_VERFROMTAB_COLUMNSWHEREVERSION=604

高效：

SELECTTAB_NAMEFROMTABLESWHERE(TAB_NAME,DB_VER)=(SELECTTAB_NAME,DB_VER)FROMTAB_COLUMNSWHEREVERSION=604)

Update 多个 Column 例子:

低效：

UPDATEEMPSETEMP_CAT=(SELECTMAX(CATEGORY)FROMEMP_CATEGORIES),SAL_RANGE=(SELECTMAX(SAL_RANGE)FROMEMP_CATEGORIES)WHEREEMP_DEPT=0020;

高效:

UPDATEEMPSET(EMP_CAT,SAL_RANGE)=(SELECTMAX(CATEGORY),MAX(SAL_RANGE)FROMEMP_CATEGORIES)WHEREEMP_DEPT=0020;

10. 用 EXISTS 替代 IN, 用 NOTEXISTS 替代 NOTIN

在许多基于基础表的查询中, 为了满足一个条件, 往往需要对另一个表进行联接. 在这种情况下, 使用 EXISTS(或 NOTEXISTS)通常将提高查询的效率.

低效:

SELECT*FROMEMP(基础表)WHEREEMPNO 0ANDDEPTNOIN(SELECTDEPTNOFROMDEPTWHERELOC=‘MELB’)

高效:

SELECT*FROMEMP(基础表)WHEREEMPNO 0ANDEXISTS(SELECT‘X’FROMDEPTWHEREDEPT.DEPTNO=EMP.DEPTNOANDLOC=‘MELB’)

(相对来说, 用 NOTEXISTS 替换 NOTIN 将更显著地提高效率)

在子查询中,NOTIN 子句将执行一个内部的排序和合并. 无论在哪种情况下,NOTIN 都是最低效的 (因为它对子查询中的表执行了一个全表遍历). 为了避免使用 NOTIN, 我们可以把它改写成外连接(OuterJoins) 或 NOTEXISTS.

例如:

SELECT…FROMEMPWHEREDEPT_NONOTIN(SELECTDEPT_NOFROMDEPTWHEREDEPT_CAT= A

为了提高效率. 改写为:

(方法一: 高效)

SELECT….FROMEMPA,DEPTBWHEREA.DEPT_NO=B.DEPT(+)ANDB.DEPT_NOISNULLANDB.DEPT_CAT(+)= A

(方法二: 最高效)

SELECT….FROMEMPEWHERENOTEXISTS(SELECT X FROMDEPTDWHERED.DEPT_NO=E.DEPT_NOANDDEPT_CAT= A

当然, 最高效率的方法是有表关联. 直接两表关系对联的速度是最快的!

11. 识别低效执行的 SQL 语句

用下列 SQL 工具找出低效 SQL:

SELECTEXECUTIONS,DISK_READS,BUFFER_GETS,ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2)Hit_radio,ROUND(DISK_READS/EXECUTIONS,2)Reads_per_run,SQL_TEXTFROMV$SQLAREAWHEREEXECUTIONS 0ANDBUFFER_GETS 0AND(BUFFER_GETS-DISK_READS)/BUFFER_GETS 0.8ORDERBY4DESC;
(虽然目前各种关于 SQL 优化的图形化工具层出不穷, 但是写出自己的 SQL 工具来解决问题始终是一个最好的方法)

看完上述内容，你们对 SQLServer 中怎样优化多表查询有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注丸趣 TV 行业资讯频道，感谢大家的支持。

正文完