怎么理解并掌握mysql的表

67次阅读
没有评论

共计 3759 个字符,预计需要花费 10 分钟才能阅读完成。

本篇内容介绍了“怎么理解并掌握 mysql 的表”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让丸趣 TV 小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

一. 索引组织表
如果在创建表时没有定义主键,则 innodb 存储引擎会按如下方式选择或创建主键
- 首先判断表中是否有非空的唯一索引,如果有则该列即为主键,当表中有多个非空唯一索引时,innodb 存储引擎将选择建表时第一个定义的非空唯一索引为主键。
- 如果不符合上述条件,innodb 存储引擎自动创建一个 6 字节大小的指针。

点击 (此处) 折叠或打开

由于 b 为允许为 null 的唯一索引,所以该表的主键为 d

create table wwj.z(

 a int not null,

 b int null,

 c int not null,

 d int not null,

 unique key (b),

 unique key (d),

 unique key (c)

);

insert into wwj.z select 1,2,3,4;

insert into wwj.z select 5,6,7,8;

insert into wwj.z select 9,10,11,12;

mysql select a,b,c,d,_rowid from wwj.z;

+—+——+—-+—-+——–+

| a | b | c | d | _rowid |

+—+——+—-+—-+——–+

| 1 | 2 | 3 | 4 | 4 |

| 5 | 6 | 7 | 8 | 8 |

| 9 | 10 | 11 | 12 | 12 |

+—+——+—-+—-+——–+

二.innodb 逻辑存储结构
1. 表空间
默认为所有数据都存放在共享表空间中。如果开启参数 innodb_file_per_table 之后,则每张表的数据将会放在单独的表空间中。
如果启用了 innodb_file_per_table,则每张表的表空间内存放的只是数据,索引,和插入缓冲的 bitmap 页。其他类的数据,如插入缓冲索引页,系统事务信息,二次写缓冲,还是存放在原来的共享表空间中。

2. 段
表空间是由各个段组成的,常见的段有数据段,索引段,回滚段等。
段的管理都是由引擎自身所完成,DBA 不能也没有必要对其进行控制。

3. 区
区是由连续页组成的空间,在任何情况下每个区的大小都为 1m。
为了保证区中页的连续性,innodb 存储引擎一次从磁盘申请 4~5 个区。默认情况 innodb 存储引擎页的大小为 16kb,即一个区中一共有 64 个连续的页。
当用户启用参数 innodb_file_er_table 后,创建的表默认大小是 96kb,而不是区的默认大小 1m。这是因为在每个段开始时,先用 32 个页大小的碎片页来存放数据,使用完这些碎片页后,才是 64 个连续页的申请。这样做的目的是,对于一些小表,或者是 undo 这类的段,可以在开始时申请较少的空间,节省磁盘容量的开销。

4. 页
innodb 磁盘管理的最小单位
常见的页类型有:
数据页
undo 页
系统页
事务数据页
插入缓冲位图页
插入缓冲空闲列表页
未压缩的二进制大对象页
压缩的二进制大对象页

5. 行

三.innodb 行记录格式
1.compact 行记录格式
5.0 以后引入,其设计目的是高效的存储数据,简单来说,一个页中存放的行数据越多,其性能越高。

2.redundant
5.0 之前的行记录存储格式

3. 行溢出数据
行存放 varchar 类型的数据最大长度和为 65532 字节。
建表时 varchar(N)表示的是字符长度。

例如: 下面建表语句将会报错
create table haha22(
 a varchar(65532)
) charset=utf8 engine=innodb;
ERROR 1074 (42000): Column length too big for column a (max = 21845); use BLOB or TEXT instead

下面语句可以正常执行
create table haha22(
 a varchar(1)
) charset=utf8 engine=innodb;
insert into wwj.haha22 values (阳

行溢出数据存储图:

那么多长的 varchar 是保存在单个数据页中的,从多长开始又会保存在 blob 页呢?
可以这样进行思考:innodb 存储引擎表是索引组织的,即 B +Tree 结构,这样每个页中至少应该有两条行记录,因此如果页中只能存放下一条记录,那么 innodb 存储引擎会自动将行数据存放到溢出页中。
经过实验发现当行的长度为 8098 字节时,可以在页中放入两条记录,并且不用扩展至 blob 页。
对于 TEXT 和 BLOB 数据类型也是如此,如果在数据页中能存放至少 2 条记录,则将不会将记录扩展至 blob 页。

4. 新的文件格式 barracuda
该文件格式下拥有两种新的行记录格式:compressed 和 dynamic
新的记录格式对于存放在 blob 中的数据采用了完全的行溢出的方式,在数据页中只存放 20 个字节的指针,实际数据都存放在 off page 中,而之前的 compact 和 redundant 两种格式会存放 768 个前缀字节。

compressed 行记录格式的另一个功能就是,存储在其中的行数据会以 zlib 的算法进行压缩。因此对于 blob,text,varchar 这类大长度类型的数据能够进行非常有效的存储。

参数 innodb_file_format 用来指定文件格式

四. 约束
约束类型
primary key
unique key
foreign key
default
not null

五. 分区表
1.mysql 支持以下几种类型的分区:
range 分区
list 分区
hash 分区
key 分区
* 如果表中存在主键或唯一索引时,分区列必须是唯一索引的一个组成部分. 如果建表时没有指定主键,唯一索引,可以指定任何一个列为分区列。
* mysql 分区表中的索引都是局部分区索引,不支持全局索引

2. 分区类型
(1).range 分区
create table wwj.sales(
 money int,
    date1 datetime
) engine=innodb
partition by range(year(date1)) (
 partition p2008 values less than (year( 2009-01-01)),
    partition p2009 values less than (year( 2010-01-01)),
    partition p2010 values less than (year( 2011-01-01))
);
优化器只能对 year(),to_days(),to_seconds(),unix_timestamp()这类函数进行优化选择

(2).list 分区
create table wwj.tt(
 a int,
    b int
) engine=innodb
partition by list(b) (
 partition p0 values in (1,3,5,7,9),
    partition p1 values in (0,2,4,6,8)
);

(3).hash 分区
目的是将数据均匀的分布到预先定义的各个分区中,保证各分区的数据量大致都是一样的
– 普通 hash 分区
create table wwj.qqq(
 a int,
    b datetime
) engine=innodb
partition by hash (year(b)) 
partitions 4;
分配记录的算法如下:
mod(year( 2010-04-01),4) = mod(2010,4) =2
因此记录会放在 p2 分区中

–linear hash 分区
create table wwj.qqq(
 a int,
    b datetime
) engine=innodb
partition by hash (year(b)) 
partitions 4;
分配记录的算法如下:
取大于分区数量 4 的下一个 2 的幂值 V V=POWER(2,CEILING(LOG(2,num)))=4
所在分区 N =YEAR(2010-04-01) (V-1)=2
因此记录会放在 p2 分区中

linear hash 分区的优点在于,增加,删除,合并,拆分分区将变得更加快捷,有利于处理含有大量数据的表。
缺点在于数据分布可能不太均衡。

(4).key 分区
和 hash 分区相似,不同之处在于 hash 分区使用用户定义的函数进行分区,key 分区使用 mysql 数据库提供的函数进行分区。
create table wwj.www(
 a int,
    b datetime
) engine=innodb
partition by key (b) 
partitions 4;

(5).columns 分区
前面的 4 种分区中,分区的条件是: 数据必须是整形,如果不是整形,则需要通过函数将其转化为整形。
columns 分区可以直接使用非整形的数据进行分区,分区根据类型直接比较而得,不需要转化为整形,并且支持多个列的值进行分区。
columns 支持以下数据类型:
int,smallint,tinyint,bigint,date,datetime,char,varchar,binary,varbinary

“怎么理解并掌握 mysql 的表”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注丸趣 TV 网站,丸趣 TV 小编将为大家输出更多高质量的实用文章!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-07-20发表,共计3759字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)