Posted in MySQL onApril 06, 2021
数据类型优化
- 尽量使用可以正确存储数据的最小数据类型
更小的数据类型通常更快,因为它们占用更少的磁盘、内存和CPU缓存,并且处理时需要的CPU周期更少,但是要确保没有低估需要存储的值的范围,如果无法确认哪个数据类型,就选择你认为不会超过范围的最小类型 - 整型比字符操作代价更低
因为字符集和校对规则使字符比较比整型比较更复杂 - 经常查询的列,应该尽量避免使用有null
如果查询中包含可为NULL的列,对mysql来说很难优化,因为可为null的列使得索引、索引统计和值比较都更加复杂,坦白来说,通常情况下null的列改为not null带来的性能提升比较小,所有没有必要将所有的表的schema进行修改,但是应该尽量避免设计成可为null的列 - 尽量使用满足需求的最小数据类型
TINYINT,SMALLINT,MEDIUMINT,INT,BIGINT分别使用8,16,24,32,64位存储空间。 - 选择合适的字符/字符串类型
查询速度:char>varchar>text- char长度固定,即每条数据占用等长字节空间;最大长度是255个字符,适合用在身份证号、手机号等定长字符串。char在存储时,会自动删除末尾的空格。检索效率、写效率会比varchar高,以空间换时间
- varchar可变程度,可以设置最大长度;最大空间是65535个字节,适合用在长度可变的属性。varchar在mysql5.6之前变更长度,或者从255一下变更到255以上时时,都会导致锁表。
- text不设置长度,当不知道属性的最大长度时,适合用text
- datetime和timestamp
- 不要使用字符串类型来存储日期时间数据
- 日期时间类型通常比字符串占用的存储空间小
- 日期时间类型在进行查找过滤时可以利用日期来进行比对
- 日期时间类型还有着丰富的处理函数,可以方便的对时间类型进行日期计算
- 使用int存储日期时间不如使用timestamp类型
- 使用枚举代替字符串类型
有时可以使用枚举类代替常用的字符串类型,mysql存储枚举类型会非常紧凑,会根据列表值的数据压缩到一个或两个字节中,mysql在内部会将每个值在列表中的位置保存为整数,并且在表的.frm文件中保存“数字-字符串”映射关系的查找表 - 特殊类型数据
人们经常使用varchar(15)来存储ip地址,然而,它的本质是32位无符号整数不是字符串,可以使用INET_ATON()和INET_NTOA函数在这两种表示方法之间转换
主键的选择
主键应该尽量选择自增组件,这样可以减少B+树的页分裂合并
字符集的选择
字符集直接决定了数据在MySQL中的存储编码方式,由于同样的内容使用不同字符集表示所占用的空间大小会有较大的差异,所以通过使用合适的字符集,可以帮助我们尽可能减少数据量,进而减少IO操作次数。
- 纯拉丁字符能表示的内容,没必要选择 latin1 之外的其他字符编码,因为这会节省大量的存储空间。
- 如果我们可以确定不需要存放多种语言,就没必要非得使用UTF8或者其他UNICODE字符类型,这回造成大量的存储空间浪费。
- MySQL的数据类型可以精确到字段,所以当我们需要大型数据库中存放多字节数据的时候,可以通过对不同表不同字段使用不同的数据类型来较大程度减小数据存储量,进而降低 IO 操作次数并提高缓存命中率。
适当拆分
当我们的表中存在类似于 TEXT 或者是很大的 VARCHAR类型的大字段的时候,如果我们大部分访问这张表的时候都不需要这个字段,我们就该义无反顾的将其拆分到另外的独立表中,以减少常用数据所占用的存储空间。这样做的一个明显好处就是每个数据块中可以存储的数据条数可以大大增加,既减少物理 IO 次数,也能大大提高内存中的缓存命中率。
适当的数据冗余
对于被频繁引用且只能通过 Join 2张(或者更多)大表的方式才能得到的独立小字段,由于每次Join仅仅只是为了取得某个小字段的值,Join到的记录又大,会造成大量不必要的 IO,完全可以通过空间换取时间的方式来优化。不过,冗余的同时需要确保数据的一致性不会遭到破坏,确保更新的同时冗余字段也被更新。
索引优化
- 使用索引列进行查询时,尽量不要使用表达式,把计算放到业务层实现
- 尽量使用主键查询,这样可以避免回表
- 使用like时,使用前匹配
- 使用索引来进行排序(如果使用组合排序,一个升序一个降序也会使索引排序失效,所以要么全升序,要么全降序)
- 组合排序使用索引页应该满足最左匹配
- union all、in、or都能使用索引,但是推荐使用in
- 范围列可以用索引
- 强制类型转换会使用全表扫描
- 更新多查询少的数据,不建议使用索引
- 数据区分度不高的字段不推荐使用索引
- 创建索引的列,不允许为null,可能会得到不符合预期的结果
- 单表索引建议控制在5个以内
- 但索引字段不允许超过5个
- 数据量少时,使用索引有时会效率更低,因为需要回表
sql语句优化
- 查询时,不要写select * ,即使需要所有字段,也要把所有列都列举出来。
- 只返回一条数据时,使用limit 1
- join操作尽量控制在三张表以内
- 确保任何的group by和order by中的表达式只涉及到一个表中的列,这样mysql才有可能使用索引来优化这个过程
- 尽量使用关联查询代替子查询
- 使用分页,当页数较多时,采用join的方式先查询id再进行关联,可以提高效率
- 除非必须消除重复行,否则使用union all代替union
- 内连接效率要高于外连接
mysql优化
- Author -
牛虻~声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
Reply on: @reply_date@
@reply_contents@