数据库30条军规
数据库 30 条军规
一、根基标准
(1)必需运用 InnoDB 存储引擎
解读:支撑事务、行级锁、并发机能更好、CPU 及内存缓存页优化使得资源应用率更高
(2)必需运用 UTF8 字符集
解读:万国码,无需转码,无乱码风险,节俭空间
(3)数据表、数据字段必需参加中文注释
解读:N 年后谁 tm 晓得这个 r1, r2, r3 字段是干嘛的
(4)制止运用存储历程、视图、触发器、Event
解读:高并发大数据的互联网业务,架构设计思绪是“解放数据库CPU,将盘算转移到办事层”,并发量大的状况下,这些功能很可能将数据库拖死,业务逻辑放到办事层具备更好的扩展性,能够轻易实现“增机器就加机能”。数据库善于存储与索引,CPU 盘算还是上移吧
(5)制止存储大文件或者大相片
解读:为什么要让数据库做它不善于的事情?大文件和相片存储在文件系统,数据库里存URI多好
二、命名标准
(6)只允许运用内网域名,而不是 ip 连贯数据库
(7)线上环境、开发环境、测试环境数据库内网域名遵循命名标准
● 业务名称:xxx
● 线上环境:dj.xxx.db
● 开发环境:dj.xxx.rdb
● 测试环境:dj.xxx.tdb
● 从库在名称后加 -s 标识,备库在名称后加 -ss 标识
● 线上从库:dj.xxx-s.db
● 线上备库:dj.xxx-sss.db
(8)库名、表名、字段名:小写,下划线格调,不超过 32 个字符,必需见名知意,制止拼音英文混用
(9)表名 t_xxx,非独一索引名 idx_xxx,独一索引名 uniq_xxx
三、表设计标准
(10)单实例表数量必需小于 500
(11)单表列数量必需小于 30
(12)表必需有主键,例如自增主键
解读:
* a)主键递增,数据行写入可以提高插入机能,可以以免 `page` 破裂,减少表碎片提拔空间和内存的运用
* b)主键要选中较短的数据类型, Innodb 引擎普通索引都会保留主键的值,较短的数据类型可以有效的减少索引的磁盘空间,提高索引的缓存效率
* c) 无主键的表删除,在 row 模式的主从架构,会致使备库夯住
(13)制止运用外键,要是有外键完备性束缚,需要利用程序控制
解读:外键会致使表与表之间耦合,update 与 delete 操纵都会波及相干联的表,十分影响 sql 的机能,甚至会造成死锁。高并发状况下容易造成数据库机能,大数据高并发业务场景数据库运用以机能优先
四、字段设计标准
(14)必需把字段定义为 NOT NULL 而且供给默许值
解读:
* a)null 的列使索引/索引统计/值比拼都更加复杂,对 MySQL 来说更难优化
* b)null 这品种型 MySQL 内部需要进行特别处置,添加数据库处置记载的复杂性;平等前提下,表中有较多空字段的时候,数据库的处置机能会落低许多
* c)null 值需要更多的存储空,不管是表还是索引中每行中的 null 的列都需要额外的空间来标识
* d)对 null 的处置时候,只能采纳 `is null` 或 `is not null`,而不克不及采纳 `=、in、<、<>、!=、not in` 这些操纵符号。如:where name!=’shenjian’,要是存在 name 为 null 值的记载,查询效果就不会包括 name 为 null 值的记载
(15)制止运用 TEXT、BLOB 类型
解读:会浪费更多的磁盘和内存空间,非须要的批量的大字段查询会裁汰掉热数据,致使内存命中率急剧落低,影响数据库机能
(16)制止运用小数存储货币
解读:运用整数吧,小数容易致使钱对不上
(17)必需运用 varchar(20) 存储手机号
解读:
* a)波及到区号或者国家代号,可能涌现 `+-()`
* b)手机号会去做数学运算么?
* c)varchar 可以支撑依稀查询,例如:`like“138%”`
(18)制止运用 ENUM,可运用 TINYINT 取代
解读:
* a)添加新的 ENUM 值要做 DDL 操纵
* b)ENUM 的内部现实存储就是整数,你认为本人定义的是字符串?
五、索引设计标准
(19)单表索引倡议控制在 5 个之内
(20)单索引字段数不允许超过 5 个
解读:字段超过 5 个时,现实已经起不到有效过滤数据的作用了
(21)制止在更新十分频繁、区分度不高的属性上创立索引
解读:
* a)更新会变动 B+ 树,更新频繁的字段创立索引会大大落低数据库机能
* b)“性别”这种区分度不大的属性,创立索引是没有什么意义的,不克不及有效过滤数据,机能与全表扫描相似
(22)创立组合索引,必需把区分度高的字段放在前面
解读:能够更加有效的过滤数据
六、SQL运用标准
(23)制止运用 SELECT *,只猎取须要的字段,需要显示注明列属性
解读:
* a)读取不需要的列会添加 CPU、IO、NET 耗损
* b)不克不及有效的应用遮盖索引
* c)运用 `SELECT *` 容易在添加或者删除字段后涌现程序BUG
(24)制止运用 INSERT INTO t_xxx VALUES(xxx),必需显示指定插入的列属性
解读:容易在添加或者删除字段后涌现程序BUG
(25)制止运用属性隐式转换
解读:`SELECT uid FROM t_user WHERE phone=13812345678` 会致使全表扫描,而不克不及命中 phone 索引,猜猜为何?(这个线上题目不止涌现过一次)
(26)制止在 WHERE 前提的属性上运用函数或者表达式
解读:`SELECT uid FROM t_user WHERE from_unixtime(day)>='2017-02-15'` 会致使全表扫描
准确的写法是:`SELECT uid FROM t_user WHERE day>= unix_timestamp('2017-02-15 00:00:00')`
(27)制止负向查询,以及%开头的依稀查询
解读:
* a)负向查询前提:`NOT、!=、<>、!<、!>、NOT IN、NOT LIKE` 等,会致使全表扫描
* b)`%` 开头的依稀查询,会致使全表扫描
(28)制止大表运用 JOIN 查询,制止大表运用子查询
解读:会发生暂时表,耗损较多内存与 CPU,极大影响数据库机能
(29)制止运用 OR 前提,必需改为 IN 查询
解读:旧版本 Mysql 的 OR 查询是不克不及命中索引的,即便能命中索引,为什么要让数据库耗费更多的 CPU 帮忙实施查询优化呢?
(30)利用程序必需捕捉 SQL 异样,并有响应处置
总结:大数据量高并发的互联网业务,极大影响数据库机能的都不让用,不让用哟。
举荐学习:MySQL教程
以上就是数据库 30 条军规的细致内容,更多请关注 百分百源码网 其它相干文章!