MySQL开发规范

mysql,开发,规范 · 浏览次数 : 17

小编点评

**SQL语句3.1 不要使用 count(列名) 或 count(常量) 来替代 count(*) tips:** count(*)会统计值为NULL的行,而count(列名)不会统计此列为NULL值的行。 **3.2 count(distinct col) 计算该列除NULL之外的不重复行数,注意 count(distinct col1, col2)如果其中一列全为NULL,那么即使另一列有不同的值,也返回为0** SELECT IFNULL(SUM(column),0) FROM table; **3.3 当某一列的值全是NULL时,count(col) 的返回结果为0;但sum(col) 的返回结果为NULL,因此使用sum()时需注意NPE(空指针异常)问题** SELECT IFNULL(SUM(column),0) FROM table; **3.4 使用 ISNULL() 来判断是否为NULL值** NULL与任何值的直接比较都为NULL,不会出现true和false;并且ISNULL(column) 相较于 column is null效率会更快一些 **3.5代码中写分页查询逻辑时,若count为0应直接返回,避免执行后面的分页语句** SELECT IFNULL(COUNT(*),0) FROM table; **3.6不得使用外键与级联,一切外键概念必须在应用层解决** 外键与级联更新适用于单机低并发,不适合分布式、高并发集群;级联更新是强阻塞,存在数据库更新风暴的风险;外键影响数据库的插入速度。 **3.7禁止使用存储过程,存储过程难以调试和扩展,更没有移植性** 数据更新要先select,确认无误 **3.8数据更新要先select,确认无误** Map<String,Object> map = new HashMap<>();map.put();map.put();list = sqlMapClient.queryForList("statementName",map); **3.9尽量避免in操作,in后面的集合元素应控制在1000个以内** Map<String,Object> map = new HashMap<>();map.put();map.put();list = sqlMapClient.queryForList("statementName",map); **3.10TRUNCATE TABLE 比DELETE 速度快,且使用的系统和事务日志资源少** TRUNCATE是DDL语句,用于清空大数据表,不受外键约束,但它无事务且不触发 trigger,有可能造成事故,故不建议在开发代码中使用此语句

正文

阿里巴巴开发手册https://developer.aliyun.com/special/tech-java

一、建表规约

1.1表达是与否概念的字段,必须使用is_xxx的方式命名,数据类型是unsigned tinyint(1表示是,0表示否)。
tip:POJO(Domin)类中的任何布尔型的变量,都不要加is前缀,否则部分框架解析会引起序列化错误,因此需要在设置is_xxx到Xxx的映射关系。
1.2表名、字段名必须使用小写字母或数字,禁止出现数字开头禁止两个下划线中间只出现数字。
1.3表名不使用复数名词
1.4禁用保留字
tip:MySQL中的保留字和Java中的保留字一样,因此在命名时不能使用保留字。详细查看MySQL官方文档
https://dev.mysql.com/doc/mysqld-version-reference/en/keywords-8-0.html】
1.5索引命令规约

索引类型 命名规约
主键索引(primary key) pk_字段名
唯一索引(unique key) uk_字段名
普通索引(index) idx_字段名

1.6小数类型为decimal,禁止使用float和double
tip:decimal详解【https://dev.mysql.com/doc/refman/8.0/en/precision-math-decimal-characteristics.html】
1.7如果存储的字符串长度几乎相等,使用char定长字符串类型
1.8varchar是可变长字符串,不预先分配存储空间,长度不要超过5000
tip:如果存储长度大于此值,定义字段类型为text,独立出来一张表,用主键来对应,避免影响其它字段索引率。
1.9表必备三字段: id, create_time,update_time
1.10物理删除与逻辑删除
tips:大部分开发场景使用物理删除即可,对于较为重要的数据,如金融方面等要用逻辑删除。
1.11字段允许适当冗余,以提高查询性能,但必须考虑数据一致。冗余字段应遵循:
● 不是频繁修改的字段。
● 不是唯一索引的字段。
● 不是varchar超长字段,更不能是text字段。
1.12分库分表——单表行数超过500万行或者单表容量超过2GB
1.13合适的字符存储长度
tips:不但节约数据库表空间、节约索引存储,更重要的是提升检索速度

二、索引规约

2.1业务上具有唯一特性的字段,即使是组合字段,也必须建成唯一索引
tips:唯一索引对insert的速度影响可以忽略,其提高的查找速度很明显
2.2超过三个表禁止join。需要join的字段,数据类型保持绝对一致;多表关联查询时,保证被关联的字段需要有索引
tips:出于性能考虑,即使双表join也要注意表索引、SQL性能。
开发中常常用分解查询重构关联查询(高并发、高性能的应用中一般使用单表查询):

  1. 让缓存的效率更高。许多应用程序可以方便地缓存单表查询对应的结果对象。另外对于MySQL的查询缓存来说,如果关联中的某个表发生了变化,那么就无法使用查询缓存了,而拆分后,如果某个表很少改变,那么基于该表的查询就可以重复利用查询缓存结果了。
  2. 将查询分解后,执行单个查询可以减少锁的竞争。
  3. 在应用层做关联,可以更容易对数据库进行拆分,更容易做到高性能和可扩展。
  4. 查询本身效率也可能会有所提升。
  5. 可以减少冗余记录的查询。
  6. 对于数据量很大时,join联合查询速度很慢
  7. 单表查询有利于后期数据量大了分库分表,联合查询一旦分库,原来的sql都需要改动
  8. 分解查询相当于在应用中实现了哈希关联,而不是使用MySQL的嵌套环关联,某些场景哈希关联的效率更高很多

2.3在varchar字段上建立索引时,必须指定索引长度,没必要对全字段建立索引,根据实际文本区分度决定索引长度
tips:对字符串类型的数据,长度为20的索引,对记录的区分度一般都会高达90%以上,可以使用count(distinct left(列名,索引长度))/ count(*)的区分度来确定
2.4页面搜索严禁左模糊或者全模糊,如果需要请走搜索引擎来解决
tips:索引文件具有 B-Tree 的最左前缀匹配特性,如果左边的值未确定,那么无法使用此索引
2.5如果有order by 的场景,请注意利用索引的有序性。order by最后的字段是组合索引的一部分,并且放在索引组合顺序的最后,避免出现filesort的情况,影响查询性能
tips:索引如果存在范围查询,那么索引有序性无法利用,如: WHERE a > 10 ORDER BY b;索引a_b无法排序。
2.6利用覆盖索引来进行查询操作,避免回表
tips:如果需要查询的字段名存在于某个索引上,就可以利用索引直接提供查询结果,不需要回表,减少树的搜索次数,显著提升查询性能
2.7利用延迟关联或者子查询优化超多分页场景
tips:MySQL并不是跳过offset行,而是取 offset+N行,然后返回放弃前offset行,返回N行,那当offset特别大的时候,效率就非常的低下,在实际应用中,可以根据当前页数判断是否需要改写SQL:如果当前页数小于特定阈值,可以使用offset和limit分页,控制返回的总页数;如果页数超过阈值,则改为基于ID的查询或其他SQL改写。
2.8SQL性能优化的目标:至少要达到range级别,要求是ref级别,如果可以是const最好
● consts单表中最多只有一个匹配行(主键或者唯一索引),在优化阶段即可读取到数据
● ref 指的是使用普通的索引 (normal index)
● range 对索引进行范围检索
2.9建组合索引的时候,区分度最高的在最左边
tips:存在非等号和等号混合判断条件时,要把等号条件的列前置
2.10防止因字段类型不同造成的隐式转换,导致索引失效
tips:类型强转,索引失效
2.11创建索引时避免有如下极端误解
● 索引宁滥勿缺。认为一个查询就需要建一个索引。
● 吝啬索引的创建。认为索引会消耗空间、严重拖慢记录的更新以及行的新增速度。
● 抵制唯一索引。认为唯一索引一律需要在应用层通过“先查后插”方式解决。

三、SQL语句

3.1不要使用count(列名)或count(常量)来替代count(*)
tips:count(*)会统计值为NULL的行,而count(列名)不会统计此列为NULL值的行。
3.2count(distinct col)计算该列除NULL之外的不重复行数,注意count(distinct col1 , col2)如果其中一列全为NULL,那么即使另一列有不同的值,也返回为0
3.3当某一列的值全是NULL时,count(col)的返回结果为0;但sum(col)的返回结果为NULL,因此使用sum()时需注意NPE(空指针异常)问题
tips:可以使用如下方式来避免 sum的 NPE问题:SELECT IFNULL(SUM(column),0) FROM table;
3.4使用ISNULL()来判断是否为NULL值
tips:NULL与任何值的直接比较都为NULL,不会出现true和false;并且ISNULL(column)相较于column is null效率会更快一些
3.5代码中写分页查询逻辑时,若count为0应直接返回,避免执行后面的分页语句
3.6不得使用外键与级联,一切外键概念必须在应用层解决
tips:外键与级联更新适用于单机低并发,不适合分布式、高并发集群;级联更新是强阻塞,存在数据库更新风暴的风险;外键影响数据库的插入速度。
3.7禁止使用存储过程,存储过程难以调试和扩展,更没有移植性
3.8数据更新要先select,确认无误
3.9尽量避免in操作,in后面的集合元素应控制在1000个以内
3.10TRUNCATE TABLE 比DELETE 速度快,且使用的系统和事务日志资源少
tips:TRUNCATE是DDL语句,用于清空大数据表,不受外键约束,但它无事务且不触发 trigger,有可能造成事故,故不建议在开发代码中使用此语句

四、ORM映射

4.1 在表查询中,一律不要使用 * 作为查询的字段列表,需要哪些字段必须明确写明
tips:无脑使用*会有以下问题:
● 增加查询分析器解析成本
● 增减字段容易与 resultMap 配置不一致
● 无用字段增加网络消耗,尤其是 text 类型的字段
4.2 POJO 类的布尔属性不能加 is,而数据库字段必须加 is_,要求在 resultMap 中进行字段与属性之间的映射
4.3 不要用 resultClass 当返回参数,即使所有类属性名与数据库字段一一对应,也需要配置完整的映射关系,使字段与DO类解耦,方便维护
4.4 sql.xml 配置参数使用:#{},#param# 不要使用${} 此种方式容易出现 SQL 注入
4.5 iBATIS 自带的 queryForList(String statementName,int start,int size)不推荐使用
tips:其实现方式是在数据库取到 statementName 对应的 SQL 语句的所有记录,再通过 subList 取 start,size 的子集合,可以做如下修改:

Map<String,Object> map = new HashMap<>();
map.put();
map.put();
list = sqlMapClient.queryForList("statementName",map);

4.6不允许直接拿HashMap与Hashtable作为查询结果集的输出
tips: resultClass="Hashtable",会置入字段名和属性值,但是值的类型不可控
4.7 @Transactional事务不要滥用。事务会影响数据库的QPS,另外使用事务的地方需要考虑各方面的回滚方案,包括缓存回滚、搜索引擎回滚、消息补偿、统计修正等

与MySQL开发规范相似的内容:

MySQL开发规范

> 阿里巴巴开发手册https://developer.aliyun.com/special/tech-java # 一、建表规约 **1.1表达是与否概念的字段,必须使用is_xxx的方式命名,数据类型是unsigned tinyint(1表示是,0表示否)。** tip:POJO(Domin)类

[转帖]21个MySQL表设计的经验准则

https://juejin.cn/post/7147135702604447758 前言 大家好,我是捡田螺的小男孩。 作为后端开发,我们经常需要设计数据库表。整理了21个设计MySQL表的经验准则,分享给大家,大家看完一定会有帮助的。 公众号:捡田螺的小男孩 1.命名规范 数据库表名、字段名、索

[转帖]在 TiDB 中正确使用索引,性能提升 666 倍

https://tidb.net/book/tidb-monthly/2022/2022-04/usercase/index-666 背景​ 最近在给一个物流系统做TiDB POC测试,这个系统是基于MySQL开发的,本次投入测试的业务数据大概10个库约900张表,最大单表6千多万行。 这个规模不算

MySQL高级4-索引的使用规则

一、最左前缀法则 如果索引了多列(联合索引),要遵守最左前缀法则。最左前缀法则指的是查询从索引的最左列开始,并且不跳过索引中的列,如果跳跃某一列,索引将部分失效(后面的字段索引失效) 示例1:account_transaction表中创建一个联合索引,使用method字段+trader_staff_

MySQL性能优化浅析及线上案例

关于数据库的性能优化其实是一个很复杂的大课题,很难通过一篇帖子讲的很全面和深刻,这也就是为什么我的标题是‘浅析’,程序员的成长一定是要付出代价和成本,因为只有真的在一线切身体会到当时的紧张和压力,对于一件事情才能印象深刻,但反之也不能太过于强调代价,如果可以通过一些别人的分享就可以规避一些自己业务的问题和错误的代价也是好的。

高性能MySQL实战(三):性能优化 | 京东物流技术团队

这篇主要介绍对慢 SQL 优化的一些手段,而在讲解具体的优化措施之前,我想先对 EXPLAIN 进行介绍,它是我们在分析查询时必要的操作,理解了它输出结果的内容更有利于我们优化 SQL。为了方便大家的阅读,在下文中规定类似 key1 的表示二级索引,key_part1 表示联合索引的第一部分,uni

JPA + MySQL 开发总结

本文为博主原创,转载请注明出处: org.springframework.data.jpa 是 Spring Data JPA 框架中的一个包,用于简化与 JPA(Java Persistence API)相关的开发任务。Spring Data JPA 提供了一套强大且易于使用的功能,使得与数据库进

Mysql到TiDB迁移,双写数据库兜底方案

作者:京东零售 石磊 TiDB 作为开源 NewSQL 数据库的典型代表之一,同样支持 SQL,支持事务 ACID 特性。在通讯协议上,TiDB 选择与 MySQL 完全兼容,并尽可能兼容 MySQL 的语法。因此,基于 MySQL 数据库开发的系统,大多数可以平滑迁移至 TiDB,而几乎不用修改代

MySQL入门到实战详细教程

MySQL介绍 MySQL是一个开源的关系型数据库管理系统(RDBMS),由瑞典 MySQL AB 公司开发,属于 Oracle 旗下产品,它广泛应用于各种Web应用程序和网站,MySQL使用结构化查询语言(SQL)进行数据的管理和操作。 MySQL主要特点 开源免费:MySQL是一个开源项目,可以

MySQL自定义函数(User Define Function)开发实例——发送TCP/UDP消息

开发背景 当数据库中某个字段的值改为特定值时,实时发送消息通知到其他系统。 实现思路 监控数据库中特定字段值的变化可以用数据库触发器实现。还需要实现一个自定义的函数,接收一个字符串参数,然后将这个字符传通过udp消息发送到指定端口。 在触发器中执行这个自定义函数并在其他系统中监听指定端口的消息。从而