• 与 MySQL 兼容性对比
    • 不支持的特性
    • 与 MySQL 有差异的特性
      • 自增 ID
      • Performance schema
      • 查询计划
      • 内建函数
      • DDL
      • ANALYZE TABLE
      • 存储引擎
      • SQL 模式
      • 默认设置的区别
      • 日期时间处理的区别
        • 时区
        • 零月和零日

    与 MySQL 兼容性对比

    TiDB 支持 MySQL 传输协议及其绝大多数的语法。这意味着您现有的 MySQL 连接器和客户端都可以继续使用。大多数情况下您现有的应用都可以迁移至 TiDB,无需任何代码修改。

    当前 TiDB 服务器官方支持的版本为 MySQL 5.7。大部分 MySQL 运维工具(如 PHPMyAdmin, Navicat, MySQL Workbench 等),以及备份恢复工具(如 mysqldump, mydumper/myloader)等都可以直接使用。

    不过一些特性由于在分布式环境下没法很好的实现,目前暂时不支持或者是表现与 MySQL 有差异。一些 MySQL 语法在 TiDB 中可以解析通过,但是不会做任何后续的处理,例如 Create Table 语句中 Engine 以及 Partition 选项,都是解析并忽略。

    注意:

    本页内容仅涉及 MySQL 与 TiDB 的总体差异。关于安全特性及事务模型的兼容信息请查看各自具体页面。

    不支持的特性

    • 存储过程与函数
    • 视图
    • 触发器
    • 事件
    • 自定义函数
    • 外键约束
    • 全文函数与索引
    • 空间函数与索引
    • utf8 字符集
    • BINARY 之外的排序规则
    • 增加主键
    • 删除主键
    • SYS schema
    • MySQL 追踪优化器
    • XML 函数
    • X Protocol
    • Savepoints
    • 列级权限
    • CREATE TABLE tblName AS SELECT stmt 语法
    • CREATE TEMPORARY TABLE 语法
    • XA 语法(TiDB 内部使用两阶段提交,但并没有通过 SQL 接口公开)
    • LOCK TABLE 语法(TiDB 使用 tidb_snapshot 来生成备份
    • CHECK TABLE 语法
    • CHECKSUM TABLE 语法

    与 MySQL 有差异的特性

    自增 ID

    TiDB 中,自增列只保证自增且唯一,并不保证连续分配。TiDB 目前采用批量分配 ID 的方式,所以如果在多台 TiDB 上同时插入数据,分配的自增 ID 会不连续。

    在集群中有多个 tidb-server 实例时,如果表结构中有自增 ID,建议不要混用缺省值和自定义值,否则在如下情况下会遇到问题。

    假设有这样一个带有自增 ID 的表:

    1. create table t(id int unique key auto_increment, c int);

    TiDB 实现自增 ID 的原理是每个 tidb-server 实例缓存一段 ID 值用于分配(目前会缓存 30000 个 ID),用完这段值再去取下一段。

    假设集群中有两个 tidb-server 实例 A 和 B(A 缓存 [1,30000] 的自增 ID,B 缓存 [30001,60000] 的自增 ID),依次执行如下操作:

    1. 客户端向 B 插入一条将 id 设置为 1 的语句 insert into t values (1, 1),并执行成功。
    2. 客户端向 A 发送 Insert 语句 insert into t (c) (1),这条语句中没有指定 id 的值,所以会由 A 分配,当前 A 缓存了 [1, 30000] 这段 ID,所以会分配 1 为自增 ID 的值,并把本地计数器加 1。而此时数据库中已经存在 id 为 1 的数据,最终返回 Duplicated Error 错误。

    Performance schema

    Performance schema 表在 TiDB 中返回结果为空。TiDB 使用 Prometheus 和 Grafana 来监测性能指标。

    查询计划

    TiDB 的查询计划(EXPLAIN/EXPLAIN FOR)输出格式与 MySQL 差别较大,同时 EXPLAIN FOR 的输出内容与权限设置与 MySQL 不一致,参见理解 TiDB 执行计划。

    内建函数

    TiDB 支持常用的 MySQL 内建函数,但是不是所有的函数都已经支持,具体请参考语法文档。

    DDL

    在 TiDB 中,运行的 DDL 操作不会影响对表的读取或写入。但是,目前 DDL 变更有如下一些限制:

    • Add Index
      • 不支持同时创建多个索引
      • 不支持通过 ALTER TABLE 在所生成的列上添加索引
    • Add Column
      • 不支持同时创建多个列
      • 不支持将新创建的列设为主键或唯一索引,也不支持将此列设成 auto_increment 属性
    • Drop Column: 不支持删除主键列或索引列
    • Change/Modify Column
      • 不支持有损变更,比如从 BIGINT 变为 INTEGER,或者从 VARCHAR(255) 变为 VARCHAR(10)
      • 不支持修改 DECIMAL 类型的精度
      • 不支持更改 UNSIGNED 属性
      • 只支持将 CHARACTER SET 属性从 utf8 更改为 utf8mb4
    • Alter Database
      • 只支持将 CHARACTER SET 属性从 utf8 更改为 utf8mb4
    • LOCK [=] {DEFAULT|NONE|SHARED|EXCLUSIVE}: TiDB 支持的语法,但是在 TiDB 中不会生效。所有支持的 DDL 变更都不会锁表。
    • ALGORITHM [=] {DEFAULT|INSTANT|INPLACE|COPY}: TiDB 完全支持 ALGORITHM=INSTANTALGORITHM=INPLACE 语法,但运行过程与 MySQL 有所不同,因为 MySQL 中的一些 INPLACE 操作实际上是 TiDB 中的 INSTANT 操作。ALGORITHM=COPY 语法在 TiDB 中不会生效,会返回警告信息。

    ANALYZE TABLE

    • ANALYZE TABLE 语句在 TiDB 和 MySQL 中表现不同。在 MySQL/InnoDB 中,它是一个轻量级语句,执行过程较短;而在 TiDB 中,它会完全重构表的统计数据,语句执行过程较长。

    存储引擎

    出于兼容性原因,TiDB 支持使用备用存储引擎创建表的语法。元数据命令将表描述为 InnoDB 存储引擎:

    1. mysql> CREATE TABLE t1 (a INT) ENGINE=MyISAM;
    2. Query OK, 0 rows affected (0.14 sec)
    3. mysql> SHOW CREATE TABLE t1\G
    4. *************************** 1. row ***************************
    5. Table: t1
    6. Create Table: CREATE TABLE `t1` (
    7. `a` int(11) DEFAULT NULL
    8. ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin
    9. 1 row in set (0.00 sec)

    从架构上讲,TiDB 确实支持类似 MySQL 的存储引擎抽象,在启动 TiDB(通常是 tikv)时 --store 选项指定的引擎中创建用户表。

    SQL 模式

    TiDB 支持 MySQL 5.7 中 绝大多数的 SQL 模式,以下几种模式除外:

    • TiDB 不支持兼容模式(例如 ORACLEPOSTGRESQL)。MySQL 5.7 已弃用兼容模式,MySQL 8.0 已移除兼容模式。
    • TiDB 中的 ONLY_FULL_GROUP_BY 与 MySQL 5.7 相比有细微的语义差别,此问题日后将予以解决。
    • NO_DIR_IN_CREATENO_ENGINE_SUBSTITUTION 这两种 SQL 模式用于解决兼容问题,但并不适用于 TiDB。

    默认设置的区别

    • 默认字符集与 MySQL 不同:
      • TiDB 中为 utf8mb4
      • MySQL 5.7 中为 latin1,MySQL 8.0 中修改为 utf8mb4
    • 默认排序规则不同:
      • TiDB 中,utf8mb4 的默认排序规则为 utf8mb4_bin
      • MySQL 5.7 中,utf8mb4 的默认排序规则为 utf8mb4_general_ci,MySQL 8.0 中修改为 utf8mb4_0900_ai_ci
      • 请使用 SHOW CHARACTER SET 语句查看所有字符集的默认排序规则
    • 默认 SQL mode 不同:
      • TiDB 中为 STRICT_TRANS_TABLES,NO_ENGINE_SUBSTITUTION
      • MySQL 中为 ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION
    • lower_case_table_names 的默认值不同:
      • TiDB 中该值默认为 2,并且目前 TiDB 只支持设置该值为 2
      • MySQL 中默认设置:
        • Linux 系统中该值为 0
        • Windows 系统中该值为 1
        • macOS 系统中该值为 2
    • explicit_defaults_for_timestamp 的默认值不同:
      • TiDB 中该值默认为 ON,并且目前 TiDB 只支持设置该值为 ON
      • MySQL 中默认设置:
        • MySQL 5.7:OFF
        • MySQL 8.0:ON

    日期时间处理的区别

    时区

    MySQL 默认使用本地时区,依赖于系统内置的当前的时区规则(例如什么时候开始夏令时等)进行计算;且在未导入时区表数据的情况下不能通过时区名称来指定时区。

    TiDB 不需要导入时区表数据也能使用所有时区名称,采用系统当前安装的所有时区规则进行计算(一般为 tzdata 包),且无法通过导入时区表数据的形式修改计算规则。

    注意:

    能下推到 TiKV 的时间相关表达式会由 TiKV 进行计算。TiKV 总是采用 TiKV 内置时区规则计算,而不依赖于系统所安装的时区规则。若系统安装的时区规则与 TiKV 内置的时区规则版本不匹配,则在少数情况下可能发生能插入的时间数据无法再读出来的问题。例如,若系统上安装了 tzdata 2018a 时区规则,则在时区设置为 Asia/Shanghai 或时区设置为本地时区且本地时区为 Asia/Shanghai 的情况下,时间 1988-04-17 02:00:00 可以被正常插入 TiDB 3.0 RC.1,但该记录对于特定类型 SQL 则无法再读出来,原因是 TiKV 3.0 RC.1 依据的 tzdata 2018i 规则中该时间在 Asia/Shanghai 时区中不存在(夏令时时间后移一小时)。

    TiKV 各个版本内置的时区规则如下:

    • 3.0.0 RC.1 及以后:tzdata 2018i
    • 2.1.0 RC.1 及以后:tzdata 2018e

    零月和零日

    目前 TiDB 尚不能完整支持月为 0 或日为 0(但年不为 0)的日期。在非严格模式下,此类日期时间能被正常插入,但对于特定类型 SQL 可能出现无法读出来的情况。