- 事务模型
- 与 MySQL 行为及性能对比
- 事务重试
- 大事务
- 小事务
- 单线程或时延敏感型 workload
- Load data
- 与 MySQL 行为及性能对比
事务模型
TiDB 使用乐观事务模型,在执行 UPDATE、INSERT、DELETE 等语句时,只有在提交过程中,执行 UPDATE,INSERT,DELETE 等语句时才会检查写写冲突,而不是像 MySQL 一样使用行锁来避免写写冲突。类似的,诸如 GET_LOCK() 和 RELEASE_LOCK() 等函数以及 SELECT .. FOR UPDATE 之类的语句在 TiDB 和 MySQL 中的执行方式并不相同。所以业务端在执行 SQL 语句后,需要注意检查 COMMIT 的返回值,即使执行时没有出错,COMMIT 的时候也可能会出错。
与 MySQL 行为及性能对比
事务重试
执行失败的事务默认不会自动重试,因为这会导致更新丢失。可通过配置 tidb_disable_txn_auto_retry = off 开启该项功能。
大事务
由于 TiDB 分布式两阶段提交的要求,修改数据的大事务可能会出现一些问题。因此,TiDB 特意对事务大小设置了一些限制以减少这种影响:
- 单个事务包含的 SQL 语句不超过 5000 条(默认)
- 每个键值对不超过 6MB
- 键值对的总数不超过 300,000
- 键值对的总大小不超过 100MB
小事务
由于 TiDB 中的每个事务都需要跟 PD leader 进行两次 round trip,TiDB 中的小事务相比于 MySQL 中的小事务延迟更高。以如下的 query 为例,用显式事务代替 auto_commit,可优化该 query 的性能。
# 使用 auto_commit 的原始版本UPDATE my_table SET a='new_value' WHERE id = 1;UPDATE my_table SET a='newer_value' WHERE id = 2;UPDATE my_table SET a='newest_value' WHERE id = 3;# 优化后的版本START TRANSACTION;UPDATE my_table SET a='new_value' WHERE id = 1;UPDATE my_table SET a='newer_value' WHERE id = 2;UPDATE my_table SET a='newest_value' WHERE id = 3;COMMIT;
单线程或时延敏感型 workload
由于 TiDB 中的 workload 是分布式的,TiDB 中单线程或时延敏感型 workload 的性能相比于单实例部署的 MySQL 较低。这与 TiDB 中的小事务延迟较高的情況类似。
Load data
语法:
LOAD DATA LOCAL INFILE 'file_name' INTO TABLE table_name{FIELDS | COLUMNS} TERMINATED BY 'string' ENCLOSED BY 'char' ESCAPED BY 'char'LINES STARTING BY 'string' TERMINATED BY 'string'IGNORE n LINES(col_name ...);
其中 ESCAPED BY 目前只支持 ‘/\/\’。
事务的处理:
TiDB 在执行
LOAD DATA操作时,默认将每 2 万行记录作为一个事务进行持久化存储。如果一次LOAD DATA操作插入的数据超过 2 万行,那么会分为多个事务进行提交。如果某个事务出错,这个事务会提交失败,但它前面的事务仍然会提交成功,在这种情况下,一次LOAD DATA操作会有部分数据插入成功,部分数据插入失败。而 MySQL 中会将一次LOAD DATA操作视为一个事务,如果其中发生失败情况,将会导致整个LOAD DATA操作失败。注意:
LOAD DATA在 TiDB 中没有事务原子性的保证,可以在数据初次导入时使用,不建议在生产环境中使用。
