• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

分布式事务三分布式事务解决方案:TCCTry、Confirm、Cancel

武飞扬头像
帅过驴的袋鼠
帮助2

什么是TCC

TCC是Try、Contirm、Cancel三个词语的缩写,TCC要求每个 分支事务实现三个操作:预处理Try、确认Contirm、撤销Cancel。Try操作业务检查以及资源预留,Contirm做业务确认,Cancel实现一个与Try相反的操作即回滚。TM首先发起所有的分支事务的try操作,任何一个分支事务的try操作执行失败,TM将会发起所有分支事务的Cancel操作,若try操作全部成功,TM将会发起所有分支事务的Confirm操作,其中Confirm/Cancel操作若执行失败,TM会进行重试。

分支事务成功的场景

学新通

分支事务失败的场景

学新通

 TCC分为三个阶段:

  1. Try 阶段是做业务检查(一致性)及资源预留(隔离),此阶段仅是一个初步操作,它和后续的Confirm一起才能真正构成一个完成的业务逻辑。
  2. Confirm 阶段是做确认提交,Try阶段所有分支事务执行成功后开始执行Confirm。通常情况下,采用TCC则认为Confirm阶段是不会出错的。即:只要Try成功,Confirm一定成功。若Confirm阶段真的出错了,需引入重试机制或人工处理。
  3. Cancel 阶段是在业务执行错误需要回滚的状态下执行分支事务的业务取消,预留资源释放。通常情况下,采用TCC则认为Cancel阶段也是一定成功的。若Cancel阶段真的出错了,需引入重试机制或人工处理。

4.TM事务管理器

  • TM事务管理器可以实现为独立的服务,也可以让全局事务发起方充当TM的角色,TM独立出来是为了成为公共组件,是为了考虑系统结构和软件复用。
  • TM再发起全局事务时生成全局事务记录,全局事务ID贯穿整个分布式事务调用链条,用来记录事务上下文,追踪和记录状态,由于Confirm和Cancel失败需要重试,因此需要实现幂等性,幂等性是指同一个操作无论请求多少次,其结果都相同。

解决方案

TCC解决方案

目前市面上的TCC框架有下面几种

框架名称 github地址 start数量
tcc-transaction https://github.com/changmingxie/tcc-transaction 5.4k
hmily https://github.com/dromara/hmily 3.8k
byteTCC https://github.com/liuyangming/ByteTCC 2.8k
easyTransaction https://github.com/QNJR-GROUP/EasyTransaction 2.3k

上一节所讲的Seata也支持TCC,但Seata的TCC模式对springcloud没有提供支持。我们的目标是理解TCC的原理以及事务协调运作的过程,因此更倾向于轻量级易于理解的框架,因此最终确定了hmily。

Hmily是一个高性能分布式事务TCC开源框架。基于Java8开发,支持Dubbo、springcloud等RPC框架进行分布式事务。它目前支持以下特性:

  • 支持嵌套事务
  • 采用disruptor框架进行事务日志的异步读写,与RPC框架的性能没有差异
  • 支持springboot-starter项目启动,使用简单。
  • RPC框架支持:dubbo、motan、springcloud
  • 本地事务存储支持:redis、mongodb、zookeeper、file、mysql
  • 事务日志序列化支持:java、hessian、kryo、protostuff
  • 采用Aspect AOP切面思想与Spring无缝集成,天然支持集群。
  • RPC事务回复,超时异常恢复等。

Hmily利用AOP对参与分布式事务的本地方法与远程方法进行拦截处理,通过多方拦截,事务参与者能透明的调用到另一方的Try、Confirm、Cancel方法;传递事务的上下文;并记录事务日志,酌情进行补偿、重试等。

TCC需要注意三种异常处理分别是空回滚、幂等、悬挂:

空回滚:

  • 在没用调用TCC资源Try方法的情况下,调用了第二阶段的Cancel方法,Cancel方法需要识别出这是一个空回滚,然后直接返回成功。
  • 出现原因是当一个分支事务所在服务宕机或网络异常,分支事务调用记录为失败,这个时候其实是没有执行Try阶段,当故障恢复后,分布式事务进行回滚则会调用第二阶段的Cacel方法,从而形成空回滚。
  • 解决思路是关键就是要识别出这个空回滚。思路很简单就是需要知道一阶段是否执行,如果执行了,那就是正常回滚。如果没有执行,那就是空回滚。前面已经说过TM在发起全局事务时生成全局事务记录,全局事务ID贯穿整个分布式事务调用链条。再额外增加一张分支事务记录表,其中有全局事务ID和分支事务ID,第一阶段Try方法里会插入一条记录,表示一阶段执行了。Cancel接口里读取该记录,如果该记录存在,则正常回滚;如果该记录不存在,则是空回滚。

幂等:

  • 通过前面介绍已经了解到,为了保证TCC二阶段提交重试机制不会引发数据不一致,要求TCC的二阶段Try、Confirm和Cancel接口保证幂等,这样不会重复使用或者释放资源。如果幂等控制没有做好,很有可能导致数据不一致等严重问题。
  • 解决思路在上述“分支事务记录”中增加执行状态,每次执行前都查询该状态。

悬挂:

  • 悬挂就是对于一个分布式事务,其二阶段Cancel接口比Try接口先执行。
  • 出现原因是在RPC调用分支事务try时,先注册分支事务,再执行RPC调用,如果此时RPC调用的网络发生拥堵,通常RPC调用是有超时时间的,RPC超时以后,TM就会通知RM回滚该分布式事务,可能回滚完成后,RPC请求才到达参与者真正执行,而一个Try方法预留的业务资源,只有该分布式事务才能使用,该分布式事务第一阶段预留的业务资源就再也没有人能够处理了,对于这种情况,我们就成为悬挂,即业务资源预留后没法继续处理。
  • 解决思路时候如果二阶段执行完成,那一阶段就不能再继续执行。再执行一阶段事务时判断在该全局事务下,“分支事务记录”表中是否已经有二阶段事务记录,如果有则不执行Try。

举例,场景为A转账30元给B。A和B在不同的服务。

方案1:

账户A

  1.  
    Try:
  2.  
        检查余额是否够30
  3.  
        扣减30
  4.  
    Confirm:
  5.  
        空
  6.  
    Cancel
  7.  
        增加30

账户B

  1.  
    Try:
  2.  
        增加30
  3.  
    Confirm:
  4.  
        空
  5.  
    Cancel
  6.  
        减少30

方案1说明:

  • 账号A,这里的余额就是所谓的业务资源,按照前面提到的规则,在第一阶段需要检查并预留业务资源,因此,我们在扣钱TCC资源的Try接口里先检查A账户余额是否足够,如果足够则扣除30元。Confirm接口表示正式提交,由于业务资源已经在Try接口里扣除掉了,name在第二阶段的Confirm接口里可以什么都不用做。Cancel接口的执行表示整个事务回滚,账户A回滚则需要把Try接口里扣除掉的30元还给账户。
  • 账号B,在第一阶段Try接口是献给账户B价钱,Cancel接口的执行表示整个事务回滚,账户B回滚则需要把Try接口里加的30元再减去。

方案1的问题分析:

  1. 如果账户A的try没有执行在cancel则就多加了30元。
  2. 由于try、cancel、confirm都是由单独的线程去调用,且会出现重复调用,所以都需要实现幂等。
  3. 账号B在try中增加30元,当try执行完成后可能会被其他线程消费了。
  4. 如果账户B的try没有执行在cancel则就多减了30元。

问题解决:

  1. 账户A的cancel方法需要判断try方法是否执行,正常执行try后方可执行cancel。
  2. try、cancel、confirm方法实现幂等。
  3. 账号B在try方法中不允许更新账户余额,在confirm中更新账户余额。
  4. 账户B的cancel方法需要判断try方法是否执行,正常执行try后方可执行cancel。

优化方案:

账户A

  1.  
    Try:
  2.  
        try幂等校验
  3.  
        try悬挂处理
  4.  
        检查余额是否够30
  5.  
        扣减30
  6.  
    Confirm:
  7.  
        空
  8.  
    Cancel
  9.  
        增加30
  10.  
    增加30

账户B

  1.  
    Try:
  2.  
        空
  3.  
    Confirm:
  4.  
        confirm幂等校验
  5.  
    正式增加30
  6.  
    Cancel
  7.  
        空

TCC与2PC比较

如果拿TCC事务的处理流程与2PC作比较,2PC通常都是在跨库的DB层面,而TCC则在应用层面处理,需要通过业务逻辑来实现。这种分布式事务的实现方式的优势在于,可以让应用自己定义数据操作的颗粒度,使得降低锁冲突、让提高吞吐量成为可能。

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhiajhbg
系列文章
更多 icon
同类精品
更多 icon
继续加载