CategoryResourceRepost/极客时间专栏/geek/设计模式之美/开源与项目实战:项目实战/93 | 项目实战二:设计实现一个通用的接口幂等框架(分析).md
louzefeng bf99793fd0 del
2024-07-09 18:38:56 +00:00

13 KiB
Raw Blame History

上三节课,我带你分析、设计、实现了一个接口限流框架。在分析阶段,我们讲到需求分析的两大方面,功能性需求分析和非功能性需求分析。在设计阶段,我们讲了如何通过合理的设计,在实功能性需求的前提下,满足易用、易扩展、灵活、高性能、高容错等非功能性需求。在实现阶段,我们讲了如何利用设计思想、原则、模式、编码规范等,编写可读、可扩展等高质量的代码实现。

从今天开始,我们来实战一个新的项目,开发一个通用的接口幂等框架。跟限流框架一样,我们还是分为分析、设计、实现三个部分,对应三节课来讲解。

话不多说,让我们正式开始今天的学习吧!

需求场景

我们先来看下幂等框架的需求场景。

还记得之前讲到的限流框架的项目背景吗为了复用代码我们把通用的功能设计成了公共服务平台。公司内部的其他金融产品的后台系统会调用公共服务平台的服务不需要完全从零开始开发。公共服务平台提供的是RESTful接口。为了简化开发调用方一般使用Feign框架一个HTTP框架来访问公共服务平台的接口。

调用方访问公共服务平台的接口会有三种可能的结果成功、失败和超时。前两种结果非常明确调用方可以自己决定收到结果之后如何处理。结果为“成功”万事大吉。结果为“失败”一般情况下调用方会将失败的结果反馈给用户移动端App让用户自行决定是否重试。

但是当接口请求超时时处理起来就没那么容易了。有可能业务逻辑已经执行成功了只是公共服务平台返回结果给调用方的时候超时了但也有可能业务逻辑没有执行成功比如因为数据库当时存在集中写入导致部分数据写入超时。总之超时对应的执行结果是未决的。那调用方调用接口超时时基于Feign框架开发的话一般是收到Timeout异常该如何处理呢

如果接口只包含查询、删除、更新这些操作,那接口天然是幂等的。所以,超时之后,重新再执行一次,也没有任何副作用。不过,这里有两点需要特殊说明一下。

删除操作需要当心ABA问题。删除操作超时了又触发一次删除但在这次删除之前又有一次新的插入。后一次删除操作删除了新插入的数据而新插入的数据本不应该删除。不过大部分业务都可以容忍ABA问题。对于少数不能容忍的业务场景我们可以针对性的特殊处理。

除此之外细究起来update x = x+delta这样格式的更新操作并非幂等只有update x=y这样格式的更新操作才是幂等的。不过后者也存在跟删除同样的ABA问题。

如果接口包含修改操作插入操作、update x=x+delta更新操作多次重复执行有可能会导致业务上的错误这是不能接受的。如果插入的数据包含数据库唯一键可以利用数据库唯一键的排他性保证不会重复插入数据。除此之外一般我会建议调用方按照这样几种方式来处理。

第一种处理方式是,调用方访问公共服务平台接口超时时,返回清晰明确的提醒给用户,告知执行结果未知,让用户自己判断是否重试。不过,你可能会说,如果用户看到了超时提醒,但还是重新发起了操作,比如重新发起了转账、充值等操作,那该怎么办呢?实际上,对这种情况,技术是无能为力的。因为两次操作都是用户主动发起的,我们无法判断第二次的转账、充值是新的操作,还是基于上一次超时的重试行为。

第二种处理方式是,调用方调用其他接口,来查询超时操作的结果,明确超时操作对应的业务,是执行成功了还是失败了,然后再基于明确的结果做处理。但是这种处理方法存在一个问题,那就是并不是所有的业务操作,都方便查询操作结果。

第三种处理方式调用方在遇到接口超时之后直接发起重试操作。这样就需要接口支持幂等。我们可以选择在业务代码中触发重试也可以将重试的操作放到Feign框架中完成。因为偶尔发生的超时在正常的业务逻辑中编写一大坨补救代码这样做会影响到代码的可读性有点划不来。当然如果项目中需要支持超时重试的业务不多那对于仅有几个业务特殊处理一下也未尝不可。但是如果项目中需要支持超时重试的业务比较多我们最好是把超时重试这些非业务相关的逻辑统一在框架层面解决。

对响应时间敏感的调用方来说它们服务的是移动端的用户过长的等待时间还不如直接返回超时给用户。所以这种情况下第一种处理方式是比较推荐的。但是对响应时间不敏感的调用方来说比如Job类的调用方我推荐选择后两种处理方式能够提高处理的成功率。而第二种处理方法本身有一定的局限性因为并不是所有业务操作都方便查询是否执行成功。第三种保证接口幂等的处理方式是比较通用的解决方案。所以我们针对这种处理方式抽象出一套统一的幂等框架简化幂等接口的开发。

需求分析

刚刚我们介绍了幂等框架的需求背景:超时重试需要接口幂等的支持。接下来,我们再对需求进行更加详细的分析和整理,这其中就包括功能性需求和非功能性需求。

不过,在此之前,我们需要先搞清楚一个重要的概念:幂等号。

前面多次提到“幂等”,那“幂等”到底是什么意思呢?放到接口调用的这个场景里,幂等的意思是,针对同一个接口,多次发起同一个业务请求,必须保证业务只执行一次。那如何判定两次接口请求是同一个业务请求呢?也就是说,如何判断两次接口请求是重试关系?而非独立的两个业务请求?比如,两次调用转账接口,尽管转账用户、金额等参数都一样,但我们也无法判断这两个转账请求就是重试关系。

实际上,要确定重试关系,我们就需要给同一业务请求一个唯一标识,也就是“幂等号”!如果两个接口请求,带有相同的幂等号,那我们就判断它们是重试关系,是同一个业务请求,不要重复执行。

幂等号需要保证全局唯一性。它可以有业务含义,比如,用户手机号码是唯一的,对于用户注册接口来说,我们可以拿它作为幂等号。不过,这样就会导致幂等框架的实现,无法完全脱离具体的业务。所以,我们更加倾向于,通过某种算法来随机生成没有业务含义的幂等号。

幂等号的概念搞清楚了,我们再来看下框架的功能性需求。

前面也介绍了一些需求分析整理方法比如画线框图、写用户用例、基于测试驱动开发等。跟限流框架类似这里我们也借助用户用例和测试驱动开发的思想先去思考如果框架最终被开发出来之后它会如何被使用。我写了一个框架使用的Demo示例如下所示。

///////// 使用方式一: 在业务代码中处理幂等 ////////////
// 接口调用方
Idempotence idempotence = new Idempotence();
String idempotenceId = idempotence.createId();
Order order = createOrderWithIdempotence(..., idempotenceId);

// 接口实现方
public class OrderController {
  private Idempotence idempontence; // 依赖注入
  
  public Order createOrderWithIdempotence(..., String idempotenceId) {
    // 前置操作
    boolean existed = idempotence.check(idempotenceId);
    if (existed) {
      // 两种处理方式:
      // 1. 查询order并且返回
      // 2. 返回duplication operation Exception
    }
    idempotence.record(idempotenceId);
        
    //...执行正常业务逻辑
  }
  
  public Order createOrder(...) {
    //...
  }
}

///////// 使用方式二:在框架层面处理幂等 //////////////
// 接口调用方
Idempotence idempotence = new Idempotence();
String idempotenceId = idempotence.createId();
//...通过feign框架将幂等号添加到http header中...

// 接口实现方
public class OrderController {
  @IdempotenceRequired
  public Order createOrder(...) {
    //...
  }
}

// 在AOP切面中处理幂等
@Aspect
public class IdempotenceSupportAdvice {
  @Autowired
  private Idempotence idempotence;

@Pointcut("@annotation(com.xzg.cd.idempotence.annotation.IdempotenceRequired)")
  public void controllerPointcut() {
  }

  @Around(value = "controllerPointcut()")
  public Object around(ProceedingJoinPoint joinPoint) throws Throwable {
    // 从HTTP header中获取幂等号idempotenceId
    
    // 前置操作
    boolean existed = idempotence.check(idempotenceId);
    if (existed) {
      // 两种处理方式:
      // 1. 查询order并且返回
      // 2. 返回duplication operation Exception
    }
    idempotence.record(idempotenceId)
    
    Object result = joinPoint.proceed();    
    return result;
  }
}

结合刚刚的Demo从使用的角度来说幂等框架的主要处理流程是这样的。接口调用方生成幂等号并且跟随接口请求将幂等号传递给接口实现方。接口实现方接收到接口请求之后按照约定从HTTP Header或者接口参数中解析出幂等号然后通过幂等号查询幂等框架。如果幂等号已经存在说明业务已经执行或正在执行则直接返回如果幂等号不存在说明业务没有执行过则记录幂等号继续执行业务。

对于幂等框架,我们再来看下,它都有哪些非功能性需求。

在易用性方面我们希望框架接入简单方便学习成本低。只需编写简单的配置以及少许代码就能完成接入。除此之外框架最好对业务代码低侵入松耦合在统一的地方比如Spring AOP中接入幂等框架而不是将它耦合在业务代码中。

在性能方面,针对每个幂等接口,在正式处理业务逻辑之前,我们都要添加保证幂等的处理逻辑。这或多或少地会增加接口请求的响应时间。而对于响应时间比较敏感的接口服务来说,我们要让幂等框架尽可能低延迟,尽可能减少对接口请求本身响应时间的影响。

在容错性方面,跟限流框架相同,不能因为幂等框架本身的异常,导致接口响应异常,影响服务本身的可用性。所以,幂等框架要有高度的容错性。比如,存储幂等号的外部存储器挂掉了,幂等逻辑无法正常运行,这个时候业务接口也要能正常服务才行。

重点回顾

好了,今天的内容到此就讲完了。我们一块来总结回顾一下,你需要重点掌握的内容。

今天我们介绍了幂等框架的一个需求场景那就是接口超时重试。大部分情况下如果接口只包含查询、删除、更新这些操作那接口天然是幂等的。除此之外如果接口包含修改操作插入操作或update x=x+delta更新操作保证接口的幂等性就需要做一些额外的工作。

现在开源的东西那么多但幂等框架非常少见。原因是幂等性的保证是业务强相关的。大部分保证幂等性的方式都是针对具体的业务具体处理比如利用业务数据中的ID唯一性来处理插入操作的幂等性。但是针对每个需要幂等的业务逻辑单独编写代码处理一方面对程序员的开发能力要求比较高另一方面开发成本也比较高。

为了简化接口幂等的开发,我们希望开发一套统一的幂等框架,脱离具体的业务,让程序员通过简单的配置和少量代码,就能将非幂等接口改造成幂等接口。

课堂讨论

  1. 重试无处不在比如Nginx、Dubbo、Feign等重试机制你还能想到哪些其他的重试场景吗
  2. 超时重试只是接口幂等的一个需求场景。除此之外,处理消息队列中消息重复的一种常用方法,就是将消息对应的业务逻辑设计成幂等的。因为业务逻辑是幂等的,所以多次接收重复消息不会导致重复执行业务逻辑。除了这些场景,你还知道有哪些其他场景需要用到幂等设计?

欢迎留言和我分享你的想法。如果有收获,也欢迎你把这篇文章分享给你的朋友。