This commit is contained in:
louzefeng
2024-07-09 18:38:56 +00:00
parent 8bafaef34d
commit bf99793fd0
6071 changed files with 1017944 additions and 0 deletions

View File

@@ -0,0 +1,181 @@
<audio id="audio" title="15 | 理论一:对于单一职责原则,如何判定某个类的职责是否够“单一”?" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/0e/3d/0e34889ffa24a0b7f7e0c5862809a43d.mp3"></audio>
上几节课中我们介绍了面向对象相关的知识。从今天起我们开始学习一些经典的设计原则其中包括SOLID、KISS、YAGNI、DRY、LOD等。
这些设计原则,从字面上理解,都不难。你一看就感觉懂了,一看就感觉掌握了,但真的用到项目中的时候,你会发现,“看懂”和“会用”是两回事,而“用好”更是难上加难。从我之前的工作经历来看,很多同事因为对这些原则理解得不够透彻,导致在使用的时候过于教条主义,拿原则当真理,生搬硬套,适得其反。
所以,在接下来的讲解中,我不仅会讲解这些原则的定义,还会解释这些原则设计的初衷,能解决哪些问题,有哪些应用场景等,让你知其然知其所以然。在学习的时候,希望你能跟上我的思路,把握住重点,真正做到活学活用。
## 如何理解单一职责原则SRP
文章的开头我们提到了SOLID原则实际上SOLID原则并非单纯的1个原则而是由5个设计原则组成的它们分别是单一职责原则、开闭原则、里式替换原则、接口隔离原则和依赖反转原则依次对应SOLID中的S、O、L、I、D这5个英文字母。我们今天要学习的是SOLID原则中的第一个原则单一职责原则。
单一职责原则的英文是Single Responsibility Principle缩写为SRP。这个原则的英文描述是这样的A class or module should have a single responsibility。如果我们把它翻译成中文那就是一个类或者模块只负责完成一个职责或者功能
注意这个原则描述的对象包含两个一个是类class一个是模块module。关于这两个概念在专栏中有两种理解方式。一种理解是把模块看作比类更加抽象的概念类也可以看作模块。另一种理解是把模块看作比类更加粗粒度的代码块模块中包含多个类多个类组成一个模块。
不管哪种理解方式,单一职责原则在应用到这两个描述对象的时候,道理都是相通的。为了方便你理解,接下来我只从“类”设计的角度,来讲解如何应用这个设计原则。对于“模块”来说,你可以自行引申。
单一职责原则的定义描述非常简单,也不难理解。一个类只负责完成一个职责或者功能。也就是说,不要设计大而全的类,要设计粒度小、功能单一的类。换个角度来讲就是,一个类包含了两个或者两个以上业务不相干的功能,那我们就说它职责不够单一,应该将它拆分成多个功能更加单一、粒度更细的类。
我举一个例子来解释一下。比如,一个类里既包含订单的一些操作,又包含用户的一些操作。而订单和用户是两个独立的业务领域模型,我们将两个不相干的功能放到同一个类中,那就违反了单一职责原则。为了满足单一职责原则,我们需要将这个类拆分成两个粒度更细、功能更加单一的两个类:订单类和用户类。
## 如何判断类的职责是否足够单一?
从刚刚这个例子来看,单一职责原则看似不难应用。那是因为我举的这个例子比较极端,一眼就能看出订单和用户毫不相干。但大部分情况下,类里的方法是归为同一类功能,还是归为不相关的两类功能,并不是那么容易判定的。在真实的软件开发中,对于一个类是否职责单一的判定,是很难拿捏的。我举一个更加贴近实际的例子来给你解释一下。
在一个社交产品中我们用下面的UserInfo类来记录用户的信息。你觉得UserInfo类的设计是否满足单一职责原则呢
```
public class UserInfo {
private long userId;
private String username;
private String email;
private String telephone;
private long createTime;
private long lastLoginTime;
private String avatarUrl;
private String provinceOfAddress; // 省
private String cityOfAddress; // 市
private String regionOfAddress; // 区
private String detailedAddress; // 详细地址
// ...省略其他属性和方法...
}
```
对于这个问题有两种不同的观点。一种观点是UserInfo类包含的都是跟用户相关的信息所有的属性和方法都隶属于用户这样一个业务模型满足单一职责原则另一种观点是地址信息在UserInfo类中所占的比重比较高可以继续拆分成独立的UserAddress类UserInfo只保留除Address之外的其他信息拆分之后的两个类的职责更加单一。
哪种观点更对呢实际上要从中做出选择我们不能脱离具体的应用场景。如果在这个社交产品中用户的地址信息跟其他信息一样只是单纯地用来展示那UserInfo现在的设计就是合理的。但是如果这个社交产品发展得比较好之后又在产品中添加了电商的模块用户的地址信息还会用在电商物流中那我们最好将地址信息从UserInfo中拆分出来独立成用户物流信息或者叫地址信息、收货信息等
我们再进一步延伸一下。如果做这个社交产品的公司发展得越来越好公司内部又开发出了很多其他产品可以理解为其他App。公司希望支持统一账号系统也就是用户一个账号可以在公司内部的所有产品中登录。这个时候我们就需要继续对UserInfo进行拆分将跟身份认证相关的信息比如email、telephone等抽取成独立的类。
从刚刚这个例子,我们可以总结出,不同的应用场景、不同阶段的需求背景下,对同一个类的职责是否单一的判定,可能都是不一样的。在某种应用场景或者当下的需求背景下,一个类的设计可能已经满足单一职责原则了,但如果换个应用场景或着在未来的某个需求背景下,可能就不满足了,需要继续拆分成粒度更细的类。
除此之外从不同的业务层面去看待同一个类的设计对类是否职责单一也会有不同的认识。比如例子中的UserInfo类。如果我们从“用户”这个业务层面来看UserInfo包含的信息都属于用户满足职责单一原则。如果我们从更加细分的“用户展示信息”“地址信息”“登录认证信息”等等这些更细粒度的业务层面来看那UserInfo就应该继续拆分。
综上所述,评价一个类的职责是否足够单一,我们并没有一个非常明确的、可以量化的标准,可以说,这是件非常主观、仁者见仁智者见智的事情。实际上,在真正的软件开发中,我们也没必要过于未雨绸缪,过度设计。所以,**我们可以先写一个粗粒度的类,满足业务需求。随着业务的发展,如果粗粒度的类越来越庞大,代码越来越多,这个时候,我们就可以将这个粗粒度的类,拆分成几个更细粒度的类。这就是所谓的持续重构**(后面的章节中我们会讲到)。
听到这里,你可能会说,这个原则如此含糊不清、模棱两可,到底该如何拿捏才好啊?我这里还有一些小技巧,能够很好地帮你,从侧面上判定一个类的职责是否够单一。而且,我个人觉得,下面这几条判断原则,比起很主观地去思考类是否职责单一,要更有指导意义、更具有可执行性:
- 类中的代码行数、函数或属性过多,会影响代码的可读性和可维护性,我们就需要考虑对类进行拆分;
- 类依赖的其他类过多,或者依赖类的其他类过多,不符合高内聚、低耦合的设计思想,我们就需要考虑对类进行拆分;
- 私有方法过多我们就要考虑能否将私有方法独立到新的类中设置为public方法供更多的类使用从而提高代码的复用性
- 比较难给类起一个合适名字很难用一个业务名词概括或者只能用一些笼统的Manager、Context之类的词语来命名这就说明类的职责定义得可能不够清晰
- 类中大量的方法都是集中操作类中的某几个属性比如在UserInfo例子中如果一半的方法都是在操作address信息那就可以考虑将这几个属性和对应的方法拆分出来。
不过,你可能还会有这样的疑问:在上面的判定原则中,我提到类中的代码行数、函数或者属性过多,就有可能不满足单一职责原则。那多少行代码才算是行数过多呢?多少个函数、属性才称得上过多呢?
比较初级的工程师经常会问这类问题。实际上,这个问题并不好定量地回答,就像你问大厨“放盐少许”中的“少许”是多少,大厨也很难告诉你一个特别具体的量值。
如果继续深究一下的话你可能还会说一些菜谱确实给出了做某某菜需要放多少克盐放多少克油的具体量值啊。我想说的是那是给家庭主妇用的那不是给专业的大厨看的。类比一下做饭如果你是没有太多项目经验的编程初学者实际上我也可以给你一个凑活能用、比较宽泛的、可量化的标准那就是一个类的代码行数最好不能超过200行函数个数及属性个数都最好不要超过10个。
实际上, 从另一个角度来看,当一个类的代码,读起来让你头大了,实现某个功能时不知道该用哪个函数了,想用哪个函数翻半天都找不到了,只用到一个小功能要引入整个类(类中包含很多无关此功能实现的函数)的时候,这就说明类的行数、函数、属性过多了。实际上,等你做多项目了,代码写多了,在开发中慢慢“品尝”,自然就知道什么是“放盐少许”了,这就是所谓的“专业第六感”。
## 类的职责是否设计得越单一越好?
为了满足单一职责原则是不是把类拆得越细就越好呢答案是否定的。我们还是通过一个例子来解释一下。Serialization类实现了一个简单协议的序列化和反序列功能具体代码如下
```
/**
* Protocol format: identifier-string;{gson string}
* For example: UEUEUE;{&quot;a&quot;:&quot;A&quot;,&quot;b&quot;:&quot;B&quot;}
*/
public class Serialization {
private static final String IDENTIFIER_STRING = &quot;UEUEUE;&quot;;
private Gson gson;
public Serialization() {
this.gson = new Gson();
}
public String serialize(Map&lt;String, String&gt; object) {
StringBuilder textBuilder = new StringBuilder();
textBuilder.append(IDENTIFIER_STRING);
textBuilder.append(gson.toJson(object));
return textBuilder.toString();
}
public Map&lt;String, String&gt; deserialize(String text) {
if (!text.startsWith(IDENTIFIER_STRING)) {
return Collections.emptyMap();
}
String gsonStr = text.substring(IDENTIFIER_STRING.length());
return gson.fromJson(gsonStr, Map.class);
}
}
```
如果我们想让类的职责更加单一我们对Serialization类进一步拆分拆分成一个只负责序列化工作的Serializer类和另一个只负责反序列化工作的Deserializer类。拆分后的具体代码如下所示
```
public class Serializer {
private static final String IDENTIFIER_STRING = &quot;UEUEUE;&quot;;
private Gson gson;
public Serializer() {
this.gson = new Gson();
}
public String serialize(Map&lt;String, String&gt; object) {
StringBuilder textBuilder = new StringBuilder();
textBuilder.append(IDENTIFIER_STRING);
textBuilder.append(gson.toJson(object));
return textBuilder.toString();
}
}
public class Deserializer {
private static final String IDENTIFIER_STRING = &quot;UEUEUE;&quot;;
private Gson gson;
public Deserializer() {
this.gson = new Gson();
}
public Map&lt;String, String&gt; deserialize(String text) {
if (!text.startsWith(IDENTIFIER_STRING)) {
return Collections.emptyMap();
}
String gsonStr = text.substring(IDENTIFIER_STRING.length());
return gson.fromJson(gsonStr, Map.class);
}
}
```
虽然经过拆分之后Serializer类和Deserializer类的职责更加单一了但也随之带来了新的问题。如果我们修改了协议的格式数据标识从“UEUEUE”改为“DFDFDF”或者序列化方式从JSON改为了XML那Serializer类和Deserializer类都需要做相应的修改代码的内聚性显然没有原来Serialization高了。而且如果我们仅仅对Serializer类做了协议修改而忘记了修改Deserializer类的代码那就会导致序列化、反序列化不匹配程序运行出错也就是说拆分之后代码的可维护性变差了。
实际上,不管是应用设计原则还是设计模式,最终的目的还是提高代码的可读性、可扩展性、复用性、可维护性等。我们在考虑应用某一个设计原则是否合理的时候,也可以以此作为最终的考量标准。
## 重点回顾
今天的内容到此就讲完了。我们来一块总结回顾一下,你应该掌握的重点内容。
**1.如何理解单一职责原则SRP**
一个类只负责完成一个职责或者功能。不要设计大而全的类,要设计粒度小、功能单一的类。单一职责原则是为了实现代码高内聚、低耦合,提高代码的复用性、可读性、可维护性。
**2.如何判断类的职责是否足够单一?**
不同的应用场景、不同阶段的需求背景、不同的业务层面,对同一个类的职责是否单一,可能会有不同的判定结果。实际上,一些侧面的判断指标更具有指导意义和可执行性,比如,出现下面这些情况就有可能说明这类的设计不满足单一职责原则:
- 类中的代码行数、函数或者属性过多;
- 类依赖的其他类过多,或者依赖类的其他类过多;
- 私有方法过多;
- 比较难给类起一个合适的名字;
- 类中大量的方法都是集中操作类中的某几个属性。
**3.类的职责是否设计得越单一越好?**
单一职责原则通过避免设计大而全的类,避免将不相关的功能耦合在一起,来提高类的内聚性。同时,类职责单一,类依赖的和被依赖的其他类也会变少,减少了代码的耦合性,以此来实现代码的高内聚、低耦合。但是,如果拆分得过细,实际上会适得其反,反倒会降低内聚性,也会影响代码的可维护性。
## 课堂讨论
今天课堂讨论的话题有两个:
1. 对于如何判断一个类是否职责单一,如何判断代码行数过多,你还有哪些其他的方法吗?
1. 单一职责原则,除了应用到类的设计上,还能延伸到哪些其他设计方面吗?
欢迎在留言区写下你的答案,和同学一起交流和分享。如果有收获,也欢迎你把这篇文章分享给你的朋友。

View File

@@ -0,0 +1,341 @@
<audio id="audio" title="16 | 理论二:如何做到“对扩展开放、修改关闭”?扩展和修改各指什么?" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/26/91/263ba74e016e21defd7d2d230300e191.mp3"></audio>
在上一节课中我们学习了单一职责原则。今天我们来学习SOLID中的第二个原则开闭原则。我个人觉得开闭原则是SOLID中最难理解、最难掌握同时也是最有用的一条原则。
之所以说这条原则难理解,那是因为,“怎样的代码改动才被定义为‘扩展’?怎样的代码改动才被定义为‘修改’?怎么才算满足或违反‘开闭原则’?修改代码就一定意味着违反‘开闭原则’吗?”等等这些问题,都比较难理解。
之所以说这条原则难掌握,那是因为,“如何做到‘对扩展开放、修改关闭’?如何在项目中灵活地应用‘开闭原则’,以避免在追求扩展性的同时影响到代码的可读性?”等等这些问题,都比较难掌握。
之所以说这条原则最有用那是因为扩展性是代码质量最重要的衡量标准之一。在23种经典设计模式中大部分设计模式都是为了解决代码的扩展性问题而存在的主要遵从的设计原则就是开闭原则。
所以说,今天的内容非常重要,希望你能集中精力,跟上我的思路,将开闭原则理解透彻,这样才能更好地理解后面章节的内容。话不多说,让我们正式开始今天的学习吧!
## 如何理解“对扩展开放、修改关闭”?
开闭原则的英文全称是Open Closed Principle简写为OCP。它的英文描述是software entities (modules, classes, functions, etc.) should be open for extension , but closed for modification。我们把它翻译成中文就是软件实体模块、类、方法等应该“对扩展开放、对修改关闭”。
这个描述比较简略,如果我们详细表述一下,那就是,添加一个新的功能应该是,在已有代码基础上扩展代码(新增模块、类、方法等),而非修改已有代码(修改模块、类、方法等)。
为了让你更好地理解这个原则我举一个例子来进一步解释一下。这是一段API接口监控告警的代码。
其中AlertRule存储告警规则可以自由设置。Notification是告警通知类支持邮件、短信、微信、手机等多种通知渠道。NotificationEmergencyLevel表示通知的紧急程度包括SEVERE严重、URGENCY紧急、NORMAL普通、TRIVIAL无关紧要不同的紧急程度对应不同的发送渠道。关于API接口监控告警这部分更加详细的业务需求分析和设计我们会在后面的设计模式模块再拿出来进一步讲解这里你只要简单知道这些就够我们今天用了。
```
public class Alert {
private AlertRule rule;
private Notification notification;
public Alert(AlertRule rule, Notification notification) {
this.rule = rule;
this.notification = notification;
}
public void check(String api, long requestCount, long errorCount, long durationOfSeconds) {
long tps = requestCount / durationOfSeconds;
if (tps &gt; rule.getMatchedRule(api).getMaxTps()) {
notification.notify(NotificationEmergencyLevel.URGENCY, &quot;...&quot;);
}
if (errorCount &gt; rule.getMatchedRule(api).getMaxErrorCount()) {
notification.notify(NotificationEmergencyLevel.SEVERE, &quot;...&quot;);
}
}
}
```
上面这段代码非常简单业务逻辑主要集中在check()函数中。当接口的TPS超过某个预先设置的最大值时以及当接口请求出错数大于某个最大允许值时就会触发告警通知接口的相关负责人或者团队。
现在如果我们需要添加一个功能当每秒钟接口超时请求个数超过某个预先设置的最大阈值时我们也要触发告警发送通知。这个时候我们该如何改动代码呢主要的改动有两处第一处是修改check()函数的入参添加一个新的统计数据timeoutCount表示超时接口请求数第二处是在check()函数中添加新的告警逻辑。具体的代码改动如下所示:
```
public class Alert {
// ...省略AlertRule/Notification属性和构造函数...
// 改动一添加参数timeoutCount
public void check(String api, long requestCount, long errorCount, long timeoutCount, long durationOfSeconds) {
long tps = requestCount / durationOfSeconds;
if (tps &gt; rule.getMatchedRule(api).getMaxTps()) {
notification.notify(NotificationEmergencyLevel.URGENCY, &quot;...&quot;);
}
if (errorCount &gt; rule.getMatchedRule(api).getMaxErrorCount()) {
notification.notify(NotificationEmergencyLevel.SEVERE, &quot;...&quot;);
}
// 改动二:添加接口超时处理逻辑
long timeoutTps = timeoutCount / durationOfSeconds;
if (timeoutTps &gt; rule.getMatchedRule(api).getMaxTimeoutTps()) {
notification.notify(NotificationEmergencyLevel.URGENCY, &quot;...&quot;);
}
}
}
```
这样的代码修改实际上存在挺多问题的。一方面我们对接口进行了修改这就意味着调用这个接口的代码都要做相应的修改。另一方面修改了check()函数,相应的单元测试都需要修改(关于单元测试的内容我们在重构那部分会详细介绍)。
上面的代码改动是基于“修改”的方式来实现新功能的。如果我们遵循开闭原则,也就是“对扩展开放、对修改关闭”。那如何通过“扩展”的方式,来实现同样的功能呢?
我们先重构一下之前的Alert代码让它的扩展性更好一些。重构的内容主要包含两部分
- 第一部分是将check()函数的多个入参封装成ApiStatInfo类
- 第二部分是引入handler的概念将if判断逻辑分散在各个handler中。
具体的代码实现如下所示:
```
public class Alert {
private List&lt;AlertHandler&gt; alertHandlers = new ArrayList&lt;&gt;();
public void addAlertHandler(AlertHandler alertHandler) {
this.alertHandlers.add(alertHandler);
}
public void check(ApiStatInfo apiStatInfo) {
for (AlertHandler handler : alertHandlers) {
handler.check(apiStatInfo);
}
}
}
public class ApiStatInfo {//省略constructor/getter/setter方法
private String api;
private long requestCount;
private long errorCount;
private long durationOfSeconds;
}
public abstract class AlertHandler {
protected AlertRule rule;
protected Notification notification;
public AlertHandler(AlertRule rule, Notification notification) {
this.rule = rule;
this.notification = notification;
}
public abstract void check(ApiStatInfo apiStatInfo);
}
public class TpsAlertHandler extends AlertHandler {
public TpsAlertHandler(AlertRule rule, Notification notification) {
super(rule, notification);
}
@Override
public void check(ApiStatInfo apiStatInfo) {
long tps = apiStatInfo.getRequestCount()/ apiStatInfo.getDurationOfSeconds();
if (tps &gt; rule.getMatchedRule(apiStatInfo.getApi()).getMaxTps()) {
notification.notify(NotificationEmergencyLevel.URGENCY, &quot;...&quot;);
}
}
}
public class ErrorAlertHandler extends AlertHandler {
public ErrorAlertHandler(AlertRule rule, Notification notification){
super(rule, notification);
}
@Override
public void check(ApiStatInfo apiStatInfo) {
if (apiStatInfo.getErrorCount() &gt; rule.getMatchedRule(apiStatInfo.getApi()).getMaxErrorCount()) {
notification.notify(NotificationEmergencyLevel.SEVERE, &quot;...&quot;);
}
}
}
```
上面的代码是对Alert的重构我们再来看下重构之后的Alert该如何使用呢具体的使用代码我也写在这里了。
其中ApplicationContext是一个单例类负责Alert的创建、组装alertRule和notification的依赖注入、初始化添加handlers工作。
```
public class ApplicationContext {
private AlertRule alertRule;
private Notification notification;
private Alert alert;
public void initializeBeans() {
alertRule = new AlertRule(/*.省略参数.*/); //省略一些初始化代码
notification = new Notification(/*.省略参数.*/); //省略一些初始化代码
alert = new Alert();
alert.addAlertHandler(new TpsAlertHandler(alertRule, notification));
alert.addAlertHandler(new ErrorAlertHandler(alertRule, notification));
}
public Alert getAlert() { return alert; }
// 饿汉式单例
private static final ApplicationContext instance = new ApplicationContext();
private ApplicationContext() {
initializeBeans();
}
public static ApplicationContext getInstance() {
return instance;
}
}
public class Demo {
public static void main(String[] args) {
ApiStatInfo apiStatInfo = new ApiStatInfo();
// ...省略设置apiStatInfo数据值的代码
ApplicationContext.getInstance().getAlert().check(apiStatInfo);
}
}
```
现在,我们再来看下,基于重构之后的代码,如果再添加上面讲到的那个新功能,每秒钟接口超时请求个数超过某个最大阈值就告警,我们又该如何改动代码呢?主要的改动有下面四处。
- 第一处改动是在ApiStatInfo类中添加新的属性timeoutCount。
- 第二处改动是添加新的TimeoutAlertHander类。
- 第三处改动是在ApplicationContext类的initializeBeans()方法中往alert对象中注册新的timeoutAlertHandler。
- 第四处改动是在使用Alert类的时候需要给check()函数的入参apiStatInfo对象设置timeoutCount的值。
改动之后的代码如下所示:
```
public class Alert { // 代码未改动... }
public class ApiStatInfo {//省略constructor/getter/setter方法
private String api;
private long requestCount;
private long errorCount;
private long durationOfSeconds;
private long timeoutCount; // 改动一:添加新字段
}
public abstract class AlertHandler { //代码未改动... }
public class TpsAlertHandler extends AlertHandler {//代码未改动...}
public class ErrorAlertHandler extends AlertHandler {//代码未改动...}
// 改动二添加新的handler
public class TimeoutAlertHandler extends AlertHandler {//省略代码...}
public class ApplicationContext {
private AlertRule alertRule;
private Notification notification;
private Alert alert;
public void initializeBeans() {
alertRule = new AlertRule(/*.省略参数.*/); //省略一些初始化代码
notification = new Notification(/*.省略参数.*/); //省略一些初始化代码
alert = new Alert();
alert.addAlertHandler(new TpsAlertHandler(alertRule, notification));
alert.addAlertHandler(new ErrorAlertHandler(alertRule, notification));
// 改动三注册handler
alert.addAlertHandler(new TimeoutAlertHandler(alertRule, notification));
}
//...省略其他未改动代码...
}
public class Demo {
public static void main(String[] args) {
ApiStatInfo apiStatInfo = new ApiStatInfo();
// ...省略apiStatInfo的set字段代码
apiStatInfo.setTimeoutCount(289); // 改动四设置tiemoutCount值
ApplicationContext.getInstance().getAlert().check(apiStatInfo);
}
```
重构之后的代码更加灵活和易扩展。如果我们要想添加新的告警逻辑只需要基于扩展的方式创建新的handler类即可不需要改动原来的check()函数的逻辑。而且我们只需要为新的handler类添加单元测试老的单元测试都不会失败也不用修改。
## 修改代码就意味着违背开闭原则吗?
看了上面重构之后的代码你可能还会有疑问在添加新的告警逻辑的时候尽管改动二添加新的handler类是基于扩展而非修改的方式来完成的但改动一、三、四貌似不是基于扩展而是基于修改的方式来完成的那改动一、三、四不就违背了开闭原则吗
**我们先来分析一下改动一往ApiStatInfo类中添加新的属性timeoutCount。**
实际上我们不仅往ApiStatInfo类中添加了属性还添加了对应的getter/setter方法。那这个问题就转化为给类中添加新的属性和方法算作“修改”还是“扩展”
我们再一块回忆一下开闭原则的定义:软件实体(模块、类、方法等)应该“对扩展开放、对修改关闭”。从定义中,我们可以看出,开闭原则可以应用在不同粒度的代码中,可以是模块,也可以类,还可以是方法(及其属性)。同样一个代码改动,在粗代码粒度下,被认定为“修改”,在细代码粒度下,又可以被认定为“扩展”。比如,改动一,添加属性和方法相当于修改类,在类这个层面,这个代码改动可以被认定为“修改”;但这个代码改动并没有修改已有的属性和方法,在方法(及其属性)这一层面,它又可以被认定为“扩展”。
实际上,我们也没必要纠结某个代码改动是“修改”还是“扩展”,更没必要太纠结它是否违反“开闭原则”。我们回到这条原则的设计初衷:只要它没有破坏原有的代码的正常运行,没有破坏原有的单元测试,我们就可以说,这是一个合格的代码改动。
**我们再来分析一下改动三和改动四在ApplicationContext类的initializeBeans()方法中往alert对象中注册新的timeoutAlertHandler在使用Alert类的时候需要给check()函数的入参apiStatInfo对象设置timeoutCount的值。**
这两处改动都是在方法内部进行的,不管从哪个层面(模块、类、方法)来讲,都不能算是“扩展”,而是地地道道的“修改”。不过,有些修改是在所难免的,是可以被接受的。为什么这么说呢?我来解释一下。
在重构之后的Alert代码中我们的核心逻辑集中在Alert类及其各个handler中当我们在添加新的告警逻辑的时候Alert类完全不需要修改而只需要扩展一个新handler类。如果我们把Alert类及各个handler类合起来看作一个“模块”那模块本身在添加新的功能的时候完全满足开闭原则。
而且,我们要认识到,添加一个新功能,不可能任何模块、类、方法的代码都不“修改”,这个是做不到的。类需要创建、组装、并且做一些初始化操作,才能构建成可运行的的程序,这部分代码的修改是在所难免的。我们要做的是尽量让修改操作更集中、更少、更上层,尽量让最核心、最复杂的那部分逻辑代码满足开闭原则。
## 如何做到“对扩展开放、修改关闭”?
在刚刚的例子中我们通过引入一组handler的方式来实现支持开闭原则。如果你没有太多复杂代码的设计和开发经验你可能会有这样的疑问这样的代码设计思路我怎么想不到呢?你是怎么想到的呢?
先给你个结论,之所以我能想到,靠的就是理论知识和实战经验,这些需要你慢慢学习和积累。对于如何做到“对扩展开放、修改关闭”,我们也有一些指导思想和具体的方法论,我们一块来看一下。
实际上,开闭原则讲的就是代码的扩展性问题,是判断一段代码是否易扩展的“金标准”。如果某段代码在应对未来需求变化的时候,能够做到“对扩展开放、对修改关闭”,那就说明这段代码的扩展性比较好。所以,问如何才能做到“对扩展开放、对修改关闭”,也就粗略地等同于在问,如何才能写出扩展性好的代码。
**在讲具体的方法论之前,我们先来看一些更加偏向顶层的指导思想。为了尽量写出扩展性好的代码,我们要时刻具备扩展意识、抽象意识、封装意识。这些“潜意识”可能比任何开发技巧都重要。**
在写代码的时候后,我们要多花点时间往前多思考一下,这段代码未来可能有哪些需求变更、如何设计代码结构,事先留好扩展点,以便在未来需求变更的时候,不需要改动代码整体结构、做到最小代码改动的情况下,新的代码能够很灵活地插入到扩展点上,做到“对扩展开放、对修改关闭”。
还有,在识别出代码可变部分和不可变部分之后,我们要将可变部分封装起来,隔离变化,提供抽象化的不可变接口,给上层系统使用。当具体的实现发生变化的时候,我们只需要基于相同的抽象接口,扩展一个新的实现,替换掉老的实现即可,上游系统的代码几乎不需要修改。
**刚刚我们讲了实现开闭原则的一些偏向顶层的指导思想,现在我们再来看下,支持开闭原则的一些更加具体的方法论。**
我们前面讲到代码的扩展性是代码质量评判的最重要的标准之一。实际上我们整个专栏的大部分知识点都是围绕扩展性问题来讲解的。专栏中讲到的很多设计原则、设计思想、设计模式都是以提高代码的扩展性为最终目的的。特别是23种经典设计模式大部分都是为了解决代码的扩展性问题而总结出来的都是以开闭原则为指导原则的。
在众多的设计原则、思想、模式中,最常用来提高代码扩展性的方法有:多态、依赖注入、基于接口而非实现编程,以及大部分的设计模式(比如,装饰、策略、模板、职责链、状态等)。设计模式这一部分内容比较多,后面课程中我们能会详细讲到,这里就不展开了。今天我重点讲一下,如何利用多态、依赖注入、基于接口而非实现编程,来实现“对扩展开放、对修改关闭”。
实际上,多态、依赖注入、基于接口而非实现编程,以及前面提到的抽象意识,说的都是同一种设计思路,只是从不同的角度、不同的层面来阐述而已。这也体现了“很多设计原则、思想、模式都是相通的”这一思想。
接下来,我就通过一个例子来解释一下,如何利用这几个设计思想或原则来实现“对扩展开放、对修改关闭”。注意,依赖注入后面会讲到,如果你对这块不了解,可以暂时先忽略这个概念,只关注多态、基于接口而非实现编程以及抽象意识。
比如我们代码中通过Kafka来发送异步消息。对于这样一个功能的开发我们要学会将其抽象成一组跟具体消息队列Kafka无关的异步消息接口。所有上层系统都依赖这组抽象的接口编程并且通过依赖注入的方式来调用。当我们要替换新的消息队列的时候比如将Kafka替换成RocketMQ可以很方便地拔掉老的消息队列实现插入新的消息队列实现。具体代码如下所示
```
// 这一部分体现了抽象意识
public interface MessageQueue { //... }
public class KafkaMessageQueue implements MessageQueue { //... }
public class RocketMQMessageQueue implements MessageQueue {//...}
public interface MessageFromatter { //... }
public class JsonMessageFromatter implements MessageFromatter {//...}
public class ProtoBufMessageFromatter implements MessageFromatter {//...}
public class Demo {
private MessageQueue msgQueue; // 基于接口而非实现编程
public Demo(MessageQueue msgQueue) { // 依赖注入
this.msgQueue = msgQueue;
}
// msgFormatter多态、依赖注入
public void sendNotification(Notification notification, MessageFormatter msgFormatter) {
//...
}
}
```
对于如何写出扩展性好的代码、如何实现“对扩展开放、对修改关闭”这个问题,我今天只是比较笼统地总结了一下,详细的知识我们在后面的章节中慢慢学习。
## 如何在项目中灵活应用开闭原则?
前面我们提到,写出支持“对扩展开放、对修改关闭”的代码的关键是预留扩展点。那问题是如何才能识别出所有可能的扩展点呢?
如果你开发的是一个业务导向的系统,比如金融系统、电商系统、物流系统等,要想识别出尽可能多的扩展点,就要对业务有足够的了解,能够知道当下以及未来可能要支持的业务需求。如果你开发的是跟业务无关的、通用的、偏底层的系统,比如,框架、组件、类库,你需要了解“它们会被如何使用?今后你打算添加哪些功能?使用者未来会有哪些更多的功能需求?”等问题。
不过,有一句话说得好,“唯一不变的只有变化本身”。即便我们对业务、对系统有足够的了解,那也不可能识别出所有的扩展点,即便你能识别出所有的扩展点,为这些地方都预留扩展点,这样做的成本也是不可接受的。我们没必要为一些遥远的、不一定发生的需求去提前买单,做过度设计。
最合理的做法是,对于一些比较确定的、短期内可能就会扩展,或者需求改动对代码结构影响比较大的情况,或者实现成本不高的扩展点,在编写代码的时候之后,我们就可以事先做些扩展性设计。但对于一些不确定未来是否要支持的需求,或者实现起来比较复杂的扩展点,我们可以等到有需求驱动的时候,再通过重构代码的方式来支持扩展的需求。
而且开闭原则也并不是免费的。有些情况下代码的扩展性会跟可读性相冲突。比如我们之前举的Alert告警的例子。为了更好地支持扩展性我们对代码进行了重构重构之后的代码要比之前的代码复杂很多理解起来也更加有难度。很多时候我们都需要在扩展性和可读性之间做权衡。在某些场景下代码的扩展性很重要我们就可以适当地牺牲一些代码的可读性在另一些场景下代码的可读性更加重要那我们就适当地牺牲一些代码的可扩展性。
在我们之前举的Alert告警的例子中如果告警规则并不是很多、也不复杂那check()函数中的if语句就不会很多代码逻辑也不复杂代码行数也不多那最初的第一种代码实现思路简单易读就是比较合理的选择。相反如果告警规则很多、很复杂check()函数的if语句、代码逻辑就会很多、很复杂相应的代码行数也会很多可读性、可维护性就会变差那重构之后的第二种代码实现思路就是更加合理的选择了。总之这里没有一个放之四海而皆准的参考标准全凭实际的应用场景来决定。
## 重点回顾
今天的内容到此就讲完了。我们一块来总结回顾一下,你需要掌握的的重点内容。
**1.如何理解“对扩展开放、对修改关闭”?**
添加一个新的功能,应该是通过在已有代码基础上扩展代码(新增模块、类、方法、属性等),而非修改已有代码(修改模块、类、方法、属性等)的方式来完成。关于定义,我们有两点要注意。第一点是,开闭原则并不是说完全杜绝修改,而是以最小的修改代码的代价来完成新功能的开发。第二点是,同样的代码改动,在粗代码粒度下,可能被认定为“修改”;在细代码粒度下,可能又被认定为“扩展”。
**2.如何做到“对扩展开放、修改关闭”?**
我们要时刻具备扩展意识、抽象意识、封装意识。在写代码的时候,我们要多花点时间思考一下,这段代码未来可能有哪些需求变更,如何设计代码结构,事先留好扩展点,以便在未来需求变更的时候,在不改动代码整体结构、做到最小代码改动的情况下,将新的代码灵活地插入到扩展点上。
很多设计原则、设计思想、设计模式都是以提高代码的扩展性为最终目的的。特别是23种经典设计模式大部分都是为了解决代码的扩展性问题而总结出来的都是以开闭原则为指导原则的。最常用来提高代码扩展性的方法有多态、依赖注入、基于接口而非实现编程以及大部分的设计模式比如装饰、策略、模板、职责链、状态
## 课堂讨论
学习设计原则,要多问个为什么。不能把设计原则当真理,而是要理解设计原则背后的思想。搞清楚这个,比单纯理解原则讲的是啥,更能让你灵活应用原则。所以,今天课堂讨论的话题是,为什么我们要“对扩展开放、对修改关闭”?
欢迎在留言区写下你的答案,和同学一起交流和分享。如果有收获,也欢迎你把这篇文章分享给你的朋友。

View File

@@ -0,0 +1,157 @@
<audio id="audio" title="17 | 理论三里式替换LSP跟多态有何区别哪些代码违背了LSP" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/2f/15/2fd63965f381663489f14545fa3dd115.mp3"></audio>
在上两节课中我们学习了SOLID原则中的单一职责原则和开闭原则这两个原则都比较重要想要灵活应用也比较难需要你在实践中多加练习、多加体会。今天我们再来学习SOLID中的“L”对应的原则里式替换原则。
整体上来讲,这个设计原则是比较简单、容易理解和掌握的。今天我主要通过几个反例,带你看看,哪些代码是违反里式替换原则的?我们该如何将它们改造成满足里式替换原则?除此之外,这条原则从定义上看起来,跟我们之前讲过的“多态”有点类似。所以,我今天也会讲一下,它跟多态的区别。
话不多说,让我们正式开始今天的学习吧!
## 如何理解“里式替换原则”?
里式替换原则的英文翻译是Liskov Substitution Principle缩写为LSP。这个原则最早是在1986年由Barbara Liskov提出他是这么描述这条原则的
>
If S is a subtype of T, then objects of type T may be replaced with objects of type S, without breaking the program。
在1996年Robert Martin在他的SOLID原则中重新描述了这个原则英文原话是这样的
>
Functions that use pointers of references to base classes must be able to use objects of derived classes without knowing it。
我们综合两者的描述将这条原则用中文描述出来是这样的子类对象object of subtype/derived class能够替换程序program中父类对象object of base/parent class出现的任何地方并且保证原来程序的逻辑行为behavior不变及正确性不被破坏。
这么说还是比较抽象我们通过一个例子来解释一下。如下代码中父类Transporter使用org.apache.http库中的HttpClient类来传输网络数据。子类SecurityTransporter继承父类Transporter增加了额外的功能支持传输appId和appToken安全认证信息。
```
public class Transporter {
private HttpClient httpClient;
public Transporter(HttpClient httpClient) {
this.httpClient = httpClient;
}
public Response sendRequest(Request request) {
// ...use httpClient to send request
}
}
public class SecurityTransporter extends Transporter {
private String appId;
private String appToken;
public SecurityTransporter(HttpClient httpClient, String appId, String appToken) {
super(httpClient);
this.appId = appId;
this.appToken = appToken;
}
@Override
public Response sendRequest(Request request) {
if (StringUtils.isNotBlank(appId) &amp;&amp; StringUtils.isNotBlank(appToken)) {
request.addPayload(&quot;app-id&quot;, appId);
request.addPayload(&quot;app-token&quot;, appToken);
}
return super.sendRequest(request);
}
}
public class Demo {
public void demoFunction(Transporter transporter) {
Reuqest request = new Request();
//...省略设置request中数据值的代码...
Response response = transporter.sendRequest(request);
//...省略其他逻辑...
}
}
// 里式替换原则
Demo demo = new Demo();
demo.demofunction(new SecurityTransporter(/*省略参数*/););
```
在上面的代码中子类SecurityTransporter的设计完全符合里式替换原则可以替换父类出现的任何位置并且原来代码的逻辑行为不变且正确性也没有被破坏。
不过,你可能会有这样的疑问,刚刚的代码设计不就是简单利用了面向对象的多态特性吗?多态和里式替换原则说的是不是一回事呢?从刚刚的例子和定义描述来看,里式替换原则跟多态看起来确实有点类似,但实际上它们完全是两回事。为什么这么说呢?
我们还是通过刚才这个例子来解释一下。不过我们需要对SecurityTransporter类中sendRequest()函数稍加改造一下。改造前如果appId或者appToken没有设置我们就不做校验改造后如果appId或者appToken没有设置则直接抛出NoAuthorizationRuntimeException未授权异常。改造前后的代码对比如下所示
```
// 改造前:
public class SecurityTransporter extends Transporter {
//...省略其他代码..
@Override
public Response sendRequest(Request request) {
if (StringUtils.isNotBlank(appId) &amp;&amp; StringUtils.isNotBlank(appToken)) {
request.addPayload(&quot;app-id&quot;, appId);
request.addPayload(&quot;app-token&quot;, appToken);
}
return super.sendRequest(request);
}
}
// 改造后:
public class SecurityTransporter extends Transporter {
//...省略其他代码..
@Override
public Response sendRequest(Request request) {
if (StringUtils.isBlank(appId) || StringUtils.isBlank(appToken)) {
throw new NoAuthorizationRuntimeException(...);
}
request.addPayload(&quot;app-id&quot;, appId);
request.addPayload(&quot;app-token&quot;, appToken);
return super.sendRequest(request);
}
}
```
在改造之后的代码中如果传递进demoFunction()函数的是父类Transporter对象那demoFunction()函数并不会有异常抛出但如果传递给demoFunction()函数的是子类SecurityTransporter对象那demoFunction()有可能会有异常抛出。尽管代码中抛出的是运行时异常Runtime Exception我们可以不在代码中显式地捕获处理但子类替换父类传递进demoFunction函数之后整个程序的逻辑行为有了改变。
虽然改造之后的代码仍然可以通过Java的多态语法动态地用子类SecurityTransporter来替换父类Transporter也并不会导致程序编译或者运行报错。但是从设计思路上来讲SecurityTransporter的设计是不符合里式替换原则的。
好了,我们稍微总结一下。虽然从定义描述和代码实现上来看,多态和里式替换有点类似,但它们关注的角度是不一样的。多态是面向对象编程的一大特性,也是面向对象编程语言的一种语法。它是一种代码实现的思路。而里式替换是一种设计原则,是用来指导继承关系中子类该如何设计的,子类的设计要保证在替换父类的时候,不改变原有程序的逻辑以及不破坏原有程序的正确性。
## 哪些代码明显违背了LSP
实际上里式替换原则还有另外一个更加能落地、更有指导意义的描述那就是“Design By Contract”中文翻译就是“按照协议来设计”。
看起来比较抽象,我来进一步解读一下。子类在设计的时候,要遵守父类的行为约定(或者叫协议)。父类定义了函数的行为约定,那子类可以改变函数的内部实现逻辑,但不能改变函数原有的行为约定。这里的行为约定包括:函数声明要实现的功能;对输入、输出、异常的约定;甚至包括注释中所罗列的任何特殊说明。实际上,定义中父类和子类之间的关系,也可以替换成接口和实现类之间的关系。
为了更好地理解这句话,我举几个违反里式替换原则的例子来解释一下。
### 1.子类违背父类声明要实现的功能
父类中提供的sortOrdersByAmount()订单排序函数是按照金额从小到大来给订单排序的而子类重写这个sortOrdersByAmount()订单排序函数之后,是按照创建日期来给订单排序的。那子类的设计就违背里式替换原则。
### 2.子类违背父类对输入、输出、异常的约定
在父类中某个函数约定运行出错的时候返回null获取数据为空的时候返回空集合empty collection。而子类重载函数之后实现变了运行出错返回异常exception获取不到数据返回null。那子类的设计就违背里式替换原则。
在父类中,某个函数约定,输入数据可以是任意整数,但子类实现的时候,只允许输入数据是正整数,负数就抛出,也就是说,子类对输入的数据的校验比父类更加严格,那子类的设计就违背了里式替换原则。
在父类中某个函数约定只会抛出ArgumentNullException异常那子类的设计实现中只允许抛出ArgumentNullException异常任何其他异常的抛出都会导致子类违背里式替换原则。
### 3.子类违背父类注释中所罗列的任何特殊说明
父类中定义的withdraw()提现函数的注释是这么写的“用户的提现金额不得超过账户余额……”而子类重写withdraw()函数之后针对VIP账号实现了透支提现的功能也就是提现金额可以大于账户余额那这个子类的设计也是不符合里式替换原则的。
以上便是三种典型的违背里式替换原则的情况。除此之外,判断子类的设计实现是否违背里式替换原则,还有一个小窍门,那就是拿父类的单元测试去验证子类的代码。如果某些单元测试运行失败,就有可能说明,子类的设计实现没有完全地遵守父类的约定,子类有可能违背了里式替换原则。
实际上,你有没有发现,里式替换这个原则是非常宽松的。一般情况下,我们写的代码都不怎么会违背它。所以,只要你能看懂我今天讲的这些,这个原则就不难掌握,也不难应用。
## 重点回顾
今天的内容到此就讲完了。我们来一块总结回顾一下,你需要掌握的重点内容。
里式替换原则是用来指导继承关系中子类该如何设计的一个原则。理解里式替换原则最核心的就是理解“design by contract按照协议来设计”这几个字。父类定义了函数的“约定”或者叫协议那子类可以改变函数的内部实现逻辑但不能改变函数原有的“约定”。这里的约定包括函数声明要实现的功能对输入、输出、异常的约定甚至包括注释中所罗列的任何特殊说明。
理解这个原则,我们还要弄明白里式替换原则跟多态的区别。虽然从定义描述和代码实现上来看,多态和里式替换有点类似,但它们关注的角度是不一样的。多态是面向对象编程的一大特性,也是面向对象编程语言的一种语法。它是一种代码实现的思路。而里式替换是一种设计原则,用来指导继承关系中子类该如何设计,子类的设计要保证在替换父类的时候,不改变原有程序的逻辑及不破坏原有程序的正确性。
## 课堂讨论
把复杂的东西讲简单,把简单的东西讲深刻,都是比较难的事情。而里式替换原则存在的意义可以说不言自喻,非常简单明确,但是越是这种不言自喻的道理,越是难组织成文字或语言来描述,有点儿只可意会不可言传的意思,所以,今天的课堂讨论的话题是:请你有条理、有深度地讲一讲里式替换原则存在的意义。
欢迎在留言区写下你的想法,和同学一起交流和分享。如果有收获,也欢迎你把这篇文章分享给你的朋友。

View File

@@ -0,0 +1,399 @@
<audio id="audio" title="18 | 理论四:接口隔离原则有哪三种应用?原则中的“接口”该如何理解?" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/e6/05/e60f6e929d047f92e7877bb5aea82805.mp3"></audio>
上几节课中我们学习了SOLID原则中的单一职责原则、开闭原则和里式替换原则今天我们学习第四个原则接口隔离原则。它对应SOLID中的英文字母“I”。对于这个原则最关键就是理解其中“接口”的含义。那针对“接口”不同的理解方式对应在原则上也有不同的解读方式。除此之外接口隔离原则跟我们之前讲到的单一职责原则还有点儿类似所以今天我也会具体讲一下它们之间的区别和联系。
话不多说,现在就让我们正式开始今天的学习吧!
## 如何理解“接口隔离原则”?
接口隔离原则的英文翻译是“ Interface Segregation Principle”缩写为ISP。Robert Martin在SOLID原则中是这样定义它的“Clients should not be forced to depend upon interfaces that they do not use。”直译成中文的话就是客户端不应该被强迫依赖它不需要的接口。其中的“客户端”可以理解为接口的调用者或者使用者。
实际上“接口”这个名词可以用在很多场合中。生活中我们可以用它来指插座接口等。在软件开发中我们既可以把它看作一组抽象的约定也可以具体指系统与系统之间的API接口还可以特指面向对象编程语言中的接口等。
前面我提到,理解接口隔离原则的关键,就是理解其中的“接口”二字。在这条原则中,我们可以把“接口”理解为下面三种东西:
- 一组API接口集合
- 单个API接口或函数
- OOP中的接口概念
接下来,我就按照这三种理解方式来详细讲一下,在不同的场景下,这条原则具体是如何解读和应用的。
## 把“接口”理解为一组API接口集合
我们还是结合一个例子来讲解。微服务用户系统提供了一组跟用户相关的API给其他系统使用比如注册、登录、获取用户信息等。具体代码如下所示
```
public interface UserService {
boolean register(String cellphone, String password);
boolean login(String cellphone, String password);
UserInfo getUserInfoById(long id);
UserInfo getUserInfoByCellphone(String cellphone);
}
public class UserServiceImpl implements UserService {
//...
}
```
现在我们的后台管理系统要实现删除用户的功能希望用户系统提供一个删除用户的接口。这个时候我们该如何来做呢你可能会说这不是很简单吗我只需要在UserService中新添加一个deleteUserByCellphone()或deleteUserById()接口就可以了。这个方法可以解决问题,但是也隐藏了一些安全隐患。
删除用户是一个非常慎重的操作我们只希望通过后台管理系统来执行所以这个接口只限于给后台管理系统使用。如果我们把它放到UserService中那所有使用到UserService的系统都可以调用这个接口。不加限制地被其他业务系统调用就有可能导致误删用户。
当然最好的解决方案是从架构设计的层面通过接口鉴权的方式来限制接口的调用。不过如果暂时没有鉴权框架来支持我们还可以从代码设计的层面尽量避免接口被误用。我们参照接口隔离原则调用者不应该强迫依赖它不需要的接口将删除接口单独放到另外一个接口RestrictedUserService中然后将RestrictedUserService只打包提供给后台管理系统来使用。具体的代码实现如下所示
```
public interface UserService {
boolean register(String cellphone, String password);
boolean login(String cellphone, String password);
UserInfo getUserInfoById(long id);
UserInfo getUserInfoByCellphone(String cellphone);
}
public interface RestrictedUserService {
boolean deleteUserByCellphone(String cellphone);
boolean deleteUserById(long id);
}
public class UserServiceImpl implements UserService, RestrictedUserService {
// ...省略实现代码...
}
```
在刚刚的这个例子中,我们把接口隔离原则中的接口,理解为一组接口集合,它可以是某个微服务的接口,也可以是某个类库的接口等等。在设计微服务或者类库接口的时候,如果部分接口只被部分调用者使用,那我们就需要将这部分接口隔离出来,单独给对应的调用者使用,而不是强迫其他调用者也依赖这部分不会被用到的接口。
## 把“接口”理解为单个API接口或函数
现在我们再换一种理解方式,把接口理解为单个接口或函数(以下为了方便讲解,我都简称为“函数”)。那接口隔离原则就可以理解为:函数的设计要功能单一,不要将多个不同的功能逻辑在一个函数中实现。接下来,我们还是通过一个例子来解释一下。
```
public class Statistics {
private Long max;
private Long min;
private Long average;
private Long sum;
private Long percentile99;
private Long percentile999;
//...省略constructor/getter/setter等方法...
}
public Statistics count(Collection&lt;Long&gt; dataSet) {
Statistics statistics = new Statistics();
//...省略计算逻辑...
return statistics;
}
```
在上面的代码中count()函数的功能不够单一包含很多不同的统计功能比如求最大值、最小值、平均值等等。按照接口隔离原则我们应该把count()函数拆成几个更小粒度的函数,每个函数负责一个独立的统计功能。拆分之后的代码如下所示:
```
public Long max(Collection&lt;Long&gt; dataSet) { //... }
public Long min(Collection&lt;Long&gt; dataSet) { //... }
public Long average(Colletion&lt;Long&gt; dataSet) { //... }
// ...省略其他统计函数...
```
不过你可能会说在某种意义上讲count()函数也不能算是职责不够单一,毕竟它做的事情只跟统计相关。我们在讲单一职责原则的时候,也提到过类似的问题。实际上,判定功能是否单一,除了很强的主观性,还需要结合具体的场景。
如果在项目中对每个统计需求Statistics定义的那几个统计信息都有涉及那count()函数的设计就是合理的。相反如果每个统计需求只涉及Statistics罗列的统计信息中一部分比如有的只需要用到max、min、average这三类统计信息有的只需要用到average、sum。而count()函数每次都会把所有的统计信息计算一遍就会做很多无用功势必影响代码的性能特别是在需要统计的数据量很大的时候。所以在这个应用场景下count()函数的设计就有点不合理了,我们应该按照第二种设计思路,将其拆分成粒度更细的多个统计函数。
不过,你应该已经发现,接口隔离原则跟单一职责原则有点类似,不过稍微还是有点区别。单一职责原则针对的是模块、类、接口的设计。而接口隔离原则相对于单一职责原则,一方面它更侧重于接口的设计,另一方面它的思考的角度不同。它提供了一种判断接口是否职责单一的标准:通过调用者如何使用接口来间接地判定。如果调用者只使用部分接口或接口的部分功能,那接口的设计就不够职责单一。
## 把“接口”理解为OOP中的接口概念
除了刚讲过的两种理解方式我们还可以把“接口”理解为OOP中的接口概念比如Java中的interface。我还是通过一个例子来给你解释。
假设我们的项目中用到了三个外部系统Redis、MySQL、Kafka。每个系统都对应一系列配置信息比如地址、端口、访问超时时间等。为了在内存中存储这些配置信息供项目中的其他模块来使用我们分别设计实现了三个Configuration类RedisConfig、MysqlConfig、KafkaConfig。具体的代码实现如下所示。注意这里我只给出了RedisConfig的代码实现另外两个都是类似的我这里就不贴了。
```
public class RedisConfig {
private ConfigSource configSource; //配置中心比如zookeeper
private String address;
private int timeout;
private int maxTotal;
//省略其他配置: maxWaitMillis,maxIdle,minIdle...
public RedisConfig(ConfigSource configSource) {
this.configSource = configSource;
}
public String getAddress() {
return this.address;
}
//...省略其他get()、init()方法...
public void update() {
//从configSource加载配置到address/timeout/maxTotal...
}
}
public class KafkaConfig { //...省略... }
public class MysqlConfig { //...省略... }
```
现在我们有一个新的功能需求希望支持Redis和Kafka配置信息的热更新。所谓“热更新hot update”就是如果在配置中心中更改了配置信息我们希望在不用重启系统的情况下能将最新的配置信息加载到内存中也就是RedisConfig、KafkaConfig类中。但是因为某些原因我们并不希望对MySQL的配置信息进行热更新。
为了实现这样一个功能需求我们设计实现了一个ScheduledUpdater类以固定时间频率periodInSeconds来调用RedisConfig、KafkaConfig的update()方法更新配置信息。具体的代码实现如下所示:
```
public interface Updater {
void update();
}
public class RedisConfig implemets Updater {
//...省略其他属性和方法...
@Override
public void update() { //... }
}
public class KafkaConfig implements Updater {
//...省略其他属性和方法...
@Override
public void update() { //... }
}
public class MysqlConfig { //...省略其他属性和方法... }
public class ScheduledUpdater {
private final ScheduledExecutorService executor = Executors.newSingleThreadScheduledExecutor();;
private long initialDelayInSeconds;
private long periodInSeconds;
private Updater updater;
public ScheduleUpdater(Updater updater, long initialDelayInSeconds, long periodInSeconds) {
this.updater = updater;
this.initialDelayInSeconds = initialDelayInSeconds;
this.periodInSeconds = periodInSeconds;
}
public void run() {
executor.scheduleAtFixedRate(new Runnable() {
@Override
public void run() {
updater.update();
}
}, this.initialDelayInSeconds, this.periodInSeconds, TimeUnit.SECONDS);
}
}
public class Application {
ConfigSource configSource = new ZookeeperConfigSource(/*省略参数*/);
public static final RedisConfig redisConfig = new RedisConfig(configSource);
public static final KafkaConfig kafkaConfig = new KakfaConfig(configSource);
public static final MySqlConfig mysqlConfig = new MysqlConfig(configSource);
public static void main(String[] args) {
ScheduledUpdater redisConfigUpdater = new ScheduledUpdater(redisConfig, 300, 300);
redisConfigUpdater.run();
ScheduledUpdater kafkaConfigUpdater = new ScheduledUpdater(kafkaConfig, 60, 60);
kafkaConfigUpdater.run();
}
}
```
刚刚的热更新的需求我们已经搞定了。现在我们又有了一个新的监控功能需求。通过命令行来查看Zookeeper中的配置信息是比较麻烦的。所以我们希望能有一种更加方便的配置信息查看方式。
我们可以在项目中开发一个内嵌的SimpleHttpServer输出项目的配置信息到一个固定的HTTP地址比如[http://127.0.0.1:2389/config](http://127.0.0.1:2389/config) 。我们只需要在浏览器中输入这个地址就可以显示出系统的配置信息。不过出于某些原因我们只想暴露MySQL和Redis的配置信息不想暴露Kafka的配置信息。
为了实现这样一个功能,我们还需要对上面的代码做进一步改造。改造之后的代码如下所示:
```
public interface Updater {
void update();
}
public interface Viewer {
String outputInPlainText();
Map&lt;String, String&gt; output();
}
public class RedisConfig implemets Updater, Viewer {
//...省略其他属性和方法...
@Override
public void update() { //... }
@Override
public String outputInPlainText() { //... }
@Override
public Map&lt;String, String&gt; output() { //...}
}
public class KafkaConfig implements Updater {
//...省略其他属性和方法...
@Override
public void update() { //... }
}
public class MysqlConfig implements Viewer {
//...省略其他属性和方法...
@Override
public String outputInPlainText() { //... }
@Override
public Map&lt;String, String&gt; output() { //...}
}
public class SimpleHttpServer {
private String host;
private int port;
private Map&lt;String, List&lt;Viewer&gt;&gt; viewers = new HashMap&lt;&gt;();
public SimpleHttpServer(String host, int port) {//...}
public void addViewers(String urlDirectory, Viewer viewer) {
if (!viewers.containsKey(urlDirectory)) {
viewers.put(urlDirectory, new ArrayList&lt;Viewer&gt;());
}
this.viewers.get(urlDirectory).add(viewer);
}
public void run() { //... }
}
public class Application {
ConfigSource configSource = new ZookeeperConfigSource();
public static final RedisConfig redisConfig = new RedisConfig(configSource);
public static final KafkaConfig kafkaConfig = new KakfaConfig(configSource);
public static final MySqlConfig mysqlConfig = new MySqlConfig(configSource);
public static void main(String[] args) {
ScheduledUpdater redisConfigUpdater =
new ScheduledUpdater(redisConfig, 300, 300);
redisConfigUpdater.run();
ScheduledUpdater kafkaConfigUpdater =
new ScheduledUpdater(kafkaConfig, 60, 60);
redisConfigUpdater.run();
SimpleHttpServer simpleHttpServer = new SimpleHttpServer(“127.0.0.1”, 2389);
simpleHttpServer.addViewer(&quot;/config&quot;, redisConfig);
simpleHttpServer.addViewer(&quot;/config&quot;, mysqlConfig);
simpleHttpServer.run();
}
}
```
至此,热更新和监控的需求我们就都实现了。我们来回顾一下这个例子的设计思想。
我们设计了两个功能非常单一的接口Updater和Viewer。ScheduledUpdater只依赖Updater这个跟热更新相关的接口不需要被强迫去依赖不需要的Viewer接口满足接口隔离原则。同理SimpleHttpServer只依赖跟查看信息相关的Viewer接口不依赖不需要的Updater接口也满足接口隔离原则。
你可能会说如果我们不遵守接口隔离原则不设计Updater和Viewer两个小接口而是设计一个大而全的Config接口让RedisConfig、KafkaConfig、MysqlConfig都实现这个Config接口并且将原来传递给ScheduledUpdater的Updater和传递给SimpleHttpServer的Viewer都替换为Config那会有什么问题呢我们先来看一下按照这个思路来实现的代码是什么样的。
```
public interface Config {
void update();
String outputInPlainText();
Map&lt;String, String&gt; output();
}
public class RedisConfig implements Config {
//...需要实现Config的三个接口update/outputIn.../output
}
public class KafkaConfig implements Config {
//...需要实现Config的三个接口update/outputIn.../output
}
public class MysqlConfig implements Config {
//...需要实现Config的三个接口update/outputIn.../output
}
public class ScheduledUpdater {
//...省略其他属性和方法..
private Config config;
public ScheduleUpdater(Config config, long initialDelayInSeconds, long periodInSeconds) {
this.config = config;
//...
}
//...
}
public class SimpleHttpServer {
private String host;
private int port;
private Map&lt;String, List&lt;Config&gt;&gt; viewers = new HashMap&lt;&gt;();
public SimpleHttpServer(String host, int port) {//...}
public void addViewer(String urlDirectory, Config config) {
if (!viewers.containsKey(urlDirectory)) {
viewers.put(urlDirectory, new ArrayList&lt;Config&gt;());
}
viewers.get(urlDirectory).add(config);
}
public void run() { //... }
}
```
这样的设计思路也是能工作的,但是对比前后两个设计思路,在同样的代码量、实现复杂度、同等可读性的情况下,第一种设计思路显然要比第二种好很多。为什么这么说呢?主要有两点原因。
**首先,第一种设计思路更加灵活、易扩展、易复用。**因为Updater、Viewer职责更加单一单一就意味了通用、复用性好。比如我们现在又有一个新的需求开发一个Metrics性能统计模块并且希望将Metrics也通过SimpleHttpServer显示在网页上以方便查看。这个时候尽管Metrics跟RedisConfig等没有任何关系但我们仍然可以让Metrics类实现非常通用的Viewer接口复用SimpleHttpServer的代码实现。具体的代码如下所示
```
public class ApiMetrics implements Viewer {//...}
public class DbMetrics implements Viewer {//...}
public class Application {
ConfigSource configSource = new ZookeeperConfigSource();
public static final RedisConfig redisConfig = new RedisConfig(configSource);
public static final KafkaConfig kafkaConfig = new KakfaConfig(configSource);
public static final MySqlConfig mySqlConfig = new MySqlConfig(configSource);
public static final ApiMetrics apiMetrics = new ApiMetrics();
public static final DbMetrics dbMetrics = new DbMetrics();
public static void main(String[] args) {
SimpleHttpServer simpleHttpServer = new SimpleHttpServer(“127.0.0.1”, 2389);
simpleHttpServer.addViewer(&quot;/config&quot;, redisConfig);
simpleHttpServer.addViewer(&quot;/config&quot;, mySqlConfig);
simpleHttpServer.addViewer(&quot;/metrics&quot;, apiMetrics);
simpleHttpServer.addViewer(&quot;/metrics&quot;, dbMetrics);
simpleHttpServer.run();
}
}
```
**其次,第二种设计思路在代码实现上做了一些无用功。**因为Config接口中包含两类不相关的接口一类是update()一类是output()和outputInPlainText()。理论上KafkaConfig只需要实现update()接口并不需要实现output()相关的接口。同理MysqlConfig只需要实现output()相关接口并需要实现update()接口。但第二种设计思路要求RedisConfig、KafkaConfig、MySqlConfig必须同时实现Config的所有接口函数update、output、outputInPlainText。除此之外如果我们要往Config中继续添加一个新的接口那所有的实现类都要改动。相反如果我们的接口粒度比较小那涉及改动的类就比较少。
## 重点回顾
今天的内容到此就讲完了。我们一块来总结回顾一下,你需要掌握的重点内容。
**1.如何理解“接口隔离原则”?**
理解“接口隔离原则”的重点是理解其中的“接口”二字。这里有三种不同的理解。
如果把“接口”理解为一组接口集合,可以是某个微服务的接口,也可以是某个类库的接口等。如果部分接口只被部分调用者使用,我们就需要将这部分接口隔离出来,单独给这部分调用者使用,而不强迫其他调用者也依赖这部分不会被用到的接口。
如果把“接口”理解为单个API接口或函数部分调用者只需要函数中的部分功能那我们就需要把函数拆分成粒度更细的多个函数让调用者只依赖它需要的那个细粒度函数。
如果把“接口”理解为OOP中的接口也可以理解为面向对象编程语言中的接口语法。那接口的设计要尽量单一不要让接口的实现类和调用者依赖不需要的接口函数。
**2.接口隔离原则与单一职责原则的区别**
单一职责原则针对的是模块、类、接口的设计。接口隔离原则相对于单一职责原则,一方面更侧重于接口的设计,另一方面它的思考角度也是不同的。接口隔离原则提供了一种判断接口的职责是否单一的标准:通过调用者如何使用接口来间接地判定。如果调用者只使用部分接口或接口的部分功能,那接口的设计就不够职责单一。
## 课堂讨论
今天课堂讨论的话题是这样的:
java.util.concurrent并发包提供了AtomicInteger这样一个原子类其中有一个函数getAndIncrement()是这样定义的:给整数增加一,并且返回未増之前的值。我的问题是,这个函数的设计是否符合单一职责原则和接口隔离原则?为什么?
```
/**
* Atomically increments by one the current value.
* @return the previous value
*/
public final int getAndIncrement() {//...}
```
欢迎在留言区写下你的答案,和同学一起交流和分享。如果有收获,也欢迎你把这篇文章分享给你的朋友。

View File

@@ -0,0 +1,244 @@
<audio id="audio" title="19 | 理论五:控制反转、依赖反转、依赖注入,这三者有何区别和联系?" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/f5/6d/f5869e083ecb4c59597ce8eb8964fa6d.mp3"></audio>
关于SOLID原则我们已经学过单一职责、开闭、里式替换、接口隔离这四个原则。今天我们再来学习最后一个原则依赖反转原则。在前面几节课中我们讲到单一职责原则和开闭原则的原理比较简单但是想要在实践中用好却比较难。而今天我们要讲到的依赖反转原则正好相反。这个原则用起来比较简单但概念理解起来比较难。比如下面这几个问题你看看能否清晰地回答出来
- “依赖反转”这个概念指的是“谁跟谁”的“什么依赖”被反转了?“反转”两个字该如何理解?
- 我们还经常听到另外两个概念:“控制反转”和“依赖注入”。这两个概念跟“依赖反转”有什么区别和联系呢?它们说的是同一个事情吗?
- 如果你熟悉Java语言那Spring框架中的IOC跟这些概念又有什么关系呢
看了刚刚这些问题,你是不是有点懵?别担心,今天我会带你将这些问题彻底搞个清楚。之后再有人问你,你就能轻松应对。话不多说,现在就让我们带着这些问题,正式开始今天的学习吧!
## 控制反转IOC
在讲“依赖反转原则”之前我们先讲一讲“控制反转”。控制反转的英文翻译是Inversion Of Control缩写为IOC。此处我要强调一下如果你是Java工程师的话暂时别把这个“IOC”跟Spring框架的IOC联系在一起。关于Spring的IOC我们待会儿还会讲到。
我们先通过一个例子来看一下,什么是控制反转。
```
public class UserServiceTest {
public static boolean doTest() {
// ...
}
public static void main(String[] args) {//这部分逻辑可以放到框架中
if (doTest()) {
System.out.println(&quot;Test succeed.&quot;);
} else {
System.out.println(&quot;Test failed.&quot;);
}
}
}
```
在上面的代码中,所有的流程都由程序员来控制。如果我们抽象出一个下面这样一个框架,我们再来看,如何利用框架来实现同样的功能。具体的代码实现如下所示:
```
public abstract class TestCase {
public void run() {
if (doTest()) {
System.out.println(&quot;Test succeed.&quot;);
} else {
System.out.println(&quot;Test failed.&quot;);
}
}
public abstract boolean doTest();
}
public class JunitApplication {
private static final List&lt;TestCase&gt; testCases = new ArrayList&lt;&gt;();
public static void register(TestCase testCase) {
testCases.add(testCase);
}
public static final void main(String[] args) {
for (TestCase case: testCases) {
case.run();
}
}
```
把这个简化版本的测试框架引入到工程中之后我们只需要在框架预留的扩展点也就是TestCase类中的doTest()抽象函数中填充具体的测试代码就可以实现之前的功能了完全不需要写负责执行流程的main()函数了。 具体的代码如下所示:
```
public class UserServiceTest extends TestCase {
@Override
public boolean doTest() {
// ...
}
}
// 注册操作还可以通过配置的方式来实现不需要程序员显示调用register()
JunitApplication.register(new UserServiceTest();
```
刚刚举的这个例子,就是典型的通过框架来实现“控制反转”的例子。框架提供了一个可扩展的代码骨架,用来组装对象、管理整个执行流程。程序员利用框架进行开发的时候,只需要往预留的扩展点上,添加跟自己业务相关的代码,就可以利用框架来驱动整个程序流程的执行。
这里的“控制”指的是对程序执行流程的控制,而“反转”指的是在没有使用框架之前,程序员自己控制整个程序的执行。在使用框架之后,整个程序的执行流程可以通过框架来控制。流程的控制权从程序员“反转”到了框架。
实际上,实现控制反转的方法有很多,除了刚才例子中所示的类似于模板设计模式的方法之外,还有马上要讲到的依赖注入等方法,所以,控制反转并不是一种具体的实现技巧,而是一个比较笼统的设计思想,一般用来指导框架层面的设计。
## 依赖注入DI
接下来我们再来看依赖注入。依赖注入跟控制反转恰恰相反它是一种具体的编码技巧。依赖注入的英文翻译是Dependency Injection缩写为DI。对于这个概念有一个非常形象的说法那就是依赖注入是一个标价25美元实际上只值5美分的概念。也就是说这个概念听起来很“高大上”实际上理解、应用起来非常简单。
那到底什么是依赖注入呢我们用一句话来概括就是不通过new()的方式在类内部创建依赖类对象,而是将依赖的类对象在外部创建好之后,通过构造函数、函数参数等方式传递(或注入)给类使用。
我们还是通过一个例子来解释一下。在这个例子中Notification类负责消息推送依赖MessageSender类实现推送商品促销、验证码等消息给用户。我们分别用依赖注入和非依赖注入两种方式来实现一下。具体的实现代码如下所示
```
// 非依赖注入实现方式
public class Notification {
private MessageSender messageSender;
public Notification() {
this.messageSender = new MessageSender(); //此处有点像hardcode
}
public void sendMessage(String cellphone, String message) {
//...省略校验逻辑等...
this.messageSender.send(cellphone, message);
}
}
public class MessageSender {
public void send(String cellphone, String message) {
//....
}
}
// 使用Notification
Notification notification = new Notification();
// 依赖注入的实现方式
public class Notification {
private MessageSender messageSender;
// 通过构造函数将messageSender传递进来
public Notification(MessageSender messageSender) {
this.messageSender = messageSender;
}
public void sendMessage(String cellphone, String message) {
//...省略校验逻辑等...
this.messageSender.send(cellphone, message);
}
}
//使用Notification
MessageSender messageSender = new MessageSender();
Notification notification = new Notification(messageSender);
```
通过依赖注入的方式来将依赖的类对象传递进来这样就提高了代码的扩展性我们可以灵活地替换依赖的类。这一点在我们之前讲“开闭原则”的时候也提到过。当然上面代码还有继续优化的空间我们还可以把MessageSender定义成接口基于接口而非实现编程。改造后的代码如下所示
```
public class Notification {
private MessageSender messageSender;
public Notification(MessageSender messageSender) {
this.messageSender = messageSender;
}
public void sendMessage(String cellphone, String message) {
this.messageSender.send(cellphone, message);
}
}
public interface MessageSender {
void send(String cellphone, String message);
}
// 短信发送类
public class SmsSender implements MessageSender {
@Override
public void send(String cellphone, String message) {
//....
}
}
// 站内信发送类
public class InboxSender implements MessageSender {
@Override
public void send(String cellphone, String message) {
//....
}
}
//使用Notification
MessageSender messageSender = new SmsSender();
Notification notification = new Notification(messageSender);
```
实际上,你只需要掌握刚刚举的这个例子,就等于完全掌握了依赖注入。尽管依赖注入非常简单,但却非常有用,在后面的章节中,我们会讲到,它是编写可测试性代码最有效的手段。
## 依赖注入框架DI Framework
弄懂了什么是“依赖注入”,我们再来看一下,什么是“依赖注入框架”。我们还是借用刚刚的例子来解释。
在采用依赖注入实现的Notification类中虽然我们不需要用类似hard code的方式在类内部通过new来创建MessageSender对象但是这个创建对象、组装或注入对象的工作仅仅是被移动到了更上层代码而已还是需要我们程序员自己来实现。具体代码如下所示
```
public class Demo {
public static final void main(String args[]) {
MessageSender sender = new SmsSender(); //创建对象
Notification notification = new Notification(sender);//依赖注入
notification.sendMessage(&quot;13918942177&quot;, &quot;短信验证码2346&quot;);
}
}
```
在实际的软件开发中,一些项目可能会涉及几十、上百、甚至几百个类,类对象的创建和依赖注入会变得非常复杂。如果这部分工作都是靠程序员自己写代码来完成,容易出错且开发成本也比较高。而对象创建和依赖注入的工作,本身跟具体的业务无关,我们完全可以抽象成框架来自动完成。
你可能已经猜到,这个框架就是“依赖注入框架”。我们只需要通过依赖注入框架提供的扩展点,简单配置一下所有需要创建的类对象、类与类之间的依赖关系,就可以实现由框架来自动创建对象、管理对象的生命周期、依赖注入等原本需要程序员来做的事情。
实际上现成的依赖注入框架有很多比如Google Guice、Java Spring、Pico Container、Butterfly Container等。不过如果你熟悉Java Spring框架你可能会说Spring框架自己声称是**控制反转容器**Inversion Of Control Container
实际上这两种说法都没错。只是控制反转容器这种表述是一种非常宽泛的描述DI依赖注入框架的表述更具体、更有针对性。因为我们前面讲到实现控制反转的方式有很多除了依赖注入还有模板模式等而Spring框架的控制反转主要是通过依赖注入来实现的。不过这点区分并不是很明显也不是很重要你稍微了解一下就可以了。
## 依赖反转原则DIP
前面讲了控制反转、依赖注入、依赖注入框架现在我们来讲一讲今天的主角依赖反转原则。依赖反转原则的英文翻译是Dependency Inversion Principle缩写为DIP。中文翻译有时候也叫依赖倒置原则。
为了追本溯源,我先给出这条原则最原汁原味的英文描述:
>
High-level modules shouldnt depend on low-level modules. Both modules should depend on abstractions. In addition, abstractions shouldnt depend on details. Details depend on abstractions.
我们将它翻译成中文大概意思就是高层模块high-level modules不要依赖低层模块low-level。高层模块和低层模块应该通过抽象abstractions来互相依赖。除此之外抽象abstractions不要依赖具体实现细节details具体实现细节details依赖抽象abstractions
所谓高层模块和低层模块的划分简单来说就是在调用链上调用者属于高层被调用者属于低层。在平时的业务代码开发中高层模块依赖底层模块是没有任何问题的。实际上这条原则主要还是用来指导框架层面的设计跟前面讲到的控制反转类似。我们拿Tomcat这个Servlet容器作为例子来解释一下。
Tomcat是运行Java Web应用程序的容器。我们编写的Web应用程序代码只需要部署在Tomcat容器下便可以被Tomcat容器调用执行。按照之前的划分原则Tomcat就是高层模块我们编写的Web应用程序代码就是低层模块。Tomcat和应用程序代码之间并没有直接的依赖关系两者都依赖同一个“抽象”也就是Servlet规范。Servlet规范不依赖具体的Tomcat容器和应用程序的实现细节而Tomcat容器和应用程序依赖Servlet规范。
## 重点回顾
好了,今天的内容到此就讲完了。我们一块来总结回顾一下,你需要掌握的重点内容。
**1.控制反转**
实际上,控制反转是一个比较笼统的设计思想,并不是一种具体的实现方法,一般用来指导框架层面的设计。这里所说的“控制”指的是对程序执行流程的控制,而“反转”指的是在没有使用框架之前,程序员自己控制整个程序的执行。在使用框架之后,整个程序的执行流程通过框架来控制。流程的控制权从程序员“反转”给了框架。
**2.依赖注入**
依赖注入和控制反转恰恰相反它是一种具体的编码技巧。我们不通过new的方式在类内部创建依赖类的对象而是将依赖的类对象在外部创建好之后通过构造函数、函数参数等方式传递或注入给类来使用。
**3.依赖注入框架**
我们通过依赖注入框架提供的扩展点,简单配置一下所有需要的类及其类与类之间依赖关系,就可以实现由框架来自动创建对象、管理对象的生命周期、依赖注入等原本需要程序员来做的事情。
**4.依赖反转原则**
依赖反转原则也叫作依赖倒置原则。这条原则跟控制反转有点类似,主要用来指导框架层面的设计。高层模块不依赖低层模块,它们共同依赖同一个抽象。抽象不要依赖具体实现细节,具体实现细节依赖抽象。
## 课堂讨论
从Notification这个例子来看“基于接口而非实现编程”跟“依赖注入”看起来非常类似那它俩有什么区别和联系呢
欢迎在留言区写下你的答案,和同学一起交流和分享。如果有收获,也欢迎你把这篇文章分享给你的朋友。

View File

@@ -0,0 +1,198 @@
<audio id="audio" title="20 | 理论六我为何说KISS、YAGNI原则看似简单却经常被用错" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/8a/8b/8a272d93747ad1d1718f9b3e57d2a88b.mp3"></audio>
上几节课中我们学习了经典的SOLID原则。今天我们讲两个设计原则KISS原则和YAGNI原则。其中KISS原则比较经典耳熟能详但YAGNI你可能没怎么听过不过它理解起来也不难。
理解这两个原则时候经常会有一个共同的问题那就是看一眼就感觉懂了但深究的话又有很多细节问题不是很清楚。比如怎么理解KISS原则中“简单”两个字什么样的代码才算“简单”怎样的代码才算“复杂”如何才能写出“简单”的代码YAGNI原则跟KISS原则说的是一回事吗
如果你还不能非常清晰地回答出上面这几个问题,那恭喜你,又得到了一次进步提高的机会。等你听完这节课,我相信你很自然就能回答上来了。话不多说,让我们带着这些问题,正式开始今天的学习吧!
## 如何理解“KISS原则”
KISS原则的英文描述有好几个版本比如下面这几个。
- Keep It Simple and Stupid.
- Keep It Short and Simple.
- Keep It Simple and Straightforward.
不过,仔细看你就会发现,它们要表达的意思其实差不多,翻译成中文就是:尽量保持简单。
KISS原则算是一个万金油类型的设计原则可以应用在很多场景中。它不仅经常用来指导软件开发还经常用来指导更加广泛的系统设计、产品设计等比如冰箱、建筑、iPhone手机的设计等等。不过咱们的专栏是讲代码设计的所以接下来我还是重点讲解如何在编码开发中应用这条原则。
我们知道代码的可读性和可维护性是衡量代码质量非常重要的两个标准。而KISS原则就是保持代码可读和可维护的重要手段。代码足够简单也就意味着很容易读懂bug比较难隐藏。即便出现bug修复起来也比较简单。
不过这条原则只是告诉我们要保持代码“Simple and Stupid”但并没有讲到什么样的代码才是“Simple and Stupid”的更没有给出特别明确的方法论来指导如何开发出“Simple and Stupid”的代码。所以看着非常简单但不能落地这就有点像我们常说的“心灵鸡汤”。哦咱们这里应该叫“技术鸡汤”。
所以,接下来,为了能让这条原则切实地落地,能够指导实际的项目开发,我就针对刚刚的这些问题来进一步讲讲我的理解。
## 代码行数越少就越“简单”吗?
我们先一起看一个例子。下面这三段代码可以实现同样一个功能检查输入的字符串ipAddress是否是合法的IP地址。
一个合法的IP地址由四个数字组成并且通过“.”来进行分割。每组数字的取值范围是0~255。第一组数字比较特殊不允许为0。对比这三段代码你觉得哪一段代码最符合KISS原则呢如果让你来实现这个功能你会选择用哪种实现方法呢你可以先自己思考一下然后再看我下面的讲解。
```
// 第一种实现方式: 使用正则表达式
public boolean isValidIpAddressV1(String ipAddress) {
if (StringUtils.isBlank(ipAddress)) return false;
String regex = &quot;^(1\\d{2}|2[0-4]\\d|25[0-5]|[1-9]\\d|[1-9])\\.&quot;
+ &quot;(1\\d{2}|2[0-4]\\d|25[0-5]|[1-9]\\d|\\d)\\.&quot;
+ &quot;(1\\d{2}|2[0-4]\\d|25[0-5]|[1-9]\\d|\\d)\\.&quot;
+ &quot;(1\\d{2}|2[0-4]\\d|25[0-5]|[1-9]\\d|\\d)$&quot;;
return ipAddress.matches(regex);
}
// 第二种实现方式: 使用现成的工具类
public boolean isValidIpAddressV2(String ipAddress) {
if (StringUtils.isBlank(ipAddress)) return false;
String[] ipUnits = StringUtils.split(ipAddress, '.');
if (ipUnits.length != 4) {
return false;
}
for (int i = 0; i &lt; 4; ++i) {
int ipUnitIntValue;
try {
ipUnitIntValue = Integer.parseInt(ipUnits[i]);
} catch (NumberFormatException e) {
return false;
}
if (ipUnitIntValue &lt; 0 || ipUnitIntValue &gt; 255) {
return false;
}
if (i == 0 &amp;&amp; ipUnitIntValue == 0) {
return false;
}
}
return true;
}
// 第三种实现方式: 不使用任何工具类
public boolean isValidIpAddressV3(String ipAddress) {
char[] ipChars = ipAddress.toCharArray();
int length = ipChars.length;
int ipUnitIntValue = -1;
boolean isFirstUnit = true;
int unitsCount = 0;
for (int i = 0; i &lt; length; ++i) {
char c = ipChars[i];
if (c == '.') {
if (ipUnitIntValue &lt; 0 || ipUnitIntValue &gt; 255) return false;
if (isFirstUnit &amp;&amp; ipUnitIntValue == 0) return false;
if (isFirstUnit) isFirstUnit = false;
ipUnitIntValue = -1;
unitsCount++;
continue;
}
if (c &lt; '0' || c &gt; '9') {
return false;
}
if (ipUnitIntValue == -1) ipUnitIntValue = 0;
ipUnitIntValue = ipUnitIntValue * 10 + (c - '0');
}
if (ipUnitIntValue &lt; 0 || ipUnitIntValue &gt; 255) return false;
if (unitsCount != 3) return false;
return true;
}
```
第一种实现方式利用的是正则表达式只用三行代码就把这个问题搞定了。它的代码行数最少那是不是就最符合KISS原则呢答案是否定的。虽然代码行数最少看似最简单实际上却很复杂。这正是因为它使用了正则表达式。
一方面正则表达式本身是比较复杂的写出完全没有bug的正则表达本身就比较有挑战另一方面并不是每个程序员都精通正则表达式。对于不怎么懂正则表达式的同事来说看懂并且维护这段正则表达式是比较困难的。这种实现方式会导致代码的可读性和可维护性变差所以从KISS原则的设计初衷上来讲这种实现方式并不符合KISS原则。
讲完了第一种实现方式,我们再来看下其他两种实现方式。
第二种实现方式使用了StringUtils类、Integer类提供的一些现成的工具函数来处理IP地址字符串。第三种实现方式不使用任何工具函数而是通过逐一处理IP地址中的字符来判断是否合法。从代码行数上来说这两种方式差不多。但是第三种要比第二种更加有难度更容易写出bug。从可读性上来说第二种实现方式的代码逻辑更清晰、更好理解。所以在这两种实现方式中第二种实现方式更加“简单”更加符合KISS原则。
不过,你可能会说,第三种实现方式虽然实现起来稍微有点复杂,但性能要比第二种实现方式高一些啊。从性能的角度来说,选择第三种实现方式是不是更好些呢?
在回答这个问题之前我先解释一下为什么说第三种实现方式性能会更高一些。一般来说工具类的功能都比较通用和全面所以在代码实现上需要考虑和处理更多的细节执行效率就会有所影响。而第三种实现方式完全是自己操作底层字符只针对IP地址这一种格式的数据输入来做处理没有太多多余的函数调用和其他不必要的处理逻辑所以在执行效率上这种类似定制化的处理代码方式肯定比通用的工具类要高些。
不过尽管第三种实现方式性能更高些但我还是更倾向于选择第二种实现方法。那是因为第三种实现方式实际上是一种过度优化。除非isValidIpAddress()函数是影响系统性能的瓶颈代码,否则,这样优化的投入产出比并不高,增加了代码实现的难度、牺牲了代码的可读性,性能上的提升却并不明显。
## 代码逻辑复杂就违背KISS原则吗
刚刚我们提到并不是代码行数越少就越“简单”还要考虑逻辑复杂度、实现难度、代码的可读性等。那如果一段代码的逻辑复杂、实现难度大、可读性也不太好是不是就一定违背KISS原则呢在回答这个问题之前我们先来看下面这段代码
```
// KMP algorithm: a, b分别是主串和模式串n, m分别是主串和模式串的长度。
public static int kmp(char[] a, int n, char[] b, int m) {
int[] next = getNexts(b, m);
int j = 0;
for (int i = 0; i &lt; n; ++i) {
while (j &gt; 0 &amp;&amp; a[i] != b[j]) { // 一直找到a[i]和b[j]
j = next[j - 1] + 1;
}
if (a[i] == b[j]) {
++j;
}
if (j == m) { // 找到匹配模式串的了
return i - m + 1;
}
}
return -1;
}
// b表示模式串m表示模式串的长度
private static int[] getNexts(char[] b, int m) {
int[] next = new int[m];
next[0] = -1;
int k = -1;
for (int i = 1; i &lt; m; ++i) {
while (k != -1 &amp;&amp; b[k + 1] != b[i]) {
k = next[k];
}
if (b[k + 1] == b[i]) {
++k;
}
next[i] = k;
}
return next;
}
```
这段代码来自我的另一个专栏《数据结构与算法之美》中[KMP字符串匹配算法](https://time.geekbang.org/column/article/71845)的代码实现。这段代码完全符合我们刚提到的逻辑复杂、实现难度大、可读性差的特点但它并不违反KISS原则。为什么这么说呢
KMP算法以快速高效著称。当我们需要处理长文本字符串匹配问题几百MB大小文本内容的匹配或者字符串匹配是某个产品的核心功能比如Vim、Word等文本编辑器又或者字符串匹配算法是系统性能瓶颈的时候我们就应该选择尽可能高效的KMP算法。而KMP算法本身具有逻辑复杂、实现难度大、可读性差的特点。本身就复杂的问题用复杂的方法解决并不违背KISS原则。
不过平时的项目开发中涉及的字符串匹配问题大部分都是针对比较小的文本。在这种情况下直接调用编程语言提供的现成的字符串匹配函数就足够了。如果非得用KMP算法、BM算法来实现字符串匹配那就真的违背KISS原则了。也就是说同样的代码在某个业务场景下满足KISS原则换一个应用场景可能就不满足了。
## 如何写出满足KISS原则的代码
实际上,我们前面已经讲到了一些方法。这里我稍微总结一下。
- 不要使用同事可能不懂的技术来实现代码。比如前面例子中的正则表达式,还有一些编程语言中过于高级的语法等。
- 不要重复造轮子要善于使用已经有的工具类库。经验证明自己去实现这些类库出bug的概率会更高维护的成本也比较高。
- 不要过度优化。不要过度使用一些奇技淫巧比如位运算代替算术运算、复杂的条件语句代替if-else、使用一些过于底层的函数等来优化代码牺牲代码的可读性。
实际上代码是否足够简单是一个挺主观的评判。同样的代码有的人觉得简单有的人觉得不够简单。而往往自己编写的代码自己都会觉得够简单。所以评判代码是否简单还有一个很有效的间接方法那就是code review。如果在code review的时候同事对你的代码有很多疑问那就说明你的代码有可能不够“简单”需要优化啦。
这里我还想多说两句,我们在做开发的时候,一定不要过度设计,不要觉得简单的东西就没有技术含量。实际上,越是能用简单的方法解决复杂的问题,越能体现一个人的能力。
## YAGNI跟KISS说的是一回事吗
YAGNI原则的英文全称是You Aint Gonna Need It。直译就是你不会需要它。这条原则也算是万金油了。当用在软件开发中的时候它的意思是不要去设计当前用不到的功能不要去编写当前用不到的代码。实际上这条原则的核心思想就是不要做过度设计。
比如我们的系统暂时只用Redis存储配置信息以后可能会用到ZooKeeper。根据YAGNI原则在未用到ZooKeeper之前我们没必要提前编写这部分代码。当然这并不是说我们就不需要考虑代码的扩展性。我们还是要预留好扩展点等到需要的时候再去实现ZooKeeper存储配置信息这部分代码。
再比如我们不要在项目中提前引入不需要依赖的开发包。对于Java程序员来说我们经常使用Maven或者Gradle来管理依赖的类库library。我发现有些同事为了避免开发中library包缺失而频繁地修改Maven或者Gradle配置文件提前往项目里引入大量常用的library包。实际上这样的做法也是违背YAGNI原则的。
从刚刚的分析我们可以看出YAGNI原则跟KISS原则并非一回事儿。KISS原则讲的是“如何做”的问题尽量保持简单而YAGNI原则说的是“要不要做”的问题当前不需要的就不要做
## 重点回顾
好了,今天的内容到此就讲完了。我们现在来总结回顾一下,你需要掌握的重点内容。
KISS原则是保持代码可读和可维护的重要手段。KISS原则中的“简单”并不是以代码行数来考量的。代码行数越少并不代表代码越简单我们还要考虑逻辑复杂度、实现难度、代码的可读性等。而且本身就复杂的问题用复杂的方法解决并不违背KISS原则。除此之外同样的代码在某个业务场景下满足KISS原则换一个应用场景可能就不满足了。
对于如何写出满足KISS原则的代码我还总结了下面几条指导原则
- 不要使用同事可能不懂的技术来实现代码;
- 不要重复造轮子,要善于使用已经有的工具类库;
- 不要过度优化。
## 课堂讨论
你怎么看待在开发中重复造轮子这件事情?什么时候要重复造轮子?什么时候应该使用现成的工具类库、开源框架?
欢迎在留言区写下你的答案,和同学一起交流和分享。如果有收获,也欢迎你把这篇文章分享给你的朋友。

View File

@@ -0,0 +1,337 @@
<audio id="audio" title="21 | 理论七重复的代码就一定违背DRY吗如何提高代码的复用性" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/f8/d7/f82d26740eeba1788d48bd95f543cad7.mp3"></audio>
在上一节课中我们讲了KISS原则和YAGNI原则KISS原则可以说是人尽皆知。今天我们再学习一个你肯定听过的原则那就是DRY原则。它的英文描述为Dont Repeat Yourself。中文直译为不要重复自己。将它应用在编程中可以理解为不要写重复的代码。
你可能会觉得这条原则非常简单、非常容易应用。只要两段代码长得一样那就是违反DRY原则了。真的是这样吗答案是否定的。这是很多人对这条原则存在的误解。实际上重复的代码不一定违反DRY原则而且有些看似不重复的代码也有可能违反DRY原则。
听到这里你可能会有很多疑问。没关系今天我会结合具体的代码实例来把这个问题讲清楚纠正你对这个原则的错误认知。除此之外DRY原则与代码的复用性也有一些联系所以今天我还会讲一讲如何写出可复用性好的代码。
话不多说,让我们正式开始今天的学习吧!
## DRY原则Dont Repeat Yourself
DRY原则的定义非常简单我就不再过度解读。今天我们主要讲三种典型的代码重复情况它们分别是实现逻辑重复、功能语义重复和代码执行重复。这三种代码重复有的看似违反DRY实际上并不违反有的看似不违反实际上却违反了。
### 实现逻辑重复
我们先来看下面这样一段代码是否违反了DRY原则。如果违反了你觉得应该如何重构才能让它满足DRY原则如果没有违反那又是为什么呢
```
public class UserAuthenticator {
public void authenticate(String username, String password) {
if (!isValidUsername(username)) {
// ...throw InvalidUsernameException...
}
if (!isValidPassword(password)) {
// ...throw InvalidPasswordException...
}
//...省略其他代码...
}
private boolean isValidUsername(String username) {
// check not null, not empty
if (StringUtils.isBlank(username)) {
return false;
}
// check length: 4~64
int length = username.length();
if (length &lt; 4 || length &gt; 64) {
return false;
}
// contains only lowcase characters
if (!StringUtils.isAllLowerCase(username)) {
return false;
}
// contains only a~z,0~9,dot
for (int i = 0; i &lt; length; ++i) {
char c = username.charAt(i);
if (!(c &gt;= 'a' &amp;&amp; c &lt;= 'z') || (c &gt;= '0' &amp;&amp; c &lt;= '9') || c == '.') {
return false;
}
}
return true;
}
private boolean isValidPassword(String password) {
// check not null, not empty
if (StringUtils.isBlank(password)) {
return false;
}
// check length: 4~64
int length = password.length();
if (length &lt; 4 || length &gt; 64) {
return false;
}
// contains only lowcase characters
if (!StringUtils.isAllLowerCase(password)) {
return false;
}
// contains only a~z,0~9,dot
for (int i = 0; i &lt; length; ++i) {
char c = password.charAt(i);
if (!(c &gt;= 'a' &amp;&amp; c &lt;= 'z') || (c &gt;= '0' &amp;&amp; c &lt;= '9') || c == '.') {
return false;
}
}
return true;
}
}
```
代码很简单我就不做过多解释了。在代码中有两处非常明显的重复的代码片段isValidUserName()函数和isValidPassword()函数。重复的代码被敲了两遍或者简单copy-paste了一下看起来明显违反DRY原则。为了移除重复的代码我们对上面的代码做下重构将isValidUserName()函数和isValidPassword()函数合并为一个更通用的函数isValidUserNameOrPassword()。重构后的代码如下所示:
```
public class UserAuthenticatorV2 {
public void authenticate(String userName, String password) {
if (!isValidUsernameOrPassword(userName)) {
// ...throw InvalidUsernameException...
}
if (!isValidUsernameOrPassword(password)) {
// ...throw InvalidPasswordException...
}
}
private boolean isValidUsernameOrPassword(String usernameOrPassword) {
//省略实现逻辑
//跟原来的isValidUsername()或isValidPassword()的实现逻辑一样...
return true;
}
}
```
经过重构之后,代码行数减少了,也没有重复的代码了,是不是更好了呢?答案是否定的,这可能跟你预期的不一样,我来解释一下为什么。
单从名字上看我们就能发现合并之后的isValidUserNameOrPassword()函数负责两件事情验证用户名和验证密码违反了“单一职责原则”和“接口隔离原则”。实际上即便将两个函数合并成isValidUserNameOrPassword(),代码仍然存在问题。
因为isValidUserName()和isValidPassword()两个函数虽然从代码实现逻辑上看起来是重复的但是从语义上并不重复。所谓“语义不重复”指的是从功能上来看这两个函数干的是完全不重复的两件事情一个是校验用户名另一个是校验密码。尽管在目前的设计中两个校验逻辑是完全一样的但如果按照第二种写法将两个函数的合并那就会存在潜在的问题。在未来的某一天如果我们修改了密码的校验逻辑比如允许密码包含大写字符允许密码的长度为8到64个字符那这个时候isValidUserName()和isValidPassword()的实现逻辑就会不相同。我们就要把合并后的函数,重新拆成合并前的那两个函数。
尽管代码的实现逻辑是相同的但语义不同我们判定它并不违反DRY原则。对于包含重复代码的问题我们可以通过抽象成更细粒度函数的方式来解决。比如将校验只包含a~z、0~9、dot的逻辑封装成boolean onlyContains(String str, String charlist);函数。
### 功能语义重复
现在我们再来看另外一个例子。在同一个项目代码中有下面两个函数isValidIp()和checkIfIpValid()。尽管两个函数的命名不同实现逻辑不同但功能是相同的都是用来判定IP地址是否合法的。
之所以在同一个项目中会有两个功能相同的函数那是因为这两个函数是由两个不同的同事开发的其中一个同事在不知道已经有了isValidIp()的情况下自己又定义并实现了同样用来校验IP地址是否合法的checkIfIpValid()函数。
那在同一项目代码中存在如下两个函数是否违反DRY原则呢
```
public boolean isValidIp(String ipAddress) {
if (StringUtils.isBlank(ipAddress)) return false;
String regex = &quot;^(1\\d{2}|2[0-4]\\d|25[0-5]|[1-9]\\d|[1-9])\\.&quot;
+ &quot;(1\\d{2}|2[0-4]\\d|25[0-5]|[1-9]\\d|\\d)\\.&quot;
+ &quot;(1\\d{2}|2[0-4]\\d|25[0-5]|[1-9]\\d|\\d)\\.&quot;
+ &quot;(1\\d{2}|2[0-4]\\d|25[0-5]|[1-9]\\d|\\d)$&quot;;
return ipAddress.matches(regex);
}
public boolean checkIfIpValid(String ipAddress) {
if (StringUtils.isBlank(ipAddress)) return false;
String[] ipUnits = StringUtils.split(ipAddress, '.');
if (ipUnits.length != 4) {
return false;
}
for (int i = 0; i &lt; 4; ++i) {
int ipUnitIntValue;
try {
ipUnitIntValue = Integer.parseInt(ipUnits[i]);
} catch (NumberFormatException e) {
return false;
}
if (ipUnitIntValue &lt; 0 || ipUnitIntValue &gt; 255) {
return false;
}
if (i == 0 &amp;&amp; ipUnitIntValue == 0) {
return false;
}
}
return true;
}
```
这个例子跟上个例子正好相反。上一个例子是代码实现逻辑重复但语义不重复我们并不认为它违反了DRY原则。而在这个例子中尽管两段代码的实现逻辑不重复但语义重复也就是功能重复我们认为它违反了DRY原则。我们应该在项目中统一一种实现思路所有用到判断IP地址是否合法的地方都统一调用同一个函数。
假设我们不统一实现思路那有些地方调用了isValidIp()函数有些地方又调用了checkIfIpValid()函数,这就会导致代码看起来很奇怪,相当于给代码“埋坑”,给不熟悉这部分代码的同事增加了阅读的难度。同事有可能研究了半天,觉得功能是一样的,但又有点疑惑,觉得是不是有更高深的考量,才定义了两个功能类似的函数,最终发现居然是代码设计的问题。
除此之外如果哪天项目中IP地址是否合法的判定规则改变了比如255.255.255.255不再被判定为合法的了相应地我们对isValidIp()的实现逻辑做了相应的修改但却忘记了修改checkIfIpValid()函数。又或者我们压根就不知道还存在一个功能相同的checkIfIpValid()函数这样就会导致有些代码仍然使用老的IP地址判断逻辑导致出现一些莫名其妙的bug。
### 代码执行重复
前两个例子一个是实现逻辑重复一个是语义重复我们再来看第三个例子。其中UserService中login()函数用来校验用户登录是否成功。如果失败,就返回异常;如果成功,就返回用户信息。具体代码如下所示:
```
public class UserService {
private UserRepo userRepo;//通过依赖注入或者IOC框架注入
public User login(String email, String password) {
boolean existed = userRepo.checkIfUserExisted(email, password);
if (!existed) {
// ... throw AuthenticationFailureException...
}
User user = userRepo.getUserByEmail(email);
return user;
}
}
public class UserRepo {
public boolean checkIfUserExisted(String email, String password) {
if (!EmailValidation.validate(email)) {
// ... throw InvalidEmailException...
}
if (!PasswordValidation.validate(password)) {
// ... throw InvalidPasswordException...
}
//...query db to check if email&amp;password exists...
}
public User getUserByEmail(String email) {
if (!EmailValidation.validate(email)) {
// ... throw InvalidEmailException...
}
//...query db to get user by email...
}
}
```
上面这段代码既没有逻辑重复也没有语义重复但仍然违反了DRY原则。这是因为代码中存在“执行重复”。我们一块儿来看下到底哪些代码被重复执行了
重复执行最明显的一个地方就是在login()函数中email的校验逻辑被执行了两次。一次是在调用checkIfUserExisted()函数的时候另一次是调用getUserByEmail()函数的时候。这个问题解决起来比较简单我们只需要将校验逻辑从UserRepo中移除统一放到UserService中就可以了。
除此之外代码中还有一处比较隐蔽的执行重复不知道你发现了没有实际上login()函数并不需要调用checkIfUserExisted()函数只需要调用一次getUserByEmail()函数从数据库中获取到用户的email、password等信息然后跟用户输入的email、password信息做对比依次判断是否登录成功。
实际上这样的优化是很有必要的。因为checkIfUserExisted()函数和getUserByEmail()函数都需要查询数据库而数据库这类的I/O操作是比较耗时的。我们在写代码的时候应当尽量减少这类I/O操作。
按照刚刚的修改思路我们把代码重构一下移除“重复执行”的代码只校验一次email和password并且只查询一次数据库。重构之后的代码如下所示
```
public class UserService {
private UserRepo userRepo;//通过依赖注入或者IOC框架注入
public User login(String email, String password) {
if (!EmailValidation.validate(email)) {
// ... throw InvalidEmailException...
}
if (!PasswordValidation.validate(password)) {
// ... throw InvalidPasswordException...
}
User user = userRepo.getUserByEmail(email);
if (user == null || !password.equals(user.getPassword()) {
// ... throw AuthenticationFailureException...
}
return user;
}
}
public class UserRepo {
public boolean checkIfUserExisted(String email, String password) {
//...query db to check if email&amp;password exists
}
public User getUserByEmail(String email) {
//...query db to get user by email...
}
}
```
## 代码复用性Code Reusability
在专栏的最开始,我们有提到,代码的复用性是评判代码质量的一个非常重要的标准。当时只是点到为止,没有展开讲解,今天,我再带你深入地学习一下这个知识点。
### 什么是代码的复用性?
我们首先来区分三个概念代码复用性Code Reusability、代码复用Code Resue和DRY原则。
代码复用表示一种行为我们在开发新功能的时候尽量复用已经存在的代码。代码的可复用性表示一段代码可被复用的特性或能力我们在编写代码的时候让代码尽量可复用。DRY原则是一条原则不要写重复的代码。从定义描述上它们好像有点类似但深究起来三者的区别还是蛮大的。
**首先,“不重复”并不代表“可复用”。**在一个项目代码中可能不存在任何重复的代码但也并不表示里面有可复用的代码不重复和可复用完全是两个概念。所以从这个角度来说DRY原则跟代码的可复用性讲的是两回事。
**其次,“复用”和“可复用性”关注角度不同。**代码“可复用性”是从代码开发者的角度来讲的“复用”是从代码使用者的角度来讲的。比如A同事编写了一个UrlUtils类代码的“可复用性”很好。B同事在开发新功能的时候直接“复用”A同事编写的UrlUtils类。
尽管复用、可复用性、DRY原则这三者从理解上有所区别但实际上要达到的目的都是类似的都是为了减少代码量提高代码的可读性、可维护性。除此之外复用已经经过测试的老代码bug会比从零重新开发要少。
“复用”这个概念不仅可以指导细粒度的模块、类、函数的设计开发实际上一些框架、类库、组件等的产生也都是为了达到复用的目的。比如Spring框架、Google Guava类库、UI组件等等。
### 怎么提高代码复用性?
实际上我们前面已经讲到过很多提高代码可复用性的手段今天算是集中总结一下我总结了7条具体如下。
- 减少代码耦合
对于高度耦合的代码,当我们希望复用其中的一个功能,想把这个功能的代码抽取出来成为一个独立的模块、类或者函数的时候,往往会发现牵一发而动全身。移动一点代码,就要牵连到很多其他相关的代码。所以,高度耦合的代码会影响到代码的复用性,我们要尽量减少代码耦合。
- 满足单一职责原则
我们前面讲过,如果职责不够单一,模块、类设计得大而全,那依赖它的代码或者它依赖的代码就会比较多,进而增加了代码的耦合。根据上一点,也就会影响到代码的复用性。相反,越细粒度的代码,代码的通用性会越好,越容易被复用。
- 模块化
这里的“模块”,不单单指一组类构成的模块,还可以理解为单个类、函数。我们要善于将功能独立的代码,封装成模块。独立的模块就像一块一块的积木,更加容易复用,可以直接拿来搭建更加复杂的系统。
- 业务与非业务逻辑分离
越是跟业务无关的代码越是容易复用,越是针对特定业务的代码越难复用。所以,为了复用跟业务无关的代码,我们将业务和非业务逻辑代码分离,抽取成一些通用的框架、类库、组件等。
- 通用代码下沉
从分层的角度来看,越底层的代码越通用、会被越多的模块调用,越应该设计得足够可复用。一般情况下,在代码分层之后,为了避免交叉调用导致调用关系混乱,我们只允许上层代码调用下层代码及同层代码之间的调用,杜绝下层代码调用上层代码。所以,通用的代码我们尽量下沉到更下层。
- 继承、多态、抽象、封装
在讲面向对象特性的时候,我们讲到,利用继承,可以将公共的代码抽取到父类,子类复用父类的属性和方法。利用多态,我们可以动态地替换一段代码的部分逻辑,让这段代码可复用。除此之外,抽象和封装,从更加广义的层面、而非狭义的面向对象特性的层面来理解的话,越抽象、越不依赖具体的实现,越容易复用。代码封装成模块,隐藏可变的细节、暴露不变的接口,就越容易复用。
- 应用模板等设计模式
一些设计模式,也能提高代码的复用性。比如,模板模式利用了多态来实现,可以灵活地替换其中的部分代码,整个流程模板代码可复用。关于应用设计模式提高代码复用性这一部分,我们留在后面慢慢来讲解。
除了刚刚我们讲到的几点还有一些跟编程语言相关的特性也能提高代码的复用性比如泛型编程等。实际上除了上面讲到的这些方法之外复用意识也非常重要。在写代码的时候我们要多去思考一下这个部分代码是否可以抽取出来作为一个独立的模块、类或者函数供多处使用。在设计每个模块、类、函数的时候要像设计一个外部API那样去思考它的复用性。
### 辩证思考和灵活应用
实际上,编写可复用的代码并不简单。如果我们在编写代码的时候,已经有复用的需求场景,那根据复用的需求去开发可复用的代码,可能还不算难。但是,如果当下并没有复用的需求,我们只是希望现在编写的代码具有可复用的特点,能在未来某个同事开发某个新功能的时候复用得上。在这种没有具体复用需求的情况下,我们就需要去预测将来代码会如何复用,这就比较有挑战了。
实际上除非有非常明确的复用需求否则为了暂时用不到的复用需求花费太多的时间、精力投入太多的开发成本并不是一个值得推荐的做法。这也违反我们之前讲到的YAGNI原则。
除此之外有一个著名的原则叫作“Rule of Three”。这条原则可以用在很多行业和场景中你可以自己去研究一下。如果把这个原则用在这里那就是说我们在第一次写代码的时候如果当下没有复用的需求而未来的复用需求也不是特别明确并且开发可复用代码的成本比较高那我们就不需要考虑代码的复用性。在之后我们开发新的功能的时候发现可以复用之前写的这段代码那我们就重构这段代码让其变得更加可复用。
也就是说第一次编写代码的时候我们不考虑复用性第二次遇到复用场景的时候再进行重构使其复用。需要注意的是“Rule of Three”中的“Three”并不是真的就指确切的“三”这里就是指“二”。
## 重点回顾
今天的内容到此就讲完了。我们一块来回顾一下,你需要重点掌握的内容。
**1.DRY原则**
我们今天讲了三种代码重复的情况实现逻辑重复、功能语义重复、代码执行重复。实现逻辑重复但功能语义不重复的代码并不违反DRY原则。实现逻辑不重复但功能语义重复的代码也算是违反DRY原则。除此之外代码执行重复也算是违反DRY原则。
**2.代码复用性**
今天我们讲到提高代码可复用性的一些方法有以下7点。
- 减少代码耦合
- 满足单一职责原则
- 模块化
- 业务与非业务逻辑分离
- 通用代码下沉
- 继承、多态、抽象、封装
- 应用模板等设计模式
实际上除了上面讲到的这些方法之外复用意识也非常重要。在设计每个模块、类、函数的时候要像设计一个外部API一样去思考它的复用性。
我们在第一次写代码的时候,如果当下没有复用的需求,而未来的复用需求也不是特别明确,并且开发可复用代码的成本比较高,那我们就不需要考虑代码的复用性。在之后开发新的功能的时候,发现可以复用之前写的这段代码,那我们就重构这段代码,让其变得更加可复用。
相比于代码的可复用性DRY原则适用性更强一些。我们可以不写可复用的代码但一定不能写重复的代码。
## 课堂讨论
除了实现逻辑重复、功能语义重复、代码执行重复你还知道有哪些其他类型的代码重复这些代码重复是否违反DRY原则
欢迎在留言区写下你的想法,和同学一起交流和分享。如果有收获,也欢迎你把这篇文章分享给你的朋友。

View File

@@ -0,0 +1,305 @@
<audio id="audio" title="22 | 理论八如何用迪米特法则LOD实现“高内聚、松耦合”" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/94/56/9426fcabe93b8897f5baa5cd4a49e956.mp3"></audio>
今天我们讲最后一个设计原则迪米特法则。尽管它不像SOLID、KISS、DRY原则那样人尽皆知但它却非常实用。利用这个原则能够帮我们实现代码的“高内聚、松耦合”。今天我们就围绕下面几个问题并结合两个代码实战案例来深入地学习这个法则。
- 什么是“高内聚、松耦合”?
- 如何利用迪米特法则来实现“高内聚、松耦合”?
- 有哪些代码设计是明显违背迪米特法则的?对此又该如何重构?
话不多说,让我们开始今天的学习吧!
## 何为“高内聚、松耦合”?
“高内聚、松耦合”是一个非常重要的设计思想,能够有效地提高代码的可读性和可维护性,缩小功能改动导致的代码改动范围。实际上,在前面的章节中,我们已经多次提到过这个设计思想。很多设计原则都以实现代码的“高内聚、松耦合”为目的,比如单一职责原则、基于接口而非实现编程等。
实际上,“高内聚、松耦合”是一个比较通用的设计思想,可以用来指导不同粒度代码的设计与开发,比如系统、模块、类,甚至是函数,也可以应用到不同的开发场景中,比如微服务、框架、组件、类库等。为了方便我讲解,接下来我以“类”作为这个设计思想的应用对象来展开讲解,其他应用场景你可以自行类比。
在这个设计思想中,“高内聚”用来指导类本身的设计,“松耦合”用来指导类与类之间依赖关系的设计。不过,这两者并非完全独立不相干。高内聚有助于松耦合,松耦合又需要高内聚的支持。
**那到底什么是“高内聚”呢?**
所谓高内聚,就是指相近的功能应该放到同一个类中,不相近的功能不要放到同一个类中。相近的功能往往会被同时修改,放到同一个类中,修改会比较集中,代码容易维护。实际上,我们前面讲过的单一职责原则是实现代码高内聚非常有效的设计原则。对于这一点,你可以回过头再去看下专栏的[第15讲](https://time.geekbang.org/column/article/171771?utm_source=PC&amp;utm_medium=geektime&amp;utm_term=pc_interstitial_5)。
**我们再来看一下,什么是“松耦合”?**
所谓松耦合是说,在代码中,类与类之间的依赖关系简单清晰。即使两个类有依赖关系,一个类的代码改动不会或者很少导致依赖类的代码改动。实际上,我们前面讲的依赖注入、接口隔离、基于接口而非实现编程,以及今天讲的迪米特法则,都是为了实现代码的松耦合。
**最后,我们来看一下,“内聚”和“耦合”之间的关系。**
前面也提到,“高内聚”有助于“松耦合”,同理,“低内聚”也会导致“紧耦合”。关于这一点,我画了一张对比图来解释。图中左边部分的代码结构是“高内聚、松耦合”;右边部分正好相反,是“低内聚、紧耦合”。
<img src="https://static001.geekbang.org/resource/image/62/3c/62275095f1f5817cad8a9ca129a6ec3c.jpg" alt="">
图中左边部分的代码设计中,类的粒度比较小,每个类的职责都比较单一。相近的功能都放到了一个类中,不相近的功能被分割到了多个类中。这样类更加独立,代码的内聚性更好。因为职责单一,所以每个类被依赖的类就会比较少,代码低耦合。一个类的修改,只会影响到一个依赖类的代码改动。我们只需要测试这一个依赖类是否还能正常工作就行了。
图中右边部分的代码设计中,类粒度比较大,低内聚,功能大而全,不相近的功能放到了一个类中。这就导致很多其他类都依赖这个类。当我们修改这个类的某一个功能代码的时候,会影响依赖它的多个类。我们需要测试这三个依赖类,是否还能正常工作。这也就是所谓的“牵一发而动全身”。
除此之外,从图中我们也可以看出,高内聚、低耦合的代码结构更加简单、清晰,相应地,在可维护性和可读性上确实要好很多。
## “迪米特法则”理论描述
迪米特法则的英文翻译是Law of Demeter缩写是LOD。单从这个名字上来看我们完全猜不出这个原则讲的是什么。不过它还有另外一个更加达意的名字叫作最小知识原则英文翻译为The Least Knowledge Principle。
关于这个设计原则,我们先来看一下它最原汁原味的英文定义:
>
Each unit should have only limited knowledge about other units: only units “closely” related to the current unit. Or: Each unit should only talk to its friends; Dont talk to strangers.
我们把它直译成中文,就是下面这个样子:
>
每个模块unit只应该了解那些与它关系密切的模块units: only units “closely” related to the current unit的有限知识knowledge。或者说每个模块只和自己的朋友“说话”talk不和陌生人“说话”talk
我们之前讲过,大部分设计原则和思想都非常抽象,有各种各样的解读,要想灵活地应用到实际的开发中,需要有实战经验的积累。迪米特法则也不例外。所以,我结合我自己的理解和经验,对刚刚的定义重新描述一下。注意,为了统一讲解,我把定义描述中的“模块”替换成了“类”。
>
不该有直接依赖关系的类之间,不要有依赖;有依赖关系的类之间,尽量只依赖必要的接口(也就是定义中的“有限知识”)。
从上面的描述中,我们可以看出,迪米特法则包含前后两部分,这两部分讲的是两件事情,我用两个实战案例分别来解读一下。
## 理论解读与代码实战一
我们先来看这条原则中的前半部分,**“不该有直接依赖关系的类之间,不要有依赖”。**我举个例子解释一下。
这个例子实现了简化版的搜索引擎爬取网页的功能。代码中包含三个主要的类。其中NetworkTransporter类负责底层网络通信根据请求获取数据HtmlDownloader类用来通过URL获取网页Document表示网页文档后续的网页内容抽取、分词、索引都是以此为处理对象。具体的代码实现如下所示
```
public class NetworkTransporter {
// 省略属性和其他方法...
public Byte[] send(HtmlRequest htmlRequest) {
//...
}
}
public class HtmlDownloader {
private NetworkTransporter transporter;//通过构造函数或IOC注入
public Html downloadHtml(String url) {
Byte[] rawHtml = transporter.send(new HtmlRequest(url));
return new Html(rawHtml);
}
}
public class Document {
private Html html;
private String url;
public Document(String url) {
this.url = url;
HtmlDownloader downloader = new HtmlDownloader();
this.html = downloader.downloadHtml(url);
}
//...
}
```
这段代码虽然“能用”,能实现我们想要的功能,但是它不够“好用”,有比较多的设计缺陷。你可以先试着思考一下,看看都有哪些缺陷,然后再来看我下面的讲解。
**首先我们来看NetworkTransporter类。**作为一个底层网络通信类我们希望它的功能尽可能通用而不只是服务于下载HTML所以我们不应该直接依赖太具体的发送对象HtmlRequest。从这一点上讲NetworkTransporter类的设计违背迪米特法则依赖了不该有直接依赖关系的HtmlRequest类。
我们应该如何进行重构让NetworkTransporter类满足迪米特法则呢我这里有个形象的比喻。假如你现在要去商店买东西你肯定不会直接把钱包给收银员让收银员自己从里面拿钱而是你从钱包里把钱拿出来交给收银员。这里的HtmlRequest对象就相当于钱包HtmlRequest里的address和content对象就相当于钱。我们应该把address和content交给NetworkTransporter而非是直接把HtmlRequest交给NetworkTransporter。根据这个思路NetworkTransporter重构之后的代码如下所示
```
public class NetworkTransporter {
// 省略属性和其他方法...
public Byte[] send(String address, Byte[] data) {
//...
}
}
```
**我们再来看HtmlDownloader类。**这个类的设计没有问题。不过我们修改了NetworkTransporter的send()函数的定义而这个类用到了send()函数,所以我们需要对它做相应的修改,修改后的代码如下所示:
```
public class HtmlDownloader {
private NetworkTransporter transporter;//通过构造函数或IOC注入
// HtmlDownloader这里也要有相应的修改
public Html downloadHtml(String url) {
HtmlRequest htmlRequest = new HtmlRequest(url);
Byte[] rawHtml = transporter.send(
htmlRequest.getAddress(), htmlRequest.getContent().getBytes());
return new Html(rawHtml);
}
}
```
**最后我们来看下Document类。**这个类的问题比较多主要有三点。第一构造函数中的downloader.downloadHtml()逻辑复杂耗时长不应该放到构造函数中会影响代码的可测试性。代码的可测试性我们后面会讲到这里你先知道有这回事就可以了。第二HtmlDownloader对象在构造函数中通过new来创建违反了基于接口而非实现编程的设计思想也会影响到代码的可测试性。第三从业务含义上来讲Document网页文档没必要依赖HtmlDownloader类违背了迪米特法则。
虽然Document类的问题很多但修改起来比较简单只要一处改动就可以解决所有问题。修改之后的代码如下所示
```
public class Document {
private Html html;
private String url;
public Document(String url, Html html) {
this.html = html;
this.url = url;
}
//...
}
// 通过一个工厂方法来创建Document
public class DocumentFactory {
private HtmlDownloader downloader;
public DocumentFactory(HtmlDownloader downloader) {
this.downloader = downloader;
}
public Document createDocument(String url) {
Html html = downloader.downloadHtml(url);
return new Document(url, html);
}
}
```
## 理论解读与代码实战二
现在我们再来看一下这条原则中的后半部分“有依赖关系的类之间尽量只依赖必要的接口”。我们还是结合一个例子来讲解。下面这段代码非常简单Serialization类负责对象的序列化和反序列化。提醒你一下有个类似的例子在之前的第15节课中讲过你可以结合着一块儿看一下。
```
public class Serialization {
public String serialize(Object object) {
String serializedResult = ...;
//...
return serializedResult;
}
public Object deserialize(String str) {
Object deserializedResult = ...;
//...
return deserializedResult;
}
}
```
单看这个类的设计,没有一点问题。不过,如果我们把它放到一定的应用场景里,那就还有继续优化的空间。假设在我们的项目中,有些类只用到了序列化操作,而另一些类只用到反序列化操作。那基于迪米特法则后半部分“有依赖关系的类之间,尽量只依赖必要的接口”,只用到序列化操作的那部分类不应该依赖反序列化接口。同理,只用到反序列化操作的那部分类不应该依赖序列化接口。
根据这个思路我们应该将Serialization类拆分为两个更小粒度的类一个只负责序列化Serializer类一个只负责反序列化Deserializer类。拆分之后使用序列化操作的类只需要依赖Serializer类使用反序列化操作的类只需要依赖Deserializer类。拆分之后的代码如下所示
```
public class Serializer {
public String serialize(Object object) {
String serializedResult = ...;
...
return serializedResult;
}
}
public class Deserializer {
public Object deserialize(String str) {
Object deserializedResult = ...;
...
return deserializedResult;
}
}
```
不知道你有没有看出来尽管拆分之后的代码更能满足迪米特法则但却违背了高内聚的设计思想。高内聚要求相近的功能要放到同一个类中这样可以方便功能修改的时候修改的地方不至于过于分散。对于刚刚这个例子来说如果我们修改了序列化的实现方式比如从JSON换成了XML那反序列化的实现逻辑也需要一并修改。在未拆分的情况下我们只需要修改一个类即可。在拆分之后我们需要修改两个类。显然这种设计思路的代码改动范围变大了。
如果我们既不想违背高内聚的设计思想,也不想违背迪米特法则,那我们该如何解决这个问题呢?实际上,通过引入两个接口就能轻松解决这个问题,具体的代码如下所示。实际上,我们在[第18节课](https://time.geekbang.org/column/article/177442)中讲到“接口隔离原则”的时候,第三个例子就使用了类似的实现思路,你可以结合着一块儿来看。
```
public interface Serializable {
String serialize(Object object);
}
public interface Deserializable {
Object deserialize(String text);
}
public class Serialization implements Serializable, Deserializable {
@Override
public String serialize(Object object) {
String serializedResult = ...;
...
return serializedResult;
}
@Override
public Object deserialize(String str) {
Object deserializedResult = ...;
...
return deserializedResult;
}
}
public class DemoClass_1 {
private Serializable serializer;
public Demo(Serializable serializer) {
this.serializer = serializer;
}
//...
}
public class DemoClass_2 {
private Deserializable deserializer;
public Demo(Deserializable deserializer) {
this.deserializer = deserializer;
}
//...
}
```
尽管我们还是要往DemoClass_1的构造函数中传入包含序列化和反序列化的Serialization实现类但是我们依赖的Serializable接口只包含序列化操作DemoClass_1无法使用Serialization类中的反序列化接口对反序列化操作无感知这也就符合了迪米特法则后半部分所说的“依赖有限接口”的要求。
实际上,上面的的代码实现思路,也体现了“基于接口而非实现编程”的设计原则,结合迪米特法则,我们可以总结出一条新的设计原则,那就是“基于最小接口而非最大实现编程”。有些同学之前问,新的设计模式和设计原则是怎么创造出来的,实际上,就是在大量的实践中,针对开发痛点总结归纳出来的套路。
## 辩证思考与灵活应用
对于实战二最终的设计思路,你有没有什么不同的观点呢?
整个类只包含序列化和反序列化两个操作,只用到序列化操作的使用者,即便能够感知到仅有的一个反序列化函数,问题也不大。那为了满足迪米特法则,我们将一个非常简单的类,拆分出两个接口,是否有点过度设计的意思呢?
设计原则本身没有对错,只有能否用对之说。不要为了应用设计原则而应用设计原则,我们在应用设计原则的时候,一定要具体问题具体分析。
对于刚刚这个Serialization类来说只包含两个操作确实没有太大必要拆分成两个接口。但是如果我们对Serialization类添加更多的功能实现更多更好用的序列化、反序列化函数我们来重新考虑一下这个问题。修改之后的具体的代码如下
```
public class Serializer { // 参看JSON的接口定义
public String serialize(Object object) { //... }
public String serializeMap(Map map) { //... }
public String serializeList(List list) { //... }
public Object deserialize(String objectString) { //... }
public Map deserializeMap(String mapString) { //... }
public List deserializeList(String listString) { //... }
}
```
在这种场景下第二种设计思路要更好些。因为基于之前的应用场景来说大部分代码只需要用到序列化的功能。对于这部分使用者没必要了解反序列化的“知识”而修改之后的Serialization类反序列化的“知识”从一个函数变成了三个。一旦任一反序列化操作有代码改动我们都需要检查、测试所有依赖Serialization类的代码是否还能正常工作。为了减少耦合和测试工作量我们应该按照迪米特法则将反序列化和序列化的功能隔离开来。
## 重点回顾
好了,今天的内容到此就讲完了。我们一块来总结回顾一下,你需要掌握的重点内容。
**1.如何理解“高内聚、松耦合”?**
“高内聚、松耦合”是一个非常重要的设计思想,能够有效提高代码的可读性和可维护性,缩小功能改动导致的代码改动范围。“高内聚”用来指导类本身的设计,“松耦合”用来指导类与类之间依赖关系的设计。
所谓高内聚,就是指相近的功能应该放到同一个类中,不相近的功能不要放到同一类中。相近的功能往往会被同时修改,放到同一个类中,修改会比较集中。所谓松耦合指的是,在代码中,类与类之间的依赖关系简单清晰。即使两个类有依赖关系,一个类的代码改动也不会或者很少导致依赖类的代码改动。
**2.如何理解“迪米特法则”?**
不该有直接依赖关系的类之间,不要有依赖;有依赖关系的类之间,尽量只依赖必要的接口。迪米特法则是希望减少类之间的耦合,让类越独立越好。每个类都应该少了解系统的其他部分。一旦发生变化,需要了解这一变化的类就会比较少。
## 课堂讨论
在今天的讲解中,我们提到了“高内聚、松耦合”“单一职责原则”“接口隔离原则”“基于接口而非实现编程”“迪米特法则”,你能总结一下它们之间的区别和联系吗?
欢迎在留言区写下你的答案,和同学一起交流和分享。如果有收获,也欢迎你把这篇文章分享给你的朋友。

View File

@@ -0,0 +1,106 @@
<audio id="audio" title="23 | 实战一(上):针对业务系统的开发,如何做需求分析和设计?" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/b7/70/b72cc9711db2e7335e9159bd420f5f70.mp3"></audio>
对于一个工程师来说如果要追求长远发展你就不能一直只把自己放在执行者的角色不能只是一个代码实现者你还要有独立负责一个系统的能力能端到端end to end开发一个完整的系统。这其中的工作就包括前期的需求沟通分析、中期的代码设计实现、后期的系统上线维护等。
前面我们还提到过大部分工程师都是做业务开发的。很多工程师都觉得做业务开发没啥技术含量没有成长就是简单的CRUD翻译业务逻辑根本用不上专栏中讲的设计原则、思想、模式。
所以,针对这两个普遍的现象,今天,我通过一个积分兑换系统的开发实战,一方面给你展示一个业务系统从需求分析到上线维护的整个开发套路,让你能举一反三地应用到所有其他系统的开发中,另一方面也给你展示在看似没有技术含量的业务开发中,实际上都蕴含了哪些设计原则、思想、模式。
话不多说,让我们正式开始今天的学习吧!
## 需求分析
积分是一种常见的营销手段很多产品都会通过它来促进消费、增加用户粘性比如淘宝积分、信用卡积分、商场消费积分等等。假设你是一家类似淘宝这样的电商平台的工程师平台暂时还没有积分系统。Leader希望由你来负责开发这样一个系统你会如何来做呢
你可能会说只要产品经理给我产品设计文档PRD、线框图我照着实现就可以了。我觉得这种想法有点狭隘。我认为技术人员应该更多地参与到产品设计中。在Google工作的时候我很明显能感受到Google工程师跟其他公司工程师有一个很大区别那就是大部分人都具备产品思维并不是完全的“技术控”。所以Google很多产品的初期设计都是工程师来完成的在产品发展壮大到一定程度的时候才会引入产品经理的角色。
那你可能要问了,作为技术人,我该怎么做产品设计呢?首先,一定不要自己一个人闷头想。一方面,这样做很难想全面。另一方面,从零开始设计也比较浪费时间。所以,我们要学会“借鉴”。爱因斯坦说过,“创造的一大秘诀是要懂得如何隐藏你的来源”。你看大师都含蓄地表达了“借鉴”的重要性,我们也没有必要因为“借鉴”而感到不好意思了。
我们可以找几个类似的产品,比如淘宝,看看它们是如何设计积分系统的,然后借鉴到我们的产品中。你可以自己亲自用用淘宝,看看积分是怎么使用的,也可以直接百度一下“淘宝积分规则”。基于这两个输入,我们基本上就大致能摸清楚积分系统该如何设计了。除此之外,我们还要充分了解自己公司的产品,将借鉴来的东西糅合在我们自己的产品中,并做适当的微创新。
笼统地来讲,积分系统无外乎就两个大的功能点,一个是赚取积分,另一个是消费积分。赚取积分功能包括积分赚取渠道,比如下订单、每日签到、评论等;还包括积分兑换规则,比如订单金额与积分的兑换比例,每日签到赠送多少积分等。消费积分功能包括积分消费渠道,比如抵扣订单金额、兑换优惠券、积分换购、参与活动扣积分等;还包括积分兑换规则,比如多少积分可以换算成抵扣订单的多少金额,一张优惠券需要多少积分来兑换等等。
我刚刚给出的只是非常笼统、粗糙的功能需求。在实际情况中,肯定还有一些业务细节需要考虑,比如积分的有效期问题。对于这些业务细节,还是那句话,闷头拍脑袋想是想不全面的。以防遗漏,我们还是要有方法可寻。那除了刚刚讲的“借鉴”的思路之外,我还喜欢通过产品的**线框图**、**用户用例**user case 或者叫用户故事user story来细化业务流程挖掘一些比较细节的、不容易想到的功能点。
线框图对你来说应该不陌生,我就不赘述了,我这里重点说一下用户用例。用户用例有点儿类似我们后面要讲的单元测试用例。它侧重情景化,其实就是模拟用户如何使用我们的产品,描述用户在一个特定的应用场景里的一个完整的业务操作流程。所以,它包含更多的细节,且更加容易被人理解。比如,有关积分有效期的用户用例,我们可以进行如下的设计:
- 用户在获取积分的时候,会告知积分的有效期;
- 用户在使用积分的时候,会优先使用快过期的积分;
- 用户在查询积分明细的时候,会显示积分的有效期和状态(是否过期);
- 用户在查询总可用积分的时候,会排除掉过期的积分。
通过上面讲的方法,我们就可以将功能需求大致弄清楚了。积分系统的需求实际上并不复杂,我总结罗列了一下,如下所示。
### 1.积分赚取和兑换规则
积分的赚取渠道包括:下订单、每日签到、评论等。
积分兑换规则可以是比较通用的。比如签到送10积分。再比如按照订单总金额的10%兑换成积分也就是100块钱的订单可以积累10积分。除此之外积分兑换规则也可以是比较细化的。比如不同的店铺、不同的商品可以设置不同的积分兑换比例。
对于积分的有效期,我们可以根据不同渠道,设置不同的有效期。积分到期之后会作废;在消费积分的时候,优先使用快到期的积分。
### 2.积分消费和兑换规则
积分的消费渠道包括:抵扣订单金额、兑换优惠券、积分换购、参与活动扣积分等。
我们可以根据不同的消费渠道设置不同的积分兑换规则。比如积分换算成消费抵扣金额的比例是10%也就是10积分可以抵扣1块钱100积分可以兑换15块钱的优惠券等。
### 3.积分及其明细查询
查询用户的总积分,以及赚取积分和消费积分的历史记录。
## 系统设计
面向对象设计聚焦在代码层面(主要是针对类),那系统设计就是聚焦在架构层面(主要是针对模块),两者有很多相似之处。很多设计原则和思想不仅仅可以应用到代码设计中,还能用到架构设计中。还记得面向对象设计的四个步骤吗?实际上,我们也可以借鉴那个过程来做系统设计。
### 1.合理地将功能划分到不同模块
前面讲到面向对象设计的时候,我们提到,面向对象设计的本质就是把合适的代码放到合适的类中。合理地划分代码可以实现代码的高内聚、低耦合,类与类之间的交互简单清晰,代码整体结构一目了然,那代码的质量就不会差到哪里去。类比面向对象设计,系统设计实际上就是将合适的功能放到合适的模块中。合理地划分模块也可以做到模块层面的高内聚、低耦合,架构整洁清晰。
对于前面罗列的所有功能点,我们有下面三种模块划分方法。
第一种划分方式是:积分赚取渠道及兑换规则、消费渠道及兑换规则的管理和维护(增删改查),不划分到积分系统中,而是放到更上层的营销系统中。这样积分系统就会变得非常简单,只需要负责增加积分、减少积分、查询积分、查询积分明细等这几个工作。
我举个例子解释一下。比如,用户通过下订单赚取积分。订单系统通过异步发送消息或者同步调用接口的方式,告知营销系统订单交易成功。营销系统根据拿到的订单信息,查询订单对应的积分兑换规则(兑换比例、有效期等),计算得到订单可兑换的积分数量,然后调用积分系统的接口给用户增加积分。
第二种划分方式是:积分赚取渠道及兑换规则、消费渠道及兑换规则的管理和维护,分散在各个相关业务系统中,比如订单系统、评论系统、签到系统、换购商城、优惠券系统等。还是刚刚那个下订单赚取积分的例子,在这种情况下,用户下订单成功之后,订单系统根据商品对应的积分兑换比例,计算所能兑换的积分数量,然后直接调用积分系统给用户增加积分。
第三种划分方式是:所有的功能都划分到积分系统中,包括积分赚取渠道及兑换规则、消费渠道及兑换规则的管理和维护。还是同样的例子,用户下订单成功之后,订单系统直接告知积分系统订单交易成功,积分系统根据订单信息查询积分兑换规则,给用户增加积分。
怎么判断哪种模块划分合理呢?实际上,我们可以反过来通过看它是否符合高内聚、低耦合特性来判断。如果一个功能的修改或添加,经常要跨团队、跨项目、跨系统才能完成,那说明模块划分的不够合理,职责不够清晰,耦合过于严重。
除此之外,为了避免业务知识的耦合,让下层系统更加通用,一般来讲,我们不希望下层系统(也就是被调用的系统)包含太多上层系统(也就是调用系统)的业务信息,但是,可以接受上层系统包含下层系统的业务信息。比如,订单系统、优惠券系统、换购商城等作为调用积分系统的上层系统,可以包含一些积分相关的业务信息。但是,反过来,积分系统中最好不要包含太多跟订单、优惠券、换购等相关的信息。
所以,综合考虑,我们更倾向于第一种和第二种模块划分方式。但是,不管选择这两种中的哪一种,积分系统所负责的工作是一样的,只包含积分的增、减、查询,以及积分明细的记录和查询。
### 2.设计模块与模块之间的交互关系
在面向对象设计中,类设计好之后,我们需要设计类之间的交互关系。类比到系统设计,系统职责划分好之后,接下来就是设计系统之间的交互,也就是确定有哪些系统跟积分系统之间有交互以及如何进行交互。
比较常见的系统之间的交互方式有两种,一种是同步接口调用,另一种是利用消息中间件异步调用。第一种方式简单直接,第二种方式的解耦效果更好。
比如,用户下订单成功之后,订单系统推送一条消息到消息中间件,营销系统订阅订单成功消息,触发执行相应的积分兑换逻辑。这样订单系统就跟营销系统完全解耦,订单系统不需要知道任何跟积分相关的逻辑,而营销系统也不需要直接跟订单系统交互。
除此之外,上下层系统之间的调用倾向于通过同步接口,同层之间的调用倾向于异步消息调用。比如,营销系统和积分系统是上下层关系,它们之间就比较推荐使用同步接口调用。
### 3.设计模块的接口、数据库、业务模型
刚刚讲了模块的功能划分,模块之间的交互的设计,现在,我们再来看,模块本身如何来设计。实际上,业务系统本身的设计无外乎有这样三方面的工作要做:接口设计、数据库设计和业务模型设计。这部分的具体内容我们放到下一下节课中跟实现一块进行讲解。
## 重点回顾
今天的内容到此就讲完了。我们来一块总结回顾一下,你需要掌握的重点内容。
技术人也要有一些产品思维。对于产品设计、需求分析,我们要学会“借鉴”,一定不要自己闷头想。一方面这样做很难想全面,另一方面从零开始设计也比较浪费时间。除此之外,我们还可以通过线框图和用户用例来细化业务流程,挖掘一些比较细节的、不容易想到的功能点。
面向对象设计聚焦在代码层面(主要是针对类),那系统设计就是聚焦在架构层面(主要是针对模块),两者有很多相似之处。很多设计原则和思想不仅仅可以应用到代码设计中,还能用到架构设计中。实际上,我们可以借鉴面向对象设计的步骤,来做系统设计。
面向对象设计的本质就是把合适的代码放到合适的类中。合理地划分代码可以实现代码的高内聚、低耦合,类与类之间的交互简单清晰,代码整体结构一目了然。类比面向对象设计,系统设计实际上就是将合适的功能放到合适的模块中。合理地划分模块也可以做到模块层面的高内聚、低耦合,架构整洁清晰。在面向对象设计中,类设计好之后,我们需要设计类之间的交互关系。类比到系统设计,系统职责划分好之后,接下来就是设计系统之间的交互了。
## 课堂讨论
对公司业务及已有系统的熟悉程度,有时候甚至会超过个人的技术能力,更能决定一个人在公司内部的发展前途。但是,当我们出去面试的时候,面试官大部分情况下更加关注你的技术能力,而非特定的业务细节,特别是你做的业务并不是太复杂,或者跟要面试岗位无关的时候。
这两者听起来比较矛盾。作为一名技术人,为了谋求更好的发展,你觉得是应该多花点时间研究业务呢,还是要多花点心思在技术上呢?
欢迎在留言区写下你的答案,和同学一起交流和分享。如果有收获,也欢迎你把这篇文章分享给你的朋友。

View File

@@ -0,0 +1,144 @@
<audio id="audio" title="24 | 实战一(下):如何实现一个遵从设计原则的积分兑换系统?" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/31/54/31f960de9cb8683574b81a624da57354.mp3"></audio>
上一节课中,我们讲了积分系统的需求分析和系统设计。今天,我们来讲它的代码实现。
上一节课中,我们把积分赚取和消费的渠道和规则的管理维护工作,划分到了上层系统中,所以,积分系统的功能变得非常简单。相应地,代码实现也比较简单。如果你有一定的项目开发经验,那实现这样一个系统,对你来说并不是件难事。
所以我们今天讲解的重点并不是教你如何来实现积分系统的每个功能、每个接口更不是教你如何编写SQL语句来增删改查数据而是给你展示一些更普适的开发思想。比如为什么要分MVC三层来开发为什么要针对每层定义不同的数据对象最后我还会总结这其中都蕴含哪些设计原则和思想让你知其然知其所以然做到真正地透彻理解。
话不多说,让我们正式开始今天的学习吧!
## 业务开发包括哪些工作?
实际上,我们平时做业务系统的设计与开发,无外乎有这样三方面的工作要做:接口设计、数据库设计和业务模型设计(也就是业务逻辑)。
数据库和接口的设计非常重要,一旦设计好并投入使用之后,这两部分都不能轻易改动。改动数据库表结构,需要涉及数据的迁移和适配;改动接口,需要推动接口的使用者作相应的代码修改。这两种情况,即便是微小的改动,执行起来都会非常麻烦。因此,我们在设计接口和数据库的时候,一定要多花点心思和时间,切不可过于随意。相反,业务逻辑代码侧重内部实现,不涉及被外部依赖的接口,也不包含持久化的数据,所以对改动的容忍性更大。
**针对积分系统,我们先来看,如何设计数据库。**
数据库的设计比较简单。实际上,我们只需要一张记录积分流水明细的表就可以了。表中记录积分的赚取和消费流水。用户积分的各种统计数据,比如总积分、总可用积分等,都可以通过这张表来计算得到。
<img src="https://static001.geekbang.org/resource/image/e9/c4/e9562c46bcb8fc45634f0d870c4778c4.jpg" alt="">
**接下来,我们再来看,如何设计积分系统的接口。**
接口设计要符合单一职责原则粒度越小通用性就越好。但是接口粒度太小也会带来一些问题。比如一个功能的实现要调用多个小接口一方面如果接口调用走网络特别是公网多次远程接口调用会影响性能另一方面本该在一个接口中完成的原子操作现在分拆成多个小接口来完成就可能会涉及分布式事务的数据一致性问题一个接口执行成功了但另一个接口执行失败了。所以为了兼顾易用性和性能我们可以借鉴facade外观设计模式在职责单一的细粒度接口之上再封装一层粗粒度的接口给外部使用。
对于积分系统来说,我们需要设计如下这样几个接口。
<img src="https://static001.geekbang.org/resource/image/7b/af/7b9008f6bc107add2b21d3dba901deaf.jpg" alt="">
**最后,我们来看业务模型的设计。**
前面我们讲到从代码实现角度来说大部分业务系统的开发都可以分为Controller、Service、Repository三层。Controller层负责接口暴露Repository层负责数据读写Service层负责核心业务逻辑也就是这里说的业务模型。
除此之外前面我们还提到两种开发模式基于贫血模型的传统开发模式和基于充血模型的DDD开发模式。前者是一种面向过程的编程风格后者是一种面向对象的编程风格。不管是DDD还是OOP高级开发模式的存在一般都是为了应对复杂系统应对系统的复杂性。对于我们要开发的积分系统来说因为业务相对比较简单所以选择简单的基于贫血模型的传统开发模式就足够了。
从开发的角度来说,我们可以把积分系统作为一个独立的项目,来独立开发,也可以跟其他业务代码(比如营销系统)放到同一个项目中进行开发。从运维的角度来说,我们可以将它跟其他业务一块部署,也可以作为一个微服务独立部署。具体选择哪种开发和部署方式,我们可以参考公司当前的技术架构来决定。
实际上,积分系统业务比较简单,代码量也不多,我更倾向于将它跟营销系统放到一个项目中开发部署。只要我们做好代码的模块化和解耦,让积分相关的业务代码跟其他业务代码之间边界清晰,没有太多耦合,后期如果需要将它拆分成独立的项目来开发部署,那也并不困难。
相信这样一个简单的业务功能的开发,对你来说并没有太大难度。所以,具体的代码实现我就不在专栏中给出了。感兴趣的话,你可以自己实现一下。接下来的内容,才是我们这一节的重点。
## 为什么要分MVC三层开发
我们刚刚提到,大部分业务系统的开发都可以分为三层:Contoller层、Service层、Repository层。对于这种分层方式我相信大部分人都很认同甚至成为了一种开发习惯但你有没有想过为什么我们要分层开发很多业务都比较简单一层代码搞定所有的数据读取、业务逻辑、接口暴露不好吗你可以把它作为一道面试题试着自己思考下然后再看我下面的讲解。
对于这个问题,我总结了以下几点原因。
### 1.分层能起到代码复用的作用
同一个Repository可能会被多个Service来调用同一个Service可能会被多个Controller调用。比如UserService中的getUserById()接口封装了通过ID获取用户信息的逻辑这部分逻辑可能会被UserController和AdminController等多个Controller使用。如果没有Service层每个Controller都要重复实现这部分逻辑显然会违反DRY原则。
### 2.分层能起到隔离变化的作用
分层体现了一种抽象和封装的设计思想。比如Repository层封装了对数据库访问的操作提供了抽象的数据访问接口。基于接口而非实现编程的设计思想Service层使用Repository层提供的接口并不关心其底层依赖的是哪种具体的数据库。当我们需要替换数据库的时候比如从MySQL到Oracle从Oracle到Redis只需要改动Repository层的代码Service层的代码完全不需要修改。
除此之外Controller、Service、Repository三层代码的稳定程度不同、引起变化的原因不同所以分成三层来组织代码能有效地隔离变化。比如Repository层基于数据库表而数据库表改动的可能性很小所以Repository层的代码最稳定而Controller层提供适配给外部使用的接口代码经常会变动。分层之后Controller层中代码的频繁改动并不会影响到稳定的Repository层。
### 3.分层能起到隔离关注点的作用
Repository层只关注数据的读写。Service层只关注业务逻辑不关注数据的来源。Controller层只关注与外界打交道数据校验、封装、格式转换并不关心业务逻辑。三层之间的关注点不同分层之后职责分明更加符合单一职责原则代码的内聚性更好。
### 4.分层能提高代码的可测试性
后面讲单元测试的时候我们会讲到单元测试不依赖不可控的外部组件比如数据库。分层之后Repsitory层的代码通过依赖注入的方式供Service层使用当要测试包含核心业务逻辑的Service层代码的时候我们可以用mock的数据源替代真实的数据库注入到Service层代码中。代码的可测试性和单元测试我们后面会讲到这里你稍微了解即可。
### 5.分层能应对系统的复杂性
所有的代码都放到一个类中,那这个类的代码就会因为需求的迭代而无限膨胀。我们知道,当一个类或一个函数的代码过多之后,可读性、可维护性就会变差。那我们就要想办法拆分。拆分有垂直和水平两个方向。水平方向基于业务来做拆分,就是模块化;垂直方向基于流程来做拆分,就是这里说的分层。
还是那句话不管是分层、模块化还是OOP、DDD以及各种设计模式、原则和思想都是为了应对复杂系统应对系统的复杂性。对于简单系统来说其实是发挥不了作用的就是俗话说的“杀鸡焉用牛刀”。
## BO、VO、Entity存在的意义是什么
在前面的章节中我们提到针对Controller、Service、Repository三层每层都会定义相应的数据对象它们分别是VOView Object、BOBusiness Object、Entity例如UserVo、UserBo、UserEntity。在实际的开发中VO、BO、Entity可能存在大量的重复字段甚至三者包含的字段完全一样。在开发的过程中我们经常需要重复定义三个几乎一样的类显然是一种重复劳动。
**相对于每层定义各自的数据对象来说,是不是定义一个公共的数据对象更好些呢?**
实际上我更加推荐每层都定义各自的数据对象这种设计思路主要有以下3个方面的原因。
- VO、BO、Entity并非完全一样。比如我们可以在UserEntity、UserBo中定义Password字段但显然不能在UserVo中定义Password字段否则就会将用户的密码暴露出去。
- VO、BO、Entity三个类虽然代码重复但功能语义不重复从职责上讲是不一样的。所以也并不能算违背DRY原则。在前面讲到DRY原则的时候针对这种情况如果合并为同一个类那也会存在后期因为需求的变化而需要再拆分的问题。
- 为了尽量减少每层之间的耦合,把职责边界划分明确,每层都会维护自己的数据对象,层与层之间通过接口交互。数据从下一层传递到上一层的时候,将下一层的数据对象转化成上一层的数据对象,再继续处理。虽然这样的设计稍微有些繁琐,每层都需要定义各自的数据对象,需要做数据对象之间的转化,但是分层清晰。对于非常大的项目来说,结构清晰是第一位的!
**既然VO、BO、Entity不能合并那如何解决代码重复的问题呢**
从设计的角度来说VO、BO、Entity的设计思路并不违反DRY原则为了分层清晰、减少耦合多维护几个类的成本也并不是不能接受的。但是如果你真的有代码洁癖对于代码重复的问题我们也有一些办法来解决。
我们前面讲到继承可以解决代码重复问题。我们可以将公共的字段定义在父类中让VO、BO、Entity都继承这个父类各自只定义特有的字段。因为这里的继承层次很浅也不复杂所以使用继承并不会影响代码的可读性和可维护性。后期如果因为业务的需要有些字段需要从父类移动到子类或者从子类提取到父类代码改起来也并不复杂。
前面在讲“多用组合少用继承”设计思想的时候我们提到组合也可以解决代码重复的问题所以这里我们还可以将公共的字段抽取到公共的类中VO、BO、Entity通过组合关系来复用这个类的代码。
**代码重复问题解决了,那不同分层之间的数据对象该如何互相转化呢?**
当下一层的数据通过接口调用传递到上一层之后我们需要将它转化成上一层对应的数据对象类型。比如Service层从Repository层获取的Entity之后将其转化成BO再继续业务逻辑的处理。所以整个开发的过程会涉及“Entity到BO”和“BO到VO”这两种转化。
最简单的转化方式是手动复制。自己写代码在两个对象之间一个字段一个字段的赋值。但这样的做法显然是没有技术含量的低级劳动。Java中提供了多种数据对象转化工具比如BeanUtils、Dozer等可以大大简化繁琐的对象转化工作。如果你是用其他编程语言来做开发也可以借鉴Java这些工具类的设计思路自己在项目中实现对象转化工具类。
**VO、BO、Entity都是基于贫血模型的而且为了兼容框架或开发库比如MyBatis、Dozer、BeanUtils我们还需要定义每个字段的set方法。这些都违背OOP的封装特性会导致数据被随意修改。那到底该怎么办好呢**
前面我们也提到过Entity和VO的生命周期是有限的都仅限在本层范围内。而对应的Repository层和Controller层也都不包含太多业务逻辑所以也不会有太多代码随意修改数据即便设计成贫血、定义每个字段的set方法相对来说也是安全的。
不过Service层包含比较多的业务逻辑代码所以BO就存在被任意修改的风险了。但是设计的问题本身就没有最优解只有权衡。为了使用方便我们只能做一些妥协放弃BO的封装特性由程序员自己来负责这些数据对象的不被错误使用。
## 总结用到的设计原则和思想
前面我们提到很多人做业务开发总感觉就是CRUD翻译代码根本用不到设计原则、思想和模式。实际上只是你没有发现而已。现在我就给你罗列一下今天讲解的内容中都用到了哪些设计原则、思想和模式。
<img src="https://static001.geekbang.org/resource/image/33/61/3332071c82182e72518143d05b8eaa61.jpg" alt="">
实际上,这两节课中还蕴含了很多其他的设计思想、原则、模式,你可以像我一样试着去总结一下,放在留言区说一说。
## 重点回顾
今天的内容到此就讲完了。我们一块来总结回顾一下,你需要掌握的重点内容。
**1.为什么要分MVC三层开发**
对于这个问题我总结了以下5点原因。
- 分层能起到代码复用的作用
- 分层能起到隔离变化的作用
- 分层能起到隔离关注点的作用
- 分层能提高代码的可测试性
- 分层能应对系统的复杂性
**2.BO、VO、Entity存在的意义是什么**
从设计的角度来说VO、BO、Entity的设计思路并不违反DRY原则为了分层清晰、减少耦合多维护几个类的成本也并不是不能接受的。但是如果你真的有代码洁癖对于代码重复的问题我们可以通过继承或者组合来解决。
如何进行数据对象之间的转化最简单的方式就是手动复制。当然你也可以使用Java中提供了数据对象转化工具比如BeanUtils、Dozer等可以大大简化繁琐的对象转化工作。
尽管VO、BO、Entity的设计违背OOP的封装特性有被随意修改的风险。但Entity和VO的生命周期是有限的都仅限在本层范围内相对来说是安全的。Service层包含比较多的业务逻辑代码所以BO就存在被任意修改的风险了。为了使用方便我们只能做一些妥协放弃BO的封装特性由程序员自己来负责这些数据对象的不被错误使用。
**3.总结用到的设计原则和思想**
从表面上看,做业务开发可能并不是特别有技术挑战,但是实际上,如果你要做到知其然知其所以然,做到透彻理解、真的懂,并不是件容易的事情。深挖一下,你会发现这其中还是蕴含了很多设计原则、思想和模式的。
## 课堂讨论
1. 上节课中我们讲到下层系统不要包含太多上层系统的业务信息。但在今天的数据库设计中积分明细表中credit_transaction中包含event_idchannel_id这些跟上层业务相关的字段那这样的设计是否合理呢
1. 我们经常说修改和查询不要耦合在一个接口中要分成两个接口来做。赚取积分和消费积分接口返回积分明细ID这样的接口设计是否违背单一职责原则呢是不是返回void或者boolean类型更合理呢
欢迎在留言区写下你的答案,和同学一起交流和分享。如果有收获,也欢迎你把这篇文章分享给你的朋友。

View File

@@ -0,0 +1,232 @@
<audio id="audio" title="25 | 实战二(上):针对非业务的通用框架开发,如何做需求分析和设计?" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/f8/15/f852f693bf58016192abcc8c17e80c15.mp3"></audio>
上两节课中,我们讲了如何针对一个业务系统做需求分析、设计和实现,并且通过一个积分兑换系统的开发,实践了之前学过的一些设计原则。接下来的两节课,我们再结合一个支持各种统计规则的性能计数器项目,学习针对一个非业务的通用框架开发,如何来做需求分析、设计和实现,同时学习如何灵活应用各种设计原则。
话不多说,让我们正式开始今天的内容吧!
## 项目背景
我们希望设计开发一个小的框架能够获取接口调用的各种统计信息比如响应时间的最大值max、最小值min、平均值avg、百分位值percentile、接口调用次数count、频率tps并且支持将统计结果以各种显示格式比如JSON格式、网页格式、自定义显示格式等输出到各种终端Console命令行、HTTP网页、Email、日志文件、自定义输出终端等以方便查看。
我们假设这是真实项目中的一个开发需求,如果让你来负责开发这样一个通用的框架,应用到各种业务系统中,支持实时计算、查看数据的统计信息,你会如何设计和实现呢?你可以先自己主动思考一下,然后再来看我的分析思路。
## 需求分析
性能计数器作为一个跟业务无关的功能,我们完全可以把它开发成一个独立的框架或者类库,集成到很多业务系统中。而作为可被复用的框架,除了功能性需求之外,非功能性需求也非常重要。所以,接下来,我们从这两个方面来做需求分析。
### 1.功能性需求分析
相对于一大长串的文字描述,人脑更容易理解短的、罗列的比较规整、分门别类的列表信息。显然,刚才那段需求描述不符合这个规律。我们需要把它拆解成一个一个的“干条条”。拆解之后我写在下面了,是不是看起来更加清晰、有条理?
- 接口统计信息:包括接口响应时间的统计信息,以及接口调用次数的统计信息等。
- 统计信息的类型max、min、avg、percentile、count、tps等。
- 统计信息显示格式Json、Html、自定义显示格式。
- 统计信息显示终端Console、Email、HTTP网页、日志、自定义显示终端。
除此之外,我们还可以借助设计产品的时候,经常用到的线框图,把最终数据的显示样式画出来,会更加一目了然。具体的线框图如下所示:
<img src="https://static001.geekbang.org/resource/image/f0/e5/f04b341ad5fda418ae24f166d0a4dde5.jpg" alt="">
实际上,从线框图中,我们还能挖掘出了下面几个隐藏的需求。
- 统计触发方式:包括主动和被动两种。主动表示以一定的频率定时统计数据,并主动推送到显示终端,比如邮件推送。被动表示用户触发统计,比如用户在网页中选择要统计的时间区间,触发统计,并将结果显示给用户。
- 统计时间区间框架需要支持自定义统计时间区间比如统计最近10分钟的某接口的tps、访问次数或者统计12月11日00点到12月12日00点之间某接口响应时间的最大值、最小值、平均值等。
- 统计时间间隔对于主动触发统计我们还要支持指定统计时间间隔也就是多久触发一次统计显示。比如每间隔10s统计一次接口信息并显示到命令行中每间隔24小时发送一封统计信息邮件。
### 2.非功能性需求分析
对于这样一个通用的框架的开发,我们还需要考虑很多非功能性的需求。具体来讲,我总结了以下几个比较重要的方面。
- 易用性
易用性听起来更像是一个评判产品的标准。没错,我们在开发这样一个技术框架的时候,也要有产品意识。框架是否易集成、易插拔、跟业务代码是否松耦合、提供的接口是否够灵活等等,都是我们应该花心思去思考和设计的。有的时候,文档写得好坏甚至都有可能决定一个框架是否受欢迎。
- 性能
对于需要集成到业务系统的框架来说,我们不希望框架本身的代码执行效率,对业务系统有太多性能上的影响。对于性能计数器这个框架来说,一方面,我们希望它是低延迟的,也就是说,统计代码不影响或很少影响接口本身的响应时间;另一方面,我们希望框架本身对内存的消耗不能太大。
- 扩展性
这里说的扩展性跟之前讲到的代码的扩展性有点类似,都是指在不修改或尽量少修改代码的情况下添加新的功能。但是这两者也有区别。之前讲到的扩展是从框架代码开发者的角度来说的。这里所说的扩展是从框架使用者的角度来说的,特指使用者可以在不修改框架源码,甚至不拿到框架源码的情况下,为框架扩展新的功能。这就有点类似给框架开发插件。关于这一点,我举一个例子来解释一下。
feign是一个HTTP客户端框架我们可以在不修改框架源码的情况下用如下方式来扩展我们自己的编解码方式、日志、拦截器等。
```
Feign feign = Feign.builder()
.logger(new CustomizedLogger())
.encoder(new FormEncoder(new JacksonEncoder()))
.decoder(new JacksonDecoder())
.errorDecoder(new ResponseErrorDecoder())
.requestInterceptor(new RequestHeadersInterceptor()).build();
public class RequestHeadersInterceptor implements RequestInterceptor {
@Override
public void apply(RequestTemplate template) {
template.header(&quot;appId&quot;, &quot;...&quot;);
template.header(&quot;version&quot;, &quot;...&quot;);
template.header(&quot;timestamp&quot;, &quot;...&quot;);
template.header(&quot;token&quot;, &quot;...&quot;);
template.header(&quot;idempotent-token&quot;, &quot;...&quot;);
template.header(&quot;sequence-id&quot;, &quot;...&quot;);
}
public class CustomizedLogger extends feign.Logger {
//...
}
public class ResponseErrorDecoder implements ErrorDecoder {
@Override
public Exception decode(String methodKey, Response response) {
//...
}
}
```
- 容错性
容错性这一点也非常重要。对于性能计数器框架来说,不能因为框架本身的异常导致接口请求出错。所以,我们要对框架可能存在的各种异常情况都考虑全面,对外暴露的接口抛出的所有运行时、非运行时异常都进行捕获处理。
- 通用性
为了提高框架的复用性能够灵活应用到各种场景中。框架在设计的时候要尽可能通用。我们要多去思考一下除了接口统计这样一个需求还可以适用到其他哪些场景中比如是否还可以处理其他事件的统计信息比如SQL请求时间的统计信息、业务统计信息比如支付成功率等。
## 框架设计
前面讲了需求分析,现在我们来看如何针对需求做框架设计。
对于稍微复杂系统的开发很多人觉得不知从何开始。我个人喜欢借鉴TDD测试驱动开发和Prototype最小原型的思想先聚焦于一个简单的应用场景基于此设计实现一个简单的原型。尽管这个最小原型系统在功能和非功能特性上都不完善但它能够看得见、摸得着比较具体、不抽象能够很有效地帮助我缕清更复杂的设计思路是迭代设计的基础。
这就好比做算法题目。当我们想要一下子就想出一个最优解法时,可以先写几组测试数据,找找规律,再先想一个最简单的算法去解决它。虽然这个最简单的算法在时间、空间复杂度上可能都不令人满意,但是我们可以基于此来做优化,这样思路就会更加顺畅。
对于性能计数器这个框架的开发来说我们可以先聚焦于一个非常具体、简单的应用场景比如统计用户注册、登录这两个接口的响应时间的最大值和平均值、接口调用次数并且将统计结果以JSON的格式输出到命令行中。现在这个需求简单、具体、明确设计实现起来难度降低了很多。
我们先给出应用场景的代码。具体如下所示:
```
//应用场景:统计下面两个接口(注册和登录)的响应时间和访问次数
public class UserController {
public void register(UserVo user) {
//...
}
public UserVo login(String telephone, String password) {
//...
}
}
```
要输出接口的响应时间的最大值、平均值和接口调用次数,我们首先要采集每次接口请求的响应时间,并且存储起来,然后按照某个时间间隔做聚合统计,最后才是将结果输出。在原型系统的代码实现中,我们可以把所有代码都塞到一个类中,暂时不用考虑任何代码质量、线程安全、性能、扩展性等等问题,怎么简单怎么来就行。
最小原型的代码实现如下所示。其中recordResponseTime()和recordTimestamp()两个函数分别用来记录接口请求的响应时间和访问时间。startRepeatedReport()函数以指定的频率统计数据并输出结果。
```
public class Metrics {
// Map的key是接口名称value对应接口请求的响应时间或时间戳
private Map&lt;String, List&lt;Double&gt;&gt; responseTimes = new HashMap&lt;&gt;();
private Map&lt;String, List&lt;Double&gt;&gt; timestamps = new HashMap&lt;&gt;();
private ScheduledExecutorService executor = Executors.newSingleThreadScheduledExecutor();
public void recordResponseTime(String apiName, double responseTime) {
responseTimes.putIfAbsent(apiName, new ArrayList&lt;&gt;());
responseTimes.get(apiName).add(responseTime);
}
public void recordTimestamp(String apiName, double timestamp) {
timestamps.putIfAbsent(apiName, new ArrayList&lt;&gt;());
timestamps.get(apiName).add(timestamp);
}
public void startRepeatedReport(long period, TimeUnit unit){
executor.scheduleAtFixedRate(new Runnable() {
@Override
public void run() {
Gson gson = new Gson();
Map&lt;String, Map&lt;String, Double&gt;&gt; stats = new HashMap&lt;&gt;();
for (Map.Entry&lt;String, List&lt;Double&gt;&gt; entry : responseTimes.entrySet()) {
String apiName = entry.getKey();
List&lt;Double&gt; apiRespTimes = entry.getValue();
stats.putIfAbsent(apiName, new HashMap&lt;&gt;());
stats.get(apiName).put(&quot;max&quot;, max(apiRespTimes));
stats.get(apiName).put(&quot;avg&quot;, avg(apiRespTimes));
}
for (Map.Entry&lt;String, List&lt;Double&gt;&gt; entry : timestamps.entrySet()) {
String apiName = entry.getKey();
List&lt;Double&gt; apiTimestamps = entry.getValue();
stats.putIfAbsent(apiName, new HashMap&lt;&gt;());
stats.get(apiName).put(&quot;count&quot;, (double)apiTimestamps.size());
}
System.out.println(gson.toJson(stats));
}
}, 0, period, unit);
}
private double max(List&lt;Double&gt; dataset) {//省略代码实现}
private double avg(List&lt;Double&gt; dataset) {//省略代码实现}
}
```
我们通过不到50行代码就实现了最小原型。接下来我们再来看如何用它来统计注册、登录接口的响应时间和访问次数。具体的代码如下所示
```
//应用场景:统计下面两个接口(注册和登录)的响应时间和访问次数
public class UserController {
private Metrics metrics = new Metrics();
public UserController() {
metrics.startRepeatedReport(60, TimeUnit.SECONDS);
}
public void register(UserVo user) {
long startTimestamp = System.currentTimeMillis();
metrics.recordTimestamp(&quot;regsiter&quot;, startTimestamp);
//...
long respTime = System.currentTimeMillis() - startTimestamp;
metrics.recordResponseTime(&quot;register&quot;, respTime);
}
public UserVo login(String telephone, String password) {
long startTimestamp = System.currentTimeMillis();
metrics.recordTimestamp(&quot;login&quot;, startTimestamp);
//...
long respTime = System.currentTimeMillis() - startTimestamp;
metrics.recordResponseTime(&quot;login&quot;, respTime);
}
}
```
最小原型的代码实现虽然简陋,但它却帮我们将思路理顺了很多,我们现在就基于它做最终的框架设计。下面是我针对性能计数器框架画的一个粗略的系统设计图。图可以非常直观地体现设计思想,并且能有效地帮助我们释放更多的脑空间,来思考其他细节问题。
<img src="https://static001.geekbang.org/resource/image/92/16/926561b82b49c937dcf4a2b9e6b35c16.jpg" alt="">
如图所示,我们把整个框架分为四个模块:数据采集、存储、聚合统计、显示。每个模块负责的工作简单罗列如下。
- 数据采集负责打点采集原始数据包括记录每次接口请求的响应时间和请求时间。数据采集过程要高度容错不能影响到接口本身的可用性。除此之外因为这部分功能是暴露给框架的使用者的所以在设计数据采集API的时候我们也要尽量考虑其易用性。
- 存储负责将采集的原始数据保存下来以便后面做聚合统计。数据的存储方式有多种比如Redis、MySQL、HBase、日志、文件、内存等。数据存储比较耗时为了尽量地减少对接口性能比如响应时间的影响采集和存储的过程异步完成。
- 聚合统计负责将原始数据聚合为统计数据比如max、min、avg、pencentile、count、tps等。为了支持更多的聚合统计规则代码希望尽可能灵活、可扩展。
- 显示:负责将统计数据以某种格式显示到终端,比如:输出到命令行、邮件、网页、自定义显示终端等。
前面讲到面向对象分析、设计和实现的时候,我们讲到设计阶段最终输出的是类的设计,同时也讲到,软件设计开发是一个迭代的过程,分析、设计和实现这三个阶段的界限划分并不明显。所以,今天我们只给出了比较粗略的模块划分,至于更加详细的设计,我们留在下一节课中跟实现一块来讲解。
## 重点回顾
今天的内容到此就讲完了。我们来一起总结回顾一下,你需要掌握的重点内容。
对于非业务通用框架的开发,我们在做需求分析的时候,除了功能性需求分析之外,还需要考虑框架的非功能性需求。比如,框架的易用性、性能、扩展性、容错性、通用性等。
对于复杂框架的设计,很多人往往觉得无从下手。今天我们分享了几个小技巧,其中包括:画产品线框图、聚焦简单应用场景、设计实现最小原型、画系统设计图等。这些方法的目的都是为了让问题简化、具体、明确,提供一个迭代设计开发的基础,逐步推进。
实际上,不仅仅是软件设计开发,不管做任何事情,如果我们总是等到所有的东西都想好了再开始,那这件事情可能永远都开始不了。有句老话讲:万事开头难,所以,先迈出第一步很重要。
## 课堂讨论
今天的课堂讨论题有下面两道。
1. 应对复杂系统的设计实现,我今天讲到了聚焦简单场景、最小原型、画图等几个技巧,你还有什么经验可以分享给大家吗?
1. 今天提到的线框图、最小原型、易用性等,实际上都是产品设计方面的手段或者概念,应用到像框架这样的技术产品的设计上也非常有用。你觉得对于一个技术人来说,产品能力是否同样重要呢?技术人是否应该具备一些产品思维呢?
欢迎在留言区写下你的答案,和同学一起交流和分享。如果有收获,也欢迎你把这篇文章分享给你的朋友。

View File

@@ -0,0 +1,348 @@
<audio id="audio" title="26 | 实战二(下):如何实现一个支持各种统计规则的性能计数器?" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/c7/79/c796e2ce12f9c450daf54db85adc9879.mp3"></audio>
在上一节课中,我们对计数器框架做了需求分析和粗略的模块划分。今天这节课,我们利用面向对象设计、实现方法,并结合之前学过的设计思想、设计原则来看一下,如何编写灵活、可扩展的、高质量的代码实现。
话不多说,现在就让我们正式开始今天的学习吧!
## 小步快跑、逐步迭代
在上一节课中,我们将整个框架分为数据采集、存储、聚合统计、显示这四个模块。除此之外,关于统计触发方式(主动推送、被动触发统计)、统计时间区间(统计哪一个时间段内的数据)、统计时间间隔(对于主动推送方法,多久统计推送一次)我们也做了简单的设计。这里我就不重新描述了,你可以打开上一节课回顾一下。
虽然上一节课的最小原型为我们奠定了迭代开发的基础,但离我们最终期望的框架的样子还有很大的距离。我自己在写这篇文章的时候,试图去实现上面罗列的所有功能需求,希望写出一个完美的框架,发现这是件挺烧脑的事情,在写代码的过程中,一直有种“脑子不够使”的感觉。我这个有十多年工作经验的人尚且如此,对于没有太多经验的开发者来说,想一下子把所有需求都实现出来,更是一件非常有挑战的事情。一旦无法顺利完成,你可能就会有很强的挫败感,就会陷入自我否定的情绪中。
不过即便你有能力将所有需求都实现可能也要花费很大的设计精力和开发时间迟迟没有产出你的leader会因此产生很强的不可控感。对于现在的互联网项目来说小步快跑、逐步迭代是一种更好的开发模式。所以我们应该分多个版本逐步完善这个框架。第一个版本可以先实现一些基本功能对于更高级、更复杂的功能以及非功能性需求不做过高的要求在后续的v2.0、v3.0……版本中继续迭代优化。
针对这个框架的开发我们在v1.0版本中暂时只实现下面这些功能。剩下的功能留在v2.0、v3.0版本也就是我们后面的第39节和第40节课中再来讲解。
- 数据采集:负责打点采集原始数据,包括记录每次接口请求的响应时间和请求时间。
- 存储负责将采集的原始数据保存下来以便之后做聚合统计。数据的存储方式有很多种我们暂时只支持Redis这一种存储方式并且采集与存储两个过程同步执行。
- 聚合统计负责将原始数据聚合为统计数据包括响应时间的最大值、最小值、平均值、99.9百分位值、99百分位值以及接口请求的次数和tps。
- 显示负责将统计数据以某种格式显示到终端暂时只支持主动推送给命令行和邮件。命令行间隔n秒统计显示上m秒的数据比如间隔60s统计上60s的数据。邮件每日统计上日的数据。
现在这个版本的需求比之前的要更加具体、简单了,实现起来也更加容易一些。实际上,学会结合具体的需求,做合理的预判、假设、取舍,规划版本的迭代设计开发,也是一个资深工程师必须要具备的能力。
## 面向对象设计与实现
在[第13节](https://time.geekbang.org/column/article/171760)和[第14节](https://time.geekbang.org/column/article/171767)课中,我们把面向对象设计与实现分开来讲解,界限划分比较明显。在实际的软件开发中,这两个过程往往是交叉进行的。一般是先有一个粗糙的设计,然后着手实现,实现的过程发现问题,再回过头来补充修改设计。所以,对于这个框架的开发来说,我们把设计和实现放到一块来讲解。
回顾上一节课中的最小原型的实现,所有的代码都耦合在一个类中,这显然是不合理的。接下来,我们就按照之前讲的面向对象设计的几个步骤,来重新划分、设计类。
### 1.划分职责进而识别出有哪些类
根据需求描述,我们先大致识别出下面几个接口或类。这一步不难,完全就是翻译需求。
- MetricsCollector类负责提供API来采集接口请求的原始数据。我们可以为MetricsCollector抽象出一个接口但这并不是必须的因为暂时我们只能想到一个MetricsCollector的实现方式。
- MetricsStorage接口负责原始数据存储RedisMetricsStorage类实现MetricsStorage接口。这样做是为了今后灵活地扩展新的存储方法比如用HBase来存储。
- Aggregator类负责根据原始数据计算统计数据。
- ConsoleReporter类、EmailReporter类分别负责以一定频率统计并发送统计数据到命令行和邮件。至于ConsoleReporter和EmailReporter是否可以抽象出可复用的抽象类或者抽象出一个公共的接口我们暂时还不能确定。
### 2.定义类及类与类之间的关系
接下来就是定义类及属性和方法,定义类与类之间的关系。这两步没法分得很开,所以,我们今天将它们合在一起来讲解。
大致地识别出几个核心的类之后我的习惯性做法是先在IDE中创建好这几个类然后开始试着定义它们的属性和方法。在设计类、类与类之间交互的时候我会不断地用之前学过的设计原则和思想来审视设计是否合理比如是否满足单一职责原则、开闭原则、依赖注入、KISS原则、DRY原则、迪米特法则是否符合基于接口而非实现编程思想代码是否高内聚、低耦合是否可以抽象出可复用代码等等。
MetricsCollector类的定义非常简单具体代码如下所示。对比上一节课中最小原型的代码MetricsCollector通过引入RequestInfo类来封装原始数据信息用一个采集函数代替了之前的两个函数。
```
public class MetricsCollector {
private MetricsStorage metricsStorage;//基于接口而非实现编程
//依赖注入
public MetricsCollector(MetricsStorage metricsStorage) {
this.metricsStorage = metricsStorage;
}
//用一个函数代替了最小原型中的两个函数
public void recordRequest(RequestInfo requestInfo) {
if (requestInfo == null || StringUtils.isBlank(requestInfo.getApiName())) {
return;
}
metricsStorage.saveRequestInfo(requestInfo);
}
}
public class RequestInfo {
private String apiName;
private double responseTime;
private long timestamp;
//...省略constructor/getter/setter方法...
}
```
MetricsStorage类和RedisMetricsStorage类的属性和方法也比较明确。具体的代码实现如下所示。注意一次性取太长时间区间的数据可能会导致拉取太多的数据到内存中有可能会撑爆内存。对于Java来说就有可能会触发OOMOut Of Memory。而且即便不出现OOM内存还够用但也会因为内存吃紧导致频繁的Full GC进而导致系统接口请求处理变慢甚至超时。这个问题解决起来并不难先留给你自己思考一下。我会在第40节课中解答。
```
public interface MetricsStorage {
void saveRequestInfo(RequestInfo requestInfo);
List&lt;RequestInfo&gt; getRequestInfos(String apiName, long startTimeInMillis, long endTimeInMillis);
Map&lt;String, List&lt;RequestInfo&gt;&gt; getRequestInfos(long startTimeInMillis, long endTimeInMillis);
}
public class RedisMetricsStorage implements MetricsStorage {
//...省略属性和构造函数等...
@Override
public void saveRequestInfo(RequestInfo requestInfo) {
//...
}
@Override
public List&lt;RequestInfo&gt; getRequestInfos(String apiName, long startTimestamp, long endTimestamp) {
//...
}
@Override
public Map&lt;String, List&lt;RequestInfo&gt;&gt; getRequestInfos(long startTimestamp, long endTimestamp) {
//...
}
}
```
MetricsCollector类和MetricsStorage类的设计思路比较简单不同的人给出的设计结果应该大差不差。但是统计和显示这两个功能就不一样了可以有多种设计思路。实际上如果我们把统计显示所要完成的功能逻辑细分一下的话主要包含下面4点
1. 根据给定的时间区间,从数据库中拉取数据;
1. 根据原始数据,计算得到统计数据;
1. 将统计数据显示到终端(命令行或邮件);
1. 定时触发以上3个过程的执行。
实际上,如果用一句话总结一下的话,**面向对象设计和实现要做的事情,就是把合适的代码放到合适的类中**。所以我们现在要做的工作就是把以上的4个功能逻辑划分到几个类中。划分的方法有很多种比如我们可以把前两个逻辑放到一个类中第3个逻辑放到另外一个类中第4个逻辑作为上帝类God Class组合前面两个类来触发前3个逻辑的执行。当然我们也可以把第2个逻辑单独放到一个类中第1、3、4都放到另外一个类中。
至于到底选择哪种排列组合方式,判定的标准是,让代码尽量地满足低耦合、高内聚、单一职责、对扩展开放对修改关闭等之前讲到的各种设计原则和思想,尽量地让设计满足代码易复用、易读、易扩展、易维护。
我们暂时选择把第1、3、4逻辑放到ConsoleReporter或EmailReporter类中把第2个逻辑放到Aggregator类中。其中Aggregator类负责的逻辑比较简单我们把它设计成只包含静态方法的工具类。具体的代码实现如下所示
```
public class Aggregator {
public static RequestStat aggregate(List&lt;RequestInfo&gt; requestInfos, long durationInMillis) {
double maxRespTime = Double.MIN_VALUE;
double minRespTime = Double.MAX_VALUE;
double avgRespTime = -1;
double p999RespTime = -1;
double p99RespTime = -1;
double sumRespTime = 0;
long count = 0;
for (RequestInfo requestInfo : requestInfos) {
++count;
double respTime = requestInfo.getResponseTime();
if (maxRespTime &lt; respTime) {
maxRespTime = respTime;
}
if (minRespTime &gt; respTime) {
minRespTime = respTime;
}
sumRespTime += respTime;
}
if (count != 0) {
avgRespTime = sumRespTime / count;
}
long tps = (long)(count / durationInMillis * 1000);
Collections.sort(requestInfos, new Comparator&lt;RequestInfo&gt;() {
@Override
public int compare(RequestInfo o1, RequestInfo o2) {
double diff = o1.getResponseTime() - o2.getResponseTime();
if (diff &lt; 0.0) {
return -1;
} else if (diff &gt; 0.0) {
return 1;
} else {
return 0;
}
}
});
int idx999 = (int)(count * 0.999);
int idx99 = (int)(count * 0.99);
if (count != 0) {
p999RespTime = requestInfos.get(idx999).getResponseTime();
p99RespTime = requestInfos.get(idx99).getResponseTime();
}
RequestStat requestStat = new RequestStat();
requestStat.setMaxResponseTime(maxRespTime);
requestStat.setMinResponseTime(minRespTime);
requestStat.setAvgResponseTime(avgRespTime);
requestStat.setP999ResponseTime(p999RespTime);
requestStat.setP99ResponseTime(p99RespTime);
requestStat.setCount(count);
requestStat.setTps(tps);
return requestStat;
}
}
public class RequestStat {
private double maxResponseTime;
private double minResponseTime;
private double avgResponseTime;
private double p999ResponseTime;
private double p99ResponseTime;
private long count;
private long tps;
//...省略getter/setter方法...
}
```
ConsoleReporter类相当于一个上帝类定时根据给定的时间区间从数据库中取出数据借助Aggregator类完成统计工作并将统计结果输出到命令行。具体的代码实现如下所示
```
public class ConsoleReporter {
private MetricsStorage metricsStorage;
private ScheduledExecutorService executor;
public ConsoleReporter(MetricsStorage metricsStorage) {
this.metricsStorage = metricsStorage;
this.executor = Executors.newSingleThreadScheduledExecutor();
}
// 第4个代码逻辑定时触发第1、2、3代码逻辑的执行
public void startRepeatedReport(long periodInSeconds, long durationInSeconds) {
executor.scheduleAtFixedRate(new Runnable() {
@Override
public void run() {
// 第1个代码逻辑根据给定的时间区间从数据库中拉取数据
long durationInMillis = durationInSeconds * 1000;
long endTimeInMillis = System.currentTimeMillis();
long startTimeInMillis = endTimeInMillis - durationInMillis;
Map&lt;String, List&lt;RequestInfo&gt;&gt; requestInfos =
metricsStorage.getRequestInfos(startTimeInMillis, endTimeInMillis);
Map&lt;String, RequestStat&gt; stats = new HashMap&lt;&gt;();
for (Map.Entry&lt;String, List&lt;RequestInfo&gt;&gt; entry : requestInfos.entrySet()) {
String apiName = entry.getKey();
List&lt;RequestInfo&gt; requestInfosPerApi = entry.getValue();
// 第2个代码逻辑根据原始数据计算得到统计数据
RequestStat requestStat = Aggregator.aggregate(requestInfosPerApi, durationInMillis);
stats.put(apiName, requestStat);
}
// 第3个代码逻辑将统计数据显示到终端命令行或邮件
System.out.println(&quot;Time Span: [&quot; + startTimeInMillis + &quot;, &quot; + endTimeInMillis + &quot;]&quot;);
Gson gson = new Gson();
System.out.println(gson.toJson(stats));
}
}, 0, periodInSeconds, TimeUnit.SECONDS);
}
}
public class EmailReporter {
private static final Long DAY_HOURS_IN_SECONDS = 86400L;
private MetricsStorage metricsStorage;
private EmailSender emailSender;
private List&lt;String&gt; toAddresses = new ArrayList&lt;&gt;();
public EmailReporter(MetricsStorage metricsStorage) {
this(metricsStorage, new EmailSender(/*省略参数*/));
}
public EmailReporter(MetricsStorage metricsStorage, EmailSender emailSender) {
this.metricsStorage = metricsStorage;
this.emailSender = emailSender;
}
public void addToAddress(String address) {
toAddresses.add(address);
}
public void startDailyReport() {
Calendar calendar = Calendar.getInstance();
calendar.add(Calendar.DATE, 1);
calendar.set(Calendar.HOUR_OF_DAY, 0);
calendar.set(Calendar.MINUTE, 0);
calendar.set(Calendar.SECOND, 0);
calendar.set(Calendar.MILLISECOND, 0);
Date firstTime = calendar.getTime();
Timer timer = new Timer();
timer.schedule(new TimerTask() {
@Override
public void run() {
long durationInMillis = DAY_HOURS_IN_SECONDS * 1000;
long endTimeInMillis = System.currentTimeMillis();
long startTimeInMillis = endTimeInMillis - durationInMillis;
Map&lt;String, List&lt;RequestInfo&gt;&gt; requestInfos =
metricsStorage.getRequestInfos(startTimeInMillis, endTimeInMillis);
Map&lt;String, RequestStat&gt; stats = new HashMap&lt;&gt;();
for (Map.Entry&lt;String, List&lt;RequestInfo&gt;&gt; entry : requestInfos.entrySet()) {
String apiName = entry.getKey();
List&lt;RequestInfo&gt; requestInfosPerApi = entry.getValue();
RequestStat requestStat = Aggregator.aggregate(requestInfosPerApi, durationInMillis);
stats.put(apiName, requestStat);
}
// TODO: 格式化为html格式并且发送邮件
}
}, firstTime, DAY_HOURS_IN_SECONDS * 1000);
}
}
```
### 3.将类组装起来并提供执行入口
因为这个框架稍微有些特殊有两个执行入口一个是MetricsCollector类提供了一组API来采集原始数据另一个是ConsoleReporter类和EmailReporter类用来触发统计显示。框架具体的使用方式如下所示
```
public class Demo {
public static void main(String[] args) {
MetricsStorage storage = new RedisMetricsStorage();
ConsoleReporter consoleReporter = new ConsoleReporter(storage);
consoleReporter.startRepeatedReport(60, 60);
EmailReporter emailReporter = new EmailReporter(storage);
emailReporter.addToAddress(&quot;wangzheng@xzg.com&quot;);
emailReporter.startDailyReport();
MetricsCollector collector = new MetricsCollector(storage);
collector.recordRequest(new RequestInfo(&quot;register&quot;, 123, 10234));
collector.recordRequest(new RequestInfo(&quot;register&quot;, 223, 11234));
collector.recordRequest(new RequestInfo(&quot;register&quot;, 323, 12334));
collector.recordRequest(new RequestInfo(&quot;login&quot;, 23, 12434));
collector.recordRequest(new RequestInfo(&quot;login&quot;, 1223, 14234));
try {
Thread.sleep(100000);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
```
## Review设计与实现
我们前面讲到了SOLID、KISS、DRY、YAGNI、LOD等设计原则基于接口而非实现编程、多用组合少用继承、高内聚低耦合等设计思想。我们现在就来看下上面的代码实现是否符合这些设计原则和思想。
- MetricsCollector
MetricsCollector负责采集和存储数据职责相对来说还算比较单一。它基于接口而非实现编程通过依赖注入的方式来传递MetricsStorage对象可以在不需要修改代码的情况下灵活地替换不同的存储方式满足开闭原则。
- MetricsStorage、RedisMetricsStorage
MetricsStorage和RedisMetricsStorage的设计比较简单。当我们需要实现新的存储方式的时候只需要实现MetricsStorage接口即可。因为所有用到MetricsStorage和RedisMetricsStorage的地方都是基于相同的接口函数来编程的所以除了在组装类的地方有所改动从RedisMetricsStorage改为新的存储实现类其他接口函数调用的地方都不需要改动满足开闭原则。
- Aggregator
Aggregator类是一个工具类里面只有一个静态函数有50行左右的代码量负责各种统计数据的计算。当需要扩展新的统计功能的时候需要修改aggregate()函数代码,并且一旦越来越多的统计功能添加进来之后,这个函数的代码量会持续增加,可读性、可维护性就变差了。所以,从刚刚的分析来看,这个类的设计可能存在职责不够单一、不易扩展等问题,需要在之后的版本中,对其结构做优化。
- ConsoleReporter、EmailReporter
ConsoleReporter和EmailReporter中存在代码重复问题。在这两个类中从数据库中取数据、做统计的逻辑都是相同的可以抽取出来复用否则就违反了DRY原则。而且整个类负责的事情比较多职责不是太单一。特别是显示部分的代码可能会比较复杂比如Email的展示方式最好是将显示部分的代码逻辑拆分成独立的类。除此之外因为代码中涉及线程操作并且调用了Aggregator的静态函数所以代码的可测试性不好。
今天我们给出的代码实现还是有诸多问题的在后面的章节第39、40讲我们会慢慢优化给你展示整个设计演进的过程这比直接给你最终的最优方案要有意义得多实际上优秀的代码都是重构出来的复杂的代码都是慢慢堆砌出来的 。所以,当你看到那些优秀而复杂的开源代码或者项目代码的时候,也不必自惭形秽,觉得自己写不出来。毕竟罗马不是一天建成的,这些优秀的代码也是靠几年的时间慢慢迭代优化出来的。
## 重点回顾
好了,今天的内容到此就讲完了。我们一块总结回顾一下,你需要掌握的重点内容。
写代码的过程本就是一个修修改改、不停调整的过程肯定不是一气呵成的。你看到的那些大牛开源项目的设计和实现也都是在不停优化、修改过程中产生的。比如我们熟悉的Unix系统第一版很简单、粗糙代码不到1万行。所以迭代思维很重要不要刚开始就追求完美。
面向对象设计和实现要做的事情,就是把合适的代码放到合适的类中。至于到底选择哪种划分方法,判定的标准是让代码尽量地满足低耦合、高内聚、单一职责、对扩展开放对修改关闭等之前讲的各种设计原则和思想,尽量地做到代码可复用、易读、易扩展、易维护。
## 课堂讨论
今天课堂讨论题有下面两道。
1. 对于今天的设计与代码实现,你有没有发现哪些不合理的地方?有哪些可以继续优化的地方呢?或者留言说说你的设计方案。
1. 说一个你觉得不错的开源框架或者项目,聊聊你为什么觉得它不错?
欢迎在留言区写下你的答案,和同学一起交流和分享。如果有收获,也欢迎你把这篇文章分享给你的朋友。