前言介绍
RocketMQ 是个消息服务器,也是个网络服务器。接下来我们将从网络 IO 模型,线程模型,看看 RocketMQ 是如何设计的。
IO 模型
RocketMQ 使用了 Netty 作为网络通信框架,自然而然使用了 Reactor 模型,或者说 Select 模型、Epoll 模型。即一个线程管理 N 个 Socket 的模式,此模式可管理海量连接,基本是所有网络服务器的首选。
配置相关的RocketMQ的配置
RocketMQ的Boss线程数为 1, Worker 线程数为 CPU * 2.
在说线程模型之前,先看看 RocketMQ 如何设计 Server 接口的。
RemotingService作为顶层接口,定义了 启动和关闭,另外还有注册 RPC 钩子,职责简单。他的两个子接口 RemotingServer 和 RemotingClient 各自增加了自己的抽象接口。
- Server 专属的 localListenPort 和 getProcessorPair
- Client 专属的 getNameServerAddressList 等
注意:两者都有 invokeSync 方法,但,参数不同,这也是因为他们自身的角色不同所影响的。
至于NettyRemotingAbstract 抽象类,这只是个简单的”抽取重复代码”的“简单操作”。
再下面,就是具体实现类,每个类,都有内部类,都是Netty各种Handler 的实现:
-
NettyConnectManageHandler 负责处理 注册,连接,异常等事件,继承自 ChannelDuplexHandler。
-
NettyServerHandler 则是关键的业务处理类,处理真正的 Msg,继承自 SimpleChannelInboundHandler。
-
HandshakeHandler 负责处理握手程序,这里就不解释了。
以上 3 个是 Server 端的 Handler,都是NettyRemotingServer的内部类。
线程模型
NettyServerHandler作为处理业务的关键类,每个 worker 线程都有自己的单独实例,但该类只是做个包装或者桥接而已,作用不大, NettyRemotingServer才是关键。
当 Request 进入到 Server 中,MQ 会根据 请求类型 code 找到对应的处理器,MQ 有多种处理器,如下:
他们都继承自 NettyRequestProcessor 接口:
此接口只有 2 个方法,处理请求和拒绝请求,处理请求的参数是 Netty 的 context 和自身的RemotingCommand 对象,这是个大对象:
RemotingCommand 的成员变量,这里说下 flag 的作用,其他就不说了。
flag表示这次请求是什么类型。
-
倒数第一位,0 表示请求,1 表示返回。
-
倒数第二位,1 表示 oneWay。
NettyRequestProcessor
刚刚提到 NettyRequestProcessor ,这是个处理器,在 MQ 中,每个 NettyRequestProcessor 都绑定了一个线程池,在 MQ 的抽象里,有个 Pair 对象,如下:
public class Pair<T1, T2> {
private T1 object1;
private T2 object2;
public Pair(T1 object1, T2 object2) { this.object1 = object1;
this.object2 = object2;}
public T1 getObject1() { return object1;}
public void setObject1(T1 object1) {this.object1 = object1; }
public T2 getObject2() { return object2;}
public void setObject2(T2 object2) { this.object2 = object2;}
}
同时,还有个 Hash 表,用 code 映射了 Pair。如此,就实现了:通过请求 code 找到“线程池和处理这种请求的处理器”,然后,提交一个任务到该线程池,任务中,会调用该处理器的 processRequest 方法,或 rejectRequest 方法。
上图中,为处理请求的关键步骤。执行钩子就不说了,我们知道,设计代码时,关键步骤都加钩子,便于扩展和以后加代码。
其中,会调用 processRequest 方法,执行具体业务,并得到返回值。然后使用 netty 的 ctx 对象,将返回值直接写回 Socket。
如果发生错误了,也将错误构造成消息,写回客户端。
注意,这里一直有个操作 就是 response.setOpaque(opaque) ,就是设置请求 ID,这是 IO 多路复用的关键。
Netty 每次请求,都会调用 NettyRemotingServer 的 processRequestCommand 方法。
而 NettyRemotingServer 保存了请求 code 和 Pair<处理器,线程池> 的hash 映射表。
每次请求,根据 code 找到线程池,生成一个新任务,提交到线程池,任务里,会执行“处理器” 的processRequest 方法得到返回值,最后写回客户端。
MQ 为每种类型的任务,使用了不同的线程池,即线程池隔离。同时,也根据每种不同的任务类型,设置了不同的线程池参数。
参数介绍
-
Send 发送消息任务,线程池大小是1。
-
pull 拉取消息任务,线程池大小是 16 + CPU*2
-
query 查询任务,线程池大小是 8 + CPU*2;
当然还有其他的,这里就不枚举了,注意:大部分线程池都是多线程,只有 send 任务默认是单线程。
send 操作是个写操作,最后是要上锁的,虽然锁的粒度已经足够小,但仍然是有锁的。如果是有锁的,多线程的是不划算的。这也是 RocketMQ 的设计决定只写一个 CommitLog。
能像Kafka一样,同时写多个文件,是不是就可以利用多线程了呢?
当然,这里不是说多线程一定好,只是表达另外一种思路。如果单线程就能触发 MQ 瓶颈,多线程也没啥意义。