三级网站在线,国产精品亚洲一区二区三区,国产精品久久久久久久久影视

Netty百万�U�推送服务（转）

疯狂 — Wed, 13 Jul 2016 02:03:00 GMT

转蝲自：http://www.open-open.com/lib/view/open1420623195375.html

1. 背景

1.1. 话题来源

最�q�很多从事移动互联网和物联网开发的同学�l�我发邮件或者微博私信我�Q�咨询推送服务相关的问题。问题五花八门，在帮助大家答疑解惑的�q�程中，我也寚w��题进行了�ȝ��Q�大概可以归�U��ؓ如下几类�Q?/p>

Netty是否可以做推送服务器�Q?/li>
如果使用Netty开发推送服务，一个服务器最多可以支撑多��个客户端？
使用Netty开发推送服务遇到的各种技术问题�?/li>

�׃��咨询者众多，��x��点也比较集中�Q�我希望通过本文的案例分析和�Ҏ��送服务设计要点的�ȝ��Q�帮助大家在实际工作中少走弯路�?/p>

1.2. 推送服�?/h3>
�U�d��互联�|�时代，推�?Push)服务成�ؓApp应用不可或缺的重要组成部分，推送服务可以提升用��L��z�跃度和留存率。我们的手机每天接收到各�U�各��L��q�告和提�C�消息等大多数都是通过推送服务实现的�?/p>
随着物联�|�的发展�Q�大多数的智能家居都支持�U�d��推送服务，未来所有接入物联网的智能设备都��是推送服务的客户端，�q�就意味着推送服务未来会面�͋��量的设备和�l�端接入�?/p>

1.3. 推送服务的特点

�U�d��推送服务的主要特点如下�Q?/p>

使用的网�l�主要是�q�营商的无线�U�d��|�络�Q�网�l�质量不�E�_��Q�例如在地铁上信号就很差�Q�容易发生网�l�闪断；
��量的客��L��接入�Q�而且通常使用长连接，无论是客��L��q�是服务端，资源消耗都非常大；
�׃��h��的推送框架无法在国内使用�Q�Android的长�q�接是由每个应用各自�l�护的，�q�就意味着每台安卓讑֤�上会存在多个长连接。即便没有消息需要推送，长连接本�w�的心蟩消息量也是非常巨大的�Q�这��׃��D��量和耗电量的增加�Q?/li>
不稳定：消息丢失、重复推送、�g�q�送达、过期推送时有发生；
垃圾消息满天飞，�~�Z��l�一的服务治理能力�?/li>

��Z��解决上述弊端�Q�一些企业也�l�出了自��q��解决�Ҏ��Q�例如京东云推出的推送服务，可以实现多应用单服务单连接模式，使用AlarmManager定时心蟩节省电量和流量�?/p>

2. ��家居领域的一个真实案�?/h2>

2.1. 问题描述

��家居MQTT消息服务中间�Ӟ��保持10万用户在�U�K��q�接�Q?万用户�ƈ发做消息��h��。程序运行一�D�|��间之后，发现内存泄露�Q�怀疑是Netty的Bug。其它相关信息如下：

MQTT消息服务中间件服务器内存16G�Q?个核心CPU�Q?/li>
Netty中boss�U�程池大��ؓ1�Q�worker�U�程池大��ؓ6�Q�其余线�E�分配给业务使用。该分配方式后来调整为worker�U�程池大��ؓ11�Q�问题依旧；
Netty版本�?.0.8.Final�?/li>

2.2. 问题定位

首先需要dump内存堆栈�Q�对疑似内存泄露的对象和引用关系�q�行分析�Q�如下所�C�：

我们发现Netty的ScheduledFutureTask增加�?076%�Q�达�?10W个左右的实例�Q�通过对业务代码的分析发现用户使用IdleStateHandler用于在链路空闲时�q�行业务逻辑处理�Q�但是空闲时间设�|�的比较大，�?5分钟�?/p>

Netty 的IdleStateHandler会根据用��L��使用场景�Q�启动三�c�d��时�Q务，分别是：ReaderIdleTimeoutTask�?WriterIdleTimeoutTask和AllIdleTimeoutTask�Q�它们都会被加入到NioEventLoop的Task队列中被调度和执行�?/p>

�?于超时时间过长，10W个长链接链�\会创�?0W个ScheduledFutureTask对象�Q�每个对象还保存有业务的成员变量�Q�非常消耗内存。用��L�� 持久代设�|�的比较大，一些定时�Q务被老化到持久代中，没有被JVM垃圾回收掉，内存一直在增长�Q�用戯��认�ؓ存在内存泄露�?/p>

事实上，我们�q�一步分析发玎ͼ�用户的超时时间设�|�的非常不合理，15分钟的超时达不到设计目标�Q�重新设计之后将��时旉��讄��?5�U�，内存可以正常回收�Q�问题解冟�?/p>

2.3. 问题�ȝ��

如果�?00个长�q�接�Q�即便是长周期的定时��d��Q�也不存在内存泄露问题，在新生代通过minor GC��可以实现内存回收。正是因为十万��的长�q�接�Q�导致小问题被放大，引出了后�l�的各种问题�?/p>

事实上，如果用户��实有长周期�q�行的定时�Q务，该如何处理？对于��量长连接的推送服务，代码处理�E�有不慎�Q�就满盘皆输�Q�下面我们针对Netty的架构特点，介绍下如何��用Netty实现百万�U�客��L��的推送服务�?/p>

3. Netty��量推送服务设计要�?/h2>
作�ؓ高性能的NIO框架�Q�利用Netty开发高效的推送服务技术上是可行的�Q�但是由于推送服务自�w�的复杂性，惌��开发出�E�_��、高性能的推送服务�ƈ非易事，需要在设计阶段针对推送服务的特点�q�行合理设计�?/p>

3.1. 最大句柄数修改

百万长连接接入，首先需要优化的��是Linux内核参数�Q�其中Linux最大文件句柄数是最重要的调优参��C��一�Q�默认单�q�程打开的最大句柄数�?024�Q�通过ulimit -a可以查看相关参数�Q�示例如下：

[root@lilinfeng ~]# ulimit -a core file size          (blocks, -c) 0 data seg size           (kbytes, -d) unlimited scheduling priority             (-e) 0 file size               (blocks, -f) unlimited pending signals                 (-i) 256324 max locked memory       (kbytes, -l) 64 max memory size         (kbytes, -m) unlimited open files                      (-n) 1024  ......后箋输出省略

当单个推送服务接收到的链接超�q�上限后�Q�就会报“too many open files”�Q�所有新的客��L��接入��失败�?/p>

通过vi /etc/security/limits.conf ��d��如下配置参数�Q�修改之后保存，注销当前用户�Q�重新登录，通过ulimit -a 查看修改的状态是否生效�?/p>

*  soft        nofile        1000000 *  hard        nofile        1000000

需要指出的是，��管我们可以��单个进�E�打开的最大句柄数修改的非常大�Q�但是当句柄数达��C��定数量��之后�Q�处理效率将出现明显下降�Q�因此，需要根据服务器的硬仉��|�和处理能力�q�行合理讄��。如果单个服务器性能不行也可以通过集群的方式实现�?/p>

3.2. 当心CLOSE_WAIT

从事�U�d��推送服务开发的同学可能都有体会�Q�移动无�U�网�l�可靠性非常差�Q�经常存在客��L��重置�q�接�Q�网�l�闪断等�?/p>

在百万长�q�接的推送系�l�中�Q�服务端需要能够正��处理这些网�l�异常，设计要点如下�Q?/p>

客户端的重连间隔需要合理设�|�，防止�q�接�q�于频繁��D��的连接失败（例如端口�q�没有被释放�Q�；
客户端重复登陆拒�l�机�Ӟ��
服务端正��处理I/O异常和解码异常等�Q�防止句柄泄霌Ӏ?/li>

最后特别需要注意的一点就是close_wait �q�多问题�Q�由于网�l�不�E�_��l�常会导致客��L��断连�Q�如果服务端没有能够及时关闭socket�Q�就会导致处于close_wait状态的链�\�q�多�?close_wait状态的链�\�q�不释放句柄和内存等资源�Q�如果积压过多可能会��D��pȝ��句柄耗尽�Q�发�?#8220;Too many open files”异常�Q�新的客��L��无法接入�Q�涉及创建或者打开句柄的操作都��失败�?/p>

下面对close_wait状态进行下��单介�l�，被动关闭TCP�q�接状态迁�U�d��如下所�C�：

�?-1 被动关闭TCP�q�接状态迁�U�d��

close_wait 是被动关闭连接是形成的，�Ҏ��TCP状态机�Q�服务器端收到客��L��发送的FIN�Q�TCP协议栈会自动发送ACK�Q�链接进入close_wait状态。但如果服务器端不执行socket的close()操作�Q�状态就不能由close_wait�q�移到last_ack�Q�则�pȝ��中会存在很多close_wait�?态的�q�接。通常来说�Q�一个close_wait会维持至��?个小时的旉��Q�系�l�默认超时时间的�?200�U�，也就�?��时�Q�。如果服务端�E�序因某个原因导致系�l�造成一堆close_wait消耗资源，那么通常是等不到释放那一刻，�pȝ��已崩溃�?/p>

��D��close_wait�q�多的可能原因如下：

�E�序处理Bug�Q�导致接收到�Ҏ��的fin之后没有及时关闭socket�Q�这可能是Netty的Bug�Q�也可能是业务层Bug�Q�需要具体问题具体分析；
关闭socket不及�Ӟ��例如I/O�U�程被意外阻塞，或者I/O�U�程执行的用戯��定义Task比例�q�高�Q�导致I/O操作处理不及�Ӟ��链�\不能被及旉��放�?/li>

下面我们�l�合Netty的原理，�Ҏ��在的故障点进行分析�?/p>

�?计要�?�Q�不要在Netty的I/O�U�程上处理业务（心蟩发送和��除外）。Why? 对于Java�q�程�Q�线�E�不能无限增长，�q�就意味着Netty的Reactor�U�程数必��L��敛。Netty的默认值是CPU核数 * 2�Q�通常情况下，I/O密集型应用徏议线�E�数��量讄��大些�Q�但�q�主要是针对传统同步I/O而言�Q�对于非��d��I/O�Q�线�E�数�q�不��讄��太大�Q�尽��没有最�?��|��但是I/O�U�程数经验值是[CPU核数 + 1�Q�CPU核数*2 ]之间�?/p>

�?如单个服务器支撑100万个长连接，服务器内核数�?2�Q�则单个I/O�U�程处理的链接数L = 100/(32 * 2) = 15625�?假如�?S有一�ơ消息交互（新消息推送、心��x��息和其它��理消息�Q�，则��^均CAPS = 15625 / 5 = 3125�?�U�。这个数值相比于Netty的处理性能而言压力�q�不大，但是在实际业务处理中�Q�经�怼�有一些额外的复杂逻辑处理�Q�例如性能�l�计、记录接口日志等�Q�这些业务操作性能开销也比较大�Q�如果在I/O�U�程上直接做业务逻辑处理�Q�可能会��d��I/O�U�程�Q�媄响对其它链�\的读写操作，�q�就会导致被动关闭的�?路不能及时关闭，造成close_wait堆积�?/p>

设计要点2�Q�在I/O�U�程上执行自定义Task要当心。Netty的I/O处理�U�程NioEventLoop支持两种自定义Task的执行：

普通的Runnable: 通过调用NioEventLoop的execute(Runnable task)�Ҏ��执行�Q?/li>
定时��d��ScheduledFutureTask:通过调用NioEventLoop的schedule(Runnable command, long delay, TimeUnit unit)�p�d��接口执行�?/li>

��Z��么NioEventLoop要支持用戯��定义Runnable和ScheduledFutureTask的执行，�q�不是本文要讨论的重点，后箋会有专题文章�q�行介绍。本文重点对它们的媄响进行分析�?/p>

�?NioEventLoop中执行Runnable和ScheduledFutureTask�Q�意味着允许用户在NioEventLoop中执行非I/O�?作类的业务逻辑�Q�这些业务逻辑通常用消息报文的处理和协议管理相兟뀂它们的执行会抢占NioEventLoop I/O��d��的CPU旉��Q�如果用戯��定义Task�q�多�Q�或者单个Task执行周期�q�长�Q�会��D��I/O��d��操作被阻塞，�q�样也间接导致close_wait 堆积�?/p>

所以，如果用户在代码中使用��C��Runnable和ScheduledFutureTask�Q�请合理讄��ioRatio的比例，通过 NioEventLoop的setIoRatio(int ioRatio)�Ҏ��可以讄��该��|��默认��gؓ50�Q�即I/O操作和用戯��定义��d��的执行时间比�?�Q?�?/p>

我的��是当服务端处理�v量客��L��长连接的时候，不要在NioEventLoop中执行自定义Task�Q�或者非心蟩�cȝ��定时��d��?/p>

�?计要�?�Q�IdleStateHandler使用要当心。很多用户会使用IdleStateHandler做心跛_��送和��，�q�种用法值得提倡。相比于�?己启定时��d��发送心跻I��q�种方式更高效。但是在实际开发中需要注意的是，在心跳的业务逻辑处理中，无论是正常还是异常场景，处理时�g要可控，防止时�g不可控导致的NioEventLoop被意外阻塞。例如，心蟩��时或者发生I/O异常�Ӟ��业务调用Email发送接口告警，�׃��Email服务端处理超�Ӟ��?致邮件发送客��L��被阻塞，�U�联引�vIdleStateHandler的AllIdleTimeoutTask��d��被阻塞，最�l�NioEventLoop�?路复用器上其它的链�\��d��被阻塞�?/p>

对于ReadTimeoutHandler和WriteTimeoutHandler�Q�约束同样存在�?/p>

3.3. 合理的心跛_��?/h3>

百万�U�的推送服务，意味着会存在百万个长连接，每个长连接都需要靠和App之间的心��x��l�持链�\。合理设�|�心跛_��期是非常重要的工作，推送服务的心蟩周期讄��需要考虑�U�d��无线�|�络的特炏V�?/p>

�?一台智能手��上移动网�l�时�Q�其实�ƈ没有真正�q�接上Internet�Q�运营商分配�l�手机的IP其实是运营商的内�|�IP�Q�手机终端要�q�接上Internet �q�必��通过�q�营商的�|�关�q�行IP地址的�{换，�q�个�|�关��U�CؓNAT(NetWork Address Translation)�Q�简单来说就是手机终端连接Internet 其实��是�U�d��内网IP�Q�端口，外网IP之间�怺�映射�?/p>

GGSN(GateWay GPRS Support Note)模块��实��C��NAT功能�Q�由于大部分的移动无�U�网�l�运营商��Z��减少�|�关NAT映射表的负荷�Q�如果一个链路有一�D�|��间没有通信时就会删除其对应表，造成链�\中断�Q�正是这�U�刻意羃短空闲连接的释放��时�Q�原本是惌��省信道资源的作用�Q�没惛_��让互联网的应用不得以�q�高于正帔R��率发送心��x��l�护推送的�?�q�接。以中移动的2.5G�|�络��Z��Q�大�U?分钟左右的基带空�Ԍ��q�接��׃��被释放�?/p>

�?于移动无�U�网�l�的特点�Q�推送服务的心蟩周期�q�不能设�|�的太长�Q�否则长�q�接会被释放�Q�造成频繁的客��L��重连�Q�但是也不能讄��太短�Q�否则在当前�~�Z��l�一心蟩�?架的机制下很�Ҏ��D��信��o风暴�Q�例如微信心跳信令风暴问题）。具体的心蟩周期�q�没有统一的标准，180S也许是个不错的选择�Q�微信�ؓ300S�?/p>

在Netty中，可以通过在ChannelPipeline中增加IdleStateHandler的方式实现心��x��，在构造函��C��指定链�\�I�闲旉��Q�然后实现空闲回调接口，实现心蟩的发送和��，代码如下�Q?/p>

public void initChannel({@link Channel} channel) {  channel.pipeline().addLast("idleStateHandler", new {@link   IdleStateHandler}(0, 0, 180));  channel.pipeline().addLast("myHandler", new MyHandler()); } 拦截链�\�I�闲事�g�q�处理心跻I��  public class MyHandler extends {@link ChannelHandlerAdapter} {      {@code @Override}       public void userEventTriggered({@link ChannelHandlerContext} ctx, {@link Object} evt) throws {@link Exception} {           if (evt instanceof {@link IdleStateEvent}} {               //心蟩处理           }       }   }

3.4. 合理讄��接收和发送缓冲区定w��

对于镉K��接，每个链�\都需要维护自��q��消息接收和发送缓冲区�Q�JDK原生的NIO�c�d��使用的是java.nio.ByteBuffer,它实际是一个长度固定的Byte数组�Q�我们都知道数组无法动态扩容，ByteBuffer也有�q�个限制�Q�相关代码如下：

public abstract class ByteBuffer     extends Buffer     implements Comparable {     final byte[] hb; // Non-null only for heap buffers     final int offset;     boolean isReadOnly;

�?量无法动态扩展会�l�用户带来一些麻烦，例如�׃��无法预测每条消息报文的长度，可能需要预分配一个比较大的ByteBuffer�Q�这通常也没有问题。但是在 ��量推送服务系�l�中�Q�这会给服务端带来沉重的内存负担。假讑֍�条推送消息最大上限�ؓ10K�Q�消息��^均大��ؓ5K�Q��ؓ了满��?0K消息的处理，ByteBuffer的容量被讄��?0K�Q�这��h��条链路实际上多消耗了5K内存�Q�如果长链接链�\��Cؓ100万，每个链�\都独立持�?ByteBuffer接收�~�冲区，则额外损耗的��d��?Total(M) = 1000000 * 5K = 4882M。内存消耗过大，不仅仅增加了��g成本�Q�而且大内存容易导致长旉��的Full GC�Q�对�pȝ��E�_��性会造成比较大的冲击�?/p>

实际上，最灉|��的处理方式就是能够动态调整内存，��x��收缓冲区可以�Ҏ��以往接收的消息进行计��，动态调整内存，利用CPU资源来换内存资源�Q�具体的�{�略如下�Q?/p>

ByteBuffer支持定w��的扩展和收羃�Q�可以按需灉|��调整�Q�以节约内存�Q?/li>
接收消息的时候，可以按照指定的算法对之前接收的消息大��进行分析，�q��未来的消息大小�Q�按照预��值灵�z�调整缓冲区定w��Q�以做到最��的资源损耗满��程序正常功能�?/li>

�q�运的是�Q�Netty提供的ByteBuf支持定w��动态调��_��对于接收�~�冲区的内存分配器，Netty提供了两�U�：

FixedRecvByteBufAllocator�Q�固定长度的接收�~�冲区分配器�Q�由它分配的ByteBuf长度都是固定大小的，�q�不会根据实际数据报的大��动态收�~�。但是，如果定w��不��Q�支持动态扩展。动态扩展是Netty ByteBuf的一��基本功能，与ByteBuf分配器的实现没有关系�Q?/li>
AdaptiveRecvByteBufAllocator�Q�容量动态调整的接收�~�冲区分配器�Q�它会根据之前Channel接收到的数据报大��进行计��，如果�q�箋填充满接收缓冲区的可写空��_��则动态扩展容量。如果连�l?�ơ接收到的数据报都小于指定��|��则收�~�当前的定w��Q�以节约内存�?/li>

相对于FixedRecvByteBufAllocator�Q��用AdaptiveRecvByteBufAllocator更�ؓ合理�Q�可以在创徏客户端或者服务端的时候指定RecvByteBufAllocator�Q�代码如下：

 Bootstrap b = new Bootstrap();             b.group(group)              .channel(NioSocketChannel.class)              .option(ChannelOption.TCP_NODELAY, true)              .option(ChannelOption.RCVBUF_ALLOCATOR, AdaptiveRecvByteBufAllocator.DEFAULT)

如果默认没有讄��Q�则使用AdaptiveRecvByteBufAllocator�?/p>

另外值得注意的是�Q�无论是接收�~�冲��是发送缓冲区�Q�缓冲区的大��徏议设�|��ؓ消息的��^均大��，不要讄��成最大消息的上限�Q�这会导致额外的内存��费。通过如下方式可以讄��接收�~�冲区的初始大小�Q?/p>

/** 	 * Creates a new predictor with the specified parameters. 	 *  	 * @param minimum 	 *            the inclusive lower bound of the expected buffer size 	 * @param initial 	 *            the initial buffer size when no feed back was received 	 * @param maximum 	 *            the inclusive upper bound of the expected buffer size 	 */ 	public AdaptiveRecvByteBufAllocator(int minimum, int initial, int maximum)

对于消息发送，通常需要用戯��己构造ByteBuf�q�编码，例如通过如下工具�c�d��建消息发送缓冲区�Q?/p>

�?-2 构造指定容量的�~�冲�?/p>

3.5. 内存�?/h3>

推送服务器承蝲了�v量的镉K��接，每个镉K��接实际就是一个会话。如果每个会话都持有心蟩数据、接收缓冲区、指令集�{�数据结构，而且�q�些实例随着消息的处理朝生夕灭，�q�就会给服务器带来沉重的GC压力�Q�同时消耗大量的内存�?/p>

最有效的解决策略就是��用内存池�Q�每个NioEventLoop�U�程处理N个链路，在线�E�内部，链�\的处理时串行的。假如A链�\首先被处理，它会创徏接收�~?冲区�{�对象，待解码完成之后，构造的POJO对象被封装成Task后投递到后台的线�E�池中执行，然后接收�~�冲��Z��被释放，每条消息的接收和处理都会重复�?收缓冲区的创建和释放。如果��用内存池�Q�则当A链�\接收到新的数据报之后�Q�从NioEventLoop的内存池中申��L��闲的ByteBuf�Q�解码完成之后，调用release��ByteBuf释放到内存池中，供后�l�B链�\�l�箋使用�?/p>

使用内存池优化之后，单个NioEventLoop的ByteBuf甌��和GC�ơ数从原来的N = 1000000/64 = 15625 �ơ减��ؓ最��?�ơ（假设每次甌��都有可用的内存）�?/p>

下面我们以推特��用Netty4的PooledByteBufAllocator�q�行GC优化作�ؓ案例�Q�对内存池的效果�q�行评估�Q�结果如下：

垃圾生成速度是原来的1/5�Q�而垃圾清理速度快了5倍。��用新的内存池机制�Q�几乎可以把�|�络带宽压满�?/p>

Netty4 之前的版本问题如下：每当收到��C��息或者用户发送信息到�q�程端，Netty 3均会创徏一个新的堆�~�冲区。这意味着�Q�对应每一个新的缓冲区�Q�都会有一个new byte[capacity]。这些缓冲区会导致GC压力�Q��ƈ消耗内存带宽。�ؓ了安全�v见，新的字节数组分配时会用零填充�Q�这会消耗内存带宽。然而，用零填充的数�l�很可能会再�ơ用实际的数据填充，�q�又会消耗同��L��内存带宽。如果Java虚拟机（JVM�Q�提供了创徏新字节数�l�而又无需用零填充的方式，那么�?们本来就可以��内存带宽消耗减��?0%�Q�但是目前没有那样一�U�方式�?/p>

在Netty 4中实��C��一个新的ByteBuf内存池，它是一个纯Java版本�?nbsp;jemalloc �Q�Facebook也在用）。现在，Netty不会再因为用零填充缓冲区而浪费内存带宽了。不�q�，�׃��它不依赖于GC�Q�开发�h员需要小心内存泄漏。如果忘记在处理�E�序中释攄��冲区�Q�那么内存��用率会无限地增长�?/p>

Netty默认不��用内存池�Q�需要在创徏客户端或者服务端的时候进行指定，代码如下�Q?/p>

Bootstrap b = new Bootstrap();             b.group(group)              .channel(NioSocketChannel.class)              .option(ChannelOption.TCP_NODELAY, true)              .option(ChannelOption.ALLOCATOR, PooledByteBufAllocator.DEFAULT)

使用内存池之后，内存的申请和释放必须成对出现�Q�即retain()和release()要成对出玎ͼ�否则会导致内存泄霌Ӏ?/p>

值得注意的是�Q�如果��用内存池�Q�完成ByteBuf的解码工作之后必��L��式的调用ReferenceCountUtil.release(msg)�Ҏ��收缓冲区ByteBuf�q�行内存释放�Q�否则它会被认�ؓ仍然在��用中�Q�这样会��D��内存泄露�?/p>

3.6. 当心“日志隐�Ş杀�?#8221;

通常情况下，大家都知道不能在Netty的I/O�U�程上做执行旉��不可控的操作�Q�例如访问数据库、发送Email�{�。但是有个常用但是非常危险的操作却容易被忽略�Q�那便是记录日志�?/p>

�?常，在生产环境中�Q�需要实时打印接口日志，其它日志处于ERROR�U�别�Q�当推送服务发生I/O异常之后�Q�会记录异常日志。如果当前磁盘的WIO比较高，�?能会发生写日志文件操作被同步��d��Q�阻塞时间无法预��。这��׃��D��Netty的NioEventLoop�U�程被阻塞，Socket链�\无法被及时关闭、其它的链�\也无法进行读写操作等�?/p>

以最常用的log4j��Z��Q�尽��它支持异步写日志（AsyncAppender�Q�，但是当日志队列满之后�Q�它会同步阻塞业务线�E�，直到日志队列有空闲位�|�可用，相关代码如下�Q?/p>

 synchronized (this.buffer) {       while (true) {         int previousSize = this.buffer.size();         if (previousSize < this.bufferSize) {           this.buffer.add(event);           if (previousSize != 0) break;           this.buffer.notifyAll(); break;         }         boolean discard = true;         if ((this.blocking) && (!Thread.interrupted()) && (Thread.currentThread() != this.dispatcher)) //判断是业务线�E?        {           try           {             this.buffer.wait();//��d��业务�U�程             discard = false;           }           catch (InterruptedException e)           {             Thread.currentThread().interrupt();           }          }

�c�M��q�类BUG��h��极强的隐蔽性，往往WIO高的旉��持箋非常短，或者是偶现的，在测试环境中很难模拟此类故障�Q�问题定位难度非常大。这��p��求读者在�q�x��写代码的时候一定要当心�Q�注意那些隐性地雗��?/p>

3.7. TCP参数优化

常用的TCP参数�Q�例如TCP层面的接收和发送缓冲区大小讄��Q�在Netty中分别对应ChannelOption的SO_SNDBUF和SO_RCVBUF�Q�需要根据推送消息的大小�Q�合理设�|�，对于��量长连接，通常32K是个不错的选择�?/p>

另外一个比较常用的优化手段��是软中断，如图所�C�：如果所有的软中断都�q�行在CPU0相应�|�卡的硬件中断上�Q�那么始�l�都是cpu0在处理��Y中断�Q�而此时其它CPU资源��p��费了，因�ؓ无法�q�行的执行多个��Y中断�?/p>

�?-3 中断信息

�?于等�?.6.35版本的Linux kernel内核�Q�开启RPS�Q�网�l�通信性能提升20%之上。RPS的基本原理：�Ҏ��数据包的源地址�Q�目的地址以及目的和源端口�Q�计��出一个hash��|�� 然后�Ҏ��q�个hash值来选择软中断运行的cpu。从上层来看�Q�也��是说将每个�q�接和cpu�l�定�Q��ƈ通过�q�个hash��|��来均衡��Y中断�q�行在多个cpu 上，从而提升通信性能�?/p>

3.8. JVM参数

最重要的参数调整有两个�Q?/p>

-Xmx:JVM最大内存需要根据内存模型进行计��ƈ得出相对合理的��|��
GC相关的参�? 例如新生代和老生代、永久代的比例，GC的策略，新生代各区的比例�{�，需要根据具体的场景�q�行讄��和测试，�q�不断的优化�Q�尽量将Full GC的频率降到最低�?/li>

4. 作者简�?/h2>
李林锋，2007�q�毕业于东北大学�Q?008�q�进入华为公�总�事高性能通信软�g的设计和开发工作，�?�q�NIO设计和开发经验，�_�N��Netty、Mina�{�NIO框架。Netty中国�C�֌�创始人，《Netty权威指南》作者�?/p>

疯狂 2016-07-13 10:03 发表评论

疯狂 — Wed, 13 Jul 2016 01:49:00 GMT

转蝲自http://blog.csdn.net/zxhoo/article/details/17264263

Netty4

Netty是一个和MINA�c�M��的Java NIO框架�Q�目前的最新版本是4.0.13�Q�这两个框架的主要作者好像都�?a target="_blank" style="color: #ca0000; text-decoration: none;">同一个韩国�h�?/p>

Channel

Channel是Netty最核心的接口，一个Channel��是一个联�l�Socket的通道�Q�通过Channel�Q�你可以对Socket�q�行各种操作�?/p>

ChannelHandler

用Netty�~�写�|�络�E�序的时候，你很��直接操�U�Channel�Q�而是通过ChannelHandler来间接操�U�Channel�?/p>

Netty中的所有handler都实现自ChannelHandler接口。按照输��出来分，分�ؓChannelInboundHandler、ChannelOutboundHandler两大�c?/span>�?/p>

ChannelInboundHandler对从客户端发往服务器的报文�q�行处理�Q�一般用来执行解码、读取客��L��数据、进行业务处理等�Q?/p>
ChannelOutboundHandler对从服务器发往客户端的报文�q�行处理�Q�一般用来进行编码、发送报文到客户端�?/p>

ChannelPipeline

ChannelPipeline实际上应该叫做ChannelHandlerPipeline�Q�可以把ChannelPipeline看成是一个ChandlerHandler的链表，当需要对Channel�q�行某种处理的时候，Pipeline负责依次调用每一个Handler�q�行处理。每个Channel都有一个属于自��q��Pipeline�Q�调用Channel#pipeline()�Ҏ��可以获得Channel的Pipeline�Q�调用Pipeline#channel()�Ҏ��可以获得Pipeline的Channel�?/p>

ChannelPipeline的方法有很多�Q�其中一部分是用来管理ChannelHandler的，如下面这些：

ChannelPipeline addFirst(String name, ChannelHandler handler); ChannelPipeline addLast(String name, ChannelHandler handler); ChannelPipeline addBefore(String baseName, String name, ChannelHandler handler); ChannelPipeline addAfter(String baseName, String name, ChannelHandler handler); ChannelPipeline remove(ChannelHandler handler); ChannelHandler remove(String name); ChannelHandler removeFirst(); ChannelHandler removeLast(); ChannelPipeline replace(ChannelHandler oldHandler, String newName, ChannelHandler newHandler); ChannelHandler replace(String oldName, String newName, ChannelHandler newHandler); ChannelHandler first(); ChannelHandler last(); ChannelHandler get(String name);

ChannelHandlerContext

ChannelPipeline�q�不是直接管理ChannelHandler�Q�而是通过ChannelHandlerContext来间接管理，�q�一炚w��过ChannelPipeline的默认实现DefaultChannelPipeline可以看出来�?/p>

调用ChannelHandlerContext#channel()�Ҏ��可以得到和Context�l�定的Channel�Q�调�?span style="box-sizing: border-box; font-weight: 700;">ChannelHandlerContext#handler()�Ҏ��可以得到和Context�l�定的Handler�?/p>

ChannelPipeline和ChannelHandlerContext默认实现

DefaultChannelHandlerContext和DefaultChannelPipeline是ChannelHandlerContext和ChannelPipeline的默认实玎ͼ�下面是它们的部分代码�Q?/p>

final class DefaultChannelHandlerContext extends DefaultAttributeMap implements ChannelHandlerContext {      volatile DefaultChannelHandlerContext next;     volatile DefaultChannelHandlerContext prev;      private final boolean inbound;     private final boolean outbound;     private final AbstractChannel channel;     private final DefaultChannelPipeline pipeline;     private final String name;     private final ChannelHandler handler;     private boolean removed;      // ... }

final class DefaultChannelPipeline implements ChannelPipeline {     // ...      final DefaultChannelHandlerContext head;     final DefaultChannelHandlerContext tail;      // ... }

从上面的代码可以看出�Q�在DefaultPipeline内部�Q�DefaultChannelHandlerContext�l�成了一个双向链表：

再来看看DefaultChannelPipeline的构造函敎ͼ�

    public DefaultChannelPipeline(AbstractChannel channel) {         if (channel == null) {             throw new NullPointerException("channel");         }         this.channel = channel;          TailHandler tailHandler = new TailHandler();         tail = new DefaultChannelHandlerContext(this, null, generateName(tailHandler), tailHandler);          HeadHandler headHandler = new HeadHandler(channel.unsafe());         head = new DefaultChannelHandlerContext(this, null, generateName(headHandler), headHandler);          head.next = tail;         tail.prev = head;     }

可以看到�Q�DefaultChinnelPipeline内部使用了两个特�D�的Handler来表�C�Handler铄��头和��：

ChannelHandler的种�c?/h2>

Netty中的所有handler都实现自ChannelHandler接口。按照输��出来分，分�ؓChannelInboundHandler、ChannelOutboundHandler两大�c�R��ChannelInboundHandler对从客户端发往服务器的报文�q�行处理�Q�一般用来执行解码、读取客��L��数据、进行业务处理等�Q�ChannelOutboundHandler对从服务器发往客户端的报文�q�行处理�Q�一般用来进行编码、发送报文到客户端�?/p>

从上面DefaultChannelHandlerContext代码可以知道�Q�Handler实际上分��Z��U�，Inbound和Outbound�Q�这一点也可以从ChannelHandler接口的子接口得到证明�Q?/p>

public interface ChannelInboundHandler extends ChannelHandler {   // ... }  public interface ChannelOutboundHandler extends ChannelHandler {   // ... }

事�g的传�?/h2>

��Z��搞清楚事件如何在Pipeline里传播，让我们从Channel的抽象子�c�AbstractChannel开始，下面是AbstractChannel#write()�Ҏ��的实玎ͼ�

public abstract class AbstractChannel extends DefaultAttributeMap implements Channel {     // ...     @Override     public Channel write(Object msg) {         return pipeline.write(msg);     }     // ... }

AbstractChannel直接调用了Pipeline的write()�Ҏ��Q?/p>

final class DefaultChannelPipeline implements ChannelPipeline {     // ...     @Override     public ChannelFuture write(Object msg) {         return tail.write(msg);     }     // ... }

因�ؓwrite是个outbound事�g�Q�所以DefaultChannelPipeline直接扑ֈ�tail部分的context�Q�调用其write()�Ҏ��Q?/p>

接着看DefaultChannelHandlerContext的write()�Ҏ��Q?/span>

final class DefaultChannelHandlerContext extends DefaultAttributeMap implements ChannelHandlerContext {     // ...     @Override     public ChannelFuture write(Object msg) {         return write(msg, newPromise());     }      @Override     public ChannelFuture write(final Object msg, final ChannelPromise promise) {         if (msg == null) {             throw new NullPointerException("msg");         }          validatePromise(promise, true);          write(msg, false, promise);          return promise;     }      private void write(Object msg, boolean flush, ChannelPromise promise) {         DefaultChannelHandlerContext next = findContextOutbound();         next.invokeWrite(msg, promise);         if (flush) {             next.invokeFlush();         }     }      private DefaultChannelHandlerContext findContextOutbound() {         DefaultChannelHandlerContext ctx = this;         do {             ctx = ctx.prev;         } while (!ctx.outbound);         return ctx;     }      private void invokeWrite(Object msg, ChannelPromise promise) {         try {             ((ChannelOutboundHandler) handler).write(this, msg, promise);         } catch (Throwable t) {             notifyOutboundHandlerException(t, promise);         }     }      // ... }

context的write()�Ҏ��沿着context铑־�前找�Q�直��x��C��个outbound�c�d��的context为止�Q�然后调用其invokeWrite()�Ҏ��Q?/p>

invokeWrite()接着调用handler的write()�Ҏ��Q?/p>

最后看看ChannelOutboundHandlerAdapter的write()�Ҏ��实现�Q?/p>

public class ChannelOutboundHandlerAdapter extends ChannelHandlerAdapter implements ChannelOutboundHandler {     // ...     @Override     public void write(ChannelHandlerContext ctx, Object msg, ChannelPromise promise) throws Exception {         ctx.write(msg, promise);     }     // ... }

默认的实现调用了context的write()�Ҏ��而不做�Q何处理，�q�样write事�g��沿着outbound铄��l�传播：

可见�Q�Pipeline的事件传播，是靠Pipeline�Q�Context和Handler共同协作完成的�?/p>

疯狂 2016-07-13 09:49 发表评论

疯狂 — Wed, 13 Jul 2016 01:39:00 GMT

摘要: 转蝲自：http://www.infoq.com/cn/articles/netty-elegant-exit-mechanism-and-principles1.�q�程的优雅退�?.1.Kill -9 PID带来的问题在Linux上通常会通过kill -9 pid的方式强制将某个�q�程杀掉，�q�种方式��单高效，因此很多�E�序的停止脚本经�怼�选择使用kill -9 pid的方式。无论是Linux的Kill... 阅读全文

疯狂 2016-07-13 09:39 发表评论