??xml version="1.0" encoding="utf-8" standalone="yes"?> 回来看了一下java如果要实现这些功能,代码可能比shellq要多,看来q个领域实在不是java的专ѝ?
其中Q红色部分是pȝQ也是启动javaE序加蝲Main函数的classloaderQ?主要的设计考量有以下几点: 1、用自定义的ExtClassLoaderQ加载java的ext目录下的jar包)把程序加载的class完全和系l加载的class隔离开Q这样即使在eclipse容器中启动都不会有类冲突?/p>
Z么不从系l的ExtClassLoader作ؓ自定义classloader数的Ҏ两个考虑Q第一个是pȝExtClassLoader有可能不存在Q第二个是如果使用同一个ExtClassLoader中,在处理JNDI、XML和URL解析{java扩展功能时会遇到后加载的handler部分D不同classloader树加载的同一个类的ClassCastExceptionQ具体参见这些模块的源代码?/p>
2、WarClassLoader除了pȝcdCommonc(目前只有log相关c)以外的类都从war包的WEB-INFO和classes下加载?/p>
3、所有执行War包中代码的线EThreadContextClassLoader都设|ؓWarClassLoaderQ以供Spring和Webx中的相关工具cM用这个classloaderl构的后门来加蝲war包中的类Q典型例子是Webx中ResourceLoaderService是使用ContextClassLoader来加载类的?/p>
4、RialtoClassLoader也就是这个项目的容器加蝲器和WarClassLoader不在同一个树路径上,可以避免E序使用cdwar使用cȝclass冲突Q典型的是Spring容器相关代码?/p>
5、CommonClassLoader加蝲的类需要严格控Ӟ否则可能会导致运行期cdH,例如Spring的相关jar包绝对不可以出现在这个classloader作用范围内?/p>
MQClassLoader采用父分z机Ӟ后来增加的Thread ContextClassLoader在这个体pM增加了一个后门,带来了灵zL,也带来了很多令h困扰的问题,在做容器cȝ目旉免会遇到class loader层次设计的问题,q里抛砖引玉Q欢q达人拍砖?/p>
最q两天被一个故障搞MQ因为原来一个报警脚本是shell写的Q从一个javaE序的jmx接口抓取信息q汇d到监控系l,个hshell脚本能力比较E松,在python牛h下,使用python写了一个脚本,发觉非常爽,我这个菜鸟(学习l历1天)单就能编写出来一个复杂的脚本Q比shell的简化将q?倍,晚上得意洋z的向一个同学吹嘘ingQ结果被BSQ语法甜点而已Qjava也可以轻村ց出来Q而且也能做的那么_ֹ。?/p>
我以前也认ؓ语法甜点认只是锦上添花Q但是用了python之后Q发现自׃前还是偏见啊Q在特定环境下,如脚本、页面等情况下,语法甜点可以大大减少输入量和代码出错可能性,动态语aq是我们工具׃可缺的工具?/p>
是一个实时监控工P使用?
java agent
?
jvm attach
技术,可以在不停机的情况下实时监控U上E序的运行情况,另外Q对
btrace
脚本Q实际上是
java
E序Q做了非怸格的安全限制Q安全性很高,对应用程序基本没有媄响。在性能斚wQ?
cobar
q行q测试,Ҏ法进行调用耗时l计的时候,基本消费在微U别,可以说微不道?
【背景?/span>
在中文站
napoli
上线q程后,发现了一个奇怪的现象Q尽?已知"?
offer
发送端都已l迁Ud
napoli
pȝ中,但是老的
mq
pȝ仍然有新?
offer
消息q来Q因?
mq
的服务器非常多,定位消息来源成了一个非常大的问题。这U情况,惛_了?
BTrace
在某一台服务器q行U上监控q而期望发现这个幽c?
【过E?/span>
首先Q我们需要知道两个基本信息:消息cd和来?
ip
Q这h可以定位
offer
消息的来源?
要知道来?
ip
Q需要找到服务器?
理的类Q只有在建立
socket
的地方,才可以抓到具?
ip
Q经q分?
amq
代码Q发?
tcp
q接基本是由下面q个cL服务所有消息的接收的:
public class TcpTransport extends TransportThreadSupport implements Transport, Service, Runnable { private static final Log LOG = LogFactory.getLog(TcpTransport.class); private static final ThreadPoolExecutor SOCKET_CLOSE; protected final URI remoteLocation; protected final URI localLocation; protected final WireFormat wireFormat; protected int connectionTimeout = 30000; protected int soTimeout; protected int socketBufferSize = 64 * 1024; protected int ioBufferSize = 8 * 1024; protected boolean closeAsync=true;
protected Socket socket;
|
q个cM包含一?
socket
对象的成员变量,所有我们只要监?
readCommand
ҎQ这个方法的q回值实际上是一?
ActivemqObjectMessage
对象Q这样就可以在一个方法上加拦截器可以同时捕获到
ip
和消息对象,两全其美Q!Q?
protected Object readCommand() throws IOException { return wireFormat.unmarshal(dataIn); } |
因ؓ原有
ESB
消息通道都是一个队?
ESBQueue
Q所以无法通过队列名称来确定消息类型,必须通过
ESBTransferObject
对象来取得消息类型:
destType
Q?
offer
的区间是
1000-1008
public class ESBTransferObject implements Serializable {
private static final long serialVersionUID = -5975115234845303878L; /** * 消息体,原则上对象序列化后的XML数据(String) 注意使用XML1.1规范?/p> */ private Object content; /** * 用户自定义数?/p> */ private Object userDefineData; /** * 目的消息cd */
private int destType = -1;
|
但是Q在服务器端q没?
ESBTransferObject
对象Q无法反序列化(
BTrace
也不支持反序列化操作Q,所以没有方法简单取得消息类型信息!Q!
OK
Q我不反序列化,直接拿二q制
byte[]
Q类型信息应该是在固定位|的吧?但是发现q个对象
content
变长字符串定义在cd之前Q类型位|不定了,晕倒啊
不死心,输出二进制数据,x花明啊,原来对象序列化的时候,
primitive
?
field
都是紧接着cd信息写入的,所以,cd信息是在固定位置?
Q类型信息始l是
255
Q?
256
两个字节Q实际上?
4
个字节,但是目前我们只占?
2
个)
Ok
Q编写代码,试环境q行一下,晕倒,竟然有数l溢出!
使用
BTrace
Q把q个数组打印下来Q这个需要点技巧,
btrace
q?
for
都不允许Q,竟然发现
位置偏移?/span>
205
Q?
206
位置
Q这个真的不知道什么原因,估计是客L发送的时候压~了Q简单修改偏U量Q测试运行,
ok
Q所有的消息cd?
ip
的对照表打印出来了?
package com.alibaba.btrace.script;
import static com.sun.btrace.BTraceUtils.*;
import com.sun.btrace.annotations.*;
@BTrace
public class AMQQueue2IP {
@OnMethod(clazz = "org.apache.activemq.transport.tcp.TcpTransport", //需要拦截的cd
method = "readCommand", //需要拦截的Ҏ?/p>
location = @Location(Kind.RETURN)) //拦截位置Q方法返回时
public static void onTransportCommandExit(@Self Object transport, @Return Object command) { //捕获调用对象和返回?/p>
String commandName = str(command);
boolean isObjectMessage = (indexOf(commandName, "org.apache.activemq.command.ActiveMQObjectMessage") >= 0);
if (isObjectMessage) {
Object msg = command;
Object content = get(field(getSuperclass(getSuperclass(classOf(msg))), "content", false), msg);//捕获消息内容byte[]
byte[] bs = (byte[]) get(field(classOf(content), "data", false), content);
if (bs.length >= 206) {
int off = getInt(field(classOf(content), "offset", false), content);
int code = (0xff00&bs[205]<<8)+(0xff&bs[206]); //转换205,206字节为消息类?/p>
//println(str(code));
Object socket = get(field(classOf(transport), "socket"), transport);
String address = str(socket); //截取ip地址
int s = indexOf(address, "/");
int e = indexOf(address, ",");
int len = e - s;
String ip = substr(address, s + 1, e);
print(strcat(timestamp(),"---"));
println(strcat(strcat("ip: ", ip), strcat(" queueName: ", str(code))));
}
}
}
}
打印l果Q?/span>
2/3/10 12:38 PM---ip: 172.22.2.34 queueName: 2001
2/3/10 12:38 PM---ip: 172.22.2.41 queueName: 5001
2/3/10 12:38 PM---ip: 172.22.2.22 queueName: 5001
2/3/10 12:38 PM---ip: 172.22.2.47 queueName: 2001
2/3/10 12:38 PM---ip: 172.22.2.31 queueName: 2001
2/3/10 12:38 PM---ip: 172.22.2.13 queueName: 5001
2/3/10 12:38 PM---ip: 172.22.2.6 queueName: 5001
2/3/10 12:38 PM---ip: 172.22.2.48 queueName: 2001
2/3/10 12:38 PM---ip: 172.22.2.39 queueName: 2001
【补充?/span>
BTrace 是一个强大的工具Q但是,在线上检的时候考虑时效性和安全性,必须有一个经q检验的脚本库才可以安全及时的定位系l问?
调试代码发现Q?/p>
在Activemq的send response处理中,使用了一个BlockingQueueQ在有timeout的方法里Q用了pollҎQ这个方法的api说明中指出,当timeout发生Ӟq个Ҏq回nullQ!Q?/p>
我们在看AMQl过层层调用后,在ActiveMQConnectionҎ中如何处理这个返回|
对返回gؓI的情况没有做Q何处理,即消息发送超Ӟamq也认个消息发送成功!估计q哥们理解poll在timeout的时候会抛出异常吧?/p>
解决办法很简单,在response为空的时候,抛出JMSExceptionQ告知发生Timeout错误?/p>