天地生人,有一人應(yīng)有一人之業(yè);人生在世,生一日當(dāng)盡一日之勤!

posts - 122, comments - 25, trackbacks - 0

(來源測試時代,http://www.testage.net)

多數(shù)人對怎樣去分析工具收集到的測試結(jié)果感到無從下手，下面我就把個人工作中的體會和收集到的有關(guān)資料整理出來，希望能對大家分析測試結(jié)果有所幫助。

分析原則：
• 具體問題具體分析（這是由于不同的應(yīng)用系統(tǒng)，不同的測試目的，不同的性能關(guān)注點）
• 查找瓶頸時按以下順序，由易到難。
服務(wù)器硬件瓶頸-〉網(wǎng)絡(luò)瓶頸（對局域網(wǎng)，可以不考慮）-〉服務(wù)器操作系統(tǒng)瓶頸（參數(shù)配置）-〉中間件瓶頸（參數(shù)配置，數(shù)據(jù)庫，web服務(wù)器等）-〉應(yīng)用瓶頸（SQL語句、數(shù)據(jù)庫設(shè)計、業(yè)務(wù)邏輯、算法等）
注：以上過程并不是每個分析中都需要的，要根據(jù)測試目的和要求來確定分析的深度。對一些要求低的，我們分析到應(yīng)用系統(tǒng)在將來大的負載壓力（并發(fā)用戶數(shù)、數(shù)據(jù)量）下，系統(tǒng)的硬件瓶頸在哪兒就夠了。
• 分段排除法很有效

分析的信息來源：
•1 根據(jù)場景運行過程中的錯誤提示信息
•2 根據(jù)測試結(jié)果收集到的監(jiān)控指標(biāo)數(shù)據(jù)

一．錯誤提示分析

分析實例：
1 •Error: Failed to connect to server "10.10.10.30:8080": [10060] Connection
  •Error: timed out Error: Server "10.10.10.30" has shut down the connection prematurely

  分析：
•A、應(yīng)用服務(wù)死掉。
（小用戶時：程序上的問題。程序上處理數(shù)據(jù)庫的問題）
•B、應(yīng)用服務(wù)沒有死
（應(yīng)用服務(wù)參數(shù)設(shè)置問題）
例：在許多客戶端連接Weblogic應(yīng)用服務(wù)器被拒絕，而在服務(wù)器端沒有錯誤顯示，則有可能是Weblogic中的server元素的 AcceptBacklog屬性值設(shè)得過低。如果連接時收到connection refused消息，說明應(yīng)提高該值，每次增加25％
•C、數(shù)據(jù)庫的連接
(1、在應(yīng)用服務(wù)的性能參數(shù)可能太小了 2、數(shù)據(jù)庫啟動的最大連接數(shù)（跟硬件的內(nèi)存有關(guān)）)

2  Error: Page download timeout (120 seconds) has expired

分析：可能是以下原因造成
•A、應(yīng)用服務(wù)參數(shù)設(shè)置太大導(dǎo)致服務(wù)器的瓶頸
•B、頁面中圖片太多
•C、在程序處理表的時候檢查字段太大多

二．監(jiān)控指標(biāo)數(shù)據(jù)分析

1．最大并發(fā)用戶數(shù)：
應(yīng)用系統(tǒng)在當(dāng)前環(huán)境（硬件環(huán)境、網(wǎng)絡(luò)環(huán)境、軟件環(huán)境（參數(shù)配置））下能承受的最大并發(fā)用戶數(shù)。
在方案運行中，如果出現(xiàn)了大于3個用戶的業(yè)務(wù)操作失敗，或出現(xiàn)了服務(wù)器shutdown的情況，則說明在當(dāng)前環(huán)境下，系統(tǒng)承受不了當(dāng)前并發(fā)用戶的負載壓力，那么最大并發(fā)用戶數(shù)就是前一個沒有出現(xiàn)這種現(xiàn)象的并發(fā)用戶數(shù)。
如果測得的最大并發(fā)用戶數(shù)到達了性能要求，且各服務(wù)器資源情況良好，業(yè)務(wù)操作響應(yīng)時間也達到了用戶要求，那么OK。否則，再根據(jù)各服務(wù)器的資源情況和業(yè)務(wù)操作響應(yīng)時間進一步分析原因所在。

2．業(yè)務(wù)操作響應(yīng)時間：
• 分析方案運行情況應(yīng)從平均事務(wù)響應(yīng)時間圖和事務(wù)性能摘要圖開始。使用“事務(wù)性能摘要”圖，可以確定在方案執(zhí)行期間響應(yīng)時間過長的事務(wù)。
• 細分事務(wù)并分析每個頁面組件的性能。查看過長的事務(wù)響應(yīng)時間是由哪些頁面組件引起的？問題是否與網(wǎng)絡(luò)或服務(wù)器有關(guān)？
• 如果服務(wù)器耗時過長，請使用相應(yīng)的服務(wù)器圖確定有問題的服務(wù)器度量并查明服務(wù)器性能下降的原因。如果網(wǎng)絡(luò)耗時過長，請使用“網(wǎng)絡(luò)監(jiān)視器”圖確定導(dǎo)致性能瓶頸的網(wǎng)絡(luò)問題
3．服務(wù)器資源監(jiān)控指標(biāo)：
內(nèi)存：
1 UNIX資源監(jiān)控中指標(biāo)內(nèi)存頁交換速率（Paging rate），如果該值偶爾走高，表明當(dāng)時有線程競爭內(nèi)存。如果持續(xù)很高，則內(nèi)存可能是瓶頸。也可能是內(nèi)存訪問命中率低。

2 Windows資源監(jiān)控中，如果Process\Private Bytes計數(shù)器和Process\Working Set計數(shù)器的值在長時間內(nèi)持續(xù)升高，同時Memory\Available bytes計數(shù)器的值持續(xù)降低，則很可能存在內(nèi)存泄漏。

內(nèi)存資源成為系統(tǒng)性能的瓶頸的征兆:
很高的換頁率(high pageout rate);
進程進入不活動狀態(tài);
交換區(qū)所有磁盤的活動次數(shù)可高;
可高的全局系統(tǒng)CPU利用率;
內(nèi)存不夠出錯(out of memory errors)

處理器：
1 UNIX資源監(jiān)控（Windows操作系統(tǒng)同理）中指標(biāo)CPU占用率（CPU utilization），如果該值持續(xù)超過95%，表明瓶頸是CPU?？梢钥紤]增加一個處理器或換一個更快的處理器。如果服務(wù)器專用于SQL Server,可接受的最大上限是80-85%
合理使用的范圍在60%至70%。
2 Windows資源監(jiān)控中，如果System\Processor Queue Length大于2，而處理器利用率（Processor Time）一直很低，則存在著處理器阻塞。

CPU資源成為系統(tǒng)性能的瓶頸的征兆:
   很慢的響應(yīng)時間(slow response time)
   CPU空閑時間為零(zero percent idle CPU)
   過高的用戶占用CPU時間(high percent user CPU)
   過高的系統(tǒng)占用CPU時間(high percent system CPU)
長時間的有很長的運行進程隊列(large run queue size sustained over time)

磁盤I/O：
1 UNIX資源監(jiān)控（Windows操作系統(tǒng)同理）中指標(biāo)磁盤交換率（Disk rate），如果該參數(shù)值一直很高，表明I/O有問題?？煽紤]更換更快的硬盤系統(tǒng)。
2 Windows資源監(jiān)控中，如果 Disk Time和Avg.Disk Queue Length的值很高，而Page Reads/sec頁面讀取操作速率很低，則可能存在磁盤瓶徑。

I/O資源成為系統(tǒng)性能的瓶頸的征兆 :
   過高的磁盤利用率(high disk utilization)
太長的磁盤等待隊列(large disk queue length)
等待磁盤I/O的時間所占的百分率太高(large percentage of time waiting for disk I/O)
太高的物理I/O速率:large physical I/O rate(not sufficient in itself)
過低的緩存命中率(low buffer cache hit ratio(not sufficient in itself))
太長的運行進程隊列，但CPU卻空閑(large run queue with idle CPU)

4．?dāng)?shù)據(jù)庫服務(wù)器：
SQL Server數(shù)據(jù)庫：
1 SQLServer資源監(jiān)控中指標(biāo)緩存點擊率（Cache Hit Ratio），該值越高越好。如果持續(xù)低于80%，應(yīng)考慮增加內(nèi)存。
2 如果Full Scans/sec（全表掃描/秒）計數(shù)器顯示的值比1或2高，則應(yīng)分析你的查詢以確定是否確實需要全表掃描，以及SQL查詢是否可以被優(yōu)化。
3 Number of Deadlocks/sec(死鎖的數(shù)量/秒)：死鎖對應(yīng)用程序的可伸縮性非常有害，并且會導(dǎo)致惡劣的用戶體驗。該計數(shù)器的值必須為0。
4 Lock Requests/sec(鎖請求/秒)，通過優(yōu)化查詢來減少讀取次數(shù)，可以減少該計數(shù)器的值。

Oracle數(shù)據(jù)庫：
  1 如果自由內(nèi)存接近于0而且?guī)炜齑婊驍?shù)據(jù)字典快存的命中率小于0.90，那么需要增加SHARED_POOL_SIZE的大小。
快存（共享SQL區(qū)）和數(shù)據(jù)字典快存的命中率：
select(sum(pins-reloads))/sum(pins) from v$librarycache;
select(sum(gets-getmisses))/sum(gets) from v$rowcache;
自由內(nèi)存： select * from v$sgastat where name=’free memory’;
2 如果數(shù)據(jù)的緩存命中率小于0.90，那么需要加大DB_BLOCK_BUFFERS參數(shù)的值（單位：塊）。
  緩沖區(qū)高速緩存命中率：
select name,value from v$sysstat where name in ('db block gets’,
'consistent gets','physical reads') ;

Hit Ratio = 1-(physical reads / ( db block gets + consistent gets))
3 如果日志緩沖區(qū)申請的值較大，則應(yīng)加大LOG_BUFFER參數(shù)的值。
日志緩沖區(qū)的申請情況：
   select name,value from v$sysstat where name = 'redo log space requests' ;
4 如果內(nèi)存排序命中率小于0.95，則應(yīng)加大SORT_AREA_SIZE以避免磁盤排序。
內(nèi)存排序命中率：
   select round((100*b.value)/decode((a.value+b.value), 0, 1, (a.value+b.value)), 2)from v$sysstat a, v$sysstat b where a.name='sorts (disk)' and b.name='sorts (memory)'

注：上述SQL Server和Oracle數(shù)據(jù)庫分析，只是一些簡單、基本的分析，特別是Oracle數(shù)據(jù)庫的分析和優(yōu)化，是一門專門的技術(shù)，進一步的分析可查相關(guān)資料。

posted on 2007-12-18 13:16 josson 閱讀(597) 評論(0) 編輯收藏所屬分類: java 開發(fā)

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關(guān)文章: 基于客戶端（瀏覽器）證書身份認證的方法 Java序列化算法原理 GC垃圾回收機制通用業(yè)務(wù)引用查詢服務(wù)實現(xiàn) 通過Findbugs 找出程序中隱藏的bug java反編譯工具 Eclipse 常用插件. ibatis 自動生成的主鍵項目構(gòu)建工具之Maven AXIS快速生成客戶端調(diào)用文件

<

2007年12月

>

日

一

二

三

四

五

六

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

常用鏈接

留言簿(3)

隨筆分類

隨筆檔案

收藏夾

搜索

最新評論

閱讀排行榜

評論排行榜