捉蟲記--大容量Web應用性能測試與LoadRunner實戰(連載四)

10原則。
　　在3秒鐘之內，頁面給予用戶響應并有所顯示被認為是"不錯的"。
　　在3～5秒鐘內，頁面給予用戶響應并有所顯示被認為是"好的"。
　　而5～10秒鐘是可以"勉強接受的"。
　　超過10秒鐘就有點讓人不耐煩了，用戶很可能不會繼續等待下去。
　　在盡可能合理的情況下，響應時間應該越快越好。
　　另外，響應時間包含了網絡傳輸數據的時間、DNS記錄查找時間和真正由網站服務器處理的時間，因此，遇到時間間隔很長的情況時，首先要排除前兩個時間的影響。
　　另外，還有很重要的兩點不能忽略：
　　小白只是以一個用戶的身份去訪問網站的測試版本，而網站一旦投入使用，真實情況是會有上萬人同時訪問它，那么響應時間還會有現在這么好嗎？
　　小白是在公司內部進行測試的，要知道公司內部的局域網一般都是百兆、千兆網，速度非?？欤蝗绻麚Q到家里，用ADSL之類的上網條件，響應時間還會如此快嗎？
　　這幾個問題都說明小白的這次性能測試確實欠缺很多因素。不過，這正是我們在下面的章節要學習的。
　　2．測試場所和指標的問題
　　小白在進行測試的時候，記錄的是自己電腦上的時間間隔，從它數值的大小來間接判斷服務器端性能的好壞。那么，能不能直接獲得服務器端的性能數據，豈不是更加精確嗎？
　　是的，完全可以。響應時間所帶給人的只是性能好壞的大概印象，如果要更加專業的測試性能，需要獲取服務器端的指標數據，我們管這些指標叫做性能計數器（Performance Counter），在第6章，我們將重點介紹它們的單個含義以及獲取方法。
　　綜上所述，小白基于目前理解的第一次性能測試有了結果，雖然過程遠遠不夠，但也讓我們體會到了性能測試所關注的要點，進行的大致過程。簡單地說，Web應用的性能測試方法，就是通過模擬若干用戶對于網站的訪問，獲得性能計數器和其他指標的數據，再分析它們以進行性能評估，使得關注性能測試的各方對系統性能有基本的認識。

　　5.1.7 壓力測試（Stress Testing）
　　相對于前面性能測試方法的普通，壓力測試（Stress Testing）方法可以說走了一個極端。它測試Web應用在事先規定的某種飽和狀態下，比如CPU處于75%利用率的情況下，系統是否還具備處理業務的能力，或者系統會發生什么樣的狀況（出現錯誤？系統宕機？等）。
　　一句話，壓力測試是考驗一個系統的抗壓能力的：在當前比較大的壓力下，它能否承受得住。壓力測試的目的是為了測試Web應用的穩定性。
　　【壓力測試與體操比賽】
　　在體育比賽場上我們可以看到生活中的壓力測試，例如體操比賽中的規定動作環節。場上選手在比賽時，其動作組合必須包含組委會所設定的所有規定動作，如圖5-3所示的經典規定動作--托馬斯全旋。通過在這樣的條件下比賽，裁判來考察運動員的完成質量，由于動作難度系數基本一致，重點將是完成質量的穩定性。通過這個類比，壓力測試就很好理解了。
圖5-3 類似壓力測試的體操規定動作比賽（圖中動作為托馬斯全旋）
　　壓力測試方法有如下的兩個特點：
　?。?）壓力測試方法的目的是測試系統（本書中為Web應用）的穩定性。人們對很多軟件系統都有這樣一個經驗：當系統處于較大壓力的時候，如果還能夠維持正常工作，那么，就能說明它在壓力不大的一般條件下，具有長時間正常工作的能力。從這里可以看出，壓力測試方法有一點“一葉知秋”、“以小見大”的含義在其中。
　　（2）壓力測試方法的具體操作過程是通過對系統施加負荷（模擬用戶對Web應用的訪問等），使系統的資源占用保持在一個事先約定的水平（比如前文所提到的CPU占用率75%），來檢驗此時系統的表現。測試的重點在于系統對于用戶的響應時間變化、系統是否出現錯誤甚至崩潰等。
　　5.1.8 負載測試（Stress Testing）簡介
　　在實際工作中，負載測試方法和壓力測試方法往往被放在一起談論，因此很容易混淆，其實它們的區別是很明顯的。
　　【負載測試方法】
　　負載測試（Load Testing）方法通過在被測試系統上不斷增加負荷，直到事先選定的性能指標（比如響應時間），變為不可接受或系統的某類資源使用已經達到飽和狀態。負載測試方法實際就是一個不斷加壓，直到找到系統不可用臨界點的過程，形象地說，那一點正是“強弩之末”。
　【負載測試方法與舉重比賽】
　　在5.1.7節我們把壓力測試和體操比賽的規定動作相類比，在這里我們將負載測試方法類比為舉重比賽，如圖5-4所示。在比賽中，選手不斷地增加重量，挑戰自己的極限，直到杠鈴加到某一個重量時，3次試舉都失敗。這一重量就是舉重比賽的最終結果。
圖5-4 舉重比賽與負載測試有相同之處
　　通過負載測試方法，我們可以發現系統的處理極限點在哪里。
　　5.1.9 負載測試的特點
　　負載測試方法有如下幾個特點。
　?。?）它的主要目的在于找到系統處理能力的極限，為系統進一步優化做參考。另外，這種測試也可以用來比較不同的優化方法對于性能極限的提升，因此也可以稱之為可擴展性測試（Scalability Testing）。這個名詞可以用圖5-5清晰地表述出來。
　　在圖5-5中，2條曲線分別代表兩種優化方法經歷負載測試的結果。A方法的性能極限在A點，B方法的性能極限在B點。根據負載測試的定義，比A、B兩點值小的部分都是系統的安全運行區間。由于B的數值要大于A，說明采用B方法優化，系統的可擴展性提高了。
圖5-5 負載測試用于優化方法的比較：B好于A
　　（2）負載測試方法的操作是一個不斷加壓的過程。負載測試方法是一個"性能指標記錄--增加負荷"的操作循環，直到預定被關注的性能指標不再令人滿意。這個極限點在測試結果中的表示類似這樣的形式："在給定條件下當前Web應用將最多允許10000個并發用戶訪問"、"在給定條件下當前Web應用最多能夠在1分鐘內處理1000次用戶對數據庫的修改"等。常見的在負載測試方法中被關注的性能指標包括：Web應用的響應時間、Web服務器平均CPU利用率等，它們的具體數值需要根據實際情況來調整。
　?。?）負載測試方法要考慮被測Web應用的實際業務負荷量與正確的使用場景，以保證測試結果具有參考價值。
　　【實戰演練：教訓】
　　在這方面，筆者的同事曾經有一個教訓。有一個網站，可以通過Web直接訪問，也可以通過RSS進行訂閱。在網站發布之前，網站技術部門的所有工程師都認為絕大部分用戶都是通過Web來訪問的，因此，在時間緊迫的情況下，重點測試了Web訪問的性能，對于RSS相關代碼測試的就很少。結果在網站上線之后，他們驚奇地發現，大部分用戶訪問都是通過RSS來完成的，因為負載測試做的很簡略，結果每過多久服務器就被拖的幾乎無法訪問了。可見，對于負載測試，乃至整個性能測試而言，模擬真實的應用場景是多么的關鍵。
　?。ㄎ赐甏m）
相關鏈接：
捉蟲記--大容量Web應用性能測試與LoadRunner實戰(連載一)
捉蟲記--大容量Web應用性能測試與LoadRunner實戰(連載二)
捉蟲記--大容量Web應用性能測試與LoadRunner實戰(連載三)

qileilove

捉蟲記--大容量Web應用性能測試與LoadRunner實戰(連載四)