2009年12月9日 #
優(yōu)化雜談
Author :放翁
Blog:http://blog.csdn.net/cenwenchu79/
當(dāng)應(yīng)用遇到規(guī)模化問題的時(shí)候,就是考慮性能優(yōu)化的時(shí)候了。今天同事和我聊起了NIO在客戶端的使用與BIO有什么優(yōu)勢(shì),也勾起了我前一陣子和其他同學(xué)交流優(yōu)化的一些想法,純粹個(gè)人的一點(diǎn)想法。
CPU利用率和Load
在過去做壓力測(cè)試的時(shí)候,我們經(jīng)常會(huì)關(guān)注兩個(gè)指標(biāo),CPU和Load。有同學(xué)覺得CPU利用率上去了Load肯定也上去了,Load上去了CPU利用率同樣會(huì)上去。但是在一些需要優(yōu)化的場(chǎng)景下,常常會(huì)看到Load很高,CPU利用率卻可能比較低(多核更是可能出現(xiàn)分配不均的情況)。Load其實(shí)就是等待處理的任務(wù)隊(duì)列,當(dāng)你的應(yīng)用在等待同步消息返回處理的同時(shí),CPU還是會(huì)將時(shí)間切片分配給這些線程,而真正需要CPU的線程,卻不得不在到了時(shí)間片以后暫時(shí)放棄工作被掛起。因此在程序設(shè)計(jì)的時(shí)候就要考慮如何利用好CPU的這個(gè)資源,如何均勻的將壓力分?jǐn)偟礁鱾€(gè)CPU上(有時(shí)候就一個(gè)線程在不斷循環(huán),導(dǎo)致單個(gè)CPU負(fù)荷很高)。
NIO在客戶端的使用
Http消息設(shè)置keepalive和采用NIO的方式復(fù)用信道、BIO結(jié)合連接池的方式,最基本的目的就是降低建立TCP產(chǎn)生握手的成本,最大限度的復(fù)用已有的資源,但是否NIO就只有復(fù)用信道這點(diǎn)呢?
NIO和BIO在數(shù)據(jù)傳輸和處理的模式上有不同,NIO采用的是BufferPacket+Channel的模式,這其實(shí)和操作系統(tǒng)本身的傳輸模式很類似,而BIO的Stream的模式是Java自己獨(dú)特的模式。在采用NIO的這種數(shù)據(jù)傳輸模式以后,可以充分利用操作系統(tǒng)本身對(duì)傳輸?shù)膬?yōu)化,因此這是一方面好處。另一方面異步和事件機(jī)制的使用,可以降低對(duì)于昂貴的資源申請(qǐng),在高并發(fā)下提高處理能力。
NIO客戶端的編程模型最大特點(diǎn):依賴反置,松耦合帶來性能提升。在請(qǐng)求流程協(xié)議中支持“票根”,也就是我們說的回執(zhí)。例如,你今天面試完了,不需要你在阿里巴巴前臺(tái)等著結(jié)果,直接留個(gè)電話,有消息就會(huì)直接通知,電話就是通知結(jié)果和服務(wù)請(qǐng)求者的關(guān)聯(lián)手段。(此時(shí)阿里巴巴前臺(tái)和會(huì)議室就會(huì)有足夠的空間給其他人來面試,這就是資源)
服務(wù)端使用NIO就不多說了,這里主要說一下在客戶端的使用場(chǎng)景。兩者是否真的有很大的差別,是否NIO有絕對(duì)的優(yōu)勢(shì),其實(shí)還是和場(chǎng)景有關(guān)。簡單說來就一個(gè)判斷標(biāo)準(zhǔn):應(yīng)用對(duì)于通道的利用率是否夠高。下面列了4種場(chǎng)景:
1. 一次請(qǐng)求數(shù)據(jù)量很少,服務(wù)處理速度很快。
2. 一次請(qǐng)求數(shù)據(jù)量很多,服務(wù)處理速度很快。
3. 一次請(qǐng)求數(shù)據(jù)量很少,服務(wù)處理速度很慢。
4. 一次請(qǐng)求數(shù)據(jù)量很多,服務(wù)處理速度很慢。
場(chǎng)景1,傳輸效率很高,服務(wù)處理速度很快,一次請(qǐng)求很快就被完成,采用NIO和BIO,在性能優(yōu)勢(shì)上除了操作系統(tǒng)對(duì)NIO的優(yōu)化以外,BIO連接池不輸于NIO。在易用性上,BIO更加容易處理。(NIO的異步機(jī)制,就要求消息傳輸協(xié)議需要有會(huì)話碼來提供異步處理入口選擇如何處理)
場(chǎng)景2,傳輸過程比較長,消耗時(shí)間比較多,服務(wù)處理速度很快,因此交互的時(shí)間大部分都還是在數(shù)據(jù)通道傳輸上,由于NIO在傳輸過程中依然是串行化的,因此BIO的連接池優(yōu)于NIO,同時(shí)NIO一個(gè)客戶端只有一個(gè)通道,因此BIO開的連接池越大,并行處理能力越強(qiáng),因此BIO效率比較好一些。
場(chǎng)景3,傳輸量比較少,服務(wù)處理比較慢,很明顯這是通道利用率低的表現(xiàn),NIO有絕對(duì)的優(yōu)勢(shì),特別是在高并發(fā)下。信道和服務(wù)端客戶端資源被充分利用。
場(chǎng)景4,傳輸量比較多,服務(wù)處理也比較慢,這時(shí)候可以發(fā)現(xiàn)信道利用率取決于服務(wù)事件和傳輸消耗時(shí)間的比例,這類場(chǎng)景某些情況下BIO也會(huì)優(yōu)于NIO。
單線程和多線程
在使用多線程來優(yōu)化程序的時(shí)候,是否考慮過多線程的使用場(chǎng)景,多線程不是萬能藥,在某些情況下還可能是毒藥。使用多線程的過程中,需要考慮這么幾個(gè)因素:
1. 資源競爭,復(fù)雜度增加。
為什么前面提到的NIO客戶端在處理數(shù)據(jù)流發(fā)送和讀取的時(shí)候都是采用單線程,數(shù)據(jù)流的發(fā)送和讀取都是在一個(gè)數(shù)據(jù)通道上的,而讀取和發(fā)送本身時(shí)間消耗是固定的(不論是多線程還是單線程),同時(shí)增加了復(fù)雜度(需要處理數(shù)據(jù)包整合問題)。這其實(shí)就是在資源上的串行化操作直接導(dǎo)致了任務(wù)的串行化,因此任務(wù)多線程反而起到了反作用。
2. 是否是關(guān)鍵路徑的工作,占關(guān)鍵路徑的比例。
首先,在優(yōu)化以前需要考慮優(yōu)化的內(nèi)容是否是關(guān)鍵路徑的工作,如果不是,那么增加復(fù)雜度實(shí)現(xiàn)的多線程模式,就沒有價(jià)值。其次就是看是否是在關(guān)鍵路徑中占有比較大的比例,同樣的,還是投入產(chǎn)出比例(多線程帶來的復(fù)雜度以及在高并發(fā)下的一些資源保護(hù)措施都需要很多的維護(hù)成本)。
3. 任務(wù)的合理切分。
在NIO的客戶端,接受數(shù)據(jù)的事件將會(huì)寫得很輕量級(jí),但是接受到數(shù)據(jù)然后分析數(shù)據(jù)還原成業(yè)務(wù)對(duì)象,則會(huì)通過線程池的方式來分別處理。就好比監(jiān)聽連接到來,和實(shí)際的去建立連接分成了兩個(gè)階段的任務(wù),讓事件型的任務(wù)單純,快速執(zhí)行,讓與業(yè)務(wù)相關(guān)的部分通過多線程并行的方式提高處理效率。總的來說就是把任務(wù)劃分成為系統(tǒng)性的任務(wù)和業(yè)務(wù)性的任務(wù),前者消耗時(shí)間少,設(shè)計(jì)盡量簡單高效,采用單線程處理即可,后者通常情況下在處理流程和資源上不沖突的情況可以通過多線程并行提高效率。
優(yōu)化應(yīng)用關(guān)注點(diǎn):
A.關(guān)鍵路徑是否可以優(yōu)化,關(guān)鍵路徑的任務(wù)拆分。
B.關(guān)鍵路徑上的單個(gè)任務(wù)是否可以拆分并行執(zhí)行。(是否有資源競爭,是否會(huì)有流程上的前后依賴,是否增加復(fù)雜度引入新的不穩(wěn)定因素)
C.系統(tǒng)資源和依賴外部系統(tǒng)是否會(huì)成為瓶頸。(單機(jī)的CPU,IO都會(huì)在一定的壓力下成下降趨勢(shì),并行執(zhí)行反而降低了處理能力)
因此,可以看到不論是MapReduce設(shè)計(jì)下的Hadoop,還是Erlang語言級(jí)別的特性,都盡量的希望任務(wù)之間可以并行執(zhí)行,相互之間低耦合,通過異步事件消息通知方式來交互,同時(shí)數(shù)據(jù)沒有共享,防止資源競爭導(dǎo)致無法并行高效處理。系統(tǒng)設(shè)計(jì)還是要根據(jù)場(chǎng)景來判斷使用什么方式優(yōu)化,越簡單越好。
中午左右收到一個(gè)看我blog的朋友的郵件,最近他在研究mapreduce,然后想用hadoop來做一些工作,不過遇到了一些問題,我這邊也貼一下他的幾個(gè)問題,同時(shí)覺得自己把自己的一些看法分享一下,當(dāng)然只是自己的一些想法,也許對(duì)新學(xué)習(xí)的同學(xué)有幫助。
問題:
- 從Map(K,V)的方式來看,難道m(xù)apreduce只能做統(tǒng)計(jì)?
- 目前我想除了日志分析之類的功能外,還想做一個(gè)全文檢索的功能,類似windows查詢一下,通過關(guān)鍵字查詢文件的位置即可(可能還要根據(jù)匹配度做排序),這個(gè)我很迷茫不知道怎么下手,痛苦ing
- 你的實(shí)踐是一個(gè)單機(jī)模式,如果用戶把一個(gè)1G的log已經(jīng)上傳到hdfs了,此時(shí)分割工作已經(jīng)完成,只需要從client那里得到文件基本信息和塊的location就可以了,那mapreduce怎么進(jìn)行下去呢?
我給回復(fù)的郵件內(nèi)容:
首先,MapReduce的思想和Hadoop的MapReduce的架構(gòu)不是一個(gè)概念,說的具體一點(diǎn)也就是Hadoop的架構(gòu)設(shè)計(jì)只是MapReduce的一個(gè)子集思想的實(shí)現(xiàn)。每個(gè)人都可以根據(jù)自己對(duì)MapReduce的理解去實(shí)現(xiàn)業(yè)務(wù)處理,簡單來說多線程處理就是MapReduce的一種最簡單的實(shí)現(xiàn),復(fù)雜來說多機(jī)協(xié)調(diào)工作就是一種復(fù)雜的實(shí)現(xiàn)。
MapReduce的思想里面最值得借鑒的:
a.問題分而治之。(找到流程的關(guān)鍵路徑,優(yōu)化可以并行處理的工作)
b.計(jì)算靠近數(shù)據(jù)。(這也是hdfs存在的最重要的特點(diǎn),計(jì)算的轉(zhuǎn)移往往要比數(shù)據(jù)轉(zhuǎn)移廉價(jià),特別是對(duì)海量數(shù)據(jù)的處理)
c.數(shù)據(jù)規(guī)模化隨著并行處理成數(shù)量級(jí)遞減。
剩下的內(nèi)容就是各個(gè)框架對(duì)于非業(yè)務(wù)性需求的處理,例如容災(zāi),如何盡量少穿數(shù)據(jù)協(xié)調(diào)處理等等。
針對(duì)他提出的三個(gè)問題:
1. Hadoop的mapreduce從架構(gòu)上來說最適合的就是統(tǒng)計(jì)分析計(jì)算。做其他方面的工作需要考慮是否適合,而不是為了技術(shù)而技術(shù),先有需求再有技術(shù)選型。
2. 對(duì)于你這個(gè)需求直接用搜索技術(shù)實(shí)現(xiàn)就可以了,不一定要硬套在mapreduce上。
3. 對(duì)于海量數(shù)據(jù)是否一定要到hdsf上,或者就簡單得數(shù)據(jù)物理或者邏輯切割來直接處理,根據(jù)自己業(yè)務(wù)場(chǎng)景選擇。hdfs的特點(diǎn)就是對(duì)文件切割,容災(zāi),數(shù)據(jù)邏輯存儲(chǔ)和物理存儲(chǔ)無關(guān)性(便于擴(kuò)容管理,同時(shí)也是計(jì)算靠近數(shù)據(jù)的技術(shù)保證)。
是否使用MapReduce框架,HDFS存儲(chǔ)關(guān)鍵還是看你是否真的需要,當(dāng)現(xiàn)有框架對(duì)自己來說并不合適的時(shí)候可以對(duì)小規(guī)模問題定制MapReduce的處理,最簡化就是你去多線程或者多進(jìn)程處理問題,需求決定技術(shù)選型。