qileilove

          blog已經(jīng)轉(zhuǎn)移至github,大家請訪問 http://qaseven.github.io/

          Linux進(jìn)程的睡眠和喚醒簡析

           1、Linux進(jìn)程的睡眠和喚醒
            在Linux中,僅等待CPU時間的進(jìn)程稱為就緒進(jìn)程,它們被放置在一個運行隊列中,一個就緒進(jìn)程的狀 態(tài)標(biāo)志位為TASK_RUNNING。一旦一個運行中的進(jìn)程時間片用完, Linux 內(nèi)核的調(diào)度器會剝奪這個進(jìn)程對CPU的控制權(quán),并且從運行隊列中選擇一個合適的進(jìn)程投入運行。
            當(dāng)然,一個進(jìn)程也可以主動釋放CPU的控制權(quán)。函數(shù) schedule()是一個調(diào)度函數(shù),它可以被一個進(jìn)程主動調(diào)用,從而調(diào)度其它進(jìn)程占用CPU。一旦這個主動放棄CPU的進(jìn)程被重新調(diào)度占用 CPU,那么它將從上次停止執(zhí)行的位置開始執(zhí)行,也就是說它將從調(diào)用schedule()的下一行代碼處開始執(zhí)行。
            有時候,進(jìn)程需要等待直到某個特定的事件發(fā)生,例如設(shè)備初始化完成、I/O 操作完成或定時器到時等。在這種情況下,進(jìn)程則必須從運行隊列移出,加入到一個等待隊列中,這個時候進(jìn)程就進(jìn)入了睡眠狀態(tài)。 
            Linux 中的進(jìn)程睡眠狀態(tài)有兩種:
            一種是可中斷的睡眠狀態(tài),其狀態(tài)標(biāo)志位TASK_INTERRUPTIBLE;
            另一種是不可中斷的睡眠狀態(tài),其狀態(tài)標(biāo)志位為TASK_UNINTERRUPTIBLE。可中斷的睡眠狀態(tài)的進(jìn)程會睡眠直到某個條件變?yōu)檎妫热缯f產(chǎn)生一個硬件中斷、釋放 進(jìn)程正在等待的系統(tǒng)資源或是傳遞一個信號都可以是喚醒進(jìn)程的條件。不可中斷睡眠狀態(tài)與可中斷睡眠狀態(tài)類似,但是它有一個例外,那就是把信號傳遞到這種睡眠 狀態(tài)的進(jìn)程不能改變它的狀態(tài),也就是說它不響應(yīng)信號的喚醒。不可中斷睡眠狀態(tài)一般較少用到,但在一些特定情況下這種狀態(tài)還是很有用的,比如說:進(jìn)程必須等 待,不能被中斷,直到某個特定的事件發(fā)生。
            在現(xiàn)代的Linux操作系統(tǒng)中,進(jìn)程一般都是用調(diào)用schedule()的方法進(jìn)入睡眠狀態(tài)的,下面的代碼演示了如何讓正在運行的進(jìn)程進(jìn)入睡眠狀態(tài)。
            sleeping_task = current;
            set_current_state(TASK_INTERRUPTIBLE);
            schedule();
            func1();
            /* Rest of the code ... */
            在第一個語句中,程序存儲了一份進(jìn)程結(jié)構(gòu)指針sleeping_task,current 是一個宏,它指向正在執(zhí)行的進(jìn)程結(jié)構(gòu)。set_current_state()將該進(jìn)程的狀態(tài)從執(zhí)行狀態(tài)TASK_RUNNING 變成睡眠狀態(tài)TASK_INTERRUPTIBLE。 如果schedule()是被一個狀態(tài)為TASK_RUNNING 的進(jìn)程調(diào)度,那么schedule()將調(diào)度另外一個進(jìn)程占用CPU;如果schedule()是被一個狀態(tài)為TASK_INTERRUPTIBLE 或TASK_UNINTERRUPTIBLE 的進(jìn)程調(diào)度,那么還有一個附加的步驟將被執(zhí)行:當(dāng)前執(zhí)行的進(jìn)程在另外一個進(jìn)程被調(diào)度之前會被從運行隊列中移出,這將導(dǎo)致正在運行的那個進(jìn)程進(jìn)入睡眠,因為它已經(jīng)不在運行隊列中了。
            我們可以使用下面的這個函數(shù)將剛才那個進(jìn)入睡眠的進(jìn)程喚醒。
            wake_up_process(sleeping_task);  
            在調(diào)用了wake_up_process()以后,這個睡眠進(jìn)程的狀態(tài)會被設(shè)置為TASK_RUNNING,而且調(diào)度器會把它加入到運行隊列中去。當(dāng)然,這個進(jìn)程只有在下次被調(diào)度器調(diào)度到的時候才能真正地投入運行。
            2、無效喚醒
            幾乎在所有的情況下,進(jìn)程都會在檢查了某些條件之后,發(fā)現(xiàn)條件不滿足才進(jìn)入睡眠。可是有的時候進(jìn)程卻會在 判定條件為真后開始睡眠,如果這樣的話進(jìn)程就會無限期地休眠下去,這就是所謂的無效喚醒問題。在操作系統(tǒng)中,當(dāng)多個進(jìn)程都企圖對共享數(shù)據(jù)進(jìn)行某種處理,而 最后的結(jié)果又取決于進(jìn)程運行的順序時,就會發(fā)生競爭條件,這是操作系統(tǒng)中一個典型的問題,無效喚醒恰恰就是由于競爭條件導(dǎo)致的。
            設(shè)想有兩個進(jìn)程A 和B,A 進(jìn)程正在處理一個鏈表,它需要檢查這個鏈表是否為空,如果不空就對鏈表里面的數(shù)據(jù)進(jìn)行一些操作,同時B進(jìn)程也在往這個鏈表添加節(jié)點。當(dāng)這個鏈表是空的時候,由于無數(shù)據(jù)可操作,這時A進(jìn)程就進(jìn)入睡眠,當(dāng)B進(jìn)程向鏈表里面添加了節(jié)點之后它就喚醒A 進(jìn)程,其代碼如下:
            A進(jìn)程:
          1 spin_lock(&list_lock);
          2 if(list_empty(&list_head)) {
          3 spin_unlock(&list_lock);
          4 set_current_state(TASK_INTERRUPTIBLE);
          5 schedule();
          6 spin_lock(&list_lock);
          7 }
          8
          9 /* Rest of the code ... */
          10 spin_unlock(&list_lock);
            B進(jìn)程:
            100 spin_lock(&list_lock);
            101 list_add_tail(&list_head, new_node);
            102 spin_unlock(&list_lock); 
            103 wake_up_process(processa_task);
            這里會出現(xiàn)一個問題,假如當(dāng)A進(jìn)程執(zhí)行到第3行后第4行前的時候,B進(jìn)程被另外一個處理器調(diào)度投入運行。在這個時間片內(nèi),B進(jìn)程執(zhí)行完了它所有的指令,因此它試圖喚醒A進(jìn)程,而此時的A進(jìn)程還沒有進(jìn)入睡眠,所以喚醒操作無效。在這之后,A 進(jìn)程繼續(xù)執(zhí)行,它會錯誤地認(rèn)為這個時候鏈表仍然是空的,于是將自己的狀態(tài)設(shè)置為TASK_INTERRUPTIBLE然后調(diào)用schedule()進(jìn)入睡眠。由于錯過了B進(jìn)程喚醒,它將會無限期的睡眠下去,這就是無效喚醒問題,因為即使鏈表中有數(shù)據(jù)需要處理,A 進(jìn)程也還是睡眠了。
            3、避免無效喚醒
            如何避免無效喚醒問題呢?我們發(fā)現(xiàn)無效喚醒主要發(fā)生在檢查條件之后和進(jìn)程狀態(tài)被設(shè)置為睡眠狀態(tài)之前, 本來B進(jìn)程的wake_up_process()提供了一次將A進(jìn)程狀態(tài)置為TASK_RUNNING 的機會,可惜這個時候A進(jìn)程的狀態(tài)仍然是TASK_RUNNING,所以wake_up_process()將A進(jìn)程狀態(tài)從睡眠狀態(tài)轉(zhuǎn)變?yōu)檫\行狀態(tài)的努力 沒有起到預(yù)期的作用。要解決這個問題,必須使用一種保障機制使得判斷鏈表為空和設(shè)置進(jìn)程狀態(tài)為睡眠狀態(tài)成為一個不可分割的步驟才行,也就是必須消除競爭條 件產(chǎn)生的根源,這樣在這之后出現(xiàn)的wake_up_process ()就可以起到喚醒狀態(tài)是睡眠狀態(tài)的進(jìn)程的作用了。
            找到了原因后,重新設(shè)計一下A進(jìn)程的代碼結(jié)構(gòu),就可以避免上面例子中的無效喚醒問題了。
            A進(jìn)程:
          1 set_current_state(TASK_INTERRUPTIBLE);
          2 spin_lock(&list_lock);
          3 if(list_empty(&list_head)) {
          4 spin_unlock(&list_lock);
          5 schedule();
          6 spin_lock(&list_lock);
          7 }
          8 set_current_state(TASK_RUNNING);
          9
          10 /* Rest of the code ... */
          11 spin_unlock(&list_lock);
            可以看到,這段代碼在測試條件之前就將當(dāng)前執(zhí)行進(jìn)程狀態(tài)轉(zhuǎn)設(shè)置成TASK_INTERRUPTIBLE了,并且在鏈表不為空的情況下又將自己置為TASK_RUNNING狀態(tài)。這樣一來如果B進(jìn)程在A進(jìn)程進(jìn)程檢查了鏈表為空以后調(diào)用wake_up_process(),那么A進(jìn)程的狀態(tài)就會自動由原來TASK_INTERRUPTIBLE變成TASK_RUNNING,此后即使進(jìn)程又調(diào)用了schedule(),由于它現(xiàn)在的狀態(tài)是TASK_RUNNING,所以仍然不會被從運行隊列中移出,因而不會錯誤的進(jìn)入睡眠,當(dāng)然也就避免了無效喚醒問題。
            4、Linux內(nèi)核的例子
            在Linux操作系統(tǒng)中,內(nèi)核的穩(wěn)定性至關(guān)重要,為了避免在Linux操作系統(tǒng)內(nèi)核中出現(xiàn)無效喚醒問題,Linux內(nèi)核在需要進(jìn)程睡眠的時候應(yīng)該使用類似如下的操作:
            /* ‘q’是我們希望睡眠的等待隊列 */
            DECLARE_WAITQUEUE(wait,current);
            add_wait_queue(q, &wait);
            set_current_state(TASK_INTERRUPTIBLE);
            /* 或TASK_INTERRUPTIBLE */
            while(!condition) /* ‘condition’ 是等待的條件*/
            schedule(); 
            set_current_state(TASK_RUNNING);
            remove_wait_queue(q, &wait);
            上面的操作,使得進(jìn)程通過下面的一系列步驟安全地將自己加入到一個等待隊列中進(jìn)行睡眠:首先調(diào)用DECLARE_WAITQUEUE ()創(chuàng)建一個等待隊列的項,然后調(diào)用add_wait_queue()把自己加入到等待隊列中,并且將進(jìn)程的狀態(tài)設(shè)置為 TASK_INTERRUPTIBLE 或者TASK_INTERRUPTIBLE。然后循環(huán)檢查條件是否為真:如果是的話就沒有必要睡眠,如果條件不為真,就調(diào)用schedule()。當(dāng)進(jìn)程 檢查的條件滿足后,進(jìn)程又將自己設(shè)置為TASK_RUNNING 并調(diào)用remove_wait_queue()將自己移出等待隊列。
            從上面可以看到,Linux的內(nèi)核代碼維護(hù)者也是在進(jìn)程檢查條件之前就設(shè)置進(jìn)程的狀態(tài)為睡眠狀態(tài),
            然后才循環(huán)檢查條件。如果在進(jìn)程開始睡眠之前條件就已經(jīng)達(dá)成了,那么循環(huán)會退出并用set_current_state()將自己的狀態(tài)設(shè)置為就緒,這樣同樣保證了進(jìn)程不會存在錯誤的進(jìn)入睡眠的傾向,當(dāng)然也就不會導(dǎo)致出現(xiàn)無效喚醒問題。
            下面讓我們用linux 內(nèi)核中的實例來看看Linux 內(nèi)核是如何避免無效睡眠的,這段代碼出自Linux2.6的內(nèi)核(linux-2.6.11/kernel/sched.c: 4254):
            4253 /* Wait for kthread_stop */
            4254 set_current_state(TASK_INTERRUPTIBLE);
            4255 while (!kthread_should_stop()) {
            4256 schedule();
            4257 set_current_state(TASK_INTERRUPTIBLE);
            4258 }
            4259 __set_current_state(TASK_RUNNING);
            4260 return 0; 
            上面的這些代碼屬于遷移服務(wù)線程migration_thread,這個線程不斷地檢查kthread_should_stop(),直到kthread_should_stop()返回1它才可以退出循環(huán),也就是說只要kthread_should_stop()返回0該進(jìn)程就會一直睡 眠。從代碼中我們可以看出,檢查kthread_should_stop()確實是在進(jìn)程的狀態(tài)被置為TASK_INTERRUPTIBLE后才開始執(zhí)行的。因此,如果在條件檢查之后但是在schedule()之前有其他進(jìn)程試圖喚醒它,那么該進(jìn)程的喚醒操作不會失效。
            小結(jié)
            通過上面的討論,可以發(fā)現(xiàn)在Linux 中避免進(jìn)程的無效喚醒的關(guān)鍵是在進(jìn)程檢查條件之前就將進(jìn)程的狀態(tài)置為TASK_INTERRUPTIBLE或TASK_UNINTERRUPTIBLE,并且如果檢查的條件滿足的話就應(yīng)該將其狀態(tài)重新設(shè)置為TASK_RUNNING。這樣無論進(jìn)程等待的條件是否滿足, 進(jìn)程都不會因為被移出就緒隊列而錯誤地進(jìn)入睡眠狀態(tài),從而避免了無效喚醒問題。

          posted on 2014-09-15 10:44 順其自然EVO 閱讀(210) 評論(0)  編輯  收藏 所屬分類: 測試學(xué)習(xí)專欄

          <2014年9月>
          31123456
          78910111213
          14151617181920
          21222324252627
          2829301234
          567891011

          導(dǎo)航

          統(tǒng)計

          常用鏈接

          留言簿(55)

          隨筆分類

          隨筆檔案

          文章分類

          文章檔案

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 北安市| 合肥市| 临江市| 饶平县| 定安县| 漳浦县| 潼南县| 南郑县| 兴和县| 成武县| 瑞丽市| 麦盖提县| 孟连| 乐安县| 通榆县| 霍林郭勒市| 苏尼特左旗| 靖安县| 临汾市| 吉隆县| 马山县| 邹平县| 沭阳县| 清徐县| 双峰县| 泰州市| 临潭县| 平乐县| 新巴尔虎右旗| 宽甸| 雷州市| 高尔夫| 博兴县| 贡觉县| 彰化县| 秭归县| 三原县| 宕昌县| 咸阳市| 新和县| 长子县|