David.Ko

          Follow my heart!
          posts - 100, comments - 11, trackbacks - 0, articles - 0
             :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

          Linux poll機制分析

          Posted on 2010-07-08 10:35 David.Ko 閱讀(4401) 評論(0)  編輯  收藏 所屬分類: Unix&Linux

          來源:http://www.100ask.net/showtopic-2399.aspx 韋東山 2009.12.10


          所有的系統調用,基于都可以在它的名字前加上“sys_”前綴,這就是它在內核中對應的函數。比如系統調用openreadwritepoll,與之對應的內核函數為:sys_opensys_readsys_writesys_poll

          一、內核框架:
          對于系統調用pollselect,它們對應的內核函數都是sys_poll。分析sys_poll,即可理解poll機制。
          1.
          sys_poll
          函數位于fs/select.c文件中,代碼如下:
          asmlinkage long sys_poll(struct pollfd __user *ufds, unsigned int nfds,

          long timeout_msecs)

          {

          s64 timeout_jiffies;



          if (timeout_msecs > 0) {

          #if HZ > 1000

          /* We can only overflow if HZ > 1000 */


          if (timeout_msecs / 1000 > (s64)0x7fffffffffffffffULL / (s64)HZ)


          timeout_jiffies = -1;


          else

          #endif

          timeout_jiffies = msecs_to_jiffies(timeout_msecs);


          } else {


          /* Infinite (< 0) or no (0) timeout */


          timeout_jiffies = timeout_msecs;


          }



          return do_sys_poll(ufds, nfds, &timeout_jiffies);

          }
          它對超時參數稍作處理后,直接調用do_sys_poll

          2.
          do_sys_poll
          函數也位于位于fs/select.c文件中,我們忽略其他代碼:
          int do_sys_poll(struct pollfd __user *ufds, unsigned int nfds, s64 *timeout)
          {
          ……
          poll_initwait(&table);
          ……

          fdcount = do_poll(nfds, head, &table, timeout);

          ……
          }

          poll_initwait函數非常簡單,它初始化一個poll_wqueues變量table
          poll_initwait > init_poll_funcptr(&pwq->pt, __pollwait); > pt->qproc = qproc;
          table->pt->qproc = __pollwait__pollwait將在驅動的poll函數里用到。


          3.
          do_sys_poll
          函數位于fs/select.c文件中,代碼如下:

          static int do_poll(unsigned int nfds,
          struct poll_list *list,



          struct poll_wqueues *wait, s64 *timeout)

          {
          01 ……
          02
          for (;;) {

          03 ……
          04
          if (do_pollfd(pfd, pt)) {

          05
          count++;

          06
          pt = NULL;

          07
          }

          08 ……
          09
          if (count || !*timeout || signal_pending(current))

          10
          break;

          11
          count = wait->error;

          12
          if (count)

          13
          break;

          14
          15
          if (*timeout < 0) {

          16
          /* Wait indefinitely */

          17
          __timeout = MAX_SCHEDULE_TIMEOUT;

          18
          } else if (unlikely(*timeout >= (s64)MAX_SCHEDULE_TIMEOUT-1)) {

          19
          /*

          20
          * Wait for longer than MAX_SCHEDULE_TIMEOUT. Do it in

          21
          * a loop

          22
          */

          23
          __timeout = MAX_SCHEDULE_TIMEOUT - 1;

          24
          *timeout -= __timeout;

          25
          } else {

          26
          __timeout = *timeout;

          27
          *timeout = 0;

          28
          }

          29
          30
          __timeout = schedule_timeout(__timeout);

          31
          if (*timeout >= 0)

          32
          *timeout += __timeout;

          33
          }

          34
          __set_current_state(TASK_RUNNING);

          35
          return count;

          36 }

          分析其中的代碼,可以發現,它的作用如下:

          02行可以知道,這是個循環,它退出的條件為:
          a.
          09
          行的3個條件之一(count0,超時、有信號等待處理)
          count0表示04行的do_pollfd至少有一個成功。
          b.
          11
          12行:發生錯誤

          重點在do_pollfd函數,后面再分析

          30行,讓本進程休眠一段時間,注意:應用程序執行poll調用后,如果①②的條件不滿足,進程就會進入休眠。那么,誰喚醒呢?除了休眠到指定時間被系統喚醒外,還可以被驅動程序喚醒──記住這點,這就是為什么驅動的poll里要調用poll_wait的原因,后面分析。

          4.
          do_pollfd
          函數位于fs/select.c文件中,代碼如下:
          static inline unsigned int do_pollfd(struct pollfd *pollfd, poll_table *pwait)
          {
          ……

          if (file->f_op && file->f_op->poll)


          mask = file->f_op->poll(file, pwait);

          ……
          }

          可見,它就是調用我們的驅動程序里注冊的poll函數。

          二、驅動程序:
          驅動程序里與
          poll相關的地方有兩處:一是構造file_operation結構時,要定義自己的poll函數。二是通過poll_wait來調用上面說到的__pollwait函數,pollwait的代碼如下:
          static inline void poll_wait(struct file * filp, wait_queue_head_t * wait_address, poll_table *p)
          {

          if (p && wait_address)


          p->qproc(filp, wait_address, p);

          }
          p->qproc就是__pollwait函數,從它的代碼可知,它只是把當前進程掛入我們驅動程序里定義的一個隊列里而已。它的代碼如下:
          static void __pollwait(struct file *filp, wait_queue_head_t *wait_address,

          poll_table *p)

          {

          struct poll_table_entry *entry = poll_get_entry(p);


          if (!entry)


          return;


          get_file(filp);


          entry->filp = filp;


          entry->wait_address = wait_address;


          init_waitqueue_entry(&entry->wait, current);


          add_wait_queue(wait_address, &entry->wait);

          }

          執行到驅動程序的poll_wait函數時,進程并沒有休眠,我們的驅動程序里實現的poll函數是不會引起休眠的。讓進程進入休眠,是前面分析的do_sys_poll函數的30行“__timeout = schedule_timeout(__timeout)”。
          poll_wait只是把本進程掛入某個隊列,應用程序調用poll > sys_poll > do_sys_poll > poll_initwaitdo_poll > do_pollfd > 我們自己寫的poll函數后,再調用schedule_timeout進入休眠。如果我們的驅動程序發現情況就緒,可以把這個隊列上掛著的進程喚醒。可見,poll_wait的作用,只是為了讓驅動程序能找到要喚醒的進程。即使不用poll_wait,我們的程序也有機會被喚醒:chedule_timeout(__timeout),只是休眠__time_out這段時間。

          現在來總結一下poll機制:
          1. poll > sys_poll > do_sys_poll > poll_initwaitpoll_initwait函數注冊一下回調函數__pollwait,它就是我們的驅動程序執行poll_wait時,真正被調用的函數。

          2. 接下來執行file->f_op->poll,即我們驅動程序里自己實現的poll函數
          它會調用poll_wait把自己掛入某個隊列,這個隊列也是我們的驅動自己定義的;
          它還判斷一下設備是否就緒。

          3. 如果設備未就緒,do_sys_poll里會讓進程休眠一定時間

          4. 進程被喚醒的條件有2:一是上面說的“一定時間”到了,二是被驅動程序喚醒。驅動程序發現條件就緒時,就把“某個隊列”上掛著的進程喚醒,這個隊列,就是前面通過poll_wait把本進程掛過去的隊列。

          5. 如果驅動程序沒有去喚醒進程,那么chedule_timeout(__timeou)超時后,會重復23動作,直到應用程序的poll調用傳入的時間到達。
          主站蜘蛛池模板: 普兰店市| 抚松县| 邮箱| 新巴尔虎右旗| 中江县| 登封市| 怀安县| 靖宇县| 安化县| 江油市| 定陶县| 嘉禾县| 綦江县| 宜城市| 大丰市| 永春县| 武邑县| 吴堡县| 团风县| 行唐县| 福泉市| 黎川县| 娄烦县| 洛宁县| 贺兰县| 原阳县| 云龙县| 辽阳县| 东兰县| 广宗县| 闸北区| 昭平县| 子长县| 延寿县| 闽清县| 林周县| 康定县| 临湘市| 左贡县| 兴业县| 临高县|