posts - 403, comments - 310, trackbacks - 0, articles - 7
            BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

          翹課去浙大。

          posted @ 2008-03-25 21:20 ZelluX 閱讀(421) | 評論 (7)編輯 收藏

          一個用Lattice Boltzmann Method模擬三維空間中不可壓縮流體的程序,示意圖見底部。
          轉這個程序實在是太耗體力了 -_-b

          Brook本身的不少缺陷、bug,加上不習慣科學計算程序的代碼風格,導致大多數時間都在fix bug。

          其中de掉以后最有快感的一個bug:(只能這么形容了 >,<)

          每個cell都有一個flag值,盡管類型是double,但是程序中是用一個MAGIC_CAST宏把它當作整型處理的。
          初始情況,每個cell的flag都為~f,也就是一個1~28位都是1,29~32位為0的double型浮點。根據IEEE標準,應該是個NaN。
          CPU上沒有問題,放到GPU上問題就出來了,GPU不支持這種轉型操作,在對這個double型進行運算操作的時候,所有結果都會變成NaN。

          解決方法:
          在把數據傳給GPU之前可以先把這些flag值轉換為GPU可以操作的double型,最簡單的方法就是都先轉成int(會有truncating),然后取反,再傳給GPU。


          what_you_compute.png

          posted @ 2008-03-24 21:16 ZelluX 閱讀(697) | 評論 (1)編輯 收藏

          看來這年頭Stream Programming要越來越熱哈,恩,期待~~



          發信人: freelife (陪你一起老), 信區: METech
          標 題: Intel披露CPU/GPU混合芯片細節和時間 zz
          發信站: 水木社區 (Tue Mar 18 22:54:49 2008), 站內

          估計AMD和NV要急了~~

          3月18日消息,英特爾2008年春季開發商論壇會議下個月將在中國上海召開。英特爾在會前的新聞發布會上簡單地介紹了英特爾即將推出的圖形芯片內核“Larrabee”的狀況。

            “Larrabee”與AMD的Radeon和NVIDIA的GeForce處理器有很大區別?!癓arrabee”是以中央處理器架構中使用的 x86指令集為基礎的。英特爾副總裁Steve Smith強調說,
          “Larrabee”不僅是一個圖形處理器,而且是能夠完成任何流處理任務的多核芯片。

            Smith沒有詳細說明“Larrabee”芯片中有多少個內核,不過,英特爾2006年披露的早期方案是采用16個內核。每個內核的運行速度都超過2GHz。

            “Larrabee”芯片顯然能夠升級到數千個內核,共享與英特爾的Tera級計劃相同的研究成果。除了x86的方式之外,英特爾將很快發布一個名為 “Advanced Vector
          Extensions”(高級矢量擴展)的另一種像SSE擴展那樣的擴展集。這些擴展可能把“Larrabee”芯片的x86指令集與Core 2 Duo和Phenom處理器的x86指令區別開來。Smith說,
          “Larrabee”將支持OpenGL、 DirectX控件和光跟蹤指令。

            英特爾把處理器與圖形處理器混合在一起的芯片將有兩種版本。這兩種版本都采用Nehalem處理器架構。第一種版本代號為“Havendale”,是一種臺式電腦芯片,第二種版
          本代號為“Auburndale”,是一種筆記本電腦芯片。

            “Auburndale”和“Havendale”這兩種芯片將采用兩個Nehalem內核和一個圖形子系統。兩個內核共享4MB二級緩存和一個集成的雙通道內存控制器,支持內存配置最高可
          達DDR3-1333。

            圖形子系統最初是采用英特爾G45集成圖形芯片。這表明上述兩種芯片都沒有強大的圖形處理能力,只不過是集成圖形芯片的替代品。

            事實上,這兩種圖形芯片內核都省略了支持DirectX 9和DirectX 10的關鍵功能。這個基于G45圖形芯片的內核最終將被高級的“Larrabee”圖形處理器所取代。

            根據英特爾的產品路線圖,這種新的處理器預計將在2009年上半年進入市場。這將早于AMD Fusion處理器預計推出的時間。Fusion處理器計劃在2009年下半年推出。

            Smith許諾說,“Larrabee”芯片最終推出的時候將比Radeon和GeForce芯片更有競爭力。

          posted @ 2008-03-19 18:03 ZelluX 閱讀(362) | 評論 (0)編輯 收藏

               摘要: 包括各種paper, survey以及workshop上的講座等內容  閱讀全文

          posted @ 2008-03-15 14:46 ZelluX 閱讀(1031) | 評論 (6)編輯 收藏

          禪 意--之二

          當一切都會過去
          我知道 我會
          慢慢地將你忘記

          心上的重擔卸落
          請你原諒我
          生命原是要

          不斷地受傷和不斷地復原
          世界仍然是一個
          在溫柔地等待著我成熟的果園

          天這樣藍 樹這樣綠
          生活原來可以
          這樣的安寧和 美麗

          posted @ 2008-02-29 17:50 ZelluX 閱讀(367) | 評論 (0)編輯 收藏

          本來想看完pagefault的處理的,不過實驗室有事情了,只能先把這一半放上來了。

          頁面的分配與回收使用了一個叫做buddy allocator的機制,kernelnewbies上的解釋
          The memory allocation scheme used in the kernel. A vector of lists of free pages is kept, ordered by the size of the chunk (in powers of two). When a chunk is allocated, it is removed from the relevant list. When a chunk is freed back to the free pages pool, it is placed in the relevant list, starting from the top. If it is physically contiguous with a present chunk, they are merged and placed in the list above (i.e. where the chunks are twice the size), and this operation percolates up the vector. As regions are merged whenever possible, this design helps to reduce memory fragmentation.

          首先在zone_struct{} 中保存了一個free_area_t數組,這個數組記錄了各種大小的空閑內存塊的信息。
          include/linux/mmzone.h:


          free_area_struct {}

          頁面分配時,找到適合大小的free_area_struct{},然后從free_list中找有沒有空閑的內存塊,如果沒有就找更大的free_area_struct{},因為大小都是2^n,很容易把大塊內存拆開,一塊分配給請求,剩下的保存到對應大小的隊列中。
          頁面回收時主要的問題是如何解決過多的內存碎片。當頁面塊被釋放時,先檢查是否有相同大小的相鄰空閑塊存在,如果有的話就結合起來(遞歸過程)。

          posted @ 2008-02-27 23:29 ZelluX 閱讀(696) | 評論 (4)編輯 收藏

          幾天前的bug了,突然有興趣想再試試

          http://kerneltrap.org/Linux/Patching_CVE-2008-0600_Local_Root_Exploit

          posted @ 2008-02-27 23:15 ZelluX 閱讀(443) | 評論 (0)編輯 收藏

               摘要: 轉載自水木KernelTech版。關于hack系統調用表的一篇文章,里面還涉及了上學期ICS Lab中的二進制代碼注入,很好很強大。略作整理(為什么技術博客默認的字體不是等寬的 T.T)=-|================================================-{ www.enye-sec.org }-====|=-[ LKM Rootkits on Linux x86...  閱讀全文

          posted @ 2008-02-26 19:36 ZelluX 閱讀(1297) | 評論 (4)編輯 收藏

               摘要: 越獄第三季最后一幕的歌曲蠻不錯的,查到歌名叫Llorando,西班牙中“哭泣”的意思。google過程中還發現了這是某部叫做《穆赫蘭道》的電影中的曲子,于是對這部電影也產生了興趣。  閱讀全文

          posted @ 2008-02-26 11:56 ZelluX 閱讀(476) | 評論 (0)編輯 收藏





          Lyric:

          posted @ 2008-02-22 13:11 ZelluX 閱讀(440) | 評論 (0)編輯 收藏

          僅列出標題
          共39頁: First 上一頁 3 4 5 6 7 8 9 10 11 下一頁 Last 
          主站蜘蛛池模板: 阳山县| 图片| 绥江县| 永清县| 绥芬河市| 和平县| 临澧县| 周口市| 赣州市| 贵溪市| 务川| 和平县| 兴业县| 胶南市| 马边| 珲春市| 辛集市| 宜章县| 连南| 突泉县| 遂宁市| 龙里县| 龙胜| 页游| 明光市| 鄢陵县| 疏勒县| 平阴县| 鹿邑县| 和平县| 丹江口市| 太白县| 仁布县| 余庆县| 泗水县| 阿拉善左旗| 五指山市| 南康市| 阜康市| 芦山县| 汉沽区|