隨筆-153  評(píng)論-235  文章-19  trackbacks-0
            2008年7月27日
          如鼠標(biāo)移到 class 為 box 的 div 標(biāo)簽中背景變色

          .vbox div:hover{background: #ddd;}

          據(jù)說(shuō) IE6.0、Firefox2.0、Opera 9.23都不支持

          posted @ 2010-02-24 22:10 流浪汗 閱讀(1985) | 評(píng)論 (0)編輯 收藏
          想改 a  的默認(rèn)方式,比如:鏈接不要下劃線,鼠標(biāo)移到上面時(shí)有劃線。

          css 如
          a:hover {text-decoration: underline;}
          a:link 
          {text-decoration: none;}
          a:visited 
          {text-decoration: none;}

          是沒有達(dá)到鼠標(biāo)稱到上面有劃線。

          必須改為:
          a:link {text-decoration: none;}
          a:visited 
          {text-decoration: none;}
          a:hover 
          {text-decoration: underline;}

          a:hover 放到最后。
          posted @ 2010-02-24 22:04 流浪汗 閱讀(1008) | 評(píng)論 (3)編輯 收藏
          一、介紹Nginx是俄羅斯人編寫的十分輕量級(jí)的HTTP服務(wù)器,Nginx,它的發(fā)音為“engine X”, 是一個(gè)高性能的HTTP和反向代理服務(wù)器,同時(shí)也是一個(gè)IMAP/POP3/SMTP 代理服務(wù)器.
          二、Location語(yǔ)法語(yǔ)法:location [=|~|~*|^~] /uri/ { … }
          注:
          1、~   為區(qū)分大小寫匹配
          2、~* 為不區(qū)分大小寫匹配
          3、!~和!~*分別為區(qū)分大小寫不匹配及不區(qū)分大小寫
          不匹配
          示例一:
          location  / {
          }
          匹配任何查詢,因?yàn)樗姓?qǐng)求都以 / 開頭。但是正則表達(dá)式規(guī)則將被優(yōu)先和查詢匹配。
          示例二:
          location =/ {}
          僅僅匹配/

          示例三:
          location ~* \.(gif|jpg|jpeg)$ {
          rewrite \.(gif|jpg)$ /logo.png;

          注:不區(qū)分大小寫匹配任何以gif,jpg,jpeg結(jié)尾的文件

          三、ReWrite語(yǔ)法
          last - 基本上都用這個(gè)Flag。
          break - 中止Rewirte,不在繼續(xù)匹配
          redirect - 返回臨時(shí)重定向的HTTP狀態(tài)302
          permanent - 返回永久重定向的HTTP狀態(tài)301

          1、下面是可以用來(lái)判斷的表達(dá)式:
          -f和!-f用來(lái)判斷是否存在文件
          -d和!-d用來(lái)判斷是否存在目錄
          -e和!-e用來(lái)判斷是否存在文件或目錄
          -x和!-x用來(lái)判斷文件是否可執(zhí)行
          2、下面是可以用作判斷的全局變量
          例:http://localhost:88/test1/test2/test.php
          $host:localhost
          $server_port:88
          $request_uri:
          http://localhost:88/test1/test2/test.php
          $document_uri:/test1/test2/test.php
          $document_root:D:\nginx/html
          $request_filename:D:\nginx/html/test1/test2/test.php

          四、Redirect語(yǔ)法
              server {
              listen 80;
              server_name start.igrow.cn;
              index index.html index.php;
              root html;
              if ($http_host !~ "^star\.igrow\.cn$&quot {
                   rewrite ^(.*)
          http://star.igrow.cn$1 redirect;
              }
              }

          五、防盜鏈location ~* \.(gif|jpg|swf)$ {
            valid_referers none blocked start.igrow.cn sta.igrow.cn;
            if ($invalid_referer) {
            rewrite ^/
          http://$host/logo.png;
            }
          }

          六、根據(jù)文件類型設(shè)置過(guò)期時(shí)間
          location ~* \.(js|css|jpg|jpeg|gif|png|swf)$ {
          if (-f $request_filename) {
             expires    1h;
             break;
          }
          }

          七、禁止訪問(wèn)某個(gè)目錄
          location ~* \.(txt|doc)${
             
            root /data/www/wwwroot/linuxtone/test;
             
          deny all;
          }

          轉(zhuǎn):http://www.phpchina.com/html/70/t-162870.html,http://idev.yo2.cn/go/19761.html
          posted @ 2010-02-03 10:25 流浪汗 閱讀(12025) | 評(píng)論 (0)編輯 收藏
          top命令是Linux下常用的性能分析工具,能夠?qū)崟r(shí)顯示系統(tǒng)中各個(gè)進(jìn)程的資源占用狀況,類似于Windows的任務(wù)管理器。下面詳細(xì)介紹它的使用方法。

             
           top - 01:06:48 up  1:22,  1 user,  load average: 0.06, 0.60, 0.48
          Tasks:  29 total,   1 running,  28 sleeping,   0 stopped,   0 zombie
          Cpu(s):  0.3% us,  1.0% sy,  0.0% ni, 98.7% id,  0.0% wa,  0.0% hi,  0.0% si
          Mem:    191272k total,   173656k used,    17616k free,    22052k buffers
          Swap:   192772k total,        0k used,   192772k free,   123988k cached

             PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
            1379 root      16   0  7976 2456 1980 S  0.7  1.3   0:11.03 sshd
          14704 root      16   0  2128  980  796 R  0.7  0.5   0:02.72 top
               1 root      16   0  1992  632  544 S  0.0  0.3   0:00.90 init
               2 root      34  19     0    0    0 S  0.0  0.0   0:00.00 ksoftirqd/0
               3 root      RT   0     0    0    0 S  0.0  0.0   0:00.00 watchdog/0

              統(tǒng)計(jì)信息區(qū)
              前五行是系統(tǒng)整體的統(tǒng)計(jì)信息。第一行是任務(wù)隊(duì)列信息,同 uptime 命令的執(zhí)行結(jié)果。其內(nèi)容如下:

              01:06:48 當(dāng)前時(shí)間
              up 1:22 系統(tǒng)運(yùn)行時(shí)間,格式為時(shí):分
              1 user 當(dāng)前登錄用戶數(shù)
              load average: 0.06, 0.60, 0.48 系統(tǒng)負(fù)載,即任務(wù)隊(duì)列的平均長(zhǎng)度。
              三個(gè)數(shù)值分別為 1分鐘、5分鐘、15分鐘前到現(xiàn)在的平均值。

              第二、三行為進(jìn)程和CPU的信息。當(dāng)有多個(gè)CPU時(shí),這些內(nèi)容可能會(huì)超過(guò)兩行。內(nèi)容如下:

              Tasks: 29 total 進(jìn)程總數(shù)
              1 running 正在運(yùn)行的進(jìn)程數(shù)
              28 sleeping 睡眠的進(jìn)程數(shù)
              0 stopped 停止的進(jìn)程數(shù)
              0 zombie 僵尸進(jìn)程數(shù)
              Cpu(s): 0.3% us 用戶空間占用CPU百分比
              1.0% sy 內(nèi)核空間占用CPU百分比
              0.0% ni 用戶進(jìn)程空間內(nèi)改變過(guò)優(yōu)先級(jí)的進(jìn)程占用CPU百分比
              98.7% id 空閑CPU百分比
              0.0% wa 等待輸入輸出的CPU時(shí)間百分比
              0.0% hi
              0.0% si

              最后兩行為內(nèi)存信息。內(nèi)容如下:

              Mem: 191272k total 物理內(nèi)存總量
              173656k used 使用的物理內(nèi)存總量
              17616k free 空閑內(nèi)存總量
              22052k buffers 用作內(nèi)核緩存的內(nèi)存量
              Swap: 192772k total 交換區(qū)總量
              0k used 使用的交換區(qū)總量
              192772k free 空閑交換區(qū)總量
              123988k cached 緩沖的交換區(qū)總量。
              內(nèi)存中的內(nèi)容被換出到交換區(qū),而后又被換入到內(nèi)存,但使用過(guò)的交換區(qū)尚未被覆蓋,
              該數(shù)值即為這些內(nèi)容已存在于內(nèi)存中的交換區(qū)的大小。
              相應(yīng)的內(nèi)存再次被換出時(shí)可不必再對(duì)交換區(qū)寫入。

          進(jìn)程信息區(qū)
              統(tǒng)計(jì)信息區(qū)域的下方顯示了各個(gè)進(jìn)程的詳細(xì)信息。首先來(lái)認(rèn)識(shí)一下各列的含義。

              序號(hào) 列名 含義
              a PID 進(jìn)程id
              b PPID 父進(jìn)程id
              c RUSER Real user name
              d UID 進(jìn)程所有者的用戶id
              e USER 進(jìn)程所有者的用戶名
              f GROUP 進(jìn)程所有者的組名
              g TTY 啟動(dòng)進(jìn)程的終端名。不是從終端啟動(dòng)的進(jìn)程則顯示為 ?
              h PR 優(yōu)先級(jí)
              i NI nice值。負(fù)值表示高優(yōu)先級(jí),正值表示低優(yōu)先級(jí)
              j P 最后使用的CPU,僅在多CPU環(huán)境下有意義
              k %CPU 上次更新到現(xiàn)在的CPU時(shí)間占用百分比
              l TIME 進(jìn)程使用的CPU時(shí)間總計(jì),單位秒
              m TIME+ 進(jìn)程使用的CPU時(shí)間總計(jì),單位1/100秒
              n %MEM 進(jìn)程使用的物理內(nèi)存百分比
              o VIRT 進(jìn)程使用的虛擬內(nèi)存總量,單位kb。VIRT=SWAP+RES
              p SWAP 進(jìn)程使用的虛擬內(nèi)存中,被換出的大小,單位kb。
              q RES 進(jìn)程使用的、未被換出的物理內(nèi)存大小,單位kb。RES=CODE+DATA
              r CODE 可執(zhí)行代碼占用的物理內(nèi)存大小,單位kb
              s DATA 可執(zhí)行代碼以外的部分(數(shù)據(jù)段+棧)占用的物理內(nèi)存大小,單位kb
              t SHR 共享內(nèi)存大小,單位kb
              u nFLT 頁(yè)面錯(cuò)誤次數(shù)
              v nDRT 最后一次寫入到現(xiàn)在,被修改過(guò)的頁(yè)面數(shù)。
              w S 進(jìn)程狀態(tài)。
              D=不可中斷的睡眠狀態(tài)
              R=運(yùn)行
              S=睡眠
              T=跟蹤/停止
              Z=僵尸進(jìn)程
              x COMMAND 命令名/命令行
              y WCHAN 若該進(jìn)程在睡眠,則顯示睡眠中的系統(tǒng)函數(shù)名
              z Flags 任務(wù)標(biāo)志,參考 sched.h

              默認(rèn)情況下僅顯示比較重要的 PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND 列。可以通過(guò)下面的快捷鍵來(lái)更改顯示內(nèi)容。

              更改顯示內(nèi)容
              通過(guò) f 鍵可以選擇顯示的內(nèi)容。按 f 鍵之后會(huì)顯示列的列表,按 a-z 即可顯示或隱藏對(duì)應(yīng)的列,最后按回車鍵確定。

              按 o 鍵可以改變列的顯示順序。按小寫的 a-z 可以將相應(yīng)的列向右移動(dòng),而大寫的 A-Z 可以將相應(yīng)的列向左移動(dòng)。最后按回車鍵確定。

              按大寫的 F 或 O 鍵,然后按 a-z 可以將進(jìn)程按照相應(yīng)的列進(jìn)行排序。而大寫的 R 鍵可以將當(dāng)前的排序倒轉(zhuǎn)。

           命令使用

              1. 工具(命令)名稱
              top
              2.工具(命令)作用
              顯示系統(tǒng)當(dāng)前的進(jìn)程和其他狀況; top是一個(gè)動(dòng)態(tài)顯示過(guò)程,即可以通過(guò)用戶按鍵來(lái)不斷刷新當(dāng)前狀態(tài).如果在前臺(tái)執(zhí)行該命令,它將獨(dú)占前臺(tái),直到用戶終止該程序?yàn)橹? 比較準(zhǔn)確的說(shuō),top命令提供了實(shí)時(shí)的對(duì)系統(tǒng)處理器的狀態(tài)監(jiān)視.它將顯示系統(tǒng)中CPU最“敏感”的任務(wù)列表.該命令可以按CPU使用.內(nèi)存使用和執(zhí)行時(shí)間對(duì)任務(wù)進(jìn)行排序;而且該命令的很多特性都可以通過(guò)交互式命令或者在個(gè)人定制文件中進(jìn)行設(shè)定.
              3.環(huán)境設(shè)置
              在Linux下使用。
              4.使用方法
              4.1使用格式
              top [-] [d] [p] [q] [c] [C] [S] [s]  [n]
              4.2參數(shù)說(shuō)明
               d 指定每?jī)纱纹聊恍畔⑺⑿轮g的時(shí)間間隔。當(dāng)然用戶可以使用s交互命令來(lái)改變之。
               p 通過(guò)指定監(jiān)控進(jìn)程ID來(lái)僅僅監(jiān)控某個(gè)進(jìn)程的狀態(tài)。
               q該選項(xiàng)將使top沒有任何延遲的進(jìn)行刷新。如果調(diào)用程序有超級(jí)用戶權(quán)限,那么top將以盡可能高的優(yōu)先級(jí)運(yùn)行。
               S 指定累計(jì)模式
               s 使top命令在安全模式中運(yùn)行。這將去除交互命令所帶來(lái)的潛在危險(xiǎn)。
               i  使top不顯示任何閑置或者僵死進(jìn)程。
               c  顯示整個(gè)命令行而不只是顯示命令名
              4.3其他
                 下面介紹在top命令執(zhí)行過(guò)程中可以使用的一些交互命令。從使用角度來(lái)看,熟練的掌握這些命令比掌握選項(xiàng)還重要一些。這些命令都是單字母的,如果在命令行選項(xiàng)中使用了s選項(xiàng),則可能其中一些命令會(huì)被屏蔽掉。
                Ctrl+L 擦除并且重寫屏幕。
                h或者? 顯示幫助畫面,給出一些簡(jiǎn)短的命令總結(jié)說(shuō)明。
                k 終止一個(gè)進(jìn)程。系統(tǒng)將提示用戶輸入需要終止的進(jìn)程PID,以及需要發(fā)送給該進(jìn)程什么樣的信號(hào)。一般的終止進(jìn)程可以使用15信號(hào);如果不能正常結(jié)束那就使用信號(hào)9強(qiáng)制結(jié)束該進(jìn)程。默認(rèn)值是信號(hào)15。在安全模式中此命令被屏蔽。
                i 忽略閑置和僵死進(jìn)程。這是一個(gè)開關(guān)式命令。
                q 退出程序。
                r 重新安排一個(gè)進(jìn)程的優(yōu)先級(jí)別。系統(tǒng)提示用戶輸入需要改變的進(jìn)程PID以及需要設(shè)置的進(jìn)程優(yōu)先級(jí)值。輸入一個(gè)正值將使優(yōu)先級(jí)降低,反之則可以使該進(jìn)程擁有更高的優(yōu)先權(quán)。默認(rèn)值是10。
                S 切換到累計(jì)模式。
                s 改變兩次刷新之間的延遲時(shí)間。系統(tǒng)將提示用戶輸入新的時(shí)間,單位為s。如果有小數(shù),就換算成m s。輸入0值則系統(tǒng)將不斷刷新,默認(rèn)值是5 s。需要注意的是如果設(shè)置太小的時(shí)間,很可能會(huì)引起不斷刷新,從而根本來(lái)不及看清顯示的情況,而且系統(tǒng)負(fù)載也會(huì)大大增加。
                f或者F 從當(dāng)前顯示中添加或者刪除項(xiàng)目。
                o或者O 改變顯示項(xiàng)目的順序。
                l 切換顯示平均負(fù)載和啟動(dòng)時(shí)間信息。
                m 切換顯示內(nèi)存信息。
                t 切換顯示進(jìn)程和CPU狀態(tài)信息。
                c 切換顯示命令名稱和完整命令行。
                M 根據(jù)駐留內(nèi)存大小進(jìn)行排序。
                P 根據(jù)CPU使用百分比大小進(jìn)行排序。
                T 根據(jù)時(shí)間/累計(jì)時(shí)間進(jìn)行排序。
                  W 將當(dāng)前設(shè)置寫入~/.toprc文件中。這是寫top配置文件的推薦方法。

          posted @ 2010-01-08 11:08 流浪汗 閱讀(761) | 評(píng)論 (0)編輯 收藏

          想發(fā)布新版的 mmseg4j 到現(xiàn)在已經(jīng)有二個(gè)多月了。主要是因?yàn)檫@段時(shí)間忙其它事情了。現(xiàn) Lucene 2.9 發(fā)布了,solr 1.4 也應(yīng)該會(huì)比較快就要發(fā)布了。對(duì) mmseg4j 兼容新版的 lucene/solr 也是個(gè)任務(wù)。

          現(xiàn) mmseg4j 發(fā)布新版 1.8,可以下載:mmseg4j-1.8.zip 包括了源碼與詞庫(kù),還有創(chuàng)建文件。下面說(shuō)下此版的主要變更:

          new:

          1、有檢測(cè)詞典變更的接口,外部程序可以使用 wordsFileIsChange() 和 reload() 來(lái)完成檢測(cè)與加載的工作. (內(nèi)部不實(shí)現(xiàn)自動(dòng)檢測(cè)與加載,留給外部程序去做。)

          2、添加 MMseg4jHandler 類,可以在solr中用url的方式來(lái)控制加載檢測(cè)詞庫(kù)。

          3、增加 CutLetterDigitFilter過(guò)慮器,切分“字母和數(shù)”混在一起的過(guò)慮器。比如:mb991ch 切為 "mb 991 ch"。

          changes:

          1、默認(rèn)在 classpath 中加載 data 目錄(詞庫(kù)目錄),找不到再找 user.dir/data 目錄。但是優(yōu)先 mmseg.dic.path 系統(tǒng)屬性指定的。

          2、新詞庫(kù),去除 sogou 高頻無(wú)詞性的詞,合并 rmmseg 提供的詞(是 mmseg4j 1.0 使用的詞庫(kù)),共計(jì)(14W 多詞)。

          3、數(shù)字或英文開頭的數(shù)字或英文不獨(dú)立分出。如 MB991CH/A 分為 mb991ch a,cq40-519tx 分為 CQ40 519TX

          4、內(nèi)置支持小寫,不需要 LowerCaseFilter 了。MMSegAnalyzer 去除了小寫過(guò)慮。

          5、支持 solr 1.3/1.4、lucene 2.3/2.4/2.9

          6、嘗試加載 jar 里的 words.dic,并構(gòu)建含有 words.dic 的 jar(mmseg4j-*-with-dic.jar)。

          bugs:

          1、Dictionary 添加 finalize 方法。修正 tomcat reload 時(shí) OOM 的 bug: http://code.google.com/p/mmseg4j/issues/detail?id=4

          2、MMSegTokenizer 在 lucene 2.4 編譯的 在 lucene 2.9 中會(huì)報(bào) java.lang.NoSuchFieldError: input。bug: http://code.google.com/p/mmseg4j/issues/detail?id=5

          詳情:http://blog.chenlb.com/2009/10/chinese-segment-mmseg4j-1_8-release.html

          posted @ 2009-10-19 09:28 流浪汗 閱讀(3452) | 評(píng)論 (1)編輯 收藏
          中文分詞 mmseg4j 1.7.2 版發(fā)布,其實(shí)兩天前就發(fā)布了,只是沒有寫博客而已。與引版本發(fā)布的還有 1.6.2,兩者基本一樣,只是詞庫(kù)的數(shù)據(jù)結(jié)構(gòu)不同,1.7的是鍵樹,1.6的是數(shù)組與二分查找。 mmseg4j 1.7.2 版的主要更新:
          • 修復(fù)由 1.7-beta 升級(jí)到 1.7 版的 bug:添加 lowerCaseFilter 后的一個(gè) bug: NullPointerException。
          • 核發(fā)程序與 lucene 和 solr 擴(kuò)展分開打包, 同時(shí)給出低版本的 lucene 擴(kuò)展(lucene 1.9 到 2.2; lucene 2.3)
          如何從源碼編譯:下載源碼:mmseg4j-1.7.2-srcmmseg4j-1.6.2-src。解壓到如:e:/mmseg4j-1.7.2-src。然后到這個(gè)目錄,運(yùn)行:

           




          上面編譯是在 solr 1.3 和 lucene 2.4 環(huán)境下的。如果您要在 低版本的 lucene 中使用,到 e:/mmseg4j-1.7.2-src/contrib/lucene_1_9 或 e:/mmseg4j-1.7.2-src/contrib/lucene_2_3 運(yùn)行:

           

          說(shuō)明:到 contrib 下的子項(xiàng)目中編譯的話,先要編譯 mmseg4j,contrib/lucene_1_9 可以支持到 2.2。

          如果有任何疑問(wèn)、建議,歡迎到論壇 http://groups.google.com/group/mmseg4j/topics?hl=zh_CN 討論。或與我聯(lián)系 chenlb2008#gmail.com。

          還要感謝網(wǎng)友“苦澀可樂(lè)”提示 NullPointerException 的bug。

          官方博客:mmseg4j,項(xiàng)目:google code mmseg4j
          posted @ 2009-04-27 20:00 流浪汗 閱讀(2924) | 評(píng)論 (0)編輯 收藏
          很久沒有在此博客寫東西了。但一個(gè)多月了,原因是我已經(jīng)有自己的博客空間了,此博客很少更新,不過(guò)如果寫得好文就轉(zhuǎn)載到此博客。

          posted @ 2008-10-25 11:54 流浪汗 閱讀(686) | 評(píng)論 (0)編輯 收藏
          一直找代碼高亮顯示,在wp上可以有coolcode但,覺得美中不足的是服務(wù)器解析,每請(qǐng)求一次做一次。今天偶然看到 Unmi的博客,他的代碼好漂亮,看源碼,知道shCore,把他的拿過(guò)來(lái)試用下。 java 代碼

          java 代碼

          groovy 代碼

           

          posted @ 2008-09-05 00:26 流浪汗 閱讀(1349) | 評(píng)論 (2)編輯 收藏
          .tgz 解壓:
          tar zxvf myfile.tgz
          posted @ 2008-09-03 13:33 流浪汗 閱讀(46249) | 評(píng)論 (3)編輯 收藏
          solr分發(fā)問(wèn)題。
          用rsync同步目錄里出現(xiàn):rsync:link_stat "snapshot.20080820124136/." (in solr) failed: No such file or directory (2)

          上一編配置得沒什么問(wèn)題:http://www.aygfsteel.com/chenlb/archive/2008/07/04/212398.html 。現(xiàn)竟然出錯(cuò),郁悶。

          網(wǎng)上找了下, 說(shuō)明路徑有空格。http://bbs.chinaunix.net/viewthread.php?tid=1003058

          二樓的回復(fù):

          帶空格的文件/目錄名不知道害死了多少人。

          `rsync -av --progress $dir1 $dir2`;

          `rsync -av --progress "$dir1" "$dir2"`;
          代替。

          其實(shí) `` 雖然用著方便,
          但不適合內(nèi)插變量。
          有變量作為參數(shù)的情況下,建議用 system。

          此是解決那樓主的問(wèn)題,可以本來(lái)就沒有空格的問(wèn)題,沒解決到我的問(wèn)題。仔細(xì)思索。

          機(jī)子里有幾個(gè)rsync服務(wù),我部署的時(shí)候是復(fù)制相關(guān)的配置,rsync服務(wù)端口沒改,子機(jī)同步這個(gè)服務(wù)的時(shí)候(子機(jī)同步端口與rsync一致,是錯(cuò)的,重復(fù)的),然后做同步的時(shí)候出現(xiàn)上面的問(wèn)題。改了其它端口后就可以。

          總的來(lái)講,還是自己對(duì)linux了解不多。
          posted @ 2008-09-02 16:14 流浪汗 閱讀(6528) | 評(píng)論 (0)編輯 收藏
          用unzip

          unzip myfile.zip
          posted @ 2008-09-02 16:03 流浪汗 閱讀(828) | 評(píng)論 (0)編輯 收藏
          上一篇記錄了本機(jī)模式我虛擬分布模式。http://www.aygfsteel.com/chenlb/archive/2008/08/11/221311.html

          現(xiàn)我在虛擬機(jī)里開三臺(tái)機(jī)子,分別命名為:master(172.16.249.210),slave-1(172.16.249.211),slave-2(172.16.249.212)。

          master可以無(wú)密碼登錄到slave機(jī)。
          每臺(tái)機(jī)子都匹配ip對(duì)應(yīng)名。
          127.0.0.1       localhost       localhost

          172.16.249.210  master
          172.16.249.211  slave-1
          172.16.249.212  slave-2

          修改conf/masters文件和conf/slaves文件。
          conf/masters文件:
          master

          conf/slaves文件:
          slave-1
          slave-
          2

          格式化后可以啟動(dòng)了:
          [chenlb@master hadoop-0.17.1]$ bin/start-all.sh 


          參考資料:
          http://hadoop.apache.org/core/docs/r0.17.1/quickstart.html
          http://hadoop.apache.org/core/docs/r0.17.1/cluster_setup.html
          posted @ 2008-08-11 15:45 流浪汗 閱讀(802) | 評(píng)論 (0)編輯 收藏

           

          Required Software

          1. JavaTM 1.5.x
          2. ssh與sshd

          如果沒有安裝請(qǐng)自行安裝。我以CentOS 4.6為例。

          下載hadoop,http://apache.mirror.phpchina.com/hadoop/core/ 我下載的是0.17.1版本。

          解壓hadoop-0.17.1.tar.gz,然后conf/hadoop-env.sh 設(shè)置JAVA_HOME ,我是可JAVA_HOME 去注釋,值自己的路徑。如:

          export JAVA_HOME=/usr/java/jdk1.6.0_06

          如果不設(shè)置啟動(dòng)后用不了。

          先從簡(jiǎn)單開始。

          1、Local (Standalone) Mode ,叫單機(jī)模式。

          [chenlb@master hadoop-0.17.1]$ bin/hadoop jar hadoop-0.17.1-examples.jar grep conf output 'dfs[a-z.]+'

           

          [chenlb@master hadoop-0.17.1]$ cat output/*


          如果,正常可以看到內(nèi)容。像這樣。

          3       dfs.
          3       dfs.class
          2       dfs.period
          2       dfs.replication
          ...    ...

          2、Pseudo-Distributed Mode,虛擬分布模式。
          vi conf/hadoop-site.xml
          <configuration>
          <property>
                  
          <name>fs.default.name</name>
                  
          <value>hdfs://master:9000/</value>
          </property>
          <property>
                  
          <name>mapred.job.tracker</name>
                  
          <value>hdfs://master:9001/</value>
          </property>
          <property>
                  
          <name>dfs.replication</name>
                  
          <value>1</value>
          </property>
          <property>
                  
          <name>hadoop.tmp.dir</name>
                  
          <value>/home/chenlb/hadoop-0.17.1/tmp/</value>
          </property>
          </configuration>

          在/etc/hosts里添加本機(jī)ip對(duì)應(yīng)master,例如我的:172.16.249.210    master
          保證可以無(wú)密碼登錄。請(qǐng)看那一篇文章:http://www.aygfsteel.com/chenlb/archive/2008/07/03/212293.html

          用ssh localhost試一下是否免密碼登錄。

          格式化分布式文件系統(tǒng):
          [chenlb@master hadoop-0.17.1]$ bin/hadoop namenode -format

          啟動(dòng)Hadoop:
          [chenlb@master hadoop-0.17.1]$ bin/start-all.sh 

          默認(rèn)可以在${HADOOP_HOME}/logs里看到日志。

          可以用web看瀏覽NameNode和JobTracker
        1. NameNode - http://localhost:50070/
        2. JobTracker - http://localhost:50030/


          把文件放到分布式文件系統(tǒng)里:

          [chenlb@master hadoop-0.17.1]$ bin/hadoop dfs -put conf input

          此時(shí)已經(jīng)在分布文件系統(tǒng)里建立了input文件夾。而conf是本地的文件夾。

          執(zhí)行示例:
          [chenlb@master hadoop-0.17.1]$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'

          這里input和output都是分布式文件系統(tǒng)的的文件夾,而且output在分布式文件系統(tǒng)里不存在,否則報(bào)錯(cuò)(也可以先刪除它bin/badoop dfs -rmr output)。

          耐心等待。結(jié)束后可以查看。
          [chenlb@master hadoop-0.17.1]$ bin/hadoop dfs -get output output 
          [chenlb
          @master hadoop-0.17.1]$ cat output/* 

          也可以直接在分布式文件系統(tǒng)里查:
          [chenlb@master hadoop-0.17.1]$ bin/hadoop dfs -cat output/*

          成功運(yùn)行后可以關(guān)閉它了:
          [chenlb@master hadoop-0.17.1]$ bin/stop-all.sh

          我在第2階段,出了些問(wèn)題:output已經(jīng)存在,要先刪除它(第二次運(yùn)行前,可以不用output)。

          下一篇講:Fully-Distributed Mode http://www.aygfsteel.com/chenlb/archive/2008/08/11/221314.html
        3. posted @ 2008-08-11 15:28 流浪汗 閱讀(4956) | 評(píng)論 (2)編輯 收藏
          在linux下改了ip地址后,不能立即生效。以前是重啟機(jī)器,我覺得這樣很傻,后來(lái)知道網(wǎng)卡可以重啟。

          /etc/init.d/network restart
          posted @ 2008-08-11 09:34 流浪汗 閱讀(6075) | 評(píng)論 (1)編輯 收藏
          一直想了解分布搜索與索引。Lucene有MultiSearcher,solr1.2的只能有單個(gè)索引,現(xiàn)在1.3可以有Distributed Searching這玩意。可以從多個(gè)索引里搜索出并合并結(jié)果返回給你。這些索引不是replication的,是分割的。可以先%num方式索引在num臺(tái)機(jī)器上,然后用solr的shards參數(shù)。

          如:
          shards=localhost:8080/use-solr1.3,localhost:9080/use-solr1.3&q=chenlb

          測(cè)試后可以返回結(jié)果,但合并的時(shí)候發(fā)了點(diǎn)時(shí)間,我的機(jī)子上40-60ms,單個(gè)搜索基本是0ms

          測(cè)試數(shù)據(jù)是14W結(jié)果,分開索引到兩個(gè)tomcat里。看了后臺(tái),一個(gè)搜索有兩次請(qǐng)求,其中合并的那機(jī)子是三次請(qǐng)求。時(shí)間可能花在請(qǐng)求里,還有就是合并可能緩存不到。

          官方建議:如果單個(gè)solr足夠快的話沒有必要搞Distributed Searching,如果再高點(diǎn)要求可以index repliction。

          當(dāng)索引很大的時(shí)候可能Distributed Searching用的上場(chǎng), 個(gè)人之見。

          參考:http://wiki.apache.org/solr/DistributedSearch
          posted @ 2008-08-07 18:31 流浪汗 閱讀(1017) | 評(píng)論 (0)編輯 收藏
          html 與 xml的轉(zhuǎn)義符不同, xml就只有5個(gè):

          < &lt;
          > &gt;
          & &amp;
          " &quot;
          ' &apos;


          xml沒有&nbsp;
          posted @ 2008-08-06 12:40 流浪汗 閱讀(15424) | 評(píng)論 (2)編輯 收藏
          我比較喜歡免安裝版(非安裝版)的mysql,

          下載如: mysql-noinstall-5.0.45-win32.zip

          把它解壓到如: E:/mysql-5.0.45, 當(dāng)然可以任意位置。

          然后改my-medium.ini文件為my.ini,當(dāng)然也可以不改名,但要改內(nèi)容

          basedir="E:/mysql-5.0.45/"

          datadir
          ="E:/mysql-5.0.45/Data/"

          如果上面,最好加個(gè)字符集,在[mysqld]和[mysql]下面加
          default-character-set=utf8

          當(dāng)然可能是其它字符集, 如:gbk

          寫個(gè)mysql-startup.bat
          "E:\mysql-5.0.45\bin\mysqld" --defaults-file="E:\mysql-5.0.45\my.ini"

          雙擊mysql-startup.bat即可啟動(dòng)。

          用mysqladmin關(guān)閉mysql服務(wù):
          E:/mysql-5.0.45/bin/mysqladmin -u root shutdown


          ^_^
          posted @ 2008-08-03 16:22 流浪汗 閱讀(3090) | 評(píng)論 (1)編輯 收藏
              想讓Tomcat支持ssi,一般是shtml文件。配置比較簡(jiǎn)單。

          默認(rèn)tomcat不支持ssi。

          現(xiàn)以tomcat5.5.x為例。

          改conf/web.xml配置。

          有兩種方式:一是servlet,二是filter。

          servlet方式的:
          <!--
              <servlet>
                  <servlet-name>ssi</servlet-name>
                  <servlet-class>
                    org.apache.catalina.ssi.SSIServlet
                  </servlet-class>
                  <init-param>
                    <param-name>buffered</param-name>
                    <param-value>1</param-value>
                  </init-param>
                  <init-param>
                    <param-name>debug</param-name>
                    <param-value>0</param-value>
                  </init-param>
                  <init-param>
                    <param-name>expires</param-name>
                    <param-value>666</param-value>
                  </init-param>
                  <init-param>
                    <param-name>isVirtualWebappRelative</param-name>
                    <param-value>0</param-value>
                  </init-param>
                  <load-on-startup>4</load-on-startup>
              </servlet>
          -->

          <!--
              <servlet-mapping>
                  <servlet-name>ssi</servlet-name>
                  <url-pattern>*.shtml</url-pattern>
              </servlet-mapping>
          -->

          找到上面的內(nèi)容,去掉注釋。

          filter方式:
          <!--
              <filter>
                  <filter-name>ssi</filter-name>
                  <filter-class>
                    org.apache.catalina.ssi.SSIFilter
                  </filter-class>
                  <init-param>
                    <param-name>contentType</param-name>
                    <param-value>text/x-server-parsed-html(;.*)?</param-value>
                  </init-param>
                  <init-param>
                    <param-name>debug</param-name>
                    <param-value>0</param-value>
                  </init-param>
                  <init-param>
                    <param-name>expires</param-name>
                    <param-value>666</param-value>
                  </init-param>
                  <init-param>
                    <param-name>isVirtualWebappRelative</param-name>
                    <param-value>0</param-value>
                  </init-param>
              </filter>
          -->

          <!--
              <filter-mapping>
                  <filter-name>ssi</filter-name>
                  <url-pattern>*.shtml</url-pattern>
              </filter-mapping>
          -->

          同樣是去掉上面的注釋。但是filter方式的還要加mime-mapping=text/x-server-parsed-html
          <!--
              <mime-mapping>
                  <extension>shtml</extension>
                  <mime-type>text/x-server-parsed-html</mime-type>
              </mime-mapping>
          -->

          去掉mime-mapping的shtml注釋。

          在test的web試下:
          index.shtml
          <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
          <html xmlns="http://www.w3.org/1999/xhtml">
          <head>
          <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
          <title>ssi 示例</title>
          </head>

          <body>
          ssi area 
          <!--#include virtual="ssi.html" -->
          <p>

                  footer 
          <!--#include virtual="footer.html" --><p>
                  
                  
          <p>
                      
          <!--#config timefmt="%D" -->
                  Me last modified 
          <!--#echo var="LAST_MODIFIED" -->

          </body>
          </html>

          footer.html
          <ul>
              
          <li>index</li>
              
          <li>about</li>
          </ul>

          ssi.html
          <p>this is ssi.html file</p><p>
          <p>中文</p>
          ssi.html file end
          <p/>


          現(xiàn)在可以,http://localhost:8080/test/index.shtml 有結(jié)果了。
          posted @ 2008-07-27 21:55 流浪汗 閱讀(1380) | 評(píng)論 (0)編輯 收藏
          主站蜘蛛池模板: 大悟县| 郴州市| 丹棱县| 西丰县| 外汇| 南川市| 南和县| 塔城市| 会同县| 普兰店市| 图木舒克市| 宣汉县| 游戏| 阿尔山市| 孟州市| 资溪县| 城步| 沿河| 河曲县| 康平县| 沙雅县| 方正县| 秦安县| 亚东县| 若尔盖县| 胶州市| 广昌县| 镇安县| 祁东县| 安阳市| 诸暨市| 三台县| 突泉县| 沈丘县| 临城县| 杭州市| 五河县| 项城市| 临高县| 油尖旺区| 靖安县|