csusky

          常用鏈接

          統(tǒng)計(jì)

          最新評(píng)論

          #

          異步IO的關(guān)閉事件

          JAVA SOCKET只定義了四種事件

          public static final int OP_READ = 1 << 0;
          public static final int OP_WRITE = 1 << 2;
          public static final int OP_CONNECT = 1 << 3;
          public static final int OP_ACCEPT = 1 << 4;

          是沒有關(guān)閉事件的,我們?cè)趺磁袛嘁粋€(gè)連接是否關(guān)閉呢?
          如果你的selector注冊(cè)了一個(gè)OP_READ事件,那么在連接關(guān)閉的時(shí)候?qū)?huì)產(chǎn)生一個(gè)OP_READ事件
          也就是說本來阻塞的selector此時(shí)將會(huì)被喚醒,但是如果試圖在此事件的通道中讀取數(shù)據(jù)將會(huì)返回-1
          如下:

          Set<SelectionKey> readyKeys = selector.selectedKeys();

          = readyKeys.iterator()

          SelectionKey key 
          = (SelectionKey)i.next();

          if (operation == SelectionKey.OP_READ &&
                                   key.isReadable())
                          
          {
                              ReadableByteChannel incomingChannel 
          = (ReadableByteChannel)key.channel(); 
          //此時(shí)將會(huì)得到-1,表明該鏈接已關(guān)閉
          int n = incomingChannel.read(readBuffer);
          }
          此時(shí)我們需要取消該KEY 如下:
          if (n == -1)
                      
          {
                          key.cancel();
                            //關(guān)閉輸入輸出 
                            sc.socket().shutdownOutput();
                            sc.socket().shutdownInput();
                             //關(guān)閉SOCKET
                             sc.socket().close();
                            //關(guān)閉通道
                             incomingChannel.close();
                      }

          posted @ 2009-11-10 22:28 曉宇 閱讀(425) | 評(píng)論 (1)編輯 收藏

          ExecutorFilter

          1 . 用Executors構(gòu)造一個(gè)新的線程池
          ExecutorService executor = Executors.newCachedThreadPool();

          方法 newCachedThreadPool();
          創(chuàng)建一個(gè)可根據(jù)需要?jiǎng)?chuàng)建新線程的線程池,但是在以前構(gòu)造的線程可用時(shí)將重用它們,并在需要時(shí)使用提供的 ThreadFactory 創(chuàng)建新線程。
          2. 用構(gòu)造的線程池創(chuàng)建ExecutorFilter
          ExecutorFilter es= new ExecutorFilter(executor));

          在ExecutorFilter內(nèi)部:
          只需要將相應(yīng)的事件分發(fā)到到線程池的相應(yīng)線程即可,但是SessionCreated事件只能在主線程中,不能分發(fā)
          觸發(fā)方法
          1 .
          首先構(gòu)造一個(gè)IoFilterEvent,這個(gè)IoFilterEvent包含1、事件的類型,2、下一個(gè)過濾器
          然后觸發(fā)該時(shí)間的處理方法。
           if (eventTypes.contains(IoEventType.SESSION_OPENED)) {
                      fireEvent(
          new IoFilterEvent(nextFilter, IoEventType.SESSION_OPENED,
                              session, 
          null));
                  }

          2 .
          從線程池中取出一個(gè)線程執(zhí)行事件處理
          protected void fireEvent(IoFilterEvent event) {
                  getExecutor().execute(event);
              }


          在構(gòu)造ExecutorFilter 時(shí)如果沒有傳入IoEventType則默認(rèn)只對(duì)如下幾種幾件感興趣
          EXCEPTION_CAUGHT
          MESSAGE_RECEIVED
          MESSAGE_SENT
          SESSION_CLOSED
          SESSION_IDLE
          SESSION_OPENED
          當(dāng)然還需要覆蓋相應(yīng)的事件處理方法 如上所示

          posted @ 2008-12-12 11:33 曉宇 閱讀(1561) | 評(píng)論 (0)編輯 收藏

          ORACLE的塊大小

          參數(shù)db_block_size;
          這個(gè)參數(shù)只能設(shè)置成底層操作系統(tǒng)物理塊大小的整數(shù)倍,最好是2的n次方倍。
          如WINDOWS下4KB,8KB,16KB
          且該參數(shù)需要在建庫的時(shí)候指定,一旦指定不能更改。
          雖然在ORACLE9I以上可以指定表空間的數(shù)據(jù)庫大小,允許同時(shí)使用包括非默認(rèn)大小在內(nèi)的數(shù)據(jù)庫塊大小。不過需要設(shè)置指定大小數(shù)據(jù)塊的buffer_cache.

          小的塊:
          小的塊降低塊競(jìng)爭,因?yàn)槊總€(gè)塊中的行較少.
          小的塊對(duì)于小的行有益.
          小的塊對(duì)于隨意的訪問較好.如果一個(gè)塊不太可能在讀入內(nèi)存后被修改,那么塊的大小越小使用buffer cache越有效率。當(dāng)內(nèi)存資源很珍貴時(shí)尤為重要,因?yàn)閿?shù)據(jù)庫的buffer cache是被限制大小的。
          劣勢(shì):
          小塊的管理消費(fèi)相對(duì)大.
          因?yàn)樾械拇笮∧憧赡苤辉趬K中存儲(chǔ)很小數(shù)目的行,這可能導(dǎo)致額外的I/O。
          小塊可能導(dǎo)致更多的索引塊被讀取

          大的塊
          好處:
          更少的管理消費(fèi)和更多存儲(chǔ)數(shù)據(jù)的空間.
          大塊對(duì)于有順序的讀取較好.  譬如說全表掃描
          大塊對(duì)很大的行較好
          大塊改進(jìn)了索引讀取的性能.大的塊可以在一個(gè)塊中容納更多的索引條目,降低了大的索引級(jí)的數(shù)量.越少的index level意味著在遍歷索引分支的時(shí)候越少的I/O。
          劣勢(shì):
          大塊不適合在OLTP中用作索引塊,因?yàn)樗鼈冊(cè)黾恿嗽谒饕~塊上的塊競(jìng)爭。
          如果你是隨意的訪問小的行并有大的塊,buffer cache就被浪費(fèi)了。例如,8 KB的block size 和50 byte row size,你浪費(fèi)了7,950



           

          posted @ 2008-11-25 15:45 曉宇 閱讀(1769) | 評(píng)論 (0)編輯 收藏

          TIPS

          將進(jìn)酒  杯莫停  -------> 亭名:  悲默亭

          全球通史

          《詩經(jīng)·采薇》

          昔我往矣,楊柳依依 今我來思,雨雪霏霏

          posted @ 2008-11-10 16:31 曉宇 閱讀(187) | 評(píng)論 (0)編輯 收藏

          SPRING整合IBMMQ實(shí)現(xiàn)全局事物

               摘要: <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans"     xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance...  閱讀全文

          posted @ 2008-10-27 17:01 曉宇 閱讀(2414) | 評(píng)論 (0)編輯 收藏

          Lucene的切詞 analysis包

          在搜索引擎中,切詞語是一個(gè)重要的部分,其中包括專有名詞的提取、詞的分割、詞的格式化等等。
          TokenStream 類幾乎是所有這些類的基類
          有兩個(gè)需要被子類實(shí)現(xiàn)的方法Token next() 和 close()
          首先來看analysis包,這個(gè)包主要是提供一些簡單的詞匯化處理
          Tokenizer結(jié)尾的類是將要處理的字符串進(jìn)行分割成Token流,而根據(jù)分割的依據(jù)的又產(chǎn)生了以下幾個(gè)Tokenizer類
          首先Tokenizer類是所有以Tokenizer結(jié)尾的類的基
          然后是CharTokenizer,所有的以Tokenizer結(jié)尾的類都是從這個(gè)類繼承的
          這個(gè)類中有一個(gè)抽象方法
            protected abstract boolean isTokenChar(char c);
          另外一個(gè)需要被子類覆寫的方法
            protected char normalize(char c) {};
          是對(duì)單個(gè)字符進(jìn)行處理的方法譬如說將英文字母全部轉(zhuǎn)化為小寫

          還有一個(gè)變量
          protected Reader input;
          這個(gè)讀取器是這些類所處理的數(shù)據(jù)的   數(shù)據(jù)源
          輸入一個(gè)Reader ,產(chǎn)生一個(gè)Token流


          這個(gè)方法是是否進(jìn)行切分的依據(jù),依次讀取char流,然后用這個(gè)方法對(duì)每個(gè)char進(jìn)行檢測(cè),如果返回false則將預(yù)先存儲(chǔ)在
          詞匯緩沖區(qū)中的char數(shù)組作為一個(gè)Token返回
          LetterTokenizer :
                protected boolean isTokenChar(char c) {
                        return Character.isLetter(c);
                }
          WhitespaceTokenizer:
                protected boolean isTokenChar(char c) {
                        return !Character.isWhitespace(c);
                } 
          LowerCaseTokenizer extends LetterTokenizer:
          protected char normalize(char c) {
                return Character.toLowerCase(c);
             }

             在構(gòu)造函數(shù)中調(diào)用super(in);進(jìn)行和 LetterTokenizer同樣的操作,但是在詞匯化之前所有的詞都轉(zhuǎn)化為小寫了
           
          然后是以Filter結(jié)尾的類,這個(gè)類簇主要是對(duì)已經(jīng)詞匯化的Token流進(jìn)行進(jìn)一步的處理
           輸入是Token流 , 輸出仍然是Token流。
          TokenFilter extends TokenStream  是所有這些類的父類
          protected TokenStream input;
          在TokenFilter 中有一個(gè)TokenStream 變量,是Filter類簇處理的數(shù)據(jù)源,而Filter類簇又是繼承了TokenStream 類的
          有一個(gè)public final Token next()方法,這個(gè)方法以TokenStream.next()產(chǎn)生的Token流 為處理源,產(chǎn)生的仍然是Token流
          只不過中間有一些處理的過程
          LowerCaseFilter:將所有的Token流的轉(zhuǎn)化為小寫
               t.termText = t.termText.toLowerCase();
          StopFilter:過濾掉一些停止詞,這些停止詞由構(gòu)造函數(shù)指定
               for (Token token = input.next(); token != null; token = input.next())
                if (!stopWords.contains(token.termText))
                  return token;


          比較一下Tokenizer類簇和Filter類簇,可以知道
          Tokenizer類簇主要是對(duì)輸入的Reader流,實(shí)際上是字符流按照一定的規(guī)則進(jìn)行分割,產(chǎn)生出Token流
          其輸入是字符串的Reader流形式,輸出是Token流

          Filter類簇主要是對(duì)輸入的Token流進(jìn)行更進(jìn)一步的處理,如去除停止詞,轉(zhuǎn)化為小寫
          主要為一些格式化操作。
          由于Filter類簇的輸入輸出相同,所以可以嵌套幾個(gè)不同的Filter類,以達(dá)到預(yù)期的處理目的。
          前一個(gè)Filter類的輸出作為后一個(gè)Filter類的輸入
          而Tokenizer類簇由于輸入輸出不同,所以不能嵌套







          posted @ 2008-05-30 14:47 曉宇 閱讀(1030) | 評(píng)論 (1)編輯 收藏

          JDK1.5的自動(dòng)裝箱功能

          在JAVA JDK1.5以后具有的自動(dòng)裝箱與拆箱的功能,所謂的自動(dòng)裝箱
          與拆箱也就是把基本的數(shù)據(jù)類型自動(dòng)的轉(zhuǎn)為封裝類型。

          如:自動(dòng)裝箱,它可以直接把基本類型賦值給封裝類型

          Integer num = 10 ;

          Double d = 2d ;

          自動(dòng)拆箱,它可以把封裝類型賦值給基本類型

          int num = new Integer(10);

          double d = new Double(2d);

          自動(dòng)裝箱與拆箱的功能事實(shí)上是編譯器來幫您的忙,編譯器在編譯時(shí)期依您所編寫的語法,決定是否進(jìn)行裝箱或拆箱動(dòng)作。在自動(dòng)裝箱時(shí)對(duì)于值從-128到127之間的值,它們被裝箱為Integer對(duì)象后,會(huì)存在內(nèi)存中被重用,所以范例4.6中使用==進(jìn)行比較時(shí),i1 與 i2實(shí)際上參考至同一個(gè)對(duì)象。如果超過了從-128到127之間的值,被裝箱后的Integer對(duì)象并不會(huì)被重用,即相當(dāng)于每次裝箱時(shí)都新建一個(gè)Integer對(duì)象,所以范例4.7使用==進(jìn)行比較時(shí),i1與i2參考的是不同的對(duì)象。所以不要過分依賴自動(dòng)裝箱與拆箱,您還是必須知道基本數(shù)據(jù)類型與對(duì)象的差異。

              public void testBoxingUnboxing() {

                  int i = 10;

                  Integer inta = i;

                  inta++;

                  inta += 1;

                  int j = inta;

                  assertTrue(j == inta);結(jié)果是:true//junit里面的方法

                  assertTrue(j == new Integer(j)); 結(jié)果是:true

                  assertTrue(10000 == new Integer(10000)); 結(jié)果是:true

              }

          Integer i = 100.相當(dāng)于編譯器自動(dòng)為您作以下的語法編譯:

          Integer i = new Integer(100).所以自動(dòng)裝箱與拆箱的功能是所謂的“編譯器蜜糖”(Compiler Sugar),雖然使用這個(gè)功能很方便,但在程序運(yùn)行階段您得了解Java的語義。例如下面的程序是可以通過編譯的:

          Integer i = null.int j = i.這樣的語法在編譯時(shí)期是合法的,但是在運(yùn)行時(shí)期會(huì)有錯(cuò)誤,因?yàn)檫@種寫法相當(dāng)于:

          Integer i = null.int j = i.intValue().null表示i沒有參考至任何的對(duì)象實(shí)體,它可以合法地指定給對(duì)象參考名稱。由于實(shí)際上i并沒有參考至任何的對(duì)象,所以也就不可能操作intValue()方法,這樣上面的寫法在運(yùn)行時(shí)會(huì)出現(xiàn)NullPointerException錯(cuò)誤。

          自動(dòng)裝箱、拆箱的功能提供了方便性,但隱藏了一些細(xì)節(jié),所以必須小心。再來看范例4.6,您認(rèn)為結(jié)果是什么呢?

          Ü. 范例4.6 AutoBoxDemo2.java

          public class AutoBoxDemo2 {

          public static void main(String[] args) {
          Integer i1 = 100;

          Integer i2 = 100;

          if (i1 == i2)

          System.out.println("i1 == i2");

          else

          System.out.println("i1 != i2").

          }

          }

          從自動(dòng)裝箱與拆箱的機(jī)制來看,可能會(huì)覺得結(jié)果是顯示i1 == i2,您是對(duì)的。那么范例4.7的這個(gè)程序,您覺得結(jié)果是什么?

          Ü. 范例4.7 AutoBoxDemo3.java

          public class AutoBoxDemo3 {

          public static void main(String[] args) {

          Integer i1 = 200;

          Integer i2 = 200;

          if (i1 == i2)

          System.out.println("i1 == i2");

          else

          System.out.println("i1 != i2");

          }

          }

          結(jié)果是顯示i1 != i2這有些令人驚訝,兩個(gè)范例語法完全一樣,只不過改個(gè)數(shù)值而已,結(jié)果卻相反。

          其實(shí)這與==運(yùn)算符的比較有關(guān),在第3章中介紹過==是用來比較兩個(gè)基本數(shù)據(jù)類型的變量值是否相等,事實(shí)上==也用于判斷兩個(gè)對(duì)象引用名稱是否參考至同一個(gè)對(duì)象。

          在自動(dòng)裝箱時(shí)對(duì)于值從–128127之間的值,它們被裝箱為Integer對(duì)象后,會(huì)存在內(nèi)存中被重用,所以范例4.6中使用==進(jìn)行比較時(shí),i1 i2實(shí)際上參考至同一個(gè)對(duì)象。如果超過了從–128127之間的值,被裝箱后的Integer對(duì)象并不會(huì)被重用,即相當(dāng)于每次裝箱時(shí)都新建一個(gè)Integer對(duì)象,所以范例4.7使用==進(jìn)行比較時(shí),i1i2參考的是不同的對(duì)象。

          所以不要過分依賴自動(dòng)裝箱與拆箱,您還是必須知道基本數(shù)據(jù)類型與對(duì)象的差異。范例4.7最好還是依正規(guī)的方式來寫,而不是依賴編譯器蜜糖(Compiler Sugar)。例如范例4.7必須改寫為范例4.8才是正確的。

          Ü. 范例4.8 AutoBoxDemo4.java

          public class AutoBoxDemo4 {
          public static void main(String[] args) {

          Integer i1 = 200;

          Integer i2 = 200;

          if (i1.equals(i2))

          System.out.println("i1 == i2");

          else

          System.out.println("i1 != i2");

          }

          }

          結(jié)果這次是顯示i1 == i2使用這樣的寫法,相信也會(huì)比較放心一些,對(duì)于這些方便但隱藏細(xì)節(jié)的功能到底要不要用呢?基本上只有一個(gè)原則:如果您不確定就不要用。

          posted @ 2008-05-16 11:33 曉宇 閱讀(447) | 評(píng)論 (0)編輯 收藏

          關(guān)于IndexWriter中的3個(gè)性能參數(shù)

          IndexWriter中有3個(gè)重要的性能參數(shù)
          mergeFactor           默認(rèn)為10
          minMergeDocs      默認(rèn)為10
          maxMergeDocs     默認(rèn)為Integer.maxValue

          maxMergeDocs     一個(gè)段中所能包含的最大的doc數(shù),達(dá)到這個(gè)數(shù)目即不再將段進(jìn)行合并 一般不改變這個(gè)值
          minMergeDocs      是指在RAMDirectory中保存的Doc的個(gè)數(shù),達(dá)到minMergeDocs 個(gè)即要合并到硬盤上去(在硬盤上新建一個(gè)段)
          mergeFactor           合并因子,是控制硬盤上的段的合并的,每次在硬盤上新建一個(gè)段之后即執(zhí)行
                                           targetMergeDocs*=mergeFactor(一開始targetMergeDocs=minMergeDocs) 如果硬盤上的doc數(shù)目大于等于                            targetMergeDocs則將硬盤上最后建立的mergeFactor個(gè)段進(jìn)行合并成一個(gè)段

          拿默認(rèn)的參數(shù)舉例:
          如果硬盤上面已經(jīng)有9個(gè)段  每個(gè)段分別存儲(chǔ)了10個(gè)Document,共(90個(gè)DOC),這時(shí)候如果程序再向硬盤合并一個(gè)新的段(含10個(gè)DOC),合并完之后targetMergeDocs=10*10  程序檢查已經(jīng)合并的最后(按照創(chuàng)建的時(shí)間先后順序)mergeFactor個(gè)段的document的總和100是否大于等于targetMergeDocs(這里是100,剛好滿足要求)于是程序又將硬盤上面的后10個(gè)段合并為一個(gè)新的段。

          另外一個(gè)例子:
          doc數(shù)目            段數(shù)目
            1000---------------9個(gè)
            100-----------------9個(gè)
            10   ----------------9個(gè)
          這時(shí)如果再象硬盤中新建一個(gè)新的包含了10個(gè)doc的段
              doc數(shù)目            段數(shù)目
            (1) 1000----------------9個(gè)

            (2)  100-----------------9個(gè)

            (3)   10  ----------------9個(gè)
                                               
            (4)    10 ----------------1個(gè)
          這時(shí)候(3)(4)首先合并成一個(gè)新的段(3-4)包含100個(gè)doc
           然后(2)(3-4)和并成一個(gè)新段(2-3-4)包含1000個(gè)doc
          然后(1)(2-3-4)合并成一個(gè)新的段  包含10000個(gè)doc
          最后合并成一個(gè)段


          private final void maybeMergeSegments() throws IOException {
              
          long targetMergeDocs = minMergeDocs;
              
          while (targetMergeDocs <= maxMergeDocs) {
                
          // find segments smaller than current target size
                int minSegment = segmentInfos.size();
                
          int mergeDocs = 0;
                
          while (--minSegment >= 0{
                  SegmentInfo si 
          = segmentInfos.info(minSegment);
                  
          if (si.docCount >= targetMergeDocs)
                    
          break;
                  mergeDocs 
          += si.docCount;
                }


                
          if (mergeDocs >= targetMergeDocs)          // found a merge to do
                  mergeSegments(minSegment+1);
                
          else
                  
          break;

                targetMergeDocs 
          *= mergeFactor;        // increase target size
                System.out.println("- -- - -targetMergeDocs:"+targetMergeDocs);
                
          try {Thread.sleep(5000);} catch(Exception e) {};
              }

            }

          posted @ 2008-05-15 19:27 曉宇 閱讀(1432) | 評(píng)論 (0)編輯 收藏

          HIBERNATE的一對(duì)多和多對(duì)一關(guān)聯(lián)

          HIBERNATE一多對(duì)關(guān)聯(lián)中  要求在持久化類中定義集合類屬性時(shí),必須把屬性聲明為接口,因?yàn)镠IBERNATE在調(diào)用持久化類的SET/GET方法時(shí)傳遞的是HIBERNATE自己定義的集合類。
          在定義集合時(shí),一般先初始化為集合實(shí)現(xiàn)類的一個(gè)實(shí)例 : private Set orders=new HashSet(),這樣可以避免訪問空集合出現(xiàn)NullPointerException.

          posted @ 2008-05-14 11:01 曉宇 閱讀(241) | 評(píng)論 (0)編輯 收藏

          Lucene索引文件的格式

          segments文件的格式: (段的信息)
          int:  =-1    查看文件是否是Lucene合法的文件格式
          long:        版本號(hào),每更新一次該文件將會(huì)將版本號(hào)加1
          int:         用來命名新段
          int:         段的數(shù)目
          String + int 段的信息 String是段的名稱  int是段中所含的doc數(shù)目
          String + int 同上


          .fnm的文件格式:   (Field的信息)
          int:               Field的個(gè)數(shù),最少為1,最少有一個(gè)Field("",false),在初始化的時(shí)候?qū)懭?暫時(shí)不知道原因); 名稱為空字符串,未索引,        未               向           量化。readVInt()讀取
          String: byte      String是 Field的名稱  byte指示該Field 是否被索引,是否向量化 (值有:11,10,01)第一個(gè)1代表被索引,第二個(gè)代表被向量化
          String: byte Field 同上
               

           

          .fdx的文件格式:主要是提供對(duì).fdt中存儲(chǔ)的document的隨即讀取
          long :       第一個(gè)document在.fdt文件中的位置
          long:        第二個(gè)document在.fdt文件中的位置


          .fdt的文件格式:  .fdt文件存儲(chǔ)了一系列document的信息
          VInt:        該document中的isStored屬性為true的域的個(gè)數(shù)
          (VInt:)      如果該field的isStored屬性為true則得到該field的fieldNumber,暫時(shí)不知道這個(gè)fieldNumber是怎么產(chǎn)生的,有什么用,初步估計(jì)是按照field創(chuàng)建的順序產(chǎn)生的,每次再上一個(gè)field的fieldNumber基礎(chǔ)上加1。
          byte:        如果該field的isTokenized屬性為true寫入1否則寫入false。
          String:      該field的stringValue()值。
          一個(gè)document結(jié)束,下面的數(shù)據(jù)將會(huì)開始一個(gè)新的document,每個(gè)新的document的開始點(diǎn)的文件位置都會(huì)在.fdx中有記載,便于隨即訪問

           

          posted @ 2008-04-21 17:52 曉宇 閱讀(483) | 評(píng)論 (0)編輯 收藏

          僅列出標(biāo)題
          共4頁: 1 2 3 4 下一頁 
          主站蜘蛛池模板: 疏勒县| 林州市| 海口市| 石首市| 大荔县| 资溪县| 澎湖县| 北宁市| 柳林县| 宁波市| 香河县| 吕梁市| 洛隆县| 钟山县| 诸城市| 黄浦区| 闽侯县| 肥西县| 东乌珠穆沁旗| 龙口市| 盘锦市| 固原市| 寿宁县| 马尔康县| 鄂托克前旗| 广西| 大丰市| 嘉峪关市| 乌海市| 招远市| 蒲江县| 嘉黎县| 武清区| 海兴县| 长治市| 临城县| 克拉玛依市| 高台县| 雅江县| 柘荣县| 新乐市|