dyerac  
          dyerac In Java
          公告

          日歷
          <2007年7月>
          24252627282930
          1234567
          891011121314
          15161718192021
          22232425262728
          2930311234
          統(tǒng)計(jì)
          • 隨筆 - 36
          • 文章 - 10
          • 評(píng)論 - 94
          • 引用 - 0

          導(dǎo)航

          常用鏈接

          留言簿(5)

          隨筆分類(49)

          隨筆檔案(36)

          文章分類(11)

          文章檔案(10)

          相冊(cè)

          dyerac

          搜索

          •  

          積分與排名

          • 積分 - 79498
          • 排名 - 705

          最新隨筆

          最新評(píng)論

          閱讀排行榜

          評(píng)論排行榜

           

          轉(zhuǎn)的這篇文章雖然是講動(dòng)態(tài)代理的
          但是其中涉及到了Decorator模式 也是一個(gè)學(xué)習(xí)的亮點(diǎn)




          -----------------------------------------------------------------------------------------------------
          記憶是衍生自Lisp,Python,和Perl等過程性語言的一種設(shè)計(jì)模式,它可以對(duì)前次的計(jì)算結(jié)果進(jìn)行記憶。 一個(gè)實(shí)現(xiàn)了記憶功能的函數(shù), 帶有顯式的cache, 所以, 已經(jīng)計(jì)算過的結(jié)果就能直接從cache中獲得, 而不用每次都進(jìn)行計(jì)算.
          記憶能顯著的提升大計(jì)算量代碼的效率. 而且是一種可重用的方案.
          本文闡述了在Java中使用這一模式的方法,并提供了一個(gè)可以提供上述功能的"記憶類":
               Foo foo = (Foo) Memoizer.memoize(new FooImpl());
               這里,Foo是一個(gè)接口,它含有的方法是需要記憶的.FooImpl是Foo的一個(gè)實(shí)現(xiàn).foo是Foo的一個(gè)引用.方法與FooImpl基本相同,區(qū)別在于Foo返回的值,會(huì)被緩存起來.單個(gè)記憶類的優(yōu)點(diǎn)在于為任何類添加記憶功能是很簡(jiǎn)單的:定義一個(gè)包含需要記憶的方法的接口,然后調(diào)用memoize來實(shí)現(xiàn)一個(gè)實(shí)例.

              為了理解記憶類是怎么實(shí)現(xiàn)的,我們將分幾步來解釋.首先,我解釋一下為何緩存能夠在需要它的類中實(shí)現(xiàn).然后,我測(cè)試一下如何為一個(gè)特定的類添加緩存包裝器.最后,我解釋一下如何才能使得一個(gè)緩存包裝器能夠通用于任意的類.

          為大計(jì)算量的程序添加緩存
              作為一個(gè)大計(jì)算量程序的例子,我們考慮PiBinaryDigitsCalculator這個(gè)例子-計(jì)算二進(jìn)制數(shù)據(jù)pi.僅有的public方法calculateBinaryDigit帶有一個(gè)參數(shù):整數(shù)n,代表需要精確到的位數(shù).例如,1000000,將會(huì)返回小數(shù)點(diǎn)后的一百萬位,通過byte值返回-每位為0或者1.(算法可以參考: http://www.cecm.sfu.ca/~pborwein/PAPERS/P123.pdf)

          public class PiBinaryDigitsCalculator {
            /**
             * Returns the coefficient of 2^n in the binary
             * expansion of pi.
             * @param n the binary digit of pi to calculate.
             * @throws ValidityCheckFailedException if the validity
             * check fails, this means the implementation is buggy
             * or n is too large for sufficient precision to be
             * retained.
             */
            public byte calculateBinaryDigit(final int n) {
                return runBBPAlgorithm(n);
            }
              
            private byte runBBPAlgorithm(final int n) {
                // Lengthy routine goes here ...
            }

          }

              最簡(jiǎn)單直接的方法來緩存返回值可以通過修改這個(gè)類來實(shí)現(xiàn):添加一個(gè)Map來保存之前計(jì)算得到的值,如下:
          import java.util.HashMap;

          public class PiBinaryDigitsCalculator {

            private HashMap cache = new HashMap();

            public synchronized byte calculateBinaryDigit(
            final int n) {

                final Integer N = new Integer(n);
                Byte B = (Byte) cache.get(N);
                if (B == null) {
                    byte b = runBBPAlgorithm(n);
                    cache.put(N, new Byte(b));
                    return b;
                } else {
                    return B.bytevalue();
                }
            }

            private byte runBBPAlgorithm(final int n) {
                // Lengthy routine goes here ...
            }
          }

           
              calculateBinaryDigit方法首先會(huì)檢查HashMap里面是否緩存了這個(gè)關(guān)鍵字-參數(shù)n,如果找到了,就直接返回這個(gè)值.否則,就會(huì)進(jìn)行這個(gè)冗長(zhǎng)的計(jì)算,并將結(jié)果保存到緩存里面.在添加進(jìn)HashMap的時(shí)候,在原始類型和對(duì)象之間還要進(jìn)行小小的轉(zhuǎn)換.
              盡管這個(gè)方法是可行的,但是有幾個(gè)缺點(diǎn).首先,進(jìn)行緩存的代碼和正常的算法代碼不是顯著分開的.一個(gè)類,不僅負(fù)責(zé)進(jìn)行計(jì)算,也要負(fù)責(zé)進(jìn)行維護(hù)緩存數(shù)據(jù).這樣,要進(jìn)行一些測(cè)試就會(huì)顯得很困難.比如,不能寫一個(gè)測(cè)試程序來測(cè)試這個(gè)算法持續(xù)地返回相同的值,因?yàn)?從第二次開始,結(jié)果都是直接從cache中獲得了.
              其次,當(dāng)緩存代碼不再需要,移除它會(huì)變得困難,因?yàn)樗退惴▔K地代碼是緊密結(jié)合在一起的.所以,要想知道緩存是否帶來了很高的效率提升也是很困難的,因?yàn)椴荒軐懸粋€(gè)測(cè)試程序是和緩存數(shù)據(jù)分開的.當(dāng)你改進(jìn)了你的算法,緩存有可能失效-但是這個(gè)時(shí)候你并不知道.
              第三,緩存代碼不能被重用.盡管代碼遵從了一個(gè)普通的模式,但是都是在一個(gè)類- PiBinaryDigitsCalculator里面.

              前面兩個(gè)問題都可以通過構(gòu)造一個(gè)緩存包裝器來解決.

          緩存包裝器
              通過使用Decorator模式,要分開計(jì)算代碼和緩存代碼是很容易的.首先,定義一個(gè)接口,里面定義基本的方法.
               public interface BinaryDigitsCalculator {

            public byte calculateBinaryDigit(final int n);
          }

              

              然后定義兩個(gè)實(shí)現(xiàn),分別負(fù)責(zé)兩個(gè)任務(wù):
          public class PiBinaryDigitsCalculator
            implements BinaryDigitsCalculator {

            public byte calculateBinaryDigit(final int n) {
                return runBBPAlgorithm(n);
            }

            private byte runBBPAlgorithm(final int n) {
                // Lengthy routine goes here ...
            }

          }

          import java.util.HashMap;

          public class CachingBinaryDigitsCalculator implements
          BinaryDigitsCalculator {

            private BinaryDigitsCalculator binaryDigitsCalculator;
            private HashMap cache = new HashMap();

            public CachingBinaryDigitsCalculator(
            BinaryDigitsCalculator calculator) {
                this.binaryDigitsCalculator = calculator;
            }

            public synchronized byte calculateBinaryDigit(int n) {
                final Integer N = new Integer(n);
                Byte B = (Byte) cache.get(N);
                if (B == null) {
                    byte b =
                      binaryDigitsCalculator.calculateBinaryDigit(n);
                    cache.put(N, new Byte(b));
                    return b;
                } else {
                    return B.bytevalue();
                }
            }
          }

              
              這是很之前的實(shí)現(xiàn)PiBinaryDigitsCalculator的一種簡(jiǎn)單的refactored版本. CachingBinaryDigitsCalculator包裝了BinaryDigitsCalculator句柄,并增加了緩存,供calculateBinaryDigit的方法調(diào)用. 這種方法提高了代碼的可讀性與可維護(hù)性. 用戶不能直接使用BinaryDigitsCalculator接口來實(shí)現(xiàn)算法,所以,如果需要關(guān)閉緩存塊,將是很容易實(shí)現(xiàn)的.
              還有,合適的測(cè)試程序很容易寫出來.比如,我們寫一個(gè)假的BinaryDigitsCalculator實(shí)現(xiàn),每次calculateBinaryDigit被調(diào)用,賦予相同的參數(shù),返回不同的值. 這樣,我們就能測(cè)試緩存是否工作了,因?yàn)槿绻看味挤祷叵嗤闹?則證明緩存是正常工作了. 這種測(cè)試在之前那種簡(jiǎn)單的實(shí)現(xiàn)是不可能的.

          這是很之前的實(shí)現(xiàn)PiBinaryDigitsCalculator的一種簡(jiǎn)單的refactored版本. CachingBinaryDigitsCalculator包裝了BinaryDigitsCalculator句柄,并增加了緩存,供calculateBinaryDigit的方法調(diào)用. 這種方法提高了代碼的可讀性與可維護(hù)性. 用戶不能直接使用BinaryDigitsCalculator接口來實(shí)現(xiàn)算法,所以,如果需要關(guān)閉緩存塊,將是很容易實(shí)現(xiàn)的.

              還有,合適的測(cè)試程序很容易寫出來.比如,我們寫一個(gè)假的BinaryDigitsCalculator實(shí)現(xiàn),每次calculateBinaryDigit被調(diào)用,賦予相同的參數(shù),返回不同的值. 這樣,我們就能測(cè)試緩存是否工作了,因?yàn)槿绻看味挤祷叵嗤闹?則證明緩存是正常工作了. 這種測(cè)試在之前那種簡(jiǎn)單的實(shí)現(xiàn)是不可能的。
          通過動(dòng)態(tài)代理類來創(chuàng)建一個(gè)通用的緩存包裝器\r

              上面第二種方法僅有的缺點(diǎn)就是緩存包裝器不能重用,每次我們希望添加一個(gè)緩存給某個(gè)類,我們就要寫一個(gè)特殊的緩存包裝器給目標(biāo)接口.這是一個(gè)很慢,容易出錯(cuò)的過程.

              Jdk1.3開始支持動(dòng)態(tài)代理類: 特別的類能夠在運(yùn)行期決定實(shí)現(xiàn)哪個(gè)接口-通常的模式都是,在運(yùn)行期即決定實(shí)現(xiàn)哪個(gè)接口.通過這個(gè),我們有可能實(shí)現(xiàn)一個(gè)通用的緩存包裝器,我們稱它為Memoizer,在運(yùn)行期決定實(shí)現(xiàn)哪個(gè)接口.這樣, CachingBinaryDigitsCalculator就是不再需要的.它是這樣被調(diào)用的:

          BinaryDigitsCalculator calculator =
          new CachingBinaryDigitsCalculator(
          new PiBinaryDigitsCalculator()
          );  

              可以通過Memoizer來重寫如下:

          BinaryDigitsCalculator calculator =
          (BinaryDigitsCalculator) Memoizer.memoize(
          new PiBinaryDigitsCalculator()
          );

          Memoizer的代碼如下:

          package demo.proxy;

          import java.lang.reflect.InvocationHandler;
          import java.lang.reflect.InvocationTargetException;
          import java.lang.reflect.Method;
          import java.lang.reflect.Proxy;
          import java.util.Arrays;
          import java.util.Collections;
          import java.util.HashMap;
          import java.util.List;
          import java.util.Map;

          public class Memorizer implements InvocationHandler {
              
          public static Object memorize(Object object) {
                  
          return Proxy.newProxyInstance(object.getClass().getClassLoader(),
                          object.getClass().getInterfaces(), 
          new Memorizer(object));
              }


              
          private Object object;

              
          private Map caches = new HashMap();

              
          private Memorizer(Object object) {
                  
          this.object = object;
              }


              
          public Object invoke(Object proxy, Method method, Object[] args)
                      
          throws Throwable {
                  
          // Don't cache void methods
                  if (method.getReturnType().equals(Void.TYPE)) {
                      
          return invoke(method, args);
                  }
           else {
                      Map cache 
          = getCache(method);
                      List key 
          = Arrays.asList(args);
                      Object value 
          = cache.get(key);
                      
          if (value == null && !cache.containsKey(key)) {
                          value 
          = invoke(method, args);
                          cache.put(key, value);
                      }

                      
          return value;
                  }

              }


              
          private Object invoke(Method method, Object[] args) throws Throwable {
                  
          try {
                      
          return method.invoke(object, args);
                  }
           catch (InvocationTargetException e) {
                      
          throw e.getTargetException();
                  }

              }


              
          private synchronized Map getCache(Method m) {
                  Map cache 
          = (Map) caches.get(m);
                  
          if (cache == null{
                      cache 
          = Collections.synchronizedMap(new HashMap());
                      caches.put(m, cache);
                  }

                  
          return cache;
              }

          }
           



          當(dāng)調(diào)用靜態(tài)方法memoize的時(shí)候,將會(huì)創(chuàng)建一個(gè)新的代理實(shí)例-也就是一個(gè)java.lang.reflect.proxy的實(shí)例.實(shí)現(xiàn)了一個(gè)接口集.這個(gè)接口集由object.getClass().getInterfaces()來決定.每個(gè)代理實(shí)例包含一個(gè)java.lang.reflect.InvocationHandler實(shí)例來處理這個(gè)代理實(shí)例調(diào)用的相關(guān)方法.在我們的例子里,Memoizer就是一個(gè)InvocationHandler實(shí)例.

              當(dāng)一個(gè)方法在代理實(shí)例里被調(diào)用,比如, calculateBinaryDigit,那么, Memoizer實(shí)例里的invoke方法就會(huì)被調(diào)用,相關(guān)信息會(huì)傳給invoke方法,以決定proxy實(shí)例調(diào)用了哪個(gè)方法,包含參數(shù)信息.在我們的例子里,傳入Memoizer的java.lang.Method參數(shù)是calculateBinaryDigit,而參數(shù)信息則是pi需要精確的位數(shù)-整數(shù)n.在這個(gè)基礎(chǔ)上,Memoizer能夠進(jìn)一步進(jìn)行緩存操作的.

              在例子里(caches是一個(gè)Hashmap,cache是一個(gè)map)里用到的Key,主要是傳入的方法信息:Method對(duì)象和參數(shù)對(duì)象. 為了實(shí)現(xiàn)的簡(jiǎn)單與通用性,Memoizer有一個(gè)關(guān)于cache的HashMap caches,每個(gè)method是一個(gè)key,對(duì)應(yīng)的value為一個(gè)cache.然后把參數(shù)信息轉(zhuǎn)化成一個(gè)List對(duì)象,作為cache的Key.使用List是很方便的,同時(shí)也可以保證equals()方法,所以能夠保證當(dāng)且僅當(dāng)參數(shù)信息完全相同的時(shí)候這個(gè)List才相等.

              一旦一個(gè)cache的Key被創(chuàng)建,那么,計(jì)算之前都會(huì)先查找這個(gè)cache,如果找到,則返回cache里的值.否則,如果帶有這些參數(shù)的這個(gè)方法沒有被調(diào)用過,那么,則會(huì)通過invoke來調(diào)用這個(gè)method.在我們的例子里, 實(shí)例PiBinaryDigitsCalculator 里的calculateBinaryDigit方法將會(huì)通過invoke被調(diào)用.而且計(jì)算結(jié)果將會(huì)被存在cache里.
          何時(shí)使用Memoizer

              作為一條通用的規(guī)則,Memoizer能夠在任何需要傳統(tǒng)的cache的時(shí)候使用-比如上面提到的例子. 特別地,接口里每個(gè)需要使用記憶功能的method需要滿足下面幾條條件:

              1. 這個(gè)method的返回值最好不要每次調(diào)用都會(huì)改變\r

              2. 這個(gè)method不要有副效應(yīng)

              3. 這個(gè)method的參數(shù)是確定的,非mutable的.

              顯然,如果每次調(diào)用這個(gè)method返回值都不同,那么cache就毫無用處了.同樣也是很重要的一點(diǎn)是,因?yàn)橛懈毙?yīng)的method不會(huì)被重復(fù),所以這個(gè)method不能有副效應(yīng)(method自動(dòng)更新某些狀態(tài)).當(dāng)然,void方法除外.

              同樣,memorize一個(gè)帶有未定(mutable)參數(shù)的method是很危險(xiǎn)的,因?yàn)?要把這些參數(shù)儲(chǔ)存到hashmap里會(huì)是很危險(xiǎn)的一件事.根據(jù)Map的定義,當(dāng)這個(gè)Map里的key發(fā)生改變,Map是不知道的.所以,當(dāng)你執(zhí)行了一次這個(gè)method之后,相關(guān)信息添加進(jìn)了Map,然后參數(shù)發(fā)生變異(mutate),第二次調(diào)用的時(shí)候,就會(huì)得到錯(cuò)誤的結(jié)果.

              性能

              使用cache的主要目的就是為了提升你的程序的速度.然而,reflection確是眾所周知的低效(在jdk1.4里有所改進(jìn),通過reflection調(diào)用方法是普通調(diào)用速度的1/2,這個(gè)比jdk1.3要快40倍).Memoizer主要依靠reflection來調(diào)用方法,所以,它看上去并不是一個(gè)好的途徑.但是,如果使用cache能給程序速度帶來的提升遠(yuǎn)高于reflection對(duì)速度的影響,那么,使用Memoizer是值得考慮的.

              在我們對(duì)PiBinaryDigitsCalculator的測(cè)試中,測(cè)試環(huán)境為jdk1.4,當(dāng)n小于10的時(shí)候,使不使用cache速度是相當(dāng)?shù)?但是,當(dāng)n增大的時(shí)候,使用cache的優(yōu)勢(shì)就開始顯示出來.所以,經(jīng)常使用PiBinaryDigitsCalculator的用戶,可以考慮使用cache.

              不幸的是,唯一測(cè)試你的程序是否需要cache的途徑是比較你的程序在兩種情況下的運(yùn)行效率.盡管如此,因?yàn)闉橐粋€(gè)程序構(gòu)造一個(gè)cache包裝器是很容易的一件事,移除它也是很容易的,下面的建議可以作為一個(gè)參考的步驟:

              1. 選擇需要記憶操作的類\r

              2. 運(yùn)行它\r

              3. 如果效率是滿意的,go to 6

              4. 添加memoizer,使用cache

              5. 如果效率沒有顯著提升,移初memoizer

              6. 如果需要,重試.

              理論上,你需要分析為一個(gè)類添加記憶功能對(duì)整個(gè)系統(tǒng)的影響.只有你自己清楚是否值得添加.有些方法,即使是計(jì)算量很大的,但是在這個(gè)系統(tǒng)里很少被調(diào)用,所以,沒必要為它添加記憶功能.為了保證這個(gè),我開發(fā)了一個(gè)更有特點(diǎn)的Memoizer,實(shí)現(xiàn)了一個(gè)叫做CacheStatistics的接口,你能從它得到cache的數(shù)量以及無效的cache.你可以使用它作為判斷的一個(gè)尺度.

              擴(kuò)展Memoizer

              修改Memoizer類來支持不同的cache策略是很簡(jiǎn)單的.一個(gè)比較普通的類型就是Least-Recently-Used(LRU)cahce,擁有固定數(shù)量的入口.這個(gè)cache確保入口不大于它的最大數(shù)目,如果超過,就摒棄最舊的緩存數(shù)據(jù).也就是,能夠從cache里得到的是新的數(shù)據(jù).一個(gè)類可以使用LRU cache來防止一個(gè)程序長(zhǎng)期保持一個(gè)狀態(tài).你可以僅僅傳遞一個(gè)參數(shù)給CacheFactory里的memoize方法來選擇你需要的cache類型.下面的例子,LRU cache最多有1000個(gè)入口:

          BinaryDigitsCalculator calculator =
          (BinaryDigitsCalculator) Memoizer.memoize(
          new PiBinaryDigitsCalculator(),
          new LruCacheFactory(1000)
          );

              即使是這么簡(jiǎn)單,Memoizer也應(yīng)該是java程序員一個(gè)有用的工具.

          posted on 2007-07-24 14:03 dyerac in java... 閱讀(757) 評(píng)論(0)  編輯  收藏 所屬分類: JavaSE
           
          Copyright © dyerac in java... Powered by: 博客園 模板提供:滬江博客
          主站蜘蛛池模板: 鄄城县| 镇赉县| 沐川县| 密山市| 故城县| 绥中县| 吐鲁番市| 民乐县| 昭通市| 五莲县| 托里县| 沁源县| 大连市| 九龙县| 遂宁市| 朝阳区| 双城市| 长海县| 兴和县| 嘉定区| 潞城市| 阿巴嘎旗| 岳西县| 涞源县| 大关县| 伊通| 峨眉山市| 漳浦县| 凤阳县| 日土县| 新乡县| 乳源| 会同县| 手游| 扬州市| 昆明市| 松桃| 阳原县| 东台市| 华安县| 梁山县|