Junky's IT Notebook

          統計

          留言簿(8)

          積分與排名

          WebSphere Studio

          閱讀排行榜

          評論排行榜

          快速精確的對數學表達式求值(轉)

          步驟:
          1. 表達式語法分析
          2. 表達式檢查
          3. 一步一步的求值

          表達式語法分析

          W3Eval 的數學表達式由數字、變量、操作符、函數和括號組成。除了缺省的十進制計數制外 W3Eval 還支持二進制、八進制和十六進制。這些以其它計數制計數的數必須以 # 開頭,并緊跟 bo 或者 h 來分別表示二進制、八進制或十六進制。

          W3Eval 的變量是不限長度的大寫字母和數字序列,其首字符必須是字母。W3Eval 有一些預定義的變量,不過它也支持用戶定義的變量。

          W3Eval 支持帶有固定或不定數量自變量的函數。 函數可分為以下幾組:

          • 三角函數(sin、cos、tan、cot、sec、csc)
          • 反三角函數(asin、acos、atan、atan2、acot、asec、acsc)
          • 雙曲線函數(sinh、cosh、tanh、coth、sech、csch)
          • 反雙曲線函數(asinh、acosh、atanh、acoth、asech、acsch)
          • 指數函數(log、log2、log10、exp、exp2、exp10、sqrt、cur)
          • 組合學函數(Combinatoric)(comb、combr、perm、permr、var、varr)
          • 統計函數(sum、avg、min、max、stddev、count)
          • 其它(abs、ceil、fact、floor、pow、random、rint、round、sign、frac、hypot、deg、rad、trunc、int)

          W3Eval 對表達式進行 語法分析,也就是指它識別出表達式的算術成分,并將它們轉化成語言符號(token),然后把它們放入向量。表達式一旦處于這種狀態,就為下面兩步做好了準備:表達式檢查和求值。

          W3Eval 的 符號(token)是算術表達式的組成部分; 記號(mark)是獨立的字符, 由 applet 使用,作為識別各種符號的內部標志。每種符號有唯一的 mark 與之對應。W3Eval 的表達式由表 1 所示的符號組成。

          表 1. W3Eval 的符號

          TokenMark
          十進制數Double
          二進制數String
          十六進制數String
          八進制數String
          變量Variable
          函數Function
          操作符Operator
          開括號String
          閉括號String
          逗號String

          用以表示函數、操作符和變量類的定義如清單 1 所示:


          清單 1. Function、Operator 和 Variable 類的定義
          public class Function
             {
             public String function;
             public int number_of_arguments;
          
             public Function( String function, int number_of_arguments )
                {
                this.function=function;
                this.number_of_arguments=number_of_arguments;
                }
          
             public String toString()
                {
                return function;
                }
             }
          
          public class Operator
             {
             public String operator;
             public byte priority;
          
             public Operator( String operator, byte priority )
                {
                this.operator=operator;
                this.priority=priority;
                }
          
             public String toString()
                {
                return operator;
                }
             }
          
          public class Variable
             {
             public String variable;
             public double value;
          
             public Variable( String variable, double value )
                {
                this.variable=variable;
                this.value=value;
                }
          
             public String toString()
                {
                return variable;
                }
             }
          

          Token 類如清單 2 所示。


          清單 2. Token 類
          public class Token
             {
             public Object token;
             public char mark;
             public int position;
             public int length;
          
             public Token ( Object token, char mark, int position, int length )
                {
                this.token=token;
                this.mark=mark;
                this.position=position;
                this.length=length;
                }
          
             public String toString()
                {
                return token.toString()+" ; "+mark+" ; "+position+" ; "+length+"
          ";
                }
             }
          

          表達式檢查

          檢查正規表達式正確性的所有代碼都在一個獨立的類中。詳細的表達式檢查能夠確定錯誤確切的類型和位置。 錯誤檢查有七類:

          括號檢查。W3Eval 的表達式可以包含三種括號:標準圓括號、方括號和花括號。如果表達式包含相同數量的開括號和閉括號,并且每個開括號與一個相應的同種閉括號相匹配,則表達式的括號語法正確。三種括號在語義上等價,如下面的代碼段所示。


          清單 3. 三種括號
          import java.util.Stack;
          
          public class Parentheses_check
             {
          
             public static boolean is_open_parenthesis( char c )
                {
                if ( c=='(' || c=='[' || c=='{' )
                   return true;
                else
                   return false;
                }
          
             public static boolean is_closed_parenthesis( char c )
                {
                if ( c==')' || c==']' || c=='}' )
                   return true;
                else
                   return false;
                }
          
             private static boolean parentheses_match( char open, char closed )
                {
                if ( open=='(' && closed==')' )
                   return true;
                else if ( open=='[' && closed==']' )
                   return true;
                else if ( open=='{' && closed=='}' )
                   return true;
                else
                   return false;
                }
          
             public static boolean parentheses_valid( String exp )
                {
                Stack       s = new Stack();
                int         i;
                char        current_char;
                Character   c;
                char        c1;
                boolean     ret=true;
          
                for ( i=0; i < exp.length(); i++ )
                   {
          
                   current_char=exp.charAt( i );
          
                   if ( is_open_parenthesis( current_char ) )
                      {
                      c=new Character( current_char );
                      s.push( c );
                      }
                   else if ( is_closed_parenthesis( current_char ) )
                      {
                      if ( s.isEmpty() )
                         {
                         ret=false;
                         break;
                         }
                      else
                         {
                         c=(Character)s.pop();
                         c1=c.charValue();
                         if ( !parentheses_match( c1, current_char ) )
                            {
                            ret=false;
                            break;
                            }
                         }
                      }
                   }
          
                if ( !s.isEmpty() )
                   ret=false;
          
                return ret;
                }
             }
          

          token 檢查。檢查表達式語法。確保表達式所有部分都被認為是合法的。

          表達式開頭的檢查(請參閱 清單 4確保表達式從合法的符號開始。不可以用操作符、逗號或閉括號作為表達式的開始符。


          清單 4. 正確的表達式開頭的檢查
          private static boolean begin_check( Vector tokens, Range r, StringBuffer err )
             {
             char     mark;
             Token    t;
          
             t=(Token)tokens.elementAt( 0 );
             mark=t.mark;
          
             if ( mark=='P' )
                err.append( Messages.begin_operator );
             else if ( mark==')' )
                err.append( Messages.begin_parenthesis );
             else if ( mark=='Z' )
                err.append ( Messages.begin_comma );
             else
                return true;
          
             r.start=0;
             r.end=t.length;
             return false;
             }
          

          表達式末尾的檢查。確保表達式以合法符號結束。不可以用操作符、函數、逗號或開括號作為表達式結束符。

          符號序列的檢查。檢查表達式中的符號序列。在下面的表格中,若 X 軸上的符號和 Y 軸上的符號對應的交界處用 X 作了記號,則相應 X 軸上的符號可以接在 Y 軸上符號的后面。

          表 2. 合法的符號序列

          _DBHOVFP()Z
          D_______
          B_______
          H_______
          O_______
          V_______
          F_________
          P___
          (___
          )_______
          Z___

          函數檢查。確保表達式中所有函數的自變量數量正確。

          逗號檢查。逗號只能用于分隔函數的自變量。若用于表達式其它地方,就不合法。

          一步一步的求值

          只有能順利通過以上概括的所有檢查的表達式,W3Eval 才求值。從而確保內建于 W3Eval 中的前提條件不會出現問題。后面的算法用于單步執行表達式求值:

          1. 找出嵌入最深的那對括號。
          2. 在這對括號中,找出優先級最高的操作符。
          3. 若這對括號中沒有操作符:
            • 如果表達式再不包含任何其它的括號,求值(過程)完成。
            • 如果表達式包含括號,但不包含操作符,則存在一個函數。對函數求值,然后轉到步驟 5。
          4. 獲取操作數并執行運算。
          5. 從向量中除去用過的符號并在同一位置放入結果。
          6. 除去冗余括號。
          7. 將向量中剩余的符號結合到字符串并在屏幕上顯示結果。

          現在,我們將更為詳細的查看算法的每一步,同時查看大部分有意思的代碼片段。

          步驟 1:為避免括號的處理,W3Eval 確定哪個子表達式處于嵌套最深的那對括號中。這項任務需要兩步。第一步,W3Eval 必須找出第一個閉括號:


          清單 5. 找出第一個閉括號
          public static int pos_first_closed_parenthesis( Vector tokens )
             {
             Token   t;
          
             for ( int i=0; i<tokens.size(); i++ )
                {
                t=(Token)tokens.elementAt( i );
                if ( t.mark==')' )
                   return i;
                }
             return 0;
             }
          

          第二步,找出與第一步找到的閉括號相匹配的開括號,如 清單 6 所示


          清單 6. 找出匹配的開括號
          public static int pos_open_parenthesis( Vector tokens, int closed_parenthesis )
             {
             int      i;
             Token    t;
          
             i=closed_parenthesis-2;
          
             while ( i>=0 )
                {
                t=(Token)tokens.elementAt( i );
                if ( t.mark=='(' )
                   {
                   return i;
                   }
                i--;
                }
             return 0;
             }
          

          步驟 2:要實現求值的單步執行,W3Eval 在嵌套最深的那對括號中找出優先級最高的操作符。(操作符的優先級已硬編碼到 applet 中;請參閱 參考資料以獲取完整的代碼清單。)


          清單 7. 找出優先級最高的操作符
          public static int pos_operator( Vector tokens, Range r )
             {
             byte     max_priority=Byte.MAX_VALUE;
             int      max_pos=0;
          
             byte     priority;
             String   operator;
             Token    t;
          
             for ( int i=r.start+2; i<=r.end-2; i++ )
                {
                t=(Token)tokens.elementAt( i );
                if ( t.mark!='P' )
                   continue;
                priority=((Operator)t.token).priority;
                operator=((Operator)t.token).operator;
          
                if ( priority < max_priority || ( operator.equals("^") ||
                   operator.equals("**") ) && priority == max_priority )
                   {
                   max_priority=priority;
                   max_pos=i;
                   }
                }
             return max_pos;
             }
          

          步驟 3:如果表達式中不包含其它括號,求值的過程就完成。如果表達式包含括號,但不包含操作符,則存在需要求值的函數。


          清單 8. 檢查是否還有其它操作符
          ...
          int poz_max_op=pos_operator( tokens, range );
          // if there are no operators
          if ( poz_max_op==0 )
             {
             if ( no_more_parentheses )
                {
                return false;
                }
             else
                {
                double   result;
                result=function_result( tokens, range.start-1 );
                function_tokens_removal( tokens, range.start-1 );
          
                t = new Token ( new Double(result), 'D', 0, 0 );
                tokens.setElementAt( t, range.start-1 );
          
                parentheses_removal( tokens, range.start-1 );
                return true;
                }
             }
          ...
          

          步驟 4:所有的操作符都是二元的,也就是說第一個操作數位于操作符之前,第二個操作符位于操作符之后。


          清單 9. 獲取操作數并執行運算
          ...
          double operand1, operand2;
          
          // first operand is before...
          t=(Token)tokens.elementAt( poz_max_op-1 );
          operand1=operand_value( t );
          
          // ...and second operand is after operator
          t=(Token)tokens.elementAt( poz_max_op+1 );
          operand2=operand_value( t );
          
          // operator
          t=(Token)tokens.elementAt( poz_max_op );
          String op=((Operator)t.token).operator;
          
          double result=operation_result( operand1, operand2, op );
          
          tokens.removeElementAt( poz_max_op+1 );
          tokens.removeElementAt( poz_max_op );
          
          t = new Token ( new Double(result), 'D', 0, 0 );
          tokens.setElementAt( t, poz_max_op-1 );
          
          parentheses_removal( tokens, poz_max_op-1 );
          ...
          

          操作數可以是變量,還可以是十進制、十六進制、八進制或二進制數。


          清單 10. 獲取操作數
          public static double operand_value( Token t )
             {
             if ( t.mark=='V' )
                return ((Variable)t.token).value;
             else if ( t.mark=='D' )
                return ((Double)t.token).doubleValue();
             else if ( t.mark=='H' )
                return base_convert( ((String)t.token).substring(2), 16 );
             else if ( t.mark=='O' )
                return base_convert( ((String)t.token).substring(2), 8 );
             else if ( t.mark=='B' )
                return base_convert( ((String)t.token).substring(2), 2 );
             }
          

          接下來的方法將不同計數制的數轉化為十進制的形式。


          清單 11. 將數轉化為十進制數
          public static long base_convert( String s, int base )
             {
             long r=0;
             int i, j;
          
             for ( i=s.length()-1, j=0; i>=0; i--, j++ )
                r=r+digit_weight( s.charAt( i ) )*(long)Math.pow( base, j );
             return r;
             }
          
          public static int digit_weight( char c )
             {
             if ( Character.isDigit( c ) )
                return c-48;
             else if ( 'A'<=c && c<='f' )
                return c-55;
             else if ( 'a'<=c && c<='f' )
                return c-87;
             return -1;
             }
          

          一旦確定操作數和操作符后,就可以執行運算了,如 清單 12所示。

          步驟 5:在這步中,W3Eval 從向量中除去用過的符號并在同一位置放入結果。對于函數求值這類情況,除去的是函數、括號、自變量和逗號;而對于操作符求值這類情況而言,除去的則是操作數和操作符。

          步驟 6:在求值的這一步,W3Eval 從表達式中除去冗余括號。


          清單 13. 除去冗余括號
          private static void parentheses_removal( Vector tokens, int pos )
             {
             if ( 
                pos>1 &&
          amp;&&
          amp;
                ((Token)tokens.elementAt( poz-2 )).mark!='F' &&
          amp;&&
          amp;
                ((Token)tokens.elementAt( poz-1 )).mark=='(' &&
          amp;&&
          amp;
                ((Token)tokens.elementAt( poz+1 )).mark==')'
                ||
                pos==1 &&
          amp;&&
          amp;
                ((Token)tokens.elementAt( 0 )).mark=='(' &&
          amp;&&
          amp;
                ((Token)tokens.elementAt( 2 )).mark==')'
                )
                {
                tokens.removeElementAt( poz+1 );
                tokens.removeElementAt( poz-1 );
                }
             return;
             }
          

          步驟 7:在求值的最后一步,向量中剩余的符號被結合到字符串,并在屏幕上顯示。


          清單 14. 結合符號并顯示結果
          public static String token_join( Vector tokens )
             {
             String   result=new String();
             Token    t;
          
             for ( int i=0; i < tokens.size(); i++ )
                {
                t=(Token)tokens.elementAt( i );
          
                if ( t.mark=='D' )
                   {
                   double n=((Double)t.token).doubleValue();
                   result=result + formated_number( n );
                   }
                else
                   result=result + t.token;
          
                if ( result.endsWith( ".0" ) )
                   result=result.substring( 0, result.length()-2 );
                result=result + " ";
                }
             return result;
             }
          





          回頁首


          結論

          本文分析了一個 applet ,它能一步一步的對算術表達式求值。同時還按順序回顧了最有意思的代碼片段,并論述了兩種不同的表達式求值方法。

          下一版 W3Eval 有望在各方面得到增強,包括有能力添加用戶定義的功能;支持分數、復數和矩陣;改良的圖形用戶界面(GUI);大小和速度優化以及安全性方面的增強。我鼓勵您提供您自己對于增強方面的設想。

          我希望您會發現 W3Eval 是個對表達式求值有益的在線工具,它在某種程度上比經典的方法更簡單自然。我還期待這里談到的代碼和算法使您明白 Java 語言有助于處理數學問題。





          回頁首


          參考資料

          • 您可以參閱本文在 developerWorks 全球站點上的 英文原文.

          • W3Eval applet是免費的,它的 幫助有助于您解決問題。


          • 這張表格展示了 W3Eval 操作符的優先級


          • 請閱讀波蘭數學家 Jan Lukasiewicz的傳記。


          • Donald Knuth,計算機科學領域卓越的學者,曾詳盡的就算法的設計和分析撰寫和演講。他的 主頁提供最近出版的有關其作品的論文和信息的鏈接。


          • 有興趣隨意編寫 applet 嗎?可以查看我們的教程 Building a Java applet(developerWorks,1999 年)以獲得一步一步的指導。


          • 您會覺得 Java FAQ很有用。


          • 還有很多有關 applet 的信息在 Peter Van Der Linden(Prentice Hall PTR/Sun Microsystems 出版社出版,1998 年 12 月)的 Just Java 2中。


          • 由 Ken Arnold、James Gosling 和 David Holmes 撰寫的 The Java Programming Language(Addison Wesley 出版社出版,2000 年 12 月)包含有益的關于集合的信息。


          • 學習 Martin Bastiaan 的 “A Walk in the Park”(developerWorks,1998 年 1 月),了解更多有關 applet 的知識。


          • VisualAge for Java使 applet 的開發變得輕而易舉。


          • developerWorks Java 技術專區查找更多 Java 參考資料。




          回頁首


          關于作者

          Author photo

          Nikola Stepan 是 ABIT Ltd. 的軟件工程師,他在那里從事銀行業軟件的設計和開發。他有廣博的信息系統方面的學術背景和豐富的編程經驗(從低級編程到信息系統)。他特別喜歡面向對象編程語言、關系數據庫、因特網編程和系統編程。他于 1999 年在克羅地亞 Varazdin 的 Faculty of Organisation and Informatic 獲得信息系統學士學位。他會說克羅地亞語、英語和一點德語。請通過 nikola.stepan@vz.tel.hr與 Nikola 聯系。


          posted on 2006-10-25 17:31 junky 閱讀(598) 評論(0)  編輯  收藏 所屬分類: 計算機科學,編程思想


          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 成都市| 鄂托克前旗| 锡林郭勒盟| 张家口市| 长葛市| 阜新市| 东辽县| 龙海市| 兴和县| 柘荣县| 溧水县| 阿鲁科尔沁旗| 鄱阳县| 阿城市| 渭南市| 洞口县| 河间市| 多伦县| 灵山县| 阿城市| 隆德县| 锦屏县| 临安市| 水富县| 新余市| 万源市| 达拉特旗| 霞浦县| 五华县| 泽普县| 象山县| 金乡县| 陕西省| 德令哈市| 依兰县| 汉沽区| 图们市| 裕民县| 神木县| 遂川县| 济宁市|