瘋狂

STANDING ON THE SHOULDERS OF GIANTS

posts - 481, comments - 486, trackbacks - 0, articles - 1

在java中使用TreeMap進(jìn)行中文排序(轉(zhuǎn))

Posted on 2011-05-20 11:36 瘋狂閱讀(2203) 評(píng)論(0) 編輯收藏所屬分類: java

最近工作遇到需要按一個(gè)model中不同的列進(jìn)行排序的問題，查了一下JDK API文檔，發(fā)現(xiàn)，java中可以排序的工具類和接口共有五個(gè)SortedMap 、SortedSet、TreeMap 、TreeSet和Collections，由于我要排序的是一系列model，所以，最后使用了TreeMap對(duì)象，而且TreeMap到最后的處理比較自由，可以直接返回TreeMap對(duì)象，也可以返回model的一個(gè)Collection對(duì)象。其它幾個(gè)類的用法其實(shí)都是大同小異，如果java基礎(chǔ)較好，看一下API文檔很容易明白，只是Collection中需要顯式調(diào)用sort()方法而已。

寫理論的東西或者深入的東西就會(huì)太多了，而且讓人會(huì)看得比較煩，這里講求實(shí)用，就不多說了，直接入正體，基本的排序代碼如下：
package ChineseSort;

import java.util.Collection;

import java.util.Iterator;

import java.util.SortedMap;

import java.util.TreeMap;

public class TestSort {

public static void main(String[] args) {

// TODO Auto-generated method stub

TreeMap map = new TreeMap();

for(int i=0; i<10; i++) {

String s = ""+(int)(Math.random()*1000);

map.put(s,s);

}

map.put("abcd","abcd");

map.put("Abc", "Abc");

map.put("bbb","bbb");

map.put("BBBB", "BBBB");

map.put("北京","北京");

map.put("中國","中國");

map.put("上海", "上海");

map.put("廈門", "廈門");

map.put("香港", "香港");

map.put("碑海", "碑海");

Collection col = map.values();

Iterator it = col.iterator();

while(it.hasNext()) {

System.out.println(it.next());

}

代碼就不多作解釋了，一看就明白，開始放進(jìn)去10個(gè)整數(shù)隨機(jī)數(shù)，然后是英文，然后是中文。運(yùn)行結(jié)果如下：

132

205

287

295

399

410

411

464

670

Abc

BBBB

abcd

bbb

上海

中國

北京

廈門

碑海

香港

注意，這里的數(shù)字排序正常，而英文排序是區(qū)分大小寫的，這個(gè)也是正常的，因?yàn)锳SCII碼中小寫字母比大寫字母靠后，中文排序則明顯的不正確，碑和北明顯應(yīng)該在一起的，而且應(yīng)該在最前面。這個(gè)主要是java中使用中文編碼GB2312或者JBK時(shí)，char型轉(zhuǎn)換成int型得過程出現(xiàn)了比較大的偏差，很多文章介紹過了，大家可以去網(wǎng)上找一下，這里不多說了，直接尋找解決方案。

Java中之所以出現(xiàn)偏差，主要是compare方法的問題，所以這里自己實(shí)現(xiàn)Comparator接口，而國際化的問題，使用Collator類來解決。這里先解決中文問題,代碼如下：

package ChineseSort;

import java.text.CollationKey;

import java.text.Collator;

import java.util.Comparator;

public class CollatorComparator implements Comparator {

Collator collator = Collator.getInstance();

public int compare(Object element1, Object element2) {

CollationKey key1 = collator.getCollationKey(element1.toString());

CollationKey key2 = collator.getCollationKey(element2.toString());

return key1.compareTo(key2);

}

同時(shí)修改我們前面完成的TestSort類，找到TreeMap map = new TreeMap();

修改為

CollatorComparator comparator = new CollatorComparator();

TreeMap map = new TreeMap();

再次運(yùn)行該類，運(yùn)行結(jié)果如下：

325

653

730

757

874

895

909

921

Abc

abcd

bbb

BBBB

碑海

北京

上海

廈門

香港

中國

此時(shí)可以看到中文的排序已經(jīng)完成正常。如果想不讓英文區(qū)分大小寫，則修改CollatorComparator類，找到

element1.toString()

修改為：

element1.toString().toLowerCase()

當(dāng)然你改成轉(zhuǎn)換成大寫的也無所謂了，當(dāng)然element2.toString()也要同時(shí)修改為element2.toString().toLowerCase()。再次運(yùn)行結(jié)果如下：

207

353

656

659

770

789

857

861

931

984

Abc

abcd

bbb

BBBB

碑海

北京

上海

廈門

香港

中國

現(xiàn)在可以看到，排序已經(jīng)完全符合我們的要求了。如果要反向排序也很容易，遍歷的時(shí)候倒過來，或者你寫兩個(gè)Comparator的實(shí)現(xiàn)類，正向的排序就像我們前面所寫的，反向排序就將return key1.compareTo(key2);修改成return -key1.compareTo(key2);，加了個(gè)負(fù)號(hào)，這里你可以直接加個(gè)符號(hào)看看效果，結(jié)果我就不寫了，肯定中國是Number One。我還真沒找到TreeMap里直接反向的方法，誰看到了告訴我。

最后一些要說明的，這里我就不再寫實(shí)現(xiàn)的代碼了，就是我們要實(shí)現(xiàn)的是根據(jù)model中的一個(gè)列進(jìn)行排序，而我們測試代碼只是簡單的一些值，這個(gè)容易，遍歷所有model，把要排序的列值取出來作為TreeMap的key，然后model放進(jìn)去作為value就行了，這個(gè)很簡單，如果想寫成稍微通用點(diǎn)的，就使用反射機(jī)制，把取值方法封裝一下就行了，然后把model對(duì)象和方法名扔進(jìn)去就行了。至于value值重復(fù)的問題，也好辦，只要value相同只要不是多列同時(shí)作為排序的鍵，那么他們之間的前后順序無所謂，判斷一下當(dāng)前Map中是否含有該key值，存在，則新的key做成value+longtime就行了，就是加個(gè)時(shí)間戳（感覺用時(shí)間戳比較方便，其它的能區(qū)分的辦法也行啦）。至于多列的排序，其實(shí)也容易，按照列的前后順序firstvalue+secondvalue+......組成key放到TreeMap里照樣OK J 方便吧。

新用戶注冊(cè) 刷新評(píng)論列表


只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關(guān)文章: JAVA Thread Dump 分析綜述關(guān)于java RMI在多網(wǎng)卡下(或者啟動(dòng)360，百度，騰訊等wifi共享下)無法連接問題(java.rmi.ConnectException: Connection refused to host: xx) Quartz+Spring的集群配置(轉(zhuǎn)) java.awt.headless=true dom4j通過xpath查詢xml (轉(zhuǎn)) 深入探討 Java 類加載器 Java ClassLoader基礎(chǔ)知識(shí) synchronized 要注意的地方關(guān)于java.lang.IllegalMonitorStateException ThreadPoolExecutor運(yùn)轉(zhuǎn)機(jī)制詳解 .

瘋狂

在java中使用TreeMap進(jìn)行中文排序(轉(zhuǎn))

日歷

公告

留言簿(11)

隨筆分類

相冊(cè)

搜索

積分與排名

最新隨筆

最新評(píng)論