生命是一種過程

享受生活

導(dǎo)航

<

2025年8月

>

日

一

二

三

四

五

六

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

留言簿(1)

隨筆檔案

2006年7月 (4)

文章檔案

相冊

Photo

閱讀排行榜

評論排行榜

常用鏈接

統(tǒng)計

隨筆 - 4
文章 - 10
評論 - 3
引用 - 0

積分與排名

積分 - 4468
排名 - 3202

分配排序

　分配排序的基本思想：排序過程無須比較關(guān)鍵字，而是通過"分配"和"收集"過程來實(shí)現(xiàn)排序.它們的時間復(fù)雜度可達(dá)到線性階：O(n)。

箱排序(Bin Sort)

1、箱排序的基本思想
??? 　箱排序也稱桶排序(Bucket Sort)，其基本思想是：設(shè)置若干個箱子，依次掃描待排序的記錄R[0]，R[1]，…，R[n-1]，把關(guān)鍵字等于k的記錄全都裝入到第k個箱子里(分配)，然后按序號依次將各非空的箱子首尾連接起來(收集)。
【例】要將一副混洗的52張撲克牌按點(diǎn)數(shù)A<2<…<J<Q<K排序，需設(shè)置13個"箱子"，排序時依次將每張牌按點(diǎn)數(shù)放入相應(yīng)的箱子里，然后依次將這些箱子首尾相接，就得到了按點(diǎn)數(shù)遞增序排列的一副牌。

2、箱排序中，箱子的個數(shù)取決于關(guān)鍵字的取值范圍。
??? 　若R[0..n-1]中關(guān)鍵字的取值范圍是0到m-1的整數(shù)，則必須設(shè)置m個箱子。因此箱排序要求關(guān)鍵字的類型是有限類型，否則可能要無限個箱子。

3、箱子的類型應(yīng)設(shè)計成鏈表為宜
???　一般情況下每個箱子中存放多少個關(guān)鍵字相同的記錄是無法預(yù)料的，故箱子的類型應(yīng)設(shè)計成鏈表為宜。

4、為保證排序是穩(wěn)定的，分配過程中裝箱及收集過程中的連接必須按先進(jìn)先出原則進(jìn)行。
（1）實(shí)現(xiàn)方法一
??? 　每個箱子設(shè)為一個鏈隊列。當(dāng)一記錄裝入某箱子時，應(yīng)做人隊操作將其插入該箱子尾部；而收集過程則是對箱子做出隊操作，依次將出隊的記錄放到輸出序列中。

（2）實(shí)現(xiàn)方法二
??? 　若輸入的待排序記錄是以鏈表形式給出時，出隊操作可簡化為是將整個箱子鏈表鏈接到輸出鏈表的尾部。這只需要修改輸出鏈表的尾結(jié)點(diǎn)中的指針域，令其指向箱子鏈表的頭，然后修改輸出鏈表的尾指針，令其指向箱子鏈表的尾即可。

5、算法簡析
??? 　分配過程的時間是O(n)；收集過程的時間為O(m) （采用鏈表來存儲輸入的待排序記錄）或O(m+n)。因此，箱排序的時間為O(m+n)。若箱子個數(shù)m的數(shù)量級為O(n)，則箱排序的時間是線性的，即O(n)。
? 注意：
??? 　箱排序?qū)嵱脙r值不大，僅適用于作為基數(shù)排序(下節(jié)介紹)的一個中間步驟。

桶排序

??? 　箱排序的變種。為了區(qū)別于上述的箱排序，姑且稱它為桶排序(實(shí)際上箱排序和桶排序是同義詞)。

1、桶排序基本思想
??? 　桶排序的思想是把[0，1)劃分為n個大小相同的子區(qū)間，每一子區(qū)間是一個桶。然后將n個記錄分配到各個桶中。因?yàn)殛P(guān)鍵字序列是均勻分布在[0，1)上的，所以一般不會有很多個記錄落入同一個桶中。由于同一桶中的記錄其關(guān)鍵字不盡相同，所以必須采用關(guān)鍵字比較的排序方法(通常用插入排序)對各個桶進(jìn)行排序，然后依次將各非空桶中的記錄連接(收集)起來即可。
? 注意：
??? 　這種排序思想基于以下假設(shè)：假設(shè)輸入的n個關(guān)鍵字序列是隨機(jī)分布在區(qū)間[0，1)之上。若關(guān)鍵字序列的取值范圍不是該區(qū)間，只要其取值均非負(fù)，我們總能將所有關(guān)鍵字除以某一合適的數(shù)，將關(guān)鍵字映射到該區(qū)間上。但要保證映射后的關(guān)鍵字是均勻分布在[0，1)上的。

2、桶排序算法
? 偽代碼算法為：
? void BucketSon(R)
??? { //對R[0..n-1]做桶排序，其中0≤R[i].key<1(0≤i<n)
????? for(i=0，i<n;i++) //分配過程．
??????? 將R[i]插入到桶B[「n(R[i].key)」]中； //可插入表頭上
????? for(i=0;i<n;i++) //排序過程
??????? 當(dāng)B[i]非空時用插人排序?qū)[i]中的記錄排序；
????? for(i=0，i<n；i++) //收集過程
??????? 若B[i]非空，則將B[i]中的記錄依次輸出到R中；
???? }

? 注意：
??? 　實(shí)現(xiàn)時需設(shè)置一個指針向量B[0..n-1]來表示n個桶。但因?yàn)槿我挥涗汻[i]的關(guān)鍵字滿足：0≤R[i].key<1(0≤i≤n-1)，所以必須將R[i].key映射到B的下標(biāo)區(qū)間[0，n-1)上才能使R[i]裝入某個桶中，這可通過└n*(R[i].key)┘來實(shí)現(xiàn)。

3、桶排序示例
　??? R[0..9]中的關(guān)鍵字為 (0.78，0.17，0.39，0.26，0.72，0.94，0.21， 0.12，0.23，0.68)，用算法BucketSort排序的過程【參見動畫演示】。
分析：
??? 　這里n=10，故B[0..9]這10個桶表示的子區(qū)間分別是[0，0.1)，[0.1，0.2)，…，[0.9，1)。
??? 　收集過程只要按B[0]，B[1]，…，B[9]的次序?qū)⒏鞣强胀笆孜叉溄悠饋恚驅(qū)⑵漭敵龅絉[0..9)中即可。

4、桶排序算法分析
??? 　桶排序的平均時間復(fù)雜度是線性的，即O(n)。但最壞情況仍有可能是O(n²)。
??? 　箱排序只適用于關(guān)鍵字取值范圍較小的情況，否則所需箱子的數(shù)目m太多導(dǎo)致浪費(fèi)存儲空間和計算時間。
　　【例】n=10，被排序的記錄關(guān)鍵字k_i取值范圍是0到99之間的整數(shù)(36，5，16，98，95，47, 32，36，48)時，要用100個箱子來做一趟箱排序。（即若m=n²時，箱排序的時間O(m+n)=O(n²)）。

基數(shù)排序?

??? 　基數(shù)排序(Radix Sort)是對箱排序的改進(jìn)和推廣。

1、單關(guān)鍵字和多關(guān)鍵字
??? 　文件中任一記錄R[i]的關(guān)鍵字均由d個分量
???????????????????? 構(gòu)成。
若這d個分量中每個分量都是一個獨(dú)立的關(guān)鍵字，則文件是多關(guān)鍵字的(如撲克牌有兩個關(guān)鍵字：點(diǎn)數(shù)和花色)；否則文件是單關(guān)鍵字的，
?????????????? (0≤j<d)只不過是關(guān)鍵字中其中的一位(如字符串、十進(jìn)制整數(shù)等)。
??? 多關(guān)鍵字中的每個關(guān)鍵字的取值范圍一般不同。如撲克牌的花色取值只有4種，而點(diǎn)數(shù)則有13種。單關(guān)鍵字中的每位一般取值范圍相同。

2、基數(shù)
??? 　　設(shè)單關(guān)鍵字的每個分量的取值范圍均是：
????? C₀≤k_j≤C_rd-1(0≤j<d)
可能的取值個數(shù)rd稱為基數(shù)。
??? 　基數(shù)的選擇和關(guān)鍵字的分解因關(guān)鍵宇的類型而異:
(1) 若關(guān)鍵字是十進(jìn)制整數(shù)，則按個、十等位進(jìn)行分解，基數(shù)rd=10，C₀=0，C₉=9，d為最長整數(shù)的位數(shù)；
(2) 若關(guān)鍵字是小寫的英文字符串，則rd=26，C_o='a'，C₂₅='z'，d為字符串的最大長度。

3、基數(shù)排序的基本思想
??? 　基數(shù)排序的基本思想是：從低位到高位依次對K^j(j=d-1，d-2，…，0)進(jìn)行箱排序。在d趟箱排序中，所需的箱子數(shù)就是基數(shù)rd，這就是"基數(shù)排序"名稱的由來。

4、基數(shù)排序的排序過程
??? 　要排序的記錄關(guān)鍵字取值范圍是0到99之間的整數(shù)(36，5，16，98，95，47， 32，36，48)。對這些關(guān)鍵字進(jìn)行基數(shù)排序的過程【參見動畫演示】。

5、基數(shù)排序的類型說明和算法描述
??? 　要保證基數(shù)排序是正確的，就必須保證除第一趟外各趟箱排序是穩(wěn)定的。相應(yīng)的類型說明及算法描述【參見教材】。

6、算法分析
??? 　若排序文件不是以數(shù)組R形式給出，而是以單鏈表形式給出(此時稱為鏈?zhǔn)降幕鶖?shù)排序)，則可通過修改出隊和人隊函數(shù)使表示箱子的鏈隊列無須分配結(jié)點(diǎn)空間，而使用原鏈表的結(jié)點(diǎn)空間。人隊出隊操作亦無需移動記錄而僅需修改指針。雖然這樣一來節(jié)省了一定的時間和空間，但算法要復(fù)雜得多，且時空復(fù)雜度就其數(shù)量級而言并未得到改觀。有關(guān)鏈?zhǔn)降幕鶖?shù)排序可【閱讀參考書目[12]】。
??? 　基數(shù)排序的時間是線性的(即O(n))。
??? 　基數(shù)排序所需的輔助存儲空間為O(n+rd)。
??? 　基數(shù)排序是穩(wěn)定的。

posted on 2006-07-20 15:53 xnlijun 閱讀(390) 評論(0) 編輯收藏

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理