(1)BitSet類 默認情況下,set 中所有位的初始值都是 false。 每個位 set 都有一個當前大小,也就是該位 set 當前所用空間的位數。注意,這個大小與位 set 的實現有關,所以它可能隨實現的不同而更改。位 set 的長度與位 set 的邏輯長度有關,并且是與實現無關而定義的。 除非另行說明,否則將 null 參數傳遞給 BitSet 中的任何方法都將導致 NullPointerException。 在沒有外部同步的情況下,多個線程操作一個 BitSet 是不安全的。 |
(2) 構造函數: BitSet() or BitSet(int nbits)
(3) 一些方法
public void set(int pos): 位置pos的字位設置為true。
public void set(int bitIndex, boolean value) 將指定索引處的位設置為指定的值。
public void clear(int pos): 位置pos的字位設置為false。
public void clear() : 將此 BitSet 中的所有位設置為 false。
public int cardinality() 返回此 BitSet 中設置為 true 的位數。
public boolean get(int pos): 返回位置是pos的字位值。
public void and(BitSet other): other同該字位集進行與操作,結果作為該字位集的新值。
public void or(BitSet other): other同該字位集進行或操作,結果作為該字位集的新值。
public void xor(BitSet other): other同該字位集進行異或操作,結果作為該字位集的新值。
public void andNot(BitSet set) 清除此 BitSet 中所有的位,set - 用來屏蔽此 BitSet 的 BitSet
public int size(): 返回此 BitSet 表示位值時實際使用空間的位數。
public int length() 返回此 BitSet 的“邏輯大小”:BitSet 中最高設置位的索引加 1。
public int hashCode(): 返回該集合Hash 碼, 這個碼同集合中的字位值有關。
public boolean equals(Object other): 如果other中的字位同集合中的字位相同,返回true。
public Object clone() 克隆此 BitSet,生成一個與之相等的新 BitSet。
public String toString() 返回此位 set 的字符串表示形式。
import java.util.BitSet; public class WhichChars{ private BitSet used = new BitSet(); public WhichChars(String str){ for(int i=0;i< str.length();i++) used.set(str.charAt(i)); // set bit for char } public String toString(){ String desc="["; int size=used.size(); for(int i=0;i< size;i++){ if(used.get(i)) desc+=(char)i; } return desc+"]"; } public static void main(String args[]){ WhichChars w=new WhichChars("How do you do"); System.out.println(w); } }運行:
C:\work>java WhichChars
[ Hdouwy]
2. java.util.BitSet 研究(存數海量數據時的一個途徑)
java.util.BitSet可以按位存儲。
計算機中一個字節(byte)占8位(bit),我們java中數據至少按字節存儲的,
比如一個int占4個字節。
如果遇到大的數據量,這樣必然會需要很大存儲空間和內存。
如何減少數據占用存儲空間和內存可以用算法解決。
java.util.BitSet就提供了這樣的算法。
比如有一堆數字,需要存儲,source=[3,5,6,9]
用int就需要4*4個字節。
java.util.BitSet可以存true/false。
如果用java.util.BitSet,則會少很多,其原理是:
1,先找出數據中最大值maxvalue=9
2,聲明一個BitSet bs,它的size是maxvalue+1=10
3,遍歷數據source,bs[source[i]]設置成true.
最后的值是:
(0為false;1為true)
bs [0,0,0,1,0,1,1,0,0,1]
3, 5,6, 9
這樣一個本來要int型需要占4字節共32位的數字現在只用了1位!
比例32:1
這樣就省下了很大空間。
看看測試例子
- package com;
- import java.util.BitSet;
- public class MainTestThree {
- /**
- * @param args
- */
- public static void main(String[] args) {
- BitSet bm=new BitSet();
- System.out.println(bm.isEmpty()+"--"+bm.size());
- bm.set(0);
- System.out.println(bm.isEmpty()+"--"+bm.size());
- bm.set(1);
- System.out.println(bm.isEmpty()+"--"+bm.size());
- System.out.println(bm.get(65));
- System.out.println(bm.isEmpty()+"--"+bm.size());
- bm.set(65);
- System.out.println(bm.isEmpty()+"--"+bm.size());
- }
- }
輸出:
true--64
false--64
false--64
false
false--64
false--128
說明默認的構造函數聲明一個64位的BitSet,值都是false。
如果你要用的位超過了默認size,它會再申請64位,而不是報錯。
- package com;
- import java.util.BitSet;
- public class MianTestFour {
- /**
- * @param args
- */
- public static void main(String[] args) {
- BitSet bm1=new BitSet(7);
- System.out.println(bm1.isEmpty()+"--"+bm1.size());
- BitSet bm2=new BitSet(63);
- System.out.println(bm2.isEmpty()+"--"+bm2.size());
- BitSet bm3=new BitSet(65);
- System.out.println(bm3.isEmpty()+"--"+bm3.size());
- BitSet bm4=new BitSet(111);
- System.out.println(bm4.isEmpty()+"--"+bm4.size());
- }
- }
輸出:
true--64
true--64
true--128
true--128
說明你申請的位都是以64為倍數的,就是說你申請不超過一個64的就按64算,超過一個不超過
2個的就按128算。
- package com;
- import java.util.BitSet;
- public class MainTestFive {
- /**
- * @param args
- */
- public static void main(String[] args) {
- int[] shu={2,42,5,6,6,18,33,15,25,31,28,37};
- BitSet bm1=new BitSet(MainTestFive.getMaxValue(shu));
- System.out.println("bm1.size()--"+bm1.size());
- MainTestFive.putValueIntoBitSet(shu, bm1);
- printBitSet(bm1);
- }
- //初始全部為false,這個你可以不用,因為默認都是false
- public static void initBitSet(BitSet bs){
- for(int i=0;i<bs.size();i++){
- bs.set(i, false);
- }
- }
- //打印
- public static void printBitSet(BitSet bs){
- StringBuffer buf=new StringBuffer();
- buf.append("[\n");
- for(int i=0;i<bs.size();i++){
- if(i<bs.size()-1){
- buf.append(MainTestFive.getBitTo10(bs.get(i))+",");
- }else{
- buf.append(MainTestFive.getBitTo10(bs.get(i)));
- }
- if((i+1)%8==0&&i!=0){
- buf.append("\n");
- }
- }
- buf.append("]");
- System.out.println(buf.toString());
- }
- //找出數據集合最大值
- public static int getMaxValue(int[] zu){
- int temp=0;
- temp=zu[0];
- for(int i=0;i<zu.length;i++){
- if(temp<zu[i]){
- temp=zu[i];
- }
- }
- System.out.println("maxvalue:"+temp);
- return temp;
- }
- //放值
- public static void putValueIntoBitSet(int[] shu,BitSet bs){
- for(int i=0;i<shu.length;i++){
- bs.set(shu[i], true);
- }
- }
- //true,false換成1,0為了好看
- public static String getBitTo10(boolean flag){
- String a="";
- if(flag==true){
- return "1";
- }else{
- return "0";
- }
- }
- }
輸出:
maxvalue:42
bm1.size()--64
[
0,0,1,0,0,1,1,0,
0,0,0,0,0,0,0,1,
0,0,1,0,0,0,0,0,
0,1,0,0,1,0,0,1,
0,1,0,0,0,1,0,0,
0,0,1,0,0,0,0,0,
0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0
]
這樣便完成了存值和取值。
注意它會對重復的數字過濾,就是說,一個數字出現過超過2次的它都記成1.
出現的次數這個信息就丟了