隨筆-18 評論-7 文章-0 trackbacks-0

POI的Unable to read entire block明顯是已經久懸未決的問題了，至今在網上查找資料，都沒有一個能確定解決的方案。上周在客戶那里碰到這個問題，弄了4天，才算搞定。這個解決方式倒是沒有發現有描述的，較為簡單，而且還沒有經過長時間測試，不敢保證能夠徹底解決問題，但希望能給在泥潭中苦苦掙扎的朋友們提供一個思路。
我的程序需要將加密的Doc文件先解密出來，存為一個臨時的解碼原文件，從這個原文件中抽取索引，再刪除臨時文件。這時候Unable to read entire block的問題就很明顯。做了測試，如果直接拿原文件來抽取沒問題，就是不經過加密、寫出這步，并且確信加密解密不會造成文件的數據混亂或丟失，那么問題肯定是寫出的文件和原文件不同咯。于是拿兩個文件來對比，發現字節數不一樣，如我的異常報的是Unable to read entire block；81 bytes read; expected 512 bytes ，兩個文件之間差的字節數正是81byte。于是再用UE編輯器打開兩個文件來比較，發現無法抽取的Doc文件最后部分比原文件多了81個0。
查看代碼，發現我的字節數組是這樣定義的byte[] b = byte[255]; 每個字節數組塊是255的大小，當文件寫出到末尾時，會把初始化卻沒有用到的最后一批0一起寫到文件中。偏偏POI以512為單位來讀取，當讀到Doc文檔的末尾，發現還有字節，就報錯，表示這個文件不正確。
解決方式有兩種，我同事使用的是將POI源碼修改了，碰到多出來的字節不校驗，直接通過，但是這樣造成后面的字符串截取子串出問題，不能確保解決。另外一種就很簡單了，將程序中所有的byte初始化定義成byte[512]，這樣定義的字節數組塊跟POI讀取的字節塊是一致的，問題也隨之解決了。

PS：另外，早在2006年的一篇資料(忘記原址了,sorry)，已指出是用FileOutputStrem和FileInputStream輸入輸出的字節數不一致造成的，不過解決方案使用的是用ByteArrayInputStream來進行讀取，難道ByteArrayInputStream能夠將用不到的byte[]截取掉嗎？沒有驗證過，但是照他的方式來修改也無法解決這個問題。最后還是用byte[512]的方式來解決的。先觀察一段時間再說

posted on 2008-06-19 22:12 Timnity 閱讀(5724) 評論(0) 編輯收藏所屬分類: Tools

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: POI的Unable to read entire block異常問題解決方案 Eclipse 插件開發中出現的問題 Eclipse的link安裝&Tutor 常用Ｅｃｌｉｐｓｅ插件下載地址

<

2008年6月

>

日

一

二

三

四

五

六

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

常用鏈接

留言簿(4)

隨筆分類

隨筆檔案

搜索

最新評論

閱讀排行榜

評論排行榜