經過嘗試,發現可以利用 Office 2003 中的 Microsoft Office Document Imaging 組件來實現PDF轉WORD文檔,也就是說利用WORD來完成該任務。方法如下:
用Adobe Reader 打開想轉換的PDF文件 ,接下來 選擇 “文件→打印”菜單,在打開的“打印”窗口中將 “打印機”欄中的名稱設置為 “Microsoft Office Document Image Writer”,確認后將該PDF文 件輸出為 MDI格式的虛擬打印文件 。
注: 如果沒有找到“Microsoft Office Document Image Writer”項,使用Office 2003安裝光盤中的“添加/刪除組件”更新安裝該組件,選中“Office 工具 Microsoft DRAW轉換器”。
然后, 運行 “Microsoft Office Document Imaging”,并利用它來 打開 剛才保存的MDI文件,選擇“工具→ 將文本發送到Word ”菜單,在彈出的窗口中選中“ 在輸出時保持圖片版式不變 ”,確認后系統會提示“必須在執行此操作前重新運行 OCR 。這可能需要一些時間”,不管它, 確認 即可。
注: 對PDF轉DOC的識別率不是特別完美,轉換后會丟失原來的排版格式,所以轉換后還需要手工對其進行排版和校對工作。
以上僅在 word2003 中可用,其他版本沒有Microsoft Office Document Image Writer。