一江春水向東流

          做一個有思想的人,期待與每一位熱愛思考的人交流,您的關注是對我最大的支持。

            BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
            44 隨筆 :: 139 文章 :: 81 評論 :: 0 Trackbacks

          下載整個網站一般命令(例如):
          wget -r -p -np -k http://www.google.com

            $ wget --help

            GNU Wget 1.9.1,非交互式的網絡文件下載工具。
            用法: wget [選項]... [URL]...

            長選項必須用的參數在使用短選項時也是必須的。

          啟動:

            -V, --version 顯示 Wget 的版本并且退出。
            -h, --help 打印此幫助。
            -b, -background 啟動后進入后臺操作。
            -e, -execute=COMMAND 運行‘.wgetrc’形式的命令。

          日志記錄及輸入文件:

            -o, --output-file=文件 將日志消息寫入到指定文件中。
            -a, --append-output=文件 將日志消息追加到指定文件的末端。
            -d, --debug 打印調試輸出。
            -q, --quiet 安靜模式(不輸出信息)。
            -v, --verbose 詳細輸出模式(默認)。
            -nv, --non-verbose 關閉詳細輸出模式,但不進入安靜模式。
            -i, --input-file=文件 下載從指定文件中找到的 URL。
            -F, --force-html 以 HTML 方式處理輸入文件。
            -B, --base=URL 使用 -F -i 文件選項時,在相對鏈接前添加指定的 URL。

          下載:

            -t, --tries=次數 配置重試次數(0 表示無限)。
            --retry-connrefused 即使拒絕連接也重試。
            -O --output-document=文件 將數據寫入此文件中。
            -nc, --no-clobber 不更改已經存在的文件,也不使用在文件名后
            添加 .#(# 為數字)的方法寫入新的文件。
            -c, --continue 繼續接收已下載了一部分的文件。
            --progress=方式 選擇下載進度的表示方式。
            -N, --timestamping 除非遠程文件較新,否則不再取回。
            -S, --server-response 顯示服務器回應消息。
            --spider 不下載任何數據。
            -T, --timeout=秒數 配置讀取數據的超時時間 (秒數)。
            -w, --wait=秒數 接收不同文件之間等待的秒數。
            --waitretry=秒數 在每次重試之間稍等一段時間 (由 1 秒至指定的 秒數不等)。
            --random-wait 接收不同文件之間稍等一段時間(由 0 秒至 2*WAIT 秒不等)。
            -Y, --proxy=on/off 打開或關閉代理服務器。
            -Q, --quota=大小 配置接收數據的限額大小。
            --bind-address=地址 使用本機的指定地址 (主機名稱或 IP) 進行連接。
            --limit-rate=速率 限制下載的速率。
            --dns-cache=off 禁止查找存于高速緩存中的 DNS。
            --restrict-file-names=OS 限制文件名中的字符為指定的 OS (操作系統) 所允許的字符。

          目錄:

            -nd --no-directories 不創建目錄。
            -x, --force-directories 強制創建目錄。
            -nH, --no-host-directories 不創建含有遠程主機名稱的目錄。
            -P, --directory-prefix=名稱 保存文件前先創建指定名稱的目錄。
            --cut-dirs=數目 忽略遠程目錄中指定數目的目錄層。

          HTTP 選項:

            --http-user=用戶 配置 http 用戶名。
            --http-passwd=密碼 配置 http 用戶密碼。
            -C, --cache=on/off (不)使用服務器中的高速緩存中的數據 (默認是使用的)。
            -E, --html-extension 將所有 MIME 類型為 text/html 的文件都加上 .html 擴展文件名。
            --ignore-length 忽略“Content-Length”文件頭字段。
            --header=字符串 在文件頭中添加指定字符串。
            --proxy-user=用戶 配置代理服務器用戶名。
            --proxy-passwd=密碼 配置代理服務器用戶密碼。
            --referer=URL 在 HTTP 請求中包含“Referer:URL”頭。
            -s, --save-headers 將 HTTP 頭存入文件。
            -U, --user-agent=AGENT 標志為 AGENT 而不是 Wget/VERSION。
            --no-http-keep-alive 禁用 HTTP keep-alive(持久性連接)。
            --cookies=off 禁用 cookie。
            --load-cookies=文件 會話開始前由指定文件載入 cookie。
            --save-cookies=文件 會話結束后將 cookie 保存至指定文件。
            --post-data=字符串 使用 POST 方法,發送指定字符串。
            --post-file=文件 使用 POST 方法,發送指定文件中的內容。

          HTTPS (SSL) 選項:

            --sslcertfile=文件 可選的客戶段端證書。
            --sslcertkey=密鑰文件 對此證書可選的“密鑰文件”。
            --egd-file=文件 EGD socket 文件名。
            --sslcadir=目錄 CA 散列表所在的目錄。
            --sslcafile=文件 包含 CA 的文件。
            --sslcerttype=0/1 Client-Cert 類型 0=PEM (默認) / 1=ASN1 (DER)
            --sslcheckcert=0/1 根據提供的 CA 檢查服務器的證書
            --sslprotocol=0-3 選擇 SSL 協議;0=自動選擇,
            1=SSLv2 2=SSLv3 3=TLSv1

          FTP 選項:

            -nr, --dont-remove-listing 不刪除“.listing”文件。
            -g, --glob=on/off 設置是否展開有通配符的文件名。
            --passive-ftp 使用“被動”傳輸模式。
            --retr-symlinks 在遞歸模式中,下載鏈接所指示的文件(連至目錄則例外)。

          遞歸下載:

            -r, --recursive 遞歸下載。
            -l, --level=數字 最大遞歸深度(inf 或 0 表示無限)。
            --delete-after 刪除下載后的文件。
            -k, --convert-links 將絕對鏈接轉換為相對鏈接。
            -K, --backup-converted 轉換文件 X 前先將其備份為 X.orig。
            -m, --mirror 等效于 -r -N -l inf -nr 的選項。
            -p, --page-requisites 下載所有顯示完整網頁所需的文件,例如圖像。
            --strict-comments 打開對 HTML 備注的嚴格(SGML)處理選項。

          遞歸下載時有關接受/拒絕的選項:

            -A, --accept=列表 接受的文件樣式列表,以逗號分隔。
            -R, --reject=列表 排除的文件樣式列表,以逗號分隔。
            -D, --domains=列表 接受的域列表,以逗號分隔。
            --exclude-domains=列表 排除的域列表,以逗號分隔。
            --follow-ftp 跟隨 HTML 文件中的 FTP 鏈接。
            --follow-tags=列表 要跟隨的 HTML 標記,以逗號分隔。
            -G, --ignore-tags=列表 要忽略的 HTML 標記,以逗號分隔。
            -H, --span-hosts 遞歸時可進入其它主機。
            -L, --relative 只跟隨相對鏈接。
            -I, --include-directories=列表 要下載的目錄列表。
            -X, --exclude-directories=列表 要排除的目錄列表。
            -np, --no-parent 不搜索上層目錄。

          posted on 2008-11-20 14:12 allic 閱讀(213) 評論(0)  編輯  收藏 所屬分類: 應用技巧

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 临漳县| 中宁县| 盐津县| 凤凰县| 阿拉尔市| 漳浦县| 白水县| 灵武市| 玉树县| 孟村| 临漳县| 芷江| 蕉岭县| 交口县| 昌江| 永顺县| 岐山县| 昌乐县| 边坝县| 喀喇沁旗| 襄樊市| 普定县| 五台县| 伊川县| 理塘县| 保定市| 霍林郭勒市| 商南县| 宽甸| 科技| 宕昌县| 惠水县| 鱼台县| 鄢陵县| 逊克县| 扎鲁特旗| 太原市| 德钦县| 金门县| 霍林郭勒市| 庄浪县|