HelloWorld 善戰(zhàn)者,求之于勢,不責(zé)于人;故能擇人而任勢。

          知止而后有定,定而后能靜,靜而后能安,安而后能慮,慮而后能得。物有本末,事有終始。知所先后,則近道矣。

            BlogJava :: 首頁 ::  :: 聯(lián)系 ::  :: 管理 ::
            167 隨筆 :: 1 文章 :: 40 評論 :: 0 Trackbacks

          在網(wǎng)上那多人問,如何抓取iframe或其他所有的信息,對象等,其實(shí)很簡單的,看了以下文章就明白了.

           

           

          去這里下載jdic

          https://jdic.dev.java.net/

           

          我用的是0.94版,eclipse 3.x

           

          下截后

          將jdic.dll,IeEmbed.exe,jdic.jar,MozEmbed.exe,packager.jar,tray.dll考貝到你的工程lib目錄(在工程上建立lib目錄),然后設(shè)置以上.jar文件到編譯路徑.

           

          建一個jFrame,加一個JPanel

           

          以下為代碼片斷, 用以下代碼加載瀏覽器

                        WebBrowser webBrowser = new WebBrowser();

                        panel_name.add(webBrowser, BorderLayout.CENTER);

                        webBrowser .setURL(new URL(http://www.google.com));

                        webBrowser .addWebBrowserListener(new WebBrowserListener() {
                   
                      public void downloadStarted(WebBrowserEvent event) {;}
                      public void downloadCompleted(WebBrowserEvent event) {;}
                      public void downloadProgress(WebBrowserEvent event) {;}
                      public void downloadError(WebBrowserEvent event) {;}

                      public void documentCompleted(WebBrowserEvent event) {

                                //在這里寫代碼

                               // 很COOL的功能,與腳本交互

                              StringBuffer jsBuff = new StringBuffer();

                              jsBuff.append(" var bodyhtml = document.body.innerHTML;");   //取當(dāng)前頁的內(nèi)容

                              String html =     webBrowser .getContent();  //取當(dāng)前頁的內(nèi)容,這個不好用,在有iframe的網(wǎng)頁中不靈

                              jsBuff.append(" var hrefObj = document.getElementsByTagName('A');");

                             //....略,取頁面的N個內(nèi)容

                              //好了,好多人都問,如何取得iframe的內(nèi)容呢?jdic 的包沒有一個方法可以取得到的,看以上的腳本 var bodyhtml ,我們怎么取到它的值呢?如果取得到,那一切問題都可以解決.

                              String iframeScript= " var iframehtml = document.frames[0].body.innerHTML;";   //取得指定iframe的內(nèi)容

                              //在這里,可以與腳本變量的值進(jìn)行交互,完成我們想要的功能,確實(shí)很COOL

                              String iframeHtml = webBrowser .executeScript(iframeScript);

                              System.out.println(iframeHtml );   //出來的正是想要的,很簡單吧?但是不知道的話,想破頭也不明白

                              //說到這,其實(shí)大家已經(jīng)明白,用jdic可以操縱絕大多數(shù)的網(wǎng)站,比如時下流行的web網(wǎng)游,想到什么了?對,寫一個腳本外掛就是這么簡單.

                              //快裝一個瀏覽器dom結(jié)構(gòu)查看插件,操控在你手中

                

                         

                      }

                    public void titleChange(WebBrowserEvent event) {;} 
                      public void statusTextChange(WebBrowserEvent event) {;}
                     public void windowClose(WebBrowserEvent arg0) {
                     }
                     });



          </script>

          posted on 2011-04-20 14:36 helloworld2008 閱讀(241) 評論(0)  編輯  收藏 所屬分類: java
          主站蜘蛛池模板: 都江堰市| 满城县| 开江县| 鄂尔多斯市| 伊通| 孟州市| 井研县| 云阳县| 双流县| 蓝山县| 繁昌县| 穆棱市| 金昌市| 东安县| 榆树市| 宣威市| 潮安县| 调兵山市| 尼勒克县| 临沭县| 巴中市| 吐鲁番市| 瑞金市| 稻城县| 永平县| 佳木斯市| 花垣县| 麻江县| 思茅市| 旬邑县| 龙里县| 札达县| 南部县| 阿坝县| 沙洋县| 休宁县| 马公市| 河池市| 西乌珠穆沁旗| 莲花县| 疏附县|