HelloWorld 善戰者,求之于勢,不責于人;故能擇人而任勢。

          知止而后有定,定而后能靜,靜而后能安,安而后能慮,慮而后能得。物有本末,事有終始。知所先后,則近道矣。

            BlogJava :: 首頁 ::  :: 聯系 ::  :: 管理 ::
            167 隨筆 :: 1 文章 :: 40 評論 :: 0 Trackbacks

          在網上那多人問,如何抓取iframe或其他所有的信息,對象等,其實很簡單的,看了以下文章就明白了.

           

           

          去這里下載jdic

          https://jdic.dev.java.net/

           

          我用的是0.94版,eclipse 3.x

           

          下截后

          將jdic.dll,IeEmbed.exe,jdic.jar,MozEmbed.exe,packager.jar,tray.dll考貝到你的工程lib目錄(在工程上建立lib目錄),然后設置以上.jar文件到編譯路徑.

           

          建一個jFrame,加一個JPanel

           

          以下為代碼片斷, 用以下代碼加載瀏覽器

                        WebBrowser webBrowser = new WebBrowser();

                        panel_name.add(webBrowser, BorderLayout.CENTER);

                        webBrowser .setURL(new URL(http://www.google.com));

                        webBrowser .addWebBrowserListener(new WebBrowserListener() {
                   
                      public void downloadStarted(WebBrowserEvent event) {;}
                      public void downloadCompleted(WebBrowserEvent event) {;}
                      public void downloadProgress(WebBrowserEvent event) {;}
                      public void downloadError(WebBrowserEvent event) {;}

                      public void documentCompleted(WebBrowserEvent event) {

                                //在這里寫代碼

                               // 很COOL的功能,與腳本交互

                              StringBuffer jsBuff = new StringBuffer();

                              jsBuff.append(" var bodyhtml = document.body.innerHTML;");   //取當前頁的內容

                              String html =     webBrowser .getContent();  //取當前頁的內容,這個不好用,在有iframe的網頁中不靈

                              jsBuff.append(" var hrefObj = document.getElementsByTagName('A');");

                             //....略,取頁面的N個內容

                              //好了,好多人都問,如何取得iframe的內容呢?jdic 的包沒有一個方法可以取得到的,看以上的腳本 var bodyhtml ,我們怎么取到它的值呢?如果取得到,那一切問題都可以解決.

                              String iframeScript= " var iframehtml = document.frames[0].body.innerHTML;";   //取得指定iframe的內容

                              //在這里,可以與腳本變量的值進行交互,完成我們想要的功能,確實很COOL

                              String iframeHtml = webBrowser .executeScript(iframeScript);

                              System.out.println(iframeHtml );   //出來的正是想要的,很簡單吧?但是不知道的話,想破頭也不明白

                              //說到這,其實大家已經明白,用jdic可以操縱絕大多數的網站,比如時下流行的web網游,想到什么了?對,寫一個腳本外掛就是這么簡單.

                              //快裝一個瀏覽器dom結構查看插件,操控在你手中

                

                         

                      }

                    public void titleChange(WebBrowserEvent event) {;} 
                      public void statusTextChange(WebBrowserEvent event) {;}
                     public void windowClose(WebBrowserEvent arg0) {
                     }
                     });



          </script>

          posted on 2011-04-20 14:36 helloworld2008 閱讀(249) 評論(0)  編輯  收藏 所屬分類: java
          主站蜘蛛池模板: 庄河市| 石家庄市| 福海县| 庆城县| 洛扎县| 上饶市| 太白县| 桐庐县| 师宗县| 静宁县| 邳州市| 上饶市| 如东县| 陈巴尔虎旗| 深泽县| 化德县| 军事| 泸水县| 镇远县| 秭归县| 金华市| 收藏| 黄平县| 建瓯市| 景泰县| 会同县| 青阳县| 南木林县| 汝南县| 武山县| 绥滨县| 江油市| 杨浦区| 延津县| 云阳县| 永德县| 福泉市| 大同县| 邢台市| 永清县| 贵南县|