首頁(yè) 新隨筆新文章聯(lián)系聚合

posts - 52,comments - 7,trackbacks - 0

2025年7月

>

日

一

二

三

四

五

六

29

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

常用鏈接

留言簿

隨筆分類

隨筆檔案

搜索

閱讀排行榜

評(píng)論排行榜

獲取tmall某單品頁(yè)第一張模特的大圖的方法

之前我寫過(guò)獲取網(wǎng)頁(yè)源代碼的一篇隨筆，今天在獲取網(wǎng)頁(yè)源代碼的基礎(chǔ)上寫一篇獲取網(wǎng)頁(yè)上某單品頁(yè)上第一張大圖對(duì)應(yīng)的url的方法。
貓娘志是一家我很喜歡逛的網(wǎng)店，雖然我目前來(lái)沒(méi)有在那上面買過(guò)東西（等找到對(duì)象了給對(duì)象買）。
我們?cè)谏厦骐S便打開(kāi)一個(gè)品類頁(yè)（好吧，這是我精心挑的）
然后我們會(huì)發(fā)現(xiàn)里面有幾張圖，其中第一張是小青的，但是我們可以看見(jiàn)這張圖并不是一張很大的圖
因?yàn)樗膗rl對(duì)應(yīng)的是：http://gi1.md.alicdn.com/bao/uploaded/i1/T1fEEMFKVdXXXXXXXX_!!0-item_pic.jpg_430x430q90.jpg
去掉“_430x430q90.jpg”就是我們真正想要的圖片了。
http://gi1.md.alicdn.com/bao/uploaded/i1/T1fEEMFKVdXXXXXXXX_!!0-item_pic.jpg
在這里展示一下最終獲得的圖片。

我真的不是打廣告的。

Finder類中的getPictureUrl方法用于獲得單品頁(yè)中第一張圖（qfour中單品頁(yè)的第一張基本上是。。小青）。
main方法中提供測(cè)試。
代碼如下：

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;

public class Finder {
    public static String getPictureUrl(String urlString) throws Exception {
        URL url = new URL(urlString);
        HttpURLConnection urlConnection = (HttpURLConnection) url.openConnection();
        BufferedReader reader = new BufferedReader(new InputStreamReader(urlConnection.getInputStream()));
        String line;
        while ((line = reader.readLine()) != null){
            int len = line.length();
             int i, j;
             for(i=0;i<len && line.charAt(i)!='<';i++);
             if(i + 20 < len && line.substring(i, i + 20).equals("<img id=\"J_ImgBooth\"")) {
                 for(i += 20;i+5<len && line.substring(i, i+5).equals("src=\"") == false;i++);
                 i += 5;
                 for(j=i;j<len && line.substring(j-4,j).equals(".jpg") == false;j++);
                 return line.substring(i, j);
             }
        }
        return null;
    }
    public static void main(String[] args) throws Exception {
        String ans = getPictureUrl("http://detail.tmall.com/item.htm?spm=a1z10.1-b.w5003-6855741104.4.kCBV2T&id=38633693340&rn=61d1213d7255e897f0ee92b43b5bc9da&scene=taobao_shop");
        System.out.println(ans);
    }
}

posted @ 2015-02-12 14:40 marchalex 閱讀(324) | 評(píng)論 (0) | 編輯收藏

Java獲取網(wǎng)頁(yè)源代碼

今天用Java實(shí)現(xiàn)了一個(gè)類URLAnalysis，其中的getContent方法可用于實(shí)現(xiàn)獲取特定網(wǎng)頁(yè)源代碼，main函數(shù)用于測(cè)試。
代碼如下：

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;

public class URLAnalysis {
    public static String getContent(String urlString) throws Exception {
        URL url = new URL(urlString);
        HttpURLConnection urlConnection = (HttpURLConnection) url.openConnection();
        BufferedReader reader = new BufferedReader(new InputStreamReader(urlConnection.getInputStream()));
        String line;
        String ans = "";
        while ((line = reader.readLine()) != null){
             ans += line + "\n";
        }
        return ans;
    }
    public static void main(String[] args) throws Exception {
        String ans = getContent("http://www.baidu.com");
        System.out.println(ans);
    }
}

posted @ 2015-02-11 21:47 marchalex 閱讀(313) | 評(píng)論 (0) | 編輯收藏

僅列出標(biāo)題

常用鏈接

留言簿

隨筆分類

隨筆檔案

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜