一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|JAVA教程|ASP教程|編程技術|正則表達式|

服務器之家 - 編程語言 - JAVA教程 - 詳解JAVA抓取網頁的圖片,JAVA利用正則表達式抓取網站圖片

詳解JAVA抓取網頁的圖片,JAVA利用正則表達式抓取網站圖片

2020-07-16 11:42SwingPyzf JAVA教程

這篇文章主要介紹了詳解JAVA抓取網頁的圖片,JAVA利用正則表達式抓取網站圖片,非常具有實用價值,需要的朋友可以參考下。

利用Java抓取網頁上的所有圖片

用兩個正則表達式

1、匹配html中img標簽的正則:<img.*src=(.*?)[^>]*?>

2、匹配img標簽中得src中http路徑的正則:http:\"?(.*?)(\"|>|\\s+)

實現:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
package org.swinglife.main;
 
import java.io.File;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.net.URL;
import java.net.URLConnection;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
/***
 * java抓取網絡圖片
 * @author swinglife
 *
 */
public class CatchImage {
 
  // 地址
  private static final String URL = "http://m.ythuaji.com.cn";
  // 編碼
  private static final String ECODING = "UTF-8";
  // 獲取img標簽正則
  private static final String IMGURL_REG = "<img.*src=(.*?)[^>]*?>";
  // 獲取src路徑的正則
  private static final String IMGSRC_REG = "http:\"?(.*?)(\"|>|\\s+)";
 
   
  public static void main(String[] args) throws Exception {
    CatchImage cm = new CatchImage();
    //獲得html文本內容
    String HTML = cm.getHTML(URL);
    //獲取圖片標簽
    List<String> imgUrl = cm.getImageUrl(HTML);
    //獲取圖片src地址
    List<String> imgSrc = cm.getImageSrc(imgUrl);
    //下載圖片
    cm.Download(imgSrc);
  }
   
   
  /***
   * 獲取HTML內容
   *
   * @param url
   * @return
   * @throws Exception
   */
  private String getHTML(String url) throws Exception {
    URL uri = new URL(url);
    URLConnection connection = uri.openConnection();
    InputStream in = connection.getInputStream();
    byte[] buf = new byte[1024];
    int length = 0;
    StringBuffer sb = new StringBuffer();
    while ((length = in.read(buf, 0, buf.length)) > 0) {
      sb.append(new String(buf, ECODING));
    }
    in.close();
    return sb.toString();
  }
 
  /***
   * 獲取ImageUrl地址
   *
   * @param HTML
   * @return
   */
  private List<String> getImageUrl(String HTML) {
    Matcher matcher = Pattern.compile(IMGURL_REG).matcher(HTML);
    List<String> listImgUrl = new ArrayList<String>();
    while (matcher.find()) {
      listImgUrl.add(matcher.group());
    }
    return listImgUrl;
  }
 
  /***
   * 獲取ImageSrc地址
   *
   * @param listImageUrl
   * @return
   */
  private List<String> getImageSrc(List<String> listImageUrl) {
    List<String> listImgSrc = new ArrayList<String>();
    for (String image : listImageUrl) {
      Matcher matcher = Pattern.compile(IMGSRC_REG).matcher(image);
      while (matcher.find()) {
        listImgSrc.add(matcher.group().substring(0, matcher.group().length() - 1));
      }
    }
    return listImgSrc;
  }
 
  /***
   * 下載圖片
   *
   * @param listImgSrc
   */
  private void Download(List<String> listImgSrc) {
    try {
      for (String url : listImgSrc) {
        String imageName = url.substring(url.lastIndexOf("/") + 1, url.length());
        URL uri = new URL(url);
        InputStream in = uri.openStream();
        FileOutputStream fo = new FileOutputStream(new File(imageName));
        byte[] buf = new byte[1024];
        int length = 0;
        System.out.println("開始下載:" + url);
        while ((length = in.read(buf, 0, buf.length)) != -1) {
          fo.write(buf, 0, length);
        }
        in.close();
        fo.close();
        System.out.println(imageName + "下載完成");
      }
    } catch (Exception e) {
      System.out.println("下載失敗");
    }
  }
 
   
}

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持服務器之家。

原文鏈接:http://blog.csdn.net/swingpyzf/article/details/16338903

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 精品国产免费久久久久久 | 日韩一级片免费观看 | 欧美a大片| 特级毛片全部免费播放器 | 国产v日韩v欧美v精品专区 | 69日本xxxx| 亚洲国产精品无码中文字幕 | 免费在线观看伦理片 | 成人性生交大片免费看软件 | 好男人在线观看免费高清2019韩剧 | 精品国产精品人妻久久无码五月天 | 免费观看在线观看 | 免费免费啪视频在线观播放 | 男女姓交大视频免费观看 | 国产码一区二区三区 | 午夜福利体检 | 国产资源免费观看 | 99在线免费观看视频 | 久久国产精品无码视欧美 | 日本视频在线免费播放 | 男生和老师一起差差差 | 果冻传媒和91制片厂网站软件 | 无码日韩精品一区二区免费 | xxx88视频在线观看 | 男同志与动人物zozotv | 动漫美女日批 | free性泰国娇小videos | 天天干夜夜拍 | 福利社在线免费观看 | 免费一级国产生活片 | 99精品免费视频 | 我被黄总征服的全过程 | 1377大但人文艺术包子铺 | 国产精品亚洲午夜一区二区三区 | 黄漫免费观看 | 日韩欧一级毛片在线播无遮挡 | 视频免费视频观看网站 | 波多野结在线 | 四虎国产成人亚洲精品 | 32pao强力打造免费高速高 | 亚洲天堂2013|