找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 120|回复: 0

Jsoup 工具

[复制链接]

373

主题

55

回帖

1944

积分

管理员

积分
1944
发表于 2018-11-19 23:06:38 | 显示全部楼层 |阅读模式
程序员都是比较懒的,不喜欢人工无奈的复制粘贴,所以Jsoup 工具是不可少的,这意味着要自己写工具去解决自己实际工作中需要解决的问题。

通过JSOUP 解析目标网站
  1. package jsoup.as.catchs;

  2. import java.io.IOException;
  3. import java.util.HashSet;
  4. import java.util.Set;

  5. import org.jsoup.Jsoup;
  6. import org.jsoup.nodes.Document;
  7. import org.jsoup.nodes.Element;
  8. import org.jsoup.select.Elements;

  9. public class CatchASData {
  10.         
  11.         private static final String SESSION_VALUE = "eyJpdiI6IklrMDRxNnlcL25aSGoyOFVoQ3VGcVVBPT0iLCJ2YWx1ZSI6IjB5aGlTS2lUc20wbjU2OWJMT0F0OENaSytZd3hpdDRFZVVsMk5lVFU5RVhYNUFrSnhYKzRYdHpZUmYzR2g0ajNFR041OHd6cVBUQmFKenJTc0FPMVNBPT0iLCJtYWMiOiIxM2M4MjZlNTNhNDFjYmEwNWI0ZTg4MGMzOWMzMzgxMWIzZjJkZjBlNGIyNDA3OTJlODcxZGYwNGVlNmIwYjQzIn0%3D";
  12.         private static final String URL = "https://drive-easy.cn/axaChina/provider-dashboard/1/1?fromDate=01-02-2017&toDate=&Status=&serviceType=&driverList=&searchDashboard=&autoSelectVal=&page=";
  13.         private static final String SESSION_KEY = "myapp_session";
  14.         
  15.         private static Set<String> typeSet = new HashSet<>();
  16.         
  17.         public static void main(String[] args) throws IOException {
  18.                 System.setProperty("javax.net.ssl.trustStore", "jssecacerts");
  19.                
  20.                 for(int i=1; i<=17; i++) {
  21.                         extracted(i);
  22.                 }
  23.                
  24.                 System.out.println(typeSet);
  25.         }

  26.         private static void extracted(int i) throws IOException {
  27.                 Document document = Jsoup.connect(URL + i).cookie(SESSION_KEY, SESSION_VALUE).get();
  28.                
  29.                 Elements select = document.select(".kctr td:eq(6)");
  30.                 for (Element element : select) {
  31.                         typeSet.add(element.html());
  32.                 }
  33.         }
  34. }
复制代码



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Comsenz Inc.

GMT+8, 2024-9-20 10:42 , Processed in 0.023362 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表