jsoup 쓰며 기억용 sample

//<a/> href 값 추출

Document doc = Jsoup.connect(url).userAgent("Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.110 Safari/537.36")
                .timeout(0).followRedirects(true).execute().parse();

 

Elements titles = doc.select("a[href]");

 

for(org.jsoup.nodes.Element e: titles){

System.out.println("URL["+e.attr("abs:href")+"]");

}

 

나머지는 해당 Tag값 스페이스로 묶어도 상관 없음.

 

MAVEN :

<dependency>
      <groupId>org.jsoup</groupId>
      <artifactId>jsoup</artifactId>
      <version>1.7.2</version>
</dependency>

 

버전은 알아서 검색.

 

html 파싱하기 생각보다 엄청 편해서 쓸만함

1 2 3 →