메뉴 건너뛰기

?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

Java 라이브러리 중에 JSOUP 라고 심플하면서도 왠지 간지나는 HTML 문서를 다루는 라이브러리가 있다.


요 라이브러리를 이용해 HTML 문서에서 각종 경로를 추출해서 요 경로를 절대 경로로 바꿔보자.


먼저 테스트할 html 문서

<html>
<head>
    <title>테스트다!!</title>
 
    <script type="text/javascript" src="/resource/js/jquery-1.7.1.min.js"></script>
 
    <link type="text/css" href="/resource/css/admin/general.css" rel="stylesheet" />
</head>
 
<body>
<span id="navi">
    <img src="http://www.naver.com/resource/image/stitle_standarda.gif" alt="" />
</span>
 
테스트다!!
</body>
</html>


테스트소스


import java.io.IOException;
import java.net.URL;
 
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
 
 
public class Test  {
    public static void main(final String[] args) throws IOException{
        Document doc = Jsoup.parse(
                new URL("http://127.0.0.1:8080/index.html").openConnection().getInputStream(), 
                "UTF-8", 
                "http://127.0.0.1:8080/");
         
        // src attribute 가 있는 엘리먼트들을 선택
        Elements elems = doc.select("[src]");
        for( Element elem : elems ){
            if( !elem.attr("src").equals(elem.attr("abs:src")) ){
                elem.attr("src", elem.attr("abs:src"));
            }
        }
         
        // href attribute 가 있는 엘리먼트들을 선택 
        elems = doc.select("[href]");
        for( Element elem : elems ){
            if( !elem.attr("href").equals(elem.attr("abs:href")) ){
                elem.attr("href", elem.attr("abs:href"));
            }
        }
         
        System.out.println(doc.toString());
    }
}

변환된 html 문서

<html>

<head>

    <title>테스트다!!</title>

    <script type="text/javascript" src="http://127.0.0.1:8080/resource/js/jquery-1.7.1.min.js"></script>

    <link type="text/css" href="http://127.0.0.1:8080/resource/css/admin/general.css" rel="stylesheet" />

</head>

<body>

    <span id="navi"> <img src="http://www.naver.com/resource/image/stitle_standarda.gif" alt="" /></span> 

    테스트다!!

</body>

</html>

JSOUP 사이트 : http://jsoup.org/


Maven Dependency


<dependency>

    <groupId>org.jsoup</groupId>

    <artifactId>jsoup</artifactId>

    <version>1.6.3</version>

</dependency>



List of Articles
번호 제목 날짜 조회 수
51 JAVA 현재 시간 구하기 file 2018.07.09 1312
50 예외처리 / 예외발생 file 2018.09.21 977
49 직렬화 / 역직렬화 file 2018.09.21 998
48 시간관련 클래스 file 2018.09.21 1220
47 JSON 문자열을 Map 으로 변환하기(Jackson 사용) 2019.01.08 1044
46 Apache Commons HttpClient 3.x 로 Http 서버에 파일 전송하기 file 2019.01.08 1192
» Java : JSOUP 를 이용, html에서 소스, 링크경로 추출후 절대 경로로 바꾸기 2019.01.08 1201
44 JAVA/JSP SQL Injection 해킹 방지를 위한 코딩 2019.01.10 895
43 기본적인 스크립트 보안 2019.01.16 6090
42 변환 (문자, 숫자, KSC5601.....) 2019.01.16 1328
41 A java Runtime Environment(JRE) or Java Development Kit(JDK) must be ~~~~ 하면서 이클립스가 실행안될때. file 2019.03.05 950
40 이클립스 html, js 등등의 파일에서 에러표시 지우기 2019.03.05 1507
39 이클립에서 Javadoc 생성시 unmappable character for encoding MS949 에러가 발생할때 file 2019.03.05 771
38 이클립에서 FTP 접속하면서 Operation failed. File system input or output error 가 날때 file 2019.03.05 913
37 이클립스에서 같은 파일을 여러 편집창으로 띄우기 file 2019.03.05 712
36 자바 랜덤 함수(Java random) file 2019.03.05 806
35 국제 시간에 따른 날짜 출력 2020.06.29 162
34 XML to JSON , JSON to Map 2020.06.29 549
33 사용자의 IP를 가져오기 (IPv4) 2020.06.29 1749
32 Gmail 메일 서버를 이용해서 메일 보내기 file 2020.06.29 320
Board Pagination Prev 1 2 3 4 5 6 7 8 Next
/ 8

하단 정보를 입력할 수 있습니다

© k2s0o1d4e0s2i1g5n. All Rights Reserved