BackgroundTask

Android

[Android] Jsoup 라이브러리를 이용하여 웹 크롤링 (Web Crawling) 해보기 (AsyncTask, RxJava)

웹 크롤링 웹사이트(website), 하이퍼링크(hyperlink), 데이터(data), 정보 자원을 자동화된 방법으로 수집, 분류, 저장하는 것. 웹 크롤링은 이와 같이 인터넷에 나와있는 정보들을 수집하여 보여주는 기술이다. 안드로이드를 개발하면서 상당히 많이 사용되는 작업이기도 하다. 이 글에선 Jsoup 라이브러리를 이용하여 웹 크롤링을 할 것이다. Jsoup 라이브러리 Jsoup 라이브러리에 대해 먼저 알아보자면, Java에서도 Jsoup 라이브러리를 사용해서 HTML 파싱을 할 수 있다. 파싱을 한글로 뜻풀이를 해보면 구문 분석이라는 뜻으로 문장을 이루고 있는 구성 성분을 분해하여 구조화하는 것을 의미한다. 따라서 HTML 태그 및 정보들을 가져와 새롭게 만들어 주는 것을 뜻한다. Jsoup 라..

Sangyoon98
'BackgroundTask' 태그의 글 목록