웹크롤링 (2) 썸네일형 리스트형 웹 크롤링 - Jsoup을 이용한 ( CGV ) 크롤링 크롤링할 타겟 주소 : http://www.cgv.co.kr/movies/?lt=1&ft=0 영화 그 이상의 감동. CGV 큐어 예매율0.2% 92% 2022.07.06 개봉 예매 www.cgv.co.kr CGV 무비차트 탭에 있는 영화정보에 대해 크롤링 해보려 한다. Chrome 브라우저로 CGV 무비차트 탭에 접속한 뒤 키보드의 f12를 누르게 되면 DevTools 탭이 활성화 된다. 내가 크롤링 하려고 하는 정보는 영화들의 이름/ 이미지 / 장르이다. DevTools 좌측상단에 있는 화살표를 누르게 되면 웹 페이지 안에 요소들에 대한 코드로 이동이 가능하다. 저렇게 활성화가 되고 클릭을 하게 되면 다음과 같은 DevTools가 반응하여 코드에 해당위치로 이동하게 된다. 이곳에서 우리가 얻을 수 있는.. 웹 크롤링 기본 개념 [웹 크롤링] 1.스크랩핑 -> 데이터 수집 2. 크롤링 -> 수집된 데이터들을 분류 3. 파싱(가공) -> 특정형식에 맞춰 데이터를 추출하고 의미있는 값으로 변형하는 작업 "문서화'★★★★★ 코드를 분석 -> 가공 => "웹,앱 어플리테이션" 분석 HTML 특징 : 태그를 쓴다. , , , , , , ... 등등 종속관계는 > 로 표현 => 유일한 정보 ,id로 무언가를 받아올 때는 어떤 태그인지 쓰고 #아이디명 => = > 비슷한 정보 , 클래스로 무언가를 받아올 때는 "xx.클래스명" 이전 1 다음