본문 바로가기

개발자노트/웹

웹 크롤링 기본 개념

[웹 크롤링]
1.스크랩핑
  -> 데이터 수집


2. 크롤링
  -> 수집된 데이터들을 분류



3. 파싱(가공)
  -> 특정형식에 맞춰
데이터를 추출하고
의미있는 값으로 변형하는 작업


"문서화'★★★★★ 
 코드를 분석 -> 가공
 => "웹,앱 어플리테이션" 분석


HTML
특징 : 태그를 쓴다.
<span> , <a> , <h6>, <div> , <li>, <ul>, ... 등등
종속관계는 > 로 표현

<xx = id> => 유일한 정보 ,id로 무언가를 받아올 때는 어떤 태그인지 쓰고 #아이디명 => <"xx#id">
<xx = class> = > 비슷한 정보 , 클래스로 무언가를 받아올 때는 "xx.클래스명"


'개발자노트 > ' 카테고리의 다른 글

웹 프로젝트 기본예제1 + 이미지 삽입  (0) 2022.07.18
웹 프로젝트 생성법  (0) 2022.07.18
이클립스에서 톰캣연동  (0) 2022.07.18
웹 페이지 기본용어  (0) 2022.07.18
웹 기초용어  (0) 2022.07.18