Programming/AI & 머신러닝
[머신러닝] 머신러닝 위한 데이터 처리 방법 정리 | 스크래핑, 크롤링
MOONCO
2021. 1. 22. 19:45
스크래핑 (Scraping)
웹 사이트에서 특정 정보를 추출하는 기술
HTML로 이루어진 정보를 가공해서,
필요한 정보만을 가져온다.
로그인 해야만 열람할 수 있는 정보도 가져올 수 있다.
크롤링 (Crawling)
여러 웹사이트를 돌아다니며, 정기적으로 스크래핑을 하는 기술
1. 데이터 추출
2. 데이터 가공
3. 데이터 저장
- 파일 (csv, json, xml, yaml ... )
- 데이터베이스 (mysql ... )
반응형