알라딘: 저자파일

헤더배너

분야보기

알라딘 굿즈

온라인중고

1/0 photos

신간알리미 신청

상품평점

분류

이름:

김영하

	최근작
	2017년 4월 <파이썬 웹 스크래핑>

파이썬 웹 스크래핑

요즘도 수집하는 사람이 있을지 모르겠지만, 드라마 <응답하라 1988>의 시대를 기억하는 사람이라면 좋아하는 연예인의 기사를 예쁘게 오려 수집한 기억이 있으리라. 신문 및 잡지라는 큰 정보의 덩어리에서 원하는 부분을 칼이나 가위로 오려 노트에 붙인 것이다. 이런 아날로그적인 방법이 현대에 와서는 디지털 방식으로 전환되고 있다. 개인적으로 스플렁크(Splunk)라는 빅데이터 플랫폼의 업무를 담당하면서 자료의 수집 및 저장에 대한 관심이 많아졌다. 요즘 각종 서비스들이 데이터 공유를 위해 API를 제공하면서 수집이 쉬워졌다. 하지만 원하는 데이터를 얻기에는 제한적이기에 웹 크롤링(Web Crawling)을 통해 수집해서 웹 스크래핑(Web Scraping)으로 원하는 부분을 추출하는 과정이 필요하다. 이 책은 웹 스크래핑에 대한 법적 문제를 먼저 다루고 기술적인 방법의 가장 기초적인 단계에서 점점 발전시켜 Scrapy라는 수집 전문 프레임워크까지 다룬다. 제로 웹 페이지에서 발생할 수 있는 상황에 대한 모든 부분을 다룬다. 많은 웹 페이지를 다운로드하면서 캡차(Captcha)나 로그인, 동적 데이터 처리 등 책에서 제시한 경우를 따라 하다 보면 어느덧 웹 스크래핑에 자신감을 느끼게 될 것이다. 이 책은 독자가 파이썬에 대한 기본 지식이 있다고 가정하기 때문에 파이썬 언어 자체에 대한 설명은 없다. 책 자체는 얇지만 내용은 아주 풍부하다. 이 한국어판이 나오기까지 정말 많은 시간이 걸렸다. 파이썬 2로 만들어진 내용을 파이썬 3로 바꾸면서 가급적이면 실행되도록 수정했지만 실행 및 개선 사항이 있다면, 언제든지 연락 바란다.

주제 분류별

소설 l 에세이 l 시 l 희곡 l 문학일반 l 문화평론 l 만화 l 어린이/유아 l 인문/사회과학 l 역사 l 경제경영/자기계발 l 과학/공학/기술 l 여행 l 예술 l 취미/실용/레저 l 가정/건강/요리/교육 l 외국어/사전 l 잡지 l 종교/역학 l 컴퓨터/인터넷 l 학습서/수험서 l 교재 l 번역 l 사진/그림

가나다별

가 l 나 l 다 l 라 l 마 l 바 l 사 l 아 l 자 l 차 l 카 l 타 l 파 l 하 l 기타

	국내문학상수상자

	국내어린이문학상수상자

	해외문학상수상자

	해외어린이문학상수상자

(주)알라딘커뮤니케이션

대표이사 최우경 고객정보보호 책임자 최우경 사업자등록 201-81-23094 통신판매업신고 2003-서울중구-01520 이메일 privacy@aladin.co.kr 호스팅 제공자 알라딘커뮤니케이션 (본사) 서울시 중구 서소문로 89-31

ⓒ Aladin Communication. All Rights Reserved.

고객센터 1544-2514 (발신자 부담)

서울시 마포구 백범로 71 숨도빌딩 7층 Fax 02-6926-2600

1:1 문의 FAQ

중고매장 위치, 영업시간 안내