파이썬(Python) 2학년 스크래핑의 구조
  • 파이썬(Python) 2학년 스크래핑의 구조

파이썬(Python) 2학년 스크래핑의 구조

공유
정가
17,000
판매가
15,300
구매혜택
할인 : 적립 마일리지 :
배송비
2,500원 / 주문시결제(선결제) 조건별배송 지역별추가배송비
방문 수령지 : 서울특별시 마포구 독막로31길 9, 2층
ISBN
9788931556896
출판사
성안당
저자
모리 요시나오
발행일
2021-11-17
파이썬(Python) 2학년 스크래핑의 구조
0
총 상품금액
총 할인금액
총 합계금액

책소개

체험으로 배우고! 대화 형식으로 공부!
Python파이썬 2학년 스크래핑의 구조
데이터 수집이나 해석, 분석에 대해 알기 쉽게 설명!


파이썬은 인공지능의 기초 언어로 배우기 쉬우면서 각종 데이터 분석에 사용되는 프로그래밍 언어로 절정의 인기를 누리고 있다. 기존이 파이썬 책이 선뜻 입문하기 어려운 감이 있었다면 이 책은 염소 박사와 강아지 다솜 양의 친근한 일러스트를 도립해 책 전체가 쉬워보이며 실제로도 코드 설명이나 설치법, 버튼 안내가 큼직큼직한 주제의 만화와 대화체 방식으로 구성하여 매우 쉽게 느껴진다.

인터넷에 공개된 데이터를 수집하는 일을 ‘크롤링(Crawling)’, 이 데이터를 해석해 필요한 데이터를 구하는 일을 ‘스크래핑(Scaping)’이라고 하는데, 파이썬은 인터넷에 액세스할 수 있는 라이브러리가 풍부해 이 두가지 모두 쉽고 편하게 할 수 있는 언어로 널리 알려져 있다. 이 책에서는 스크래핑을 하는 라이브러리 ‘Beautiful Soup4’아 데이터를 분석하는 라이브러리 ‘판다스(pandas)’를 사용해 실제로 파이썬의 핵심 기능에 접근할 수 있도록 한다.

1학년 시리즈 중 독보적인 인기를 누렸던 『파이썬 1학년』의 인기에 힘입어 『파이썬 2학년 데이터 분석 구조』가 나왔고 이 책이 원서로는 2학년 시리즈중 먼저 나왔으나 번역자 이영란 박사가 국내 사정에 맞게 코드나 사이트를 정리하여 이번에 선보이게 되었다. 이 책의 예제 코드와 함께 홈페이지 회원들에게만 제공하는 회원특전 PDF는 예제와 라이브러리 사용법 간이 매뉴얼로 성안당 홈페이지(www.cyber.co.kr) [도서몰]에 회원가입 후 [자료실]-[자료실] 바로가기에서 도서 검색을 통해 다운로드할 수 있다.

목차

들어가며
이 책의 예제 테스트 환경 며
이 책의 대상 독자와 2학년 시리즈에 대해
이 책을 보는 법
예제 파일과 회원 특전 PDF의 다운로드에 대해


제1장 파이썬으로 데이터를 다운로드
LESSON 01 스크래핑이 뭘까?
크롤링과 스크래핑
주의해야 할 점도 있다
robots.txt란?

LESSON 02 파이썬을 설치해 보자
윈도에 설치하는 방법
macOS에 설치하는 방법

LESSON 03 requests로 액세스해 보자
라이브러리 설치 방법
HTML 파일을 읽어 들이는 프로그램
IDLE을 시작하자
프로그램을 만들어 보자
텍스트 파일에 쓰기: open, close
텍스트 파일에 쓰기: with문

제2장 HTML을 해석해 보자
LESSON 04 HTML을 해석해 보자
Beautiful Soup 설치하기
Beautiful Soup로 해석하기
태그를 찾아 표시하기
모든 태그를 찾아 표시하기
id나 class로 검색 범위 좁히기

LESSON 05 최신 뉴스 기사 목록을 구해 보자
디벨로퍼 툴을 사용해 범위를 좁히자

LESSON 06 링크 목록을 파일로 출력해 보자
모든 링크 태그의 href 속성 표시하기
모든 링크 태그의 href 속성을 절대 URL로 표시하기
링크 목록 자동 작성 프로그램

LESSON 07 이미지를 한꺼번에 다운로드해 보자
이미지 파일을 읽어 들여 저장하기
다운로드용 폴더를 만들어 저장하기
모든 img 태그의 이미지 파일 URL을 표시한다
페이지 안 이미지를 한꺼번에 다운로드하는 프로그램

제3장 표 데이터를 읽고 쓰자
LESSON 08 pandas를 사용해 보자
pandas 설치하기
표 데이터란?
CSV 파일 읽어 들이기
열, 행 데이터 표시하기
열, 행 데이터 추가하기
열, 행 데이터 삭제하기

LESSON 09 다양한 데이터 가공
필요한 정보 추출하기
데이터 집계하기
데이터 정렬하기
행과 열 바꾸기
CSV 파일로 출력하기

LESSON 10 그래프로 표시해 보자
matplotlib 설치하기
그래프로 표시하기
다양한 종류의 그래프 표시하기
개별 데이터를 그래프로 표시하기
막대 그래프를 이미지 파일로 출력하기

LESSON 11 엑셀 파일을 읽고 써 보자
openpyxl 설치하기
엑셀 파일로 출력하기
엑셀 파일 읽어 들이기

제4장 오픈 데이터를 분석해 보자
LESSON 12 오픈 데이터란?
오픈 데이터는 보물섬

LESSON 13 우체국: 우편번호 데이터
CSV 파일 읽어 들이기
데이터 추출하기

LESSON 14 e-나라지표: 국정모니터링지표
CSV 파일 읽어 들이기
데이터를 그래프로 표시하기

LESSON 15 기상자료개방포털: 기상청 날씨 데이터 서비스
CSV 파일 읽어 들이기
데이터를 그래프로 표시하기

LESSON 16 공공데이터포털: 지방자치단체 데이터
CSV 파일(소방서) 읽어 들이기
folium 설치하기
소방서를 지도에 표시하기
CSV 파일(음식점) 읽어 들이기
가게를 지도에 표시하기

제5장 웹 API로 데이터를 수집하자
LESSON 17 웹 API란?
다른 컴퓨터의 기능 이용하기

LESSON 18 OpenWeatherMap이란?
OpenWeatherMap 사이트 이용 순서
OpenWeatherMap 이용하기

LESSON 19 현재 날씨를 조사하자
도시명을 지정해 날씨 알아보기
JSON이란?
JSON 데이터 형식
JSON 데이터를 읽어 들이는 방법
우편번호를 지정해 날씨 알아보기

LESSON 20 오늘부터 5일 동안(3시간 간격)의 날씨 알아보기
5일 동안의 날씨를 구해 보자
UTC(협정 세계시)를 KST(한국 표준시)로 변환
5일 동안의 기온을 그래프로 표시해 보자
한 걸음 더

찾아보기

저자

모리 요시나오

출판사리뷰

■ 이 책은
머신러닝(기계학습)이나 데이터를 분석하는 데 반드시 필요한 ‘데이터’는 인터넷상에 방대하게 퍼져 있지만 파이썬을 사용하면 효율적으로 수집할 수 있다. 이러한 방법을 ‘스크래핑’이라고 합니다.
파이썬을 대략적으로 알고 계신 분들이 간단한 샘플을 만들어 보며 대화 형식으로 스크래핑의 구조를 배울 수 있습니다.

■ 대상 독자
● 파이썬의 기본 문법을 알고 있는 분(『파이썬 1학년』을 다 읽으신 분)
● 데이터 수집이나 데이터 분석 초보자

■ 2학년 시리즈의 포인트 셋
● 포인트(1) 기초 지식을 알 수 있다
각 장의 첫 부분에 만화나 일러스트를 넣어서 각 장에서 배울 내용을 소개합니다. 그 이후는 일러스트를 섞어가며 기초 지식에 대해 설명합니다.

● 포인트(2) 프로그램의 구조를 배운다
필요한 문법을 최소한으로 선별하여 중간에 포기하지 않도록 주로 대화 형식을 통해 알기 쉽게 설명합니다.

● 포인트(3) 개발 체험을 할 수 있다
프로그래밍 언어(애플리케이션) 초보자들도 재미있게 배울 수 있도록 다양한 예제를 마련했습니다.

■ 이 책의 포인트
염소 박사님, 다솜 양과 함께 인터넷에서 파일을 다운로드하는 방법, HTML을 해석하는 방법, 여러 데이터를 읽고 쓰기, ‘API의 사용법’으로 불리는 데이터 수집, 편리한 라이브러리를 이용한 간단한 가시화 방법을 알아봅니다.

상품필수 정보

도서명 파이썬(Python) 2학년 스크래핑의 구조
저자/출판사 모리 요시나오,성안당
크기/전자책용량 190*250*10
쪽수 192
제품 구성 상품상세참조
출간일 2021-11-17
목차 또는 책소개 상품상세참조

배송안내

- 기본 배송료는 2,500원 입니다. (도서,산간,오지 일부지역은 배송비 3,000원 추가)  

- 도서 20,000원 이상 구매 시 무료배송 입니다.

- 굿즈 30,000원 이상 구매 시 무료배송 입니다.

- 서점 내 재고가 있는 도서 배송 가능일은 1~2일 입니다.

- 일반 도서(단행본)의 경우 재고가 없는 도서 배송 가능일은 2~3일 입니다. 

- 독립출판물 도서의 배송 가능일은 1~2일 입니다.

- 배송 가능일이란 본 상품을 주문 하신 고객님들께 상품 배송이 가능한 기간을 의미합니다. (단, 연휴 및 공휴일은 기간 계산시 제외하며 현금 주문일 경우 입금일 기준 입니다) 

- 검색되는 모든 도서는 구매가 가능합니다. 단, 수급하는데 2~5일 시간이 걸립니다.

 

교환 및 반품안내

상품 청약철회 가능기간은 상품 수령일로 부터 7일 이내 입니다. 

 

반품/교환 가능 기간 

- 상품 택(tag)제거 또는 개봉으로 상품 가치 훼손 시에는 상품수령후 7일 이내라도 교환 및 반품이 불가능합니다.

공급받으신 상품 및 용역의 내용이 표시.광고 내용과 다르거나 다르게 이행된 경우에는 공급받은 날로부터 3월이내, 그사실을 알게 된 날로부터 30일이내

- 변심,구매 착오의 경우에만 반송료 고객 부담

 

반품/교환 불가 사유

- 소비자의 책임으로 상품 등이 손실되거나 훼손된 경우

- 소비자의 사용, 포장 개봉에 의해 가치가 현저히 감소한 경우

- 세트 상품 일부만 반품 불가

 

 

환불안내

상품 환불 규정 

- 상품 철회 가능기간은 상품 수령일로 부터 7일 이내 입니다.

출고 이후 환불요청 시 상품 회수 후 처리됩니다.

- 얼리 등 주문제작상품 / 밀봉포장상품 등은 변심에 따른 환불이 불가합니다.

- 비닐 커버 제거 시 반품 불가합니다.

- 변심 환불의 경우 왕복배송비를 차감한 금액이 환불되며, 제품 및 포장 상태가 재판매 가능하여야 합니다.

 

모임/행사 참가비 환불 규정

모임 시작일 4일 전까지 별도의 수수료 없이 전액 환불 가능합니다

- 모임 시작 3일 전까지는 환불이 되지 않습니다.

- 신청자가 저조해 모임 개설이 취소될 경우, 100% 환불됩니다.

AS안내

- 소비자분쟁해결 기준(공정거래위원회 고시)에 따라 피해를 보상받을 수 있습니다.

- A/S는 판매자에게 문의하시기 바랍니다.

이미지 확대보기파이썬(Python) 2학년 스크래핑의 구조

파이썬(Python) 2학년 스크래핑의 구조
  • 파이썬(Python) 2학년 스크래핑의 구조
닫기

비밀번호 인증

글 작성시 설정한 비밀번호를 입력해 주세요.

닫기

장바구니 담기

상품이 장바구니에 담겼습니다.
바로 확인하시겠습니까?

찜 리스트 담기

상품이 찜 리스트에 담겼습니다.
바로 확인하시겠습니까?