마지막 학습주차 이틀차. 라이브 세션을 통해 Open API를 사용하여 데이터를 가져오는 방법에 대해 학습했다.
학습 내용
데이터 수집 특강_1 : API 통신
API : Application Programming Interface 의 약자로, 소프트웨어 구성 요소가 서로 통신할 수 있게 하는 방식이다.
접근 가능한 사용자의 권한 관리 / 프로그램 간 원활한 통신 지원 / DB 접속 표준화 라는 특징이 있다.
네이버 API, 다음 API 등 포털에서 제공하는 무료 API와, 공공데이터포털에서 제공하는 공공 데이터 API 등의 예시가 있다.
Python의 requests 라이브러리를 통해 요청을 전달하고 값을 가져올 수 있다.
API를 통해 수집된 데이터는 JSON 또는 XML 형태로 가져오기 때문에, 보기에 & 분석하기에 편하도록 데이터프레임으로 가공할 수 있다.
사용하는 모듈과 라이브러리
Python import requests import pprint import json import pandas as pd url = 'http://openAPI.seoul.go.kr:8088/(인증키)/xml/ServiceInternetShopInfo/1/5/' # 예시 url API를 제공하는 사이트에 있는 샘플 URL, 중간에 인증키 값을 괄호 없이 삽입하면 된다. raw_json = requests.get(url).json() raw_df = pd.DataFrame(raw_json['row']) # JSON 파일은 딕셔너리 안에 딕셔너리가 저장된 형태로 구성되므로, 최종적으로 필요한 부분을 슬라이싱하여 데이터프레임으로 변환한다.
고찰 & 기타
최종 프로젝트 팀으로 함께하고 싶은 분들과 컨택을 마쳤다! 하다보니 예전 프로젝트 팀원 구성 그대로에, 한 분만 바뀐 조합이 되었다.
이대로 최종 프로젝트 팀 확정이 되면 좋겠다. 어떻게 되려나.
최종 프로젝트는 포트폴리오에 들어가야 하는 만큼, 어떤 주제를 선택해서 어떻게 전개할 지 감이 안 온다.
이번 주 내로 <데이터 문해력> 완독하고, 주요 내용은 다음 주 바뀔 최종 팀에 인사이트를 꼭 공유해야 겠다.
'내일배움캠프_데이터분석_2기 > TIL' 카테고리의 다른 글
[TIL] camp_day68_240722 (0) | 2024.07.23 |
---|---|
[TIL] camp_day66_240718 (0) | 2024.07.18 |
[TIL] camp_day63_240715 (0) | 2024.07.16 |
[TIL] camp_day62_240712 (0) | 2024.07.15 |
[TIL] camp_day61_240711 (0) | 2024.07.12 |