내일배움캠프_데이터분석_2기/TIL

[TIL] camp_day64_240716

단ee 2024. 7. 16. 23:54

마지막 학습주차 이틀차. 라이브 세션을 통해 Open API를 사용하여 데이터를 가져오는 방법에 대해 학습했다.

학습 내용


  1. 데이터 수집 특강_1 : API 통신

    • API : Application Programming Interface 의 약자로, 소프트웨어 구성 요소가 서로 통신할 수 있게 하는 방식이다.

    • 접근 가능한 사용자의 권한 관리 / 프로그램 간 원활한 통신 지원 / DB 접속 표준화 라는 특징이 있다.

    • 네이버 API, 다음 API 등 포털에서 제공하는 무료 API와, 공공데이터포털에서 제공하는 공공 데이터 API 등의 예시가 있다.

    • Python의 requests 라이브러리를 통해 요청을 전달하고 값을 가져올 수 있다.

    • API를 통해 수집된 데이터는 JSON 또는 XML 형태로 가져오기 때문에, 보기에 & 분석하기에 편하도록 데이터프레임으로 가공할 수 있다.

    • 사용하는 모듈과 라이브러리

      Python
      import requests
      import pprint
      import json
      import pandas as pd
      
      url = 'http://openAPI.seoul.go.kr:8088/(인증키)/xml/ServiceInternetShopInfo/1/5/'
        # 예시 url API를 제공하는 사이트에 있는 샘플 URL, 중간에 인증키 값을 괄호 없이 삽입하면 된다.
      
      raw_json = requests.get(url).json()
      
      raw_df = pd.DataFrame(raw_json['row']) 
        # JSON 파일은 딕셔너리 안에 딕셔너리가 저장된 형태로 구성되므로, 최종적으로 필요한 부분을 슬라이싱하여 데이터프레임으로 변환한다. 
      

고찰 & 기타


최종 프로젝트 팀으로 함께하고 싶은 분들과 컨택을 마쳤다! 하다보니 예전 프로젝트 팀원 구성 그대로에, 한 분만 바뀐 조합이 되었다.
이대로 최종 프로젝트 팀 확정이 되면 좋겠다. 어떻게 되려나.
최종 프로젝트는 포트폴리오에 들어가야 하는 만큼, 어떤 주제를 선택해서 어떻게 전개할 지 감이 안 온다.
이번 주 내로 <데이터 문해력> 완독하고, 주요 내용은 다음 주 바뀔 최종 팀에 인사이트를 꼭 공유해야 겠다.

'내일배움캠프_데이터분석_2기 > TIL' 카테고리의 다른 글

[TIL] camp_day68_240722  (0) 2024.07.23
[TIL] camp_day66_240718  (0) 2024.07.18
[TIL] camp_day63_240715  (0) 2024.07.16
[TIL] camp_day62_240712  (0) 2024.07.15
[TIL] camp_day61_240711  (0) 2024.07.12