이번 글에서는 본 강의의 마지막 과정인 해외직접판매액의 분석을 마치고 강사가 권장하신 해외직접구매액 분석을 하고자 한다.
우선, 가설설정이다. 우리나라의 최대무역국은 중국과 미국이다. 수입에 한해서는 미국이 더 우세할 것으로 생각된다. 또한, 필자의 경험상 의류 직접구매가 국가 간 단가차이로 인한 가격이 달라서 직접구매를 해본 경험이 있다. 생각과 경험을 바탕으로 다음과 같은 가설을 설정하였다.
- 해외직접구매액은 매년 증가하고 있다.
- 미국이 해외직접구매액이 가장 높을 것이고, 항목은 의류가 가장 높을 것이다.
- 구매액이 큰 상품군이 국가별로 동일하다.
데이터의 출처는 https://kosis.kr/index/index.do의 국내통계 - 주제별 통계 - 도소매 서비스 - 온라인쇼핑동향조사 - 지역별 / 상품군별 온라인쇼핑 해외직접구매액이다.
데이터 전처리
cvs파일을 읽으면 다음과 같이 자료를 열람할 수 있다.
각 기간별로 열이 따로 지정되어 있다. 이것을 '기간'열로 묶고, 기간 옆에 'p'가 있는 것은 잠정치이므로 p를 포함하는 열은 제거한다.
자료가 없는 것은 '-'으로 표기하고 있다. '-'는 object이므로 숫자형 데이터로 변경(Numpy의 Nan)으로 변경한다.
'합계', '소계'와 같은 항목은 통계함수 사용 시 중복될 여지가 있으므로 불필요한 행들은 제거한다. 이때, 주의해야 할 부분이 '소계'는 중복이 없는 자료일 수 있기 때문에 확인하고 제거해야 한다.
전처리를 완료한 DataFrame이다.
분석에 앞서 데이터 요약을 확인하여 데이터가 전체적으로 어떤 형태를 하고 있는지 확인해보고자 한다.
평균 대비 편차가 매우 큰 것을 확인해 볼 수 있다. 그리고 1사분위수, 중간값, 3사분위수 및 최댓값을 보면 격차가 많이 발생하고 최댓값은 3사분위수 대비 엄청 많은 차이를 보이기 때문에 특정 국가 또는 상품에 해외직접구매가 몰려있는 이상치가 있음을 생각해 볼 수 있다. 따라서, 각 자료별로 해외직접구매액의 크기가 매우 상이할 것으로 생각된다.
우측의 DataFrame은 연도별로 Groupby하여 모든 구매액의 합계를 구한 표이다.
아래와 같이 시각화를 할 경우 매년 구매액이 증가하는 것을 확인할 수 있다.
가설 1번의 해외직접구매액은 매년 증가하고 있다는 것을 확인해 볼 수 있다.
단, 2023년의 값은 매우 적게 나온 것을 확인해 볼 수 있는데, 23년 전체가 아닌 1분기의 자료만 포함된 결과이다.
앞서서 미국에서 구매하는 구매액이 가장 높은 것이라고 예상했다. 국가별 해외구매액 합계이다. 미국이 가장 많고 유럽, 중국이 뒤를 잇는다. 그 외 타국가는 매우 적거나 없는 수준이다.
그렇다면, 미국에서 구매되는 상품군 중에서는 어떤 상품이 가장 많이 구매되는지 확인해 보도록 하겠다.
미국의 해외구매액을 상품별로 시각화한 그래프이다. 필자의 경험을 바탕으로 의류가 가장 높을 것이라고 예상했으나, 음/식료품이 가장 높았다.
그렇다면 중국, 유럽의 해외구매 상품군도 미국과 동일하게 음식료품이 가장 많고 의류, 가전이 2,3위를 차지할까?
아래의 2개의 그래프는 세 지역(미국, 중국, 유럽)의 해외직접구매액과 의류 및 음식료품을 제외한 상품군의 해외직접판매액 그래프이다.
미국을 제외한 2개 지역에서는 의류의 구매액만 가장 높은 것을 확인할 수 있다. 또한, 특이하게 전체적으로 해외구매액이 증가하고 있으나, 미국의 가전 상품군만 최근 몇 년간 해외구매액이 하락하는 모습을 볼 수 있다.
번외로, 미국만 음식료품이 가장 높은데 어떤 상품이 인기가 있는 것인지 확인해 보기 위해 간단한 인터넷 검색을 실시했다. '미국 식품 해외직구 추천'으로 검색을 한 결과, 건강기능식품 즉, 영양제(비타민, 오메가 3 등)를 주로 구매하는 것을 알 수 있었다.
결론
해외직접구매액은 매년 증가하고 있다. 그중 미국, 중국, 유럽지역의 비중이 가장 높다. 그리고 미국 해외직접구매액이 가장 많았다. 그중 의류가 가장 많을 것이라고 예상했으나, 실제 많은 구매를 하고 있는 것은 음식료품이었으며, 주요 상품은 건강기능식품으로 파악된다. 미국의 음식료품을 제외할 경우 각 국가별 해외직접구매 상품군 순위는 거의 비슷하다. 하지만 미국, 유럽과는 다르게 중국의 음식료품의 해외직접구매액이 매우 저조한 것을 확인할 수 있다. 미국의 예로 봤을 때, 해당 상품군의 주요 상품이 건강기능식품인 것을 생각한다면 중국에서는 건강기능식품을 구입하지 않는 것으로 생각할 수 있다.
'개발자 공부' 카테고리의 다른 글
리팩토링, 공부방법 (0) | 2023.10.26 |
---|---|
선형방정식과 선형시스템 (0) | 2023.08.29 |
python으로 시작하는 데이터 사이언스 - 서울 동물병원, 피부과/성형외과 분포 (1) | 2023.07.14 |
예외, file, log (0) | 2023.05.24 |
모듈과 패키지 (0) | 2023.05.18 |