글과 사진, 그리고 이야기

IE & SWCON/Data Science

[금융공공데이터취합] 재정패널조사

뱃놀이가자 2023. 9. 16. 22:02
728x90

data fusion이라고 하는 내용이 있다.

데이터의 양이 많아질 수록 여러가지 데이터를 병합 및 수정에 있어 과감히 삭제할 필요도 결측치를 보간할 방법도 중요하다. 이 모든 것은 데이터 분석가의 역량이라고 할 수 있다.

그렇기에 왜 이 데이터를 어떻게 처리할 것인지 읽는 사람들로 하여금 납득할 수 있도록 해야한다. 

 

이번 데이터는 재정패널조사로 매년 조사하는 전국미 대상 가계 금융 복지 조사이다. 

https://www.kipf.re.kr/panel/

 

한국조세재정연구원

공공기관의 운영관련 사항을 조사 연구 분석함으로써 대한민국의 조세 및 공공지출 공공기관운영에 관한 정책 수립을 지원하고 국민경제 발전에 기여하고자 설립된 정부출연 연구기관으로 세

www.kipf.re.kr

해당 데이터는 매우 용량이 크고 csv 자체로는 해석하기가 부담스러운 부분이 많아 재정패널조사 측에서 제공하는 코드북을 참고하면서 데이터를 분석해야 한다. 

 

나름 정형적인 데이터다 보니 용량이 커서 결측치를 처리하는 방법을 제외하고는 비교적 수월한 분석과정이었다. 

 

해당 데이터는 익명의 사람들에게 설문조사를 받아 다양한 영역에서 국민들의 소득 수준 및 가계 상황을 확인하는 매년 실시하는 조사이다. 

 

내용은 차치하고 이번 데이터를 어떻게 가공했는지 공유하겠다.

 


 

최인수, 정유진, 김도윤, 이준용, 정용수, 김우창*   Tracking Changes in Financial Literacy: Insights from the Korean National Survey (2014-2022)   영어   2023 대한산업공학회 추계학술대회 [2023.11. 예정]

최인수, 정유진, 김도윤, 이준용, 정용수, 김우창*   통계적 데이터 분석 기반의 한국인의 금융 및 복지 관련 특성의 발견 - 가계금융·복지조사를 바탕으로   영어   2023 한국산업경영시스템학회 추계학술대회 [2023.11. 예정]

최인수, 정유진, 김도윤, 이준용, 정용수, 김우창*
Analyzing South Korea's Household Finance: Extracting Data-Inspired Insights via National Survey of Tax and Benefit Data   영어   2023 한국자료분석학회 동계학술논문발표대회 [2024.01. 예정]

 

 

 

 

728x90