본문 바로가기
데이터 분석

커리어넷 연봉 그래프 만들기

by 너구리선생님 2022. 3. 15.
반응형

얼마전 커리어넷에서 모든 직업 정보를 가져왔다.

커리어넷 직업 정보 가져오기

 

커리어넷 직업, 연봉 등 정보 csv로 만들기

얼마전 TVN D ENT 채널에서 올린 유퀴즈 영상을 크롤링했다. 유퀴즈 영상 크롤링 TVN D ENT 유퀴즈 영상 제목 및 링크 가져오기 얼마 전 친구와 같이 밥을 먹던 중 초등학교 고학년 학생에게 유퀴즈를

aigoamigo.tistory.com

 

위 데이터 중에서 연봉이 어떻게 분포되어있는지를 살펴보면 아래와 같다.

연봉 3000만원이 가장 많군!

 

  총 454개의 직업이 있는데, 그 중 연봉 기준이

2,000만원인 직업은 205개,

3,000만원인 직업은 162개,

4,000만원인 직업은 87개

이다.

 

음... 그런데 454개의 직업들의 연봉 분포가 2,3,4천만원인것은 좀 의아하다.

어떻게 이 연봉이 분포되었는지 좀더 살펴봐야겠다.

 

만약 커리어넷에 해당 기준이 나타나있지 않으면 메일로 물어라도 봐야할듯!


소스코드는 아래와 같다.

import seaborn as sns
import pandas as pd

#직업 정보 가져오기
df = pd.read_csv("job_list_from_carrernet.csv")
#불필요한 열 삭제
df = df.iloc[:,1:-1]

#그래프 그리기
sns.displot(df["연봉"])

#히스토그램 그리기
sns.displot(df["연봉"])

#연봉 2,000 직업 수
len(df[df["연봉"]==2000])
#연봉 3,000 직업 수
len(df[df["연봉"]==3000])
#연봉 4,000 직업 수
len(df[df["연봉"]==4000])
반응형

댓글