반응형
얼마전 커리어넷에서 모든 직업 정보를 가져왔다.
커리어넷 직업, 연봉 등 정보 csv로 만들기
얼마전 TVN D ENT 채널에서 올린 유퀴즈 영상을 크롤링했다. 유퀴즈 영상 크롤링 TVN D ENT 유퀴즈 영상 제목 및 링크 가져오기 얼마 전 친구와 같이 밥을 먹던 중 초등학교 고학년 학생에게 유퀴즈를
aigoamigo.tistory.com
위 데이터 중에서 연봉이 어떻게 분포되어있는지를 살펴보면 아래와 같다.
총 454개의 직업이 있는데, 그 중 연봉 기준이
2,000만원인 직업은 205개,
3,000만원인 직업은 162개,
4,000만원인 직업은 87개
이다.
음... 그런데 454개의 직업들의 연봉 분포가 2,3,4천만원인것은 좀 의아하다.
어떻게 이 연봉이 분포되었는지 좀더 살펴봐야겠다.
만약 커리어넷에 해당 기준이 나타나있지 않으면 메일로 물어라도 봐야할듯!
소스코드는 아래와 같다.
import seaborn as sns
import pandas as pd
#직업 정보 가져오기
df = pd.read_csv("job_list_from_carrernet.csv")
#불필요한 열 삭제
df = df.iloc[:,1:-1]
#그래프 그리기
sns.displot(df["연봉"])
#히스토그램 그리기
sns.displot(df["연봉"])
#연봉 2,000 직업 수
len(df[df["연봉"]==2000])
#연봉 3,000 직업 수
len(df[df["연봉"]==3000])
#연봉 4,000 직업 수
len(df[df["연봉"]==4000])
반응형
'데이터 분석' 카테고리의 다른 글
(데이터, 그래프 비공개)6학년 진단평가 결과(2/2) (0) | 2022.03.22 |
---|---|
(데이터, 그래프 비공개)6학년 진단평가 결과(1/2) (0) | 2022.03.21 |
워드클라우드 생성 프로그램 만들기(1/?) (0) | 2022.03.08 |
2017-2020 년 서울 모기지수 평균 그래프 (2) | 2022.03.06 |
워드클라우드 만들기 기초 활용! (0) | 2022.03.03 |
댓글