본문 바로가기
반응형

matplotlib8

[데이터분석]서울과 울란바토르의 교통사고 사망자, 부상자 비교 2022년 09월 13일부터 18일까지 서울특별시교육청 교류협력국 교육정보화 지원사업(KLIC)의 일환으로 몽골에 국외 출장을 다녀왔다. 몽골에 가기 전 기대했던 바는 광활한 초원과 함께하는 시원시원한 도로였다. 칭기즈 칸 국제공항에 내렸을 때 기대했던 그대로의 풍경을 보고 큰 감동을 받았다. 하지만 몽골의 수도, 울란바토르에 도착하니... 서울보다 훨씬 더 극심한 교통체증을 가지고 있었다. 20km 이동하는데 2시간... 말이 되냐고요 (울란바토르는 본래 수용인원을 50만명으로 계획했으나, 현재는 150만명이 넘게 살고 있어서 그렇다고 함) 그래서 몽골에 있을 때부터 계속 궁금했던 서울과 울란바토르의 교통사고 사망자, 부상자를 비교해보고 싶었고 이제야 데이터를 수집하고 분석하여 그래프를 그려보았다. 몽.. 2022. 10. 5.
[데이터분석]KTX, SRT 예매 경쟁률은 어느 정도일까? 추석 연휴가 막바지다. 우리 부부는 부모님 댁에 내려가지 않았지만 다른 사람들은 KTX, SRT 티켓을 위해 불타는 경쟁을 했다고 들었다. KTX나 SRT가 아닌 버스나 자가용을 이용하면 평상시 2배 이상의 시간이 걸리기 때문에!! (나도 어버이날 때 광양 갔다가 서울로 돌아오는데 10시간 걸렸음...) KTX와 SRT를 이용하는 승객과 좌석이 어느정도 차는지를 알기 위해 인터넷 검색을 했다. https://www.index.go.kr/potal/main/EachDtlPageDetail.do?idx_cd=1252 고속철도 여객 수송동향 고속철도 여객 수송동향 www.index.go.kr 위 사이트에 아래와 같은 고속철도 여객수 그래프가 있었다. 하지만 각 노선별로 얼마나 좌석이 차는지를 나타내는 이용률 .. 2022. 9. 12.
워드클라우드 생성 프로그램 만들기(1/?) http://wordcloud.kr/ 워드클라우드 워드클라우드 워클생성기 워클 단어구름 한글 워드클라우드 구름단어 글자구름 구름글자 태그클라우드 워드클라우드 태그구름 랜덤이미지 블로그이미지 페이스북이미지 wordcloud.kr 위처럼 인터넷 사이트에 워드클라우드 생성기가 존재한다. 그런데 이 사이트는 몇가지 문제가 있었다. 1. 10,000자 이상 텍스트는 입력할 수 없다. 2. 불용어(표시되지 않기를 원하는 단어)를 설정할 수 없다. 3. 아래와 같이 "명사"만 출력할 수 없다. 그래서 워드클라우드 생성 프로그램을 만들기로 했다! 대략적인 뼈대와 활용 방법을 순서대로 소개하면 1. 프로그램을 실행한다. 2. 원하는 텍스트를 넣고 생성 버튼을 누른다. 실행결과는! 불용어를 추가할 텍스트 위젯을 추가해야하.. 2022. 3. 8.
03월 04일 네이버 뉴스 타이틀 워드 클라우드 활용한 데이터는 위 csv. 위 csv를 만들기 위한 python 명령어는 아래 링크 참고! https://aigoamigo.tistory.com/entry/webScrapping8 매일의 네이버 뉴스 랭킹 데이터 가져오기 결과물 위 파일은 2022년 3월 4일 1~5위 뉴스 데이터 매일매일의 뉴스 기사 제목의 Wordcloud를 만들기위해 오늘의 뉴스 데이터를 웹스크래핑 했다. 아래 사이트에 접속해서 데이터를 가져옴! https://ne aigoamigo.tistory.com 소스코드는 아래와 같다. from konlpy.tag import Okt #품사 태깅 클래스 중 Okt 활용. 본래 Twitter 를 사용하려 했는데 Okt로 바뀜 from collections import Counter #각 단.. 2022. 3. 5.
matplotlib 그래프 이미지가 잘린 상태로 저장될 때 matplotlib으로 이미지를 그린 후 저장을 누르면 아래와 같이 이미지가 잘리는 경우가 있다. 이 문제는 간단한 명령어 하나로 해결 가능하다. plt.tight_layout() 위 명령어를 적용하면 x축 이름 모두 잘 보인다! 2022. 2. 23.
2021학년도 전국 초등학교 전출입 학생 수 평균 그래프 위 데이터는 학교 알리미에서 가져왔습니다. https://www.schoolinfo.go.kr/Main.do 학교알리미(초·중등 교육정보 공시서비스) 학교알리미_초·중등 교육정보 공시서비스 www.schoolinfo.go.kr 지난 글에서 전국 초등학생 입학생 평균(시도교육청의 학교별 평균)을 보았을 때 서울 다음으로 세종이 높았다. 그런데 전입생의 경우 세종이 압도적으로 높은 평균 전입생 수를 자랑하고 있다! 세종... 대체 어떤 도시야..? 그리고 서울은 전입생이 전출생보다 많을 것으로 생각했는데, 오히려 전출생이 더 많다는 것도 놀라웠음! 전체적인 파이썬 코드는 아래와 같다. 단, 아래 파이썬 코드는 반복문을 활용하면 더욱 깔끔하게 만들어질 수 있을듯! 1~6학년 그래프 그리기는 몇개의 값만 제외하.. 2022. 2. 22.
학교알리미로 2021 전국 초등학교 입학생 수 그래프 그리기 원래 있던 학교에서 다른 학교로 옮기게 되었다. 원래 있던 학교는 한 학년당 학급 수가 5개이며, 학급 당 학생 수는 약 20명이었다. 새로 옮기는 학교는 한 학년당 학급 수가 8개이며, 학급 당 학생 수는 약 20명이었다. 서울에서도 이렇게 초등학생 수가 차이가 큰데... 2021년도 전국 초등학교 입학생 수는 어땠을까? 학교알리미는 아래와 같이 다양한 공개용데이터를 제공하고 있다. 이 중 입학생 현황 카테고리를 선택하고 2021년도로 설정하여 csv파일을 내려받았다. 전국 시도교육청별 총 입학생 수 그래프는 다음과 같이 나타났다. 그래프를 그리기 위한 Python 코드는 아래와 같다. import pandas as pd #데이터 프레임(표) 만들기 import matplotlib #한글 설정을 위한 .. 2022. 2. 19.
서울 노원구 날씨 데이터와 그래프 만들기 일기예보를 보기 위해 네이버에서 노원구 날씨를 검색했다. 그날의 시간별 기온을 그래프로 보여준다. 그런데 주간예보는 최저, 최고 기온을 표로 나타내어 가독성이 떨어진다. 그래서 기온(+날씨)을 웹스크래핑하여 가져온 후 이를 그래프로 나타내보았다. 1. 사용할 라이브러리를 불러온다. #정적 웹페이지 데이터 가져오기 from bs4 import BeautifulSoup import requests #데이터 저장 및 분석하기 import pandas as pd #오늘의 날짜 from datetime import datetime #정규식 import re #그래프 그리기 import matplotlib import matplotlib.pyplot as plt 2. 노원구 날씨 데이터를 웹스크래핑한다. #[오늘을.. 2022. 2. 14.
반응형