반응형 pyplot5 워드클라우드 생성 프로그램 만들기(1/?) http://wordcloud.kr/ 워드클라우드 워드클라우드 워클생성기 워클 단어구름 한글 워드클라우드 구름단어 글자구름 구름글자 태그클라우드 워드클라우드 태그구름 랜덤이미지 블로그이미지 페이스북이미지 wordcloud.kr 위처럼 인터넷 사이트에 워드클라우드 생성기가 존재한다. 그런데 이 사이트는 몇가지 문제가 있었다. 1. 10,000자 이상 텍스트는 입력할 수 없다. 2. 불용어(표시되지 않기를 원하는 단어)를 설정할 수 없다. 3. 아래와 같이 "명사"만 출력할 수 없다. 그래서 워드클라우드 생성 프로그램을 만들기로 했다! 대략적인 뼈대와 활용 방법을 순서대로 소개하면 1. 프로그램을 실행한다. 2. 원하는 텍스트를 넣고 생성 버튼을 누른다. 실행결과는! 불용어를 추가할 텍스트 위젯을 추가해야하.. 2022. 3. 8. 2017-2020 년 서울 모기지수 평균 그래프 지난 글에서 2020년 서울 모기지수 그래프를 그렸다. https://aigoamigo.tistory.com/entry/graph5 2020년 서울 주거지, 수변부, 공원 모기지수 그래프로 나타내기 모기가 다가오는 계절. 2022년의 주거지, 수변부, 공원의 모기지수는 어떻게 될까 궁금했음. 그래프를 살펴보면 8월 말에 보기지수가 가장 높고, 10월 초가되면 모기지수가 급속도로 낮아지는 모 aigoamigo.tistory.com 그런데 2020년 1년의 데이터만으로는 그 정확도가 몹시 낮을 것 같았다. 2020년에 장마가 오지 않았다면? 그와 반대로 장마가 다른 때보다 2배 더 길었다면? 위와 같은 상황이 있었다면 데이터를 일반화하기에는 무리가 있을 것이다. 그래서 그나마 정확도를 높이기 위해서 2017.. 2022. 3. 6. 03월 04일 네이버 뉴스 타이틀 워드 클라우드 활용한 데이터는 위 csv. 위 csv를 만들기 위한 python 명령어는 아래 링크 참고! https://aigoamigo.tistory.com/entry/webScrapping8 매일의 네이버 뉴스 랭킹 데이터 가져오기 결과물 위 파일은 2022년 3월 4일 1~5위 뉴스 데이터 매일매일의 뉴스 기사 제목의 Wordcloud를 만들기위해 오늘의 뉴스 데이터를 웹스크래핑 했다. 아래 사이트에 접속해서 데이터를 가져옴! https://ne aigoamigo.tistory.com 소스코드는 아래와 같다. from konlpy.tag import Okt #품사 태깅 클래스 중 Okt 활용. 본래 Twitter 를 사용하려 했는데 Okt로 바뀜 from collections import Counter #각 단.. 2022. 3. 5. 2021학년도 전국 초등학교 전출입 학생 수 평균 그래프 위 데이터는 학교 알리미에서 가져왔습니다. https://www.schoolinfo.go.kr/Main.do 학교알리미(초·중등 교육정보 공시서비스) 학교알리미_초·중등 교육정보 공시서비스 www.schoolinfo.go.kr 지난 글에서 전국 초등학생 입학생 평균(시도교육청의 학교별 평균)을 보았을 때 서울 다음으로 세종이 높았다. 그런데 전입생의 경우 세종이 압도적으로 높은 평균 전입생 수를 자랑하고 있다! 세종... 대체 어떤 도시야..? 그리고 서울은 전입생이 전출생보다 많을 것으로 생각했는데, 오히려 전출생이 더 많다는 것도 놀라웠음! 전체적인 파이썬 코드는 아래와 같다. 단, 아래 파이썬 코드는 반복문을 활용하면 더욱 깔끔하게 만들어질 수 있을듯! 1~6학년 그래프 그리기는 몇개의 값만 제외하.. 2022. 2. 22. 서울 노원구 날씨 데이터와 그래프 만들기 일기예보를 보기 위해 네이버에서 노원구 날씨를 검색했다. 그날의 시간별 기온을 그래프로 보여준다. 그런데 주간예보는 최저, 최고 기온을 표로 나타내어 가독성이 떨어진다. 그래서 기온(+날씨)을 웹스크래핑하여 가져온 후 이를 그래프로 나타내보았다. 1. 사용할 라이브러리를 불러온다. #정적 웹페이지 데이터 가져오기 from bs4 import BeautifulSoup import requests #데이터 저장 및 분석하기 import pandas as pd #오늘의 날짜 from datetime import datetime #정규식 import re #그래프 그리기 import matplotlib import matplotlib.pyplot as plt 2. 노원구 날씨 데이터를 웹스크래핑한다. #[오늘을.. 2022. 2. 14. 이전 1 다음 반응형