-
(23.04.21) 파이썬크롤링5 - seaborn , wordcloud , konlpyTIL 2023. 4. 21. 22:30
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다.
상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다.학습 주제
1. seaborn 라이브러리
- 시각화 라이브러리와 특징을 학습한다
2. Word Cloud 만들기
- konlpy 라이브러리를 통해 데이터를 전처리를 수행한다
- Counter 라이브러리로 빈도수를 측정한다
- wordcloud 라이브러리를 통해 Word Cloud를 생성한다
주요 메모 사항
seaborn
- matplotlib을 기반으로 하며, 통계 그래픽을 그리기 위한 파이썬 라이브러리
matplotlib
- 그래프의 다양한 요소를 변경/추가 할 수 있다
- plt.show()
- plt.figure((x, y)) : 그래프의 크기를 지정
- plt.title(title) : 그래프의 타이틀 추가
- plt._lable(label): 그래프의 라벨 추가
- plt.xlabel(label)
- plt.ylabel(label)
- plt._lim() : 조회 범위를 지정
- plt.xlim()
- ply.ylim()
import seaborn as sns from matplotlib import pyplot as plt x = [1, 3, 2, 5] y = [4, 3, 2, 1] sns.lineplot(x=x, y=y) plt.show()
Word Cloud
- 자주 등장하는 텍스트를 중요도나 인기도를 고려하여 나타낸 것
konlpy
- 한국어 형태소 분석기 라이브러리, 문장에서 명사를 추출할 수 있다
- 자바 기반으로 구현되어있어 자바 설치가 선행되어야 한다
counter
- 빈도 수를 측정해 딕셔너리를 생성 하는 라이브러리
wordcloud
- 텍스트 클라우드 이미지를 생성하는 라이브러리 (시각화)
- 폰트를 지정해야한다
- 로컬에 폰트파일이 설치되어야 한다
공부하며 어려웠던 내용
matplotlib 경고
MatplotlibDeprecationWarning: Support for FigureCanvases without a required_interactive_framework attribute was deprecated in Matplotlib 3.6 and will be removed two minor releases later.
konlpy , M1 실리콘칩 - JVM 호환 이슈
- Oracle JDK 1.7 설치 후 진행
'TIL' 카테고리의 다른 글
(23.04.20) 파이썬크롤링4 - selenium / 좋은코드 작성법 (0) 2023.04.21 (23.04.19) 파이썬크롤링3 - beautifulsoup4, 스크래핑기법 (0) 2023.04.19 (23.04.18) 파이썬크롤링2 - HTTP 통신, requests (1) 2023.04.18 (23.04.17) 파이썬크롤링1 - HTML/CSS/JS (1) 2023.04.18 (23.04.12) 자료구조/알고리즘3 - 큐, 트리, 힙 (2) 2023.04.13