TIL
-
(23.04.21) 파이썬크롤링5 - seaborn , wordcloud , konlpyTIL 2023. 4. 21. 22:30
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. seaborn 라이브러리 - 시각화 라이브러리와 특징을 학습한다 2. Word Cloud 만들기 - konlpy 라이브러리를 통해 데이터를 전처리를 수행한다 - Counter 라이브러리로 빈도수를 측정한다 - wordcloud 라이브러리를 통해 Word Cloud를 생성한다 주요 메모 사항 seaborn matplotlib을 기반으로 하며, 통계 그래픽을 그리기 위한 파이썬 라이브러리 matplotlib 그래프의 다양한 요소를 변경/추가 할 수 있다 plt.show() plt.figure((x, y)) : 그래프의 크기를..
-
(23.04.20) 파이썬크롤링4 - selenium / 좋은코드 작성법TIL 2023. 4. 21. 22:09
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. selenium 라이브러리 - 웹 브라우저 자동화 라이브러리와 특징을 학습한다 2. 좋은 코드 작성하기 - 좋은 코드의 조건을 이해한다 - 코드리뷰의 자세와 테스트의 종류를 이해한다 주요 메모 사항 selenium 웹 브라우저 자동화 라이브러리, 브라우저 동작을 자동화하여 웹 페이지를 테스트하거나 스크래핑 할 수 있다 다양한 언어를 지원한다 (Java, C #, Python, Ruby, JavaScript, PHP) 다양한 브라우저에서 작동할 수 있다 (Firefox, Chrome, IE, Edge) 브라우저 별 WebD..
-
(23.04.19) 파이썬크롤링3 - beautifulsoup4, 스크래핑기법TIL 2023. 4. 19. 17:54
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. beatifulsoup4 라이브러리 - HTML 파싱 라이브러리와 특징을 학습한다 2. 스크래핑 기법 - 스크래핑 기법 3가지의 장단점을 학습한다 주요 메모 사항 BeautifulSoup 마크업언어(HTML,XML) 문서를 파싱하고 검색할 수 있는 라이브러리 간단하고 쉬운 인터페이스를 제공한다 파이썬으로 구현되어 있다 파이썬 표준 라이브러리인 html.parser 와 다른 파서를 지원한다 (lxml , html5lib) BeautifulSoup 와 유사한 라이브러리 lxml - C로 구현된 파서로 빠르고 메모리 효율이 좋..
-
(23.04.18) 파이썬크롤링2 - HTTP 통신, requestsTIL 2023. 4. 18. 17:21
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. 데이터 수집을 위한 웹 통신 - 웹 스크래핑과 웹 크롤링의 차이를 학습한다 - 로봇 배제 프로토콜을 해석할 수 있다 2. request 라이브러리 - HTTP client 라이브러리와 특징을 학습한다 주요 메모 사항 LAN(Local Area Network) 근거리 지역 네트워크 Internet 범지구적으로 연결된 네트워크 WWW(World Wide Web, Web) 인터넷에서 정보를 교환기 위한 시스템 HTTP(Hypertext Transfer Protocol) 웹 상에서 정보를 주고받기 위한 약속 웹 스크래핑 vs 웹..
-
(23.04.17) 파이썬크롤링1 - HTML/CSS/JSTIL 2023. 4. 18. 12:43
더보기 TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. HTML, CSS , JS 개념을 이해한다 2. HTML 요소 - 시맨틱 태그의 등장배경과 특징을 이해한다 주요 메모 사항 CSS (Cascading Style Sheets) 문서를 예쁘게 꾸미는 언어 JavaScript 문서에 기능을 만들어 주는 언어 HTML (Hypertext Markup Language) 웹 브라우저가 이해할 수 있는 언어 Display level 종류 설명 예 block 블록 처럼 쌓이고 너비가 꽉 차는 요소 블록 크기와 내/외부 여백을 지정할 수 있는 구조적 요소 inline 옆으로 나열..
-
(23.04.12) 자료구조/알고리즘3 - 큐, 트리, 힙TIL 2023. 4. 13. 13:07
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. 큐, 환형 큐, 우선순위 큐의 ADT를 구현해본다 - Array 혹은 양방향 연결 리스트를 통해 구현 2. 트리, 이진트리, 이진탐색트리 의 ADT를 구현해본다 - 이진트리, 포화 이진 트리, 완전 이진 트리의 특징을 이해한다 - 트리의 재귀적 성격을 통해 이진트리를 활용해 구현 3. 힙과 최대/최소 힙의 ADT를 구현해본다 - 배열을 통해 구현 주요 메모 사항 큐(Queues) 자료를 보관할 수 있는 선형 구조 (FIFO , 선입선출) 한 쪽에서만 밀어넣고, 반대 편에서만 꺼내쓰는 구조 큐의 ADT enqueue(x) ..
-
(23.04.11) 자료구조/알고리즘2 - 연결리스트, 스택TIL 2023. 4. 12. 11:05
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. LinkedList와 DoublyLinkedList 의 ADT를 구현해본다 - position 정보을 받아 *단방향 LinkedList 를 구현 - dummy head Node를 추가하고, Node 정보를 받아 단방향 LinkedList를 개선 - dummy head/tail Node를 추가하여 양방향 LinkedList 를 구현 2. Stack의 ADT와 응용 알고리즘을 구현해본다 - Stack은 Array (Python의 List) 혹은 LinkedList 로 구현 가능하다 - Stack을 응용하여 중위 표기식을 후위..
-
(23.04.10) 자료구조/알고리즘1 - 선형배열, 시간복잡도TIL 2023. 4. 10. 17:46
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. 자료구조를 왜 알아야 할까 - 파이썬에서 제공하는 데이터 타입으로 문제는 해결할 수 있다 - 그러나 그것만으로 해결하기 어렵거나, 효율적인 해결을 위해 자료구조를 알아야 한다 2. [특강] 코딩테스트에 대한 대비 - 문제의 본질을 이해하고 정보의 처리 흐름으로 추상화하는 과정을 갖는다 - 코드로 구현하기 위한 자료구조, 알고리즘 어휘력이 필요하다 주요 메모 사항 자료구조 - 정보의 표현 방식과 여기에 정의되는 연산들의 집합 (삽입, 삭제) - 자료구조에 따라 적용할 알고리즘이 달라진다 선형배열(Linear Arrays) ..