전체 글
-
(23.04.19) 파이썬크롤링3 - beautifulsoup4, 스크래핑기법TIL 2023. 4. 19. 17:54
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. beatifulsoup4 라이브러리 - HTML 파싱 라이브러리와 특징을 학습한다 2. 스크래핑 기법 - 스크래핑 기법 3가지의 장단점을 학습한다 주요 메모 사항 BeautifulSoup 마크업언어(HTML,XML) 문서를 파싱하고 검색할 수 있는 라이브러리 간단하고 쉬운 인터페이스를 제공한다 파이썬으로 구현되어 있다 파이썬 표준 라이브러리인 html.parser 와 다른 파서를 지원한다 (lxml , html5lib) BeautifulSoup 와 유사한 라이브러리 lxml - C로 구현된 파서로 빠르고 메모리 효율이 좋..
-
[Python] BeautifulSoupBack/Python 2023. 4. 19. 17:40
BeautifulSoup 마크업언어(HTML,XML) 문서를 파싱하고 검색할 수 있는 라이브러리 간단하고 쉬운 인터페이스를 제공한다 파이썬으로 구현되어 있다 파이썬 표준 라이브러리인 html.parser 와 다른 파서를 지원한다 (lxml , html5lib) BeautifulSoup 와 유사한 라이브러리 lxml - C로 구현된 파서로 빠르고 메모리 효율이 좋다 - 복잡하고 덜 직관적인 인터페이스를 제공 - 크롤링 프레임워크인 Scrapy에 내장되어 있다 html5lib - 파이썬으로 구현된 파서, 다른 파서에 비해 느리다 - HTML 파싱에 특화되어 있다 # cli> pip install beautifulsoup4 from bs4 import BeautifulSoup soup = BeautifulSo..
-
(23.04.18) 파이썬크롤링2 - HTTP 통신, requestsTIL 2023. 4. 18. 17:21
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. 데이터 수집을 위한 웹 통신 - 웹 스크래핑과 웹 크롤링의 차이를 학습한다 - 로봇 배제 프로토콜을 해석할 수 있다 2. request 라이브러리 - HTTP client 라이브러리와 특징을 학습한다 주요 메모 사항 LAN(Local Area Network) 근거리 지역 네트워크 Internet 범지구적으로 연결된 네트워크 WWW(World Wide Web, Web) 인터넷에서 정보를 교환기 위한 시스템 HTTP(Hypertext Transfer Protocol) 웹 상에서 정보를 주고받기 위한 약속 웹 스크래핑 vs 웹..
-
(23.04.17) 파이썬크롤링1 - HTML/CSS/JSTIL 2023. 4. 18. 12:43
더보기 TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. HTML, CSS , JS 개념을 이해한다 2. HTML 요소 - 시맨틱 태그의 등장배경과 특징을 이해한다 주요 메모 사항 CSS (Cascading Style Sheets) 문서를 예쁘게 꾸미는 언어 JavaScript 문서에 기능을 만들어 주는 언어 HTML (Hypertext Markup Language) 웹 브라우저가 이해할 수 있는 언어 Display level 종류 설명 예 block 블록 처럼 쌓이고 너비가 꽉 차는 요소 블록 크기와 내/외부 여백을 지정할 수 있는 구조적 요소 inline 옆으로 나열..
-
(23.04.12) 자료구조/알고리즘3 - 큐, 트리, 힙TIL 2023. 4. 13. 13:07
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. 큐, 환형 큐, 우선순위 큐의 ADT를 구현해본다 - Array 혹은 양방향 연결 리스트를 통해 구현 2. 트리, 이진트리, 이진탐색트리 의 ADT를 구현해본다 - 이진트리, 포화 이진 트리, 완전 이진 트리의 특징을 이해한다 - 트리의 재귀적 성격을 통해 이진트리를 활용해 구현 3. 힙과 최대/최소 힙의 ADT를 구현해본다 - 배열을 통해 구현 주요 메모 사항 큐(Queues) 자료를 보관할 수 있는 선형 구조 (FIFO , 선입선출) 한 쪽에서만 밀어넣고, 반대 편에서만 꺼내쓰는 구조 큐의 ADT enqueue(x) ..
-
(23.04.11) 자료구조/알고리즘2 - 연결리스트, 스택TIL 2023. 4. 12. 11:05
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. LinkedList와 DoublyLinkedList 의 ADT를 구현해본다 - position 정보을 받아 *단방향 LinkedList 를 구현 - dummy head Node를 추가하고, Node 정보를 받아 단방향 LinkedList를 개선 - dummy head/tail Node를 추가하여 양방향 LinkedList 를 구현 2. Stack의 ADT와 응용 알고리즘을 구현해본다 - Stack은 Array (Python의 List) 혹은 LinkedList 로 구현 가능하다 - Stack을 응용하여 중위 표기식을 후위..
-
(23.04.10) 자료구조/알고리즘1 - 선형배열, 시간복잡도TIL 2023. 4. 10. 17:46
TIL은 그날 하루 본인이 어떤 공부를 하였는지 파악하기 위함입니다. 상세하게 기록하여 이후 본인이 어떤 공부를 어떻게 하였는지 파악할 수 있도록 하는 것이 중요합니다. 학습 주제 1. 자료구조를 왜 알아야 할까 - 파이썬에서 제공하는 데이터 타입으로 문제는 해결할 수 있다 - 그러나 그것만으로 해결하기 어렵거나, 효율적인 해결을 위해 자료구조를 알아야 한다 2. [특강] 코딩테스트에 대한 대비 - 문제의 본질을 이해하고 정보의 처리 흐름으로 추상화하는 과정을 갖는다 - 코드로 구현하기 위한 자료구조, 알고리즘 어휘력이 필요하다 주요 메모 사항 자료구조 - 정보의 표현 방식과 여기에 정의되는 연산들의 집합 (삽입, 삭제) - 자료구조에 따라 적용할 알고리즘이 달라진다 선형배열(Linear Arrays) ..
-
[MySQL] Install MySQL with Homebrew (Mac)DB/MySQL 2023. 2. 7. 22:24
1. 터미널 실행 brew update brew install mysql-> 결과 ==> mysql We've installed your MySQL database without a root password. To secure it run: mysql_secure_installation MySQL is configured to only allow connections from localhost by default To connect run: mysql -u root To restart mysql after an upgrade: brew services restart mysql Or, if you don't want/need a background service you can just run..