본문 바로가기

스크래핑4

[Python] 네이버웹툰 크롤링 - 제목, 링크주소 가져오기 파이썬 'BeautifulSoup'을 이용하면 다양한 정보를 얻어 올 수 있다는 것은 이전 시간에 네이버 블로그 글 제목과 링크, 본문을 가져오는 실습을 해보면서 알았다. 이번 시간에는 현재 업로드 중인 '네이버 웹툰' 전체 제목과 링크 주소(URL)를 가져와 보겠다. 네이버에는 참 다양한 웹툰이 존재한다. F12를 눌러 개발자도구를 켜서 분석을 시작하겠다. class='list_area daily_all'인 태그 안에 우리가 원하는 모든 정보가 들어있다. 그 아래 class명이 'col'인 부분을 확인해보니, 요일 별 웹툰 정보가 들어있다. 제일 첫 번째에 있는 것이 '월요웹툰'이다. 태그 안을 살펴보면, '신의탑, 참교육, 뷰티풀 군바리' 등 다양한 웹툰이 있다. 'ul - li - div - a'까.. 2021. 5. 29.
[Python] BeautifulSoup을 이용한 네이버 블로그 크롤링 - 3 [Python] BeautifulSoup을 이용한 네이버 블로그 크롤링 - 1뷰티플수프(BeautifulSoup)를 이용해 특정 키워드 검색 후 나온 결과의 네이버 블로그 제목과 URL을 가져올 예정이다. import requests from bs4 import BeautifulSoup from urllib.parse import quote query = "s..kissi-pro.tistory.com [Python] BeautifulSoup을 이용한 네이버 블로그 크롤링 - 2지난 시간에 BeautifulSoup을 이용해 네이버 View에 있는 정보(글 제목, URL)를 가져왔다. [Python] BeautifulSoup을 이용한 네이버 블로그 크롤링 - 1 뷰티플수프(BeautifulSoup)를 이용해.. 2021. 5. 28.
[Python] BeautifulSoup을 이용한 네이버 블로그 크롤링 - 2 지난 시간에 BeautifulSoup을 이용해 네이버 View에 있는 정보(글 제목, URL)를 가져왔다. 2021. 5. 23.