BeautifulSoup5 [Python] beautifulsoup select 사용법 - 네이버 랭킹 뉴스 크롤링 파이썬 beautifulsoup select 사용법에 대해서 알아보겠다. 여러 번 사용해봐야 개념을 알 수 있고, 직접 코드를 작성하는 것이 최고라고 생각한다. beautifulsoup을 이용해 웹 스크래핑을 할 때 중요한 것은 내가 원하는 정보를 잘 정제해서 가져오는 것이다. 그냥 무턱대고 모든 HTML 코드를 가져오면, 해석하기도 힘들고, 큰 의미가 없다. 파이썬(Python) beautifulsoup에서는 select를 이용해 내가 원하는 정보를 손쉽게 가져올 수 있다. 이번 시간 select를 사용해 네이버 랭킹 뉴스 크롤링(사실 웹 스크래핑이 맞는 말이라고 한다.)을 해보겠다. ★ 목표 : 네이버 뉴스 - 언론사 별 랭킹 뉴스 제목 가져오기! 참고 : 언론사별 랭킹 뉴스는 일정시간이 지나면 새로.. 2021. 8. 12. [Python] 네이버웹툰 크롤링 - 제목, 링크주소 가져오기 파이썬 'BeautifulSoup'을 이용하면 다양한 정보를 얻어 올 수 있다는 것은 이전 시간에 네이버 블로그 글 제목과 링크, 본문을 가져오는 실습을 해보면서 알았다. 이번 시간에는 현재 업로드 중인 '네이버 웹툰' 전체 제목과 링크 주소(URL)를 가져와 보겠다. 네이버에는 참 다양한 웹툰이 존재한다. F12를 눌러 개발자도구를 켜서 분석을 시작하겠다. class='list_area daily_all'인 태그 안에 우리가 원하는 모든 정보가 들어있다. 그 아래 class명이 'col'인 부분을 확인해보니, 요일 별 웹툰 정보가 들어있다. 제일 첫 번째에 있는 것이 '월요웹툰'이다. 태그 안을 살펴보면, '신의탑, 참교육, 뷰티풀 군바리' 등 다양한 웹툰이 있다. 'ul - li - div - a'까.. 2021. 5. 29. [Python] BeautifulSoup을 이용한 네이버 블로그 크롤링 - 3 [Python] BeautifulSoup을 이용한 네이버 블로그 크롤링 - 1뷰티플수프(BeautifulSoup)를 이용해 특정 키워드 검색 후 나온 결과의 네이버 블로그 제목과 URL을 가져올 예정이다. import requests from bs4 import BeautifulSoup from urllib.parse import quote query = "s..kissi-pro.tistory.com [Python] BeautifulSoup을 이용한 네이버 블로그 크롤링 - 2지난 시간에 BeautifulSoup을 이용해 네이버 View에 있는 정보(글 제목, URL)를 가져왔다. [Python] BeautifulSoup을 이용한 네이버 블로그 크롤링 - 1 뷰티플수프(BeautifulSoup)를 이용해.. 2021. 5. 28. 이전 1 2 다음