본문 바로가기

Python12

[Python] beautifulsoup select 사용법 - 네이버 랭킹 뉴스 크롤링 파이썬 beautifulsoup select 사용법에 대해서 알아보겠다. 여러 번 사용해봐야 개념을 알 수 있고, 직접 코드를 작성하는 것이 최고라고 생각한다. beautifulsoup을 이용해 웹 스크래핑을 할 때 중요한 것은 내가 원하는 정보를 잘 정제해서 가져오는 것이다. 그냥 무턱대고 모든 HTML 코드를 가져오면, 해석하기도 힘들고, 큰 의미가 없다. 파이썬(Python) beautifulsoup에서는 select를 이용해 내가 원하는 정보를 손쉽게 가져올 수 있다. 이번 시간 select를 사용해 네이버 랭킹 뉴스 크롤링(사실 웹 스크래핑이 맞는 말이라고 한다.)을 해보겠다. ★ 목표 : 네이버 뉴스 - 언론사 별 랭킹 뉴스 제목 가져오기! 참고 : 언론사별 랭킹 뉴스는 일정시간이 지나면 새로.. 2021. 8. 12.
[Python] 네이버 블로그 자동 포스팅 프로그램 만들기 - 3. 사진 올리기 이전 글에서 기본 세팅 및 어떤 식으로 구동할지에 대한 설명과 글쓰기를 누른 후 제목과 본문 작성까지 해보았다. 이전에 작성한 코드에서 추가로 작성할 예정이니, 이전 코드를 모른다면, 아래 글들을 참고하기 바란다. 2021.08.03 - [파이썬] - [Python] 네이버 블로그 자동 포스팅 프로그램 만들기 - 1. 기본 세팅 및 설명 [Python] 네이버 블로그 자동 포스팅 프로그램 만들기 - 1. 기본 세팅 및 설명 네이버 블로그를 이용해 쿠팡 파트너스 진행을 했었다. 글 내용은 매우 간단하고 단순하다 보니, 빠르게 글을 쓸 수 있었다. 그러나 이것을 손으로 직접 하려고 하니, 눈도 아프고, 생각보다 매 kissi-pro.tistory.com 2021.08.05 - [파이썬] - [Python] .. 2021. 8. 9.
[Python] 웹크롤링 이미지 저장 - 쿠팡 상품 이미지 긁어오기 네이버 블로그를 이용해 쿠팡 파트너스를 할 때 꼭 이미지를 넣어야 하는 것은 아니지만 이미지가 있고 없고의 차이는 크다. 이왕이면 넣는 것이 좋다. 사람들이 글자보다는 이미지를 인식하는게 훨씬 빠르기 때문이다. 처음에는 간단한 캡쳐도구(글쓴이는 알 캡처를 사용한다.)를 이용해 상품 이미지를 가져왔다. 같은 작업을 계속하다 보니, 자동화하고 싶다는 생각이 들었다. Beautifulsoup과 파이썬 기능을 이용하면, 쉽게 가져올 수 있겠다는 결론에 도달했고, 바로 실행으로 옮겨보았다. '제주삼다수 그린' 상품의 이미지(빨간색 표시되어 있는 영역)를 가져와보겠다. 분명 이 이미지가 저장되는 위치가 있을 것이다. 그것을 찾아내, 해당 페이지에서 다운로드 받으면 될 것이다. 크롬 개발자 도구를 이용해 이미지의 위.. 2021. 8. 8.