🔍QA & TEST/🧑🏻‍💻Python

[팀 스파르타-업무자동화] 4주차 - 구글 뉴스 크롤링

siwoobyeol 2024. 8. 30. 17:44

1. 구글 뉴스 셀레니움 뼈대 코드

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome.options import Options
import time

chrome_options = Options()
chrome_options.add_experimental_option("detach", True)
chrome_options.add_experimental_option("excludeSwitches", ["enable-logging"])
driver = webdriver.Chrome(options=chrome_options)

# 웹 사이트 열기
driver.get('https://news.google.com')
time.sleep(1)
driver.quit()

 

2. 셀레니움 스크롤 코드

before_h = driver.execute_script("return window.scrollY")
while True:
    driver.find_element(By.CSS_SELECTOR, "body").send_keys(Keys.END)
    time.sleep(1)
    after_h = driver.execute_script("return window.scrollY")
    if after_h == before_h:
        break
    before_h = after_h