windows10環境によるスクレイピングheadless ~python~
今回はどうしても、headlessモード(非表示)でwebdriverを動かし情報をサイトから抜き出したいと考えコードを書いたので、復習で記事書きます。
今回は相当苦労しました。
様々な記事を参考にさせてもらいましたが、全然できない。
自分自身が出ているエラーに関する記事がほとんどない。
どうすればいいんだろうと悩み二日かかりました。
これまでの記事通りseleniumとbeautifulsoupを使用しサイトから欲しい情報を抜き出していました。
今回のheadlessはそのコードにoptionを追加することで可能にできます。
from selenium.webdriver.chrome.options import Options #追加
options = webdriver.ChromeOptions()
options.add_argument('--headless')
options.add_argument('--proxy-server=http://...............')
browser = webdriver.Chrome(chrome_options=options)
browser.get("URL...")
これでchromeを非表示で実行できます。