2021-04-01から1ヶ月間の記事一覧

同じクラス名があり必要でない情報まで抜き出してしまう

相変わらず、スクレイピングを楽しんでいる者です。 今回は欲しい情報を取得する際に 「おい、欲しい情報これだけなのにclass名が同じで必要ない情報までついてきてる。。だる」 ってことが起きました。 多分様々な手段があると思うんですが、私はそこにhref…

windows10環境によるスクレイピングheadless ~python~

今回はどうしても、headlessモード(非表示)でwebdriverを動かし情報をサイトから抜き出したいと考えコードを書いたので、復習で記事書きます。 今回は相当苦労しました。 様々な記事を参考にさせてもらいましたが、全然できない。 自分自身が出ているエラ…

selenium beautifulsoup エクセルへの保存

エクセルへの保存におけるエラー対応。 encoding="cp932"と設定しているが、時々エラーが発生してしまう。 今回私がでたエラーは”¥/n2013”が悪さをしていたみたいです。 んーどうしようかな。文字コード変えてもエラーなるしな・・と考えたあげく with open …