2021-04-07から1日間の記事一覧

同じクラス名があり必要でない情報まで抜き出してしまう

相変わらず、スクレイピングを楽しんでいる者です。 今回は欲しい情報を取得する際に 「おい、欲しい情報これだけなのにclass名が同じで必要ない情報までついてきてる。。だる」 ってことが起きました。 多分様々な手段があると思うんですが、私はそこにhref…

windows10環境によるスクレイピングheadless ~python~

今回はどうしても、headlessモード(非表示)でwebdriverを動かし情報をサイトから抜き出したいと考えコードを書いたので、復習で記事書きます。 今回は相当苦労しました。 様々な記事を参考にさせてもらいましたが、全然できない。 自分自身が出ているエラ…