RubyでSelenium使って、このブログをスクレイピングしてみた

ブログを書いている人 Ruby、Ruby on Rails

おはようございます。わてぷです。

 

自動テスト面白そう、なんかやってみたいと思い、よく聞くSeleniumを使ったスクレイピングをしてみました。

 

環境はこちら

使用するブラウザはFirefox。

 

スポンサーリンク

作ったもの

まずは、以前の記事通り、geckodriverを準備するところまで。

「Unable to find Mozilla geckodriver.」と表示された時
おはようございます。わてぷです。 最近、以下の本を購入し、Seleniumを使って何ができるのかを色々と試しております。 実践Selenium WebDriver /オライリ-・ジャパン/サタヤ・アバ...

 

その後は以下の通り記述。

 

これを実行することで、

  • Firefoxを起動
  • 自分のブログを表示させる
  • 「目標」のカテゴリーを開く
  • スクリーンショットをとって「goal.png」という名前で保存(同じディレクトリ内に保存される)
  • 検索欄に「Ruby」と入力して検索をする
  • 検索して出てきた最初の記事のタイトルをターミナル上へ出力
  • 「Ruby」と検索して出てきたページのスクリーンショットをとって「search.png」という名前で保存
  • Firefoxを閉じる

ということが出来ました。

 

ところどころにsleepを入れているのは、実行したらあっという間に終わってしまい、何しているのかよく分からなかったためです。

ぶっちゃけ無くても大丈夫。

 

要素をclassで取得している箇所もありますが、基本的にはidで取得した方が良さそうですね。

 

多分、他にも色々なことが出来ると思うので、暇を見つけて試してみたいですね。

 

それでは!

コメント

タイトルとURLをコピーしました