GeekFactory

int128.hatenablog.com

Seleniumで繰り返し作業を効率化する

Seleniumといえばソフトウェア開発を連想する人が多いと思いますが、日常の繰り返し作業を効率化するツールとしても活用できます。毎週の会議室予約などのWebブラウザから単調な操作を繰り返す作業は、Seleniumでまとめて処理しましょう。

ここでは、リンク切れになったWebページをGoogleの検索結果から一括削除する方法をご紹介します。

(1)操作の記録

Googleの検索結果からリンクを削除するにはこのページでURLを申請します。申請が承認されるとリンクが削除されます。リンク先が404 Not Foundを返さない場合は承認が却下されます。たくさんのリンクを削除するには、下の画面でURLを入力する作業を繰り返さなければなりません。

まずは、1回の申請操作を記録しておきます。メニューの[ツール]→[Selenium IDE]でSeleniumを起動します。起動時には右上の赤いボタンが押された状態になっていて、Webブラウザでの操作がすべて記録されるようになっています。

先ほどのページでURLを1つ申請してみましょう。すると、下の画面のようになっているはずです。操作が終わったら赤いホタンを押して、記録状態を解除しておきます。

Seleniumの画面で[ソース]タブを押すと、HTMLソースが表示されます。ここで、HTMLソースをすべてコピー(Ctrl+C)しておいてください。

(2)繰り返し項目の生成

先ほどのHTMLソースをこのページに貼り付けます。下の画面のようになっているはずです。

次の項目に進みましょう。試験項目表という欄があると思います。削除したいURLを1行ずつ入力してください。

先ほどコピーした操作のうち、どこにURLを当てはめるかを設定します。とりあえずは下の画面のように設定すればOKです。

すると、HTMLが生成されます。

このHTMLをSeleniumにコピーしましょう。元からあったHTMLは削除して構いません。コピーした後[テーブル]タブに切り替えると、あら不思議。(1)で記録した操作の繰り返しが現れます。

(3)Seleniumの実行

ここからが見ていて楽しいです。Seleniumの再生ボタンを押すと、(2)で生成した操作が流れるように実行されると思います。

待っている間はWebブラウザが使えないので、コーヒータイムにするなり、別のブラウザを切り替えてニコニコを観るなり、有意義な時間を過ごしてください。退屈な作業は自動化してサボりましょう。