Pythonでブラウザ操作を自動化しよう①

こんにちは。

今回の記事はおぎーが担当します。

梅雨も明けて一気に暑くなってきましたね。

みなさんくれぐれも体調を崩さないよう気を付けて生活してください!

さて、これまでおぎーはPythonを使ってコードを入力する上での基礎的な事項について記事を書いてきましたが、

一通り基礎的な内容については説明をしてきたつもりです。

したがって、これからはやや応用的な内容の記事を作成していこうと思いますので、

楽しみにしていてください。

もちろん、Pythonを学習して間もない方でも分かりやすい記事を作成できるよう努めていきますので、

今後もよろしくお願いいたします。

それでは早速学習を進めていきましょう。

今回の内容

今回の内容は、

Seleniumというライブラリを使って日本語版のGoogle検索ページを開く

ことです。

Seleniumを用いた内容の記事は今回から数回にわたって書いていこうと思います。

今回はその基礎的な内容であり、覚えていただきたいところです。

ぜひ一緒に習得してしまいましょう。

Seleniumとは

Seleniumって何?って思った方がほとんどだと思っておりますので、

説明させていただきます。

Seleniumとは、ブラウザでの操作を自動化するためのライブラリです。

ブラウザとは、みなさんがインターネットを利用するときに必ずお世話になっているもので、例えば、Chrome、Edge、Safariなどが挙げられます。

これらは、インターネット上のWebページを見るために必要なソフトのことを指します。

ブラウザはスマホやパソコンには購入したときにはすでにインストールされているものがありますよね。

ブラウザがなければWebページを閲覧することはできませんので、現代においては必要不可欠なものとなっていると考えられます。

そのブラウザ上で私たちは情報を収集したりするために様々な操作をしているわけですが、

私たちが行っている操作をPythonに託すことが可能です。

そのために必要なのがSeleniumというライブラリです。

Jupyter labについて

いつもGoogle Colaboratoryを使用してコードの入力や実行を行っていますが、

今回はJupyter labを使用してみましょう。

まずJupyter labを使用するためには、

anacondaをインストールする必要がありますので、

こちらの記事を参考にしてanacondaをインストールしましょう。

Anaconda3をインストールしよう!

anacondaのインストールが完了したら、

コマンドプロンプトを開いていただき、

jupyter lab

と入力してください。

入力を終えたらENTERキーを押してもらうとコンピュータが読み込みます。

数秒時間がかかるかもしれませんが、

ブラウザ上にJupyter labが登場すると思います。

ここまで出来たら、次はChromedriverというものをインストールする作業に移行します。

Chromedriverのインストール

Chromedriverをインストールする手順について説明します。

Chromedriverとは、Google Chromeを操作するのに必要なソフトのことです。

これがないとGoogle Chromeを操作することができません。

MacとWindowsとでChromedriverのインストール方法が異なるので、

ご自身のOSに適したインストール方法で行ってください。

Mac

まずは、Macの方のインストール方法を説明します。

homebrewをインストールしていない方がいれば、

まずはhomebrewをインストールします。

homebrewとはMac用のパッケージ管理システムのことです。

homebrewのインストール方法はいくつかのブロガーさんが記事を出されていますので、そちらを参考にしていただければと思います。

homebrewのインストールが完了したら、ターミナルを開いて下さい。

そして、

brew cask install chromedriver

と入力してください。

入力し終えたら、ENTERキーを押してもらい、

コンピュータはインストールを開始します。

Windows

続いてWindowsのユーザーのみなさんのインストール方法です。

Windowsでは、直接ダウンロードできるサイトまで行きます。

Googleなどの検索エンジンで、

chromedriver downloads

などと入力してもらえれば、一番上の検索候補に次の画像のようなサイトが登場すると思います。

 

このサイトはこちらをクリックしていただければ表示されます。

chromedriverダウンロードサイト

ダウンロードサイトを開いたら下記の画面が表示されます。

 

画像にも示しましたが、いくつかChromeのバージョンが記載されており、

何を選択すればよいか分からないと思います。

そこで、ご自身のChromeのバージョンを確認する必要があります。

Chromeのバージョン確認方法

Chromeのバージョンを確認するためには、

まずChromeを開きます。

そして、右上のGoogle Chromeの設定を行うアイコンをクリックします。

その後、ヘルプをクリックし、

「Google Chromeについて」

をクリックすると、Google Chromeのバージョンを確認することができます。

確認を終えたら、確認したバージョンの数字と最も近いバージョンのchromedriverをダウンロードするようにします。

chromedriverのダウンロード先は、

みなさんにとって分かりやすい場所にダウンロードしておいてください。

zipファイルでダウンロードされるので、

それを解凍し、

chromedriver.exe

といったファイルがダウンロードできていればOKです。

実際のコード

今回はこちらのコードを使用して、日本語版のGoogleサイトを開きます。

上がMac用、下がWindows用のコードとなっています。

#Macでのコード
!pip install selenium

from selenium import webdriver
import time
import pandas as pd

#Macでのコード
browser = webdriver.Chrome()
browser.implicitly_wait(3)

url_login = "https://www.google.com/?hl=ja"
browser.get(url_login)
time.sleep(3)
print("acsess_success")
#Windowsでのコード

!pip install selenium

from selenium import webdriver
import time
import pandas as pd
browser = webdriver.Chrome(executable_path = 'chromedriver.exeのファイルパス')
browser.implicitly_wait(3)

url_login = "https://www.google.com/?hl=ja"
browser.get(url_login)
time.sleep(3)
print("acsess_success")

Windows用のコードでは、

chromedriver.exeのファイルパスといった表記をしましたが、

みなさんがchromedriverを保存したファイルパスをそれぞれ入力してもらえれば大丈夫です。

このコードを実行して、

Googleの日本語版サイトが表示されれば成功です。

次回は、このコードの意味するところを解説していこうと思います。

今回は、Google Colaboratoryを使用しませんでしたが、

このことに疑問を抱いた方がいらっしゃったのではないでしょうか。

Google Colaboratoryを動かす環境がChromeというブラウザ上であり、

ブラウザを操作する権限がないので、今回はGoogle Colaboratoryは使用しませんでした。

そこで、今回説明したようにJupyter labを使用してchromeでのブラウザ操作を試みたわけです。

今回のコードはGitHubの方に載せておきますので、

ぜひ活用してください。

Pythonでブラウザ操作を自動化しよう①

GitHubの使用法が分からなければ以下の記事を参考にしてください。

【プログラミング初心者向け】GitHubって何?

30秒クッキング~一瞬でPythonを始める裏技~

それではまた次回お会いしましょう。

おぎー

“Pythonでブラウザ操作を自動化しよう①” への2件の返信

コメントを残す

メールアドレスが公開されることはありません。