インサイトラボ新潟Blog

Octoparse実用編【スクレイピングツール】

作成者: BI LAB編集室|2020年7月29日

OctoparseでWebサイトからデータを取得する方法

順を追って解説します。

 

1.前回の続きよりデスクトップに作成されたOctoparseのアイコンをクリックするとログイン画面が表示されます。登録したユーザ名とパスワードを入力してログインしてください。

 

2.今回はカスタマイズモードで実行しますので、オレンジ枠の部分をクリックしてください。



3.指定したURLをコピーして貼り付けます。今回は新潟市北区の保育園情報になります。
http://www.city.niigata.lg.jp/smph/kita/shisetsu/kosodate/hoikunyuuen.html

 

4.URLを保存すると、以下の画面に遷移し画面下部にWEBサイトが表示されます。

 

5.表の左上(公・私)を選択すると、以下の画面の表示のようになります。

 

6.操作のヒント画面のオレンジ枠の部分をクリックします。

 

7.画面のすべてのサブ要素を選択するをクリックします。

 

8.すべて選択 をクリックします。

 

9.選択したデータを抽出する をクリックします。

 

10.画面の左側に取得するデータの一覧(項目)が表示されます。問題なければ、右下のOKボタンを押してください。

 

11.抽出開始ボタンを押して、実際に抽出してみます。

 

12.画面のローカル抽出をクリックします。

 

13.出力する準備ができましたら、エクスポートボタンを押してください。

 

14.データフォーマットを選択して、エクスポートボタンを押してください。

 

15.問題なければ、完成ボタンをおして出力先に指定したフォルダのファイルを確認します。

 

16.以下のようにファイル出力ができたら、完成です。

 

このように、操作を覚えると簡単にデータ出力が可能となります。タスク保存をすることでWEBサイトの情報が更新された場合には、抽出開始を押すだけで出力が可能となります。このデータをTableauなどのデータ分析や可視化ツール等で取り込むことで様々なデータをより分かりやすく見ることが可能となります。

 

1回目の記事はこちら👇

Octoparseインストール編【スクレイピングツール】