ノーコードでデータ収集が可能なツール【parsehub】

定期的なネット上でのデータ収集、自動化できたら便利だとは思いませんか?

例えば、自社製品と競合している他社の製品の市場価格、買い物の際のセール情報、新製品チェックなどの情報取得です。

製品名や価格など、取得したい事柄が絞られている際は、スクレイピングという技術を使っての情報の自動収集が便利です。今回は、スクレイピングツールのparsehubをご紹介します。

サービス概要

parsehubトップ画面
parsehub-top


【商品名】ParseHub
【商品の特徴と尖ってるポイント】
 ・ノーコードで手軽にスクレイピングできる
 ・実践型チュートリアル
 ・定期稼働可能
【企業名】Debuggex, Inc.
【会社所在地】カナダ
【URL】https://www.parsehub.com/
【価格】月149ドル~(無料体験版あり)

サービスの詳細

parsehubはソフトウェアとして提供されています。まずはインストールファイルをダウンロードしましょう。

Mac版、Windows版、Linux版があります。

Parsehubインストールファイル選択画面
Parsehub-DL

こちらがホーム画面です。定期スクレイピングの設定もここで行います。

parsehubのhome画面
parsehub-home

さっそくスクレイピングの設定をしていきましょう。
parsehubソフト内にはChromeブラウザが内蔵されていて、そこで希望の動きを操作したり・チェック項目を指定することで情報取得を自動化させていきます。

プロジェクトスタート画面
parsehub-start

初回から数回の操作では、新しいことを始めるたびにチュートリアルが起動します。
これはユーザーに直接操作を促す実践的なものです。途中で離脱も可能です。

チュートリアルは画面左下に
parsehub-tutorial

操作は左カラムをメインに利用します。

parsehubは基本的にクリックで操作します
parsehub-edit

例えば商品情報であれば、商品名と価格をリンクさせて取得していきます。

抽出情報の紐付け
parsehub-link

取得情報のチェック画面です。

抜き出したい情報を強調表示
parsehub-extract

今回は、オークションサイトのebayでスピーカーの商品情報と価格を取得していきましょう。

オークションサイトの値段をチェック
parsehub-sauce

スクレイピングにかかる時間は、取得希望情報量に応じて変わります。今回は100商品3項目だったので数分で終了しました。

データのエクスポートはCSV, JSON, APIの3種類が選択可能です。

スクレイピング終了画面
parsehub-fin

今回はCSVでダウンロードしました。商品名と価格を取得できています。

CSVで抽出情報を書き出し
parsehub-result

サブスクリプション価格は、月149ドルからです。

parsehubの価格表
parsehub-price

著者の勝手に評価

サイトの総評

スクレイピングソフトは様々なメーカーから出されていますが、parsehubは特にチュートリアルと操作の勉強法が充実していると感じました。
何かを始めようとすると問答無用でチュートリアルが始まるので、少し戸惑いますが「ここを押すとこう反応し、フィードバックがこれ」と直感的に理解できます。
マニュアルを読んだり動画で確認したければ「ドキュメント」としてまとめられているので、そちらを利用しましょう。

表示画面・操作・チュートリアル・マニュアルは、全て英語表記です。日本語化は一切されていません。この点、競合ソフトより使い勝手が劣ります。あわせて対象が日本語サイトですと、スクレイピングが成功したり失敗したりと安定しませんでした。

いろいろと試行錯誤しているうちに試用版の上限Job数はすぐに達してしまうので、使い込んでいくには、ある程度の勉強とサブスクリプションへの加入が必要です。

多少の慣れが必要ですが、定期的に自動でデータ収集をしたい方には、うまくフィットするのではないでしょうか。

※日本語化されているスクレイピングソフトには、Octoparseがありますので併せて確認してみてください。

勝手に星で採点

       
評価項目 評価 ★5点満点
使いやすさ ★★★☆☆
価格 ★★☆☆☆
目新しさ ★★★☆☆
業務効率貢献度 ★★★★☆
知っててドヤれる ★★★☆☆

注) 当サイトの独断と偏見に基づいて評価しておりますので、参考程度と捉えていただきますよう予めご了承願います。