Webサイトのテキスト情報を取得して解析する

Webサイトから文字情報だけを取得し、指定した単語がどれくらい含まれているかを解析するパソコン作業の自動化

ここでメインで紹介するのは、Webサイトからテキスト情報を取得するパソコン操作の自動化についてです。これが出来れば、そのあとにテキスト情報を解析し、「文字数はWebサイトの文字数はどのくらいか」、「指定した単語がどの程度の頻度で使用されているか」などを解析することが可能です。

VBScriptというWindowsを自動化操縦するためのマクロプログラムを用いて実現していきます。何もインストールする必要はありませんよ。

 

こんな方に読んで欲しい
・定期的にWebサイトをチェックして解析する必要がある人
・多くのWebサイトからテキスト情報を抜き出してくる必要がある人
・VBScriptでWebサイトの自動操作に興味のある方

 

 

インストールなし!5分でできるWebサイトからテキスト情報を抜き出す操作の自動化

まずは以下のプログラムコードを「Webサイトテキスト取得.vbs」というファイル名を作って書き込みましょう。ところで、拡張子は表示されていますか?「.vbs」の部分です。まだ表示させる設定にしていない方は「ファイルの拡張子を表示する設定」から設定後にこの先へお進みください。

書き込んだら、保存して閉じます。完成です。これで、本サイトのトップページのテキスト情報を取得するためのプログラムが完成しました。

早速プログラムを実行してみましょう。「Webサイトテキスト取得.vbs」をダブルクリックするだけです。すると、プログラムがある場所と同じフォルダに「サイトテキスト情報.txt」というファイルが作成されたはずです。この中にサイトのテキスト情報が記載されています。下の画像は「サイトテキスト情報.txt」の中身の一部です。

 

さて、自分専用のプログラムにするためにはプログラムのコードを少し編集する必要があります。本サイトのトップページではなく、自分がテキスト情報を取得したいWebサイトに対するプログラムに書き換えてみましょう。

そのためには11行目の、

objIE.Navigate “https://pc-automation.tech/wp/”
 

「https://pc-automation.tech/wp/」の部分を自分の好きなURLに変更しましょう。これで、そのサイトの情報を取得できるようになりました。

また、テキスト情報を書き出すファイル「サイトテキスト情報.txt」の名前を変えるには23行目の、

Set objFile = objFSO.OpenTextFile(“サイトテキスト情報.txt”, 2, True,-1)
 

「サイトテキスト情報.txt」の部分を自分の好きな出力ファイル名に変更してください。

 

さて、このようにして抜き出したサイトのテキスト情報はまた別のプログラムで解析することができます。例えば、抜き出したテキスト情報から文字数と指定した単語の数を取得したい場合には、「ドラック&ドロップするだけでファイルの様々な情報をチェック」で紹介したようなプログラムを使えば実現できます。

ただし、前回は文字数と指定した単語の数の情報はメッセージボックスに表示させるようにしていましたが、今回はこれもテキストファイルに書き出すように編集してみましょう。以下のコードを「サイトテキスト情報の解析.vbs」と名前を付けたファイルへ保存します。

書き込んだら保存して閉じましょう。「サイトテキスト情報の解析.vbs」ファイルの上に「サイトテキスト情報.txt」をのせてみてください。

「サイトテキスト情報の解析結果.txt」という解析結果ファイルが作成されましたか?この中に「サイトテキスト情報.txt」の解析結果、すなわち今注目しているサイトの解析情報が書き出されたのです。下の画像が結果ファイルの内容です。

ここでは、このサイトの文字数と「自動化」という単語がいくつ含まれているかを書き出しました。ここを自分の欲しい情報を書き出すように改良していくとより使いやすいプログラムとなるでしょう。ちなみに、「自動化」ではなく違う単語の数を数えるように変更したい場合は、37行目の

searchWord = “自動化”
 

の「自動化」を自分の好きな単語へ変更しましょう。

 

おわりに

ここでは、Webサイトのテキスト情報を取得して解析する方法について紹介しました。VBScriptと呼ばれる二つのプログラムを記載しましたが、プログラミングを知らない方には結構複雑なプログラムに見えたかもしれません。

しかし、実際に学んでみるとここで書かれているコードは単純なものばかりです。それが少し多めに書かれてあるに過ぎません。ここで紹介したプログラムの例に限らず、普段のパソコン作業を自動化するために必要なプログラムはどれも単純なコマンドだけで実現できるものばかりです。

パソコン自動化プログラミングはプログラミング初心者の方が始めるには持って来いの題材であると考えています。興味がありましたら、「パソコン作業の自動化プログラミング 無料体験レッスン」を受講してみませんか?

自動化プログラムの作成を依頼しませんか?

普段の面倒な単純作業を自動化しませんか?

幣サイトでは、Windowsパソコンの自動化プログラムの作成サービスを行っています。

本サービスの特徴は、

・安価な値段
・個人から法人までどなたでも対応
・お客様の要望を全力で実現

です。

安いからといって、決して手は抜きません。

まずは、下のボタンからWindowsパソコンの自動化プログラムの作成サービスの詳細をご確認ください。

    コメントを残す

    メールアドレスが公開されることはありません。

    日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)