1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

Excelをノーコードで自動化しよう! パワークエリの教科書 第23回 Webページからデータを取得する方法

マイナビニュース / 2024年10月15日 11時0分

(1)Webページからデータを取得する
(2)データ表を“適切な形”に整理する
(3)加工したデータ表をExcelにテーブルとして出力する

という処理が再実行され、「最新のWebページ」を反映させた形でデータを取り込むことが可能となる。たとえば、2日後に「すべて更新」をクリックした場合、取得されるデータが2日分増えて「8月16日まで」のデータが表示されるようになる。

このように、手軽に最新データに更新できることもパワークエリならではの利点といえる。いちいち手作業でデータを取得しなおす必要はない。「すべて更新」をクリックするだけで、現在のWebページに即したデータを取得することが可能だ。

ちなみに、データの自動更新が有効になるための条件は以下の2つ。

・URLが変更されていない
・データ表の構造が変化していない

上記の2つを満たしていれば、「すべて更新」をクリックするだけで、問題なく最新データに更新できるだろう。
Webページからデータを取得した例

見た目が「表」になっていなくても、Webページからデータを取得できるケースもある。思い通りにデータを取得できるかはケース by ケースになるが、いくつか例を紹介しておこう。

以下の図は、「毎日新聞」のWebサイトで「1日のアクセス数ランキング」のページを閲覧した例だ。2024年8月15日にWebページを閲覧したので、前日の8月14日のアクセス数ランキングが表示されている。

パワークエリを使って、このWebページからデータを取得すると、以下の図のようなデータを取得できた。列名が「Column1」や「Column2」などになっているが、それ以外は特に問題なくデータを取得できているようだ。

文字数(Column4)の列を削除し、各列に適当な「列名」を入力してからExcelに出力する。その後、テーブルの書式を調整すると、以下の図のような形でデータをExcelに取り込むことができた。

もちろん、データの自動更新にも対応している。以下の図は、2日後である8月17日に「すべて更新」をクリックした例だ。テーブルの内容が「8月16日時点のアクセス数ランキング」に更新されているのを確認できる。

このように掲載元のWebページが「表」の形式になっていなくても、文字情報だけを問題なく取得できるケースもある。

もうひとつ例を紹介しておこう。以下の図は、「ORICON NEWS」のWebサイトで「デイリー シングルランキング」のページを閲覧した例だ(2024年8月13日付のランキング)。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください