1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

Excelをノーコードで自動化しよう! パワークエリの教科書 第23回 Webページからデータを取得する方法

マイナビニュース / 2024年10月15日 11時0分

これらのうち、「列名」として取得されているは1階層目のみ。2階層目以降の“見出し”は「データ」として取得されてしまっている。これを適切な形に整理するには、2階層目以降の“見出し”も「列名」に含めるように、自分で「列名」を入力しなおさなければならない。

とはいえ、すべての「列名」を入力しなおすのは面倒なので、先に“不要な列”を削除しておこう。ここでは「降水量の合計」、「最高気温」、「平均湿度」の3つが必要な場合を例に話を進めていく。この場合、「気圧」などの列は不要なので、これらの列を削除する。

不要な列を削除できたら、それぞれの「列名」を内容が理解できるように修正していく。たとえば、「気温(℃)」→「最高」→「値」という階層になっていた列は、「最高気温(℃)」という列名に修正すると内容を理解できる。同様に、「湿度(%)」→「平均」の列は、「平均湿度(%)」で内容を理解できるはずだ。

これで「列名」の修正は完了。不要になった“1~3行目のデータ”を削除しておこう。この処理は、「行の削除」→「上位の行の削除」を選択し、削除する行数に「3」を指定すると実行できる。

最後に、各列の「データ型」を指定する。小数点以下を含む数値データの場合は「10進数」、小数点以下を含まない数値データの場合は「整数」のデータ型を指定するのが基本だ。このとき、「--」の文字列がErrorになってしまうが、これらのセルは出力時に「空白セル」に置き換わるので、Errorのまま放置しておいても構わない。

「閉じて読み込む」をクリックしてデータ表をExcelに出力し、各列に「表示形式」を指定すると、以下の図に示したようなテーブルを得ることができる。

以上が、Webからデータを取得するときの大まかな流れとなる。「データ表をどのように整理していくか?」は取得元の状況に応じて変化するが、たいていの場合、特に問題なくデータを取得できるだろう。
クエリの更新による最新データの取得

パワークエリならではの利点は、手軽に“最新データ”に更新できること。これはWebからデータを取得した場合も同様だ。先ほどの例を使って詳しく解説していこう。

データを取得したのは8月15日で、その時点では8月14日までのデータがWebページに掲載されていた。よって、Excelに取得されるデータも「8月14日まで」となる。その後、再びExcelファイルを開き、「データ」タブにある「すべて更新」をクリックすると、

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください