1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

Excelをノーコードで自動化しよう! パワークエリの教科書 第24回 汚れたデータを洗浄、「書式」コマンドの使い方

マイナビニュース / 2024年10月21日 11時0分

画像提供:マイナビニュース

「Power Query エディター」には「書式」という名称のコマンドも用意されている。このコマンドには、大文字/小文字の統一、トリミング、クリーン、プレフィックスの追加、サフィックスの追加、といった機能が集められている。頻繁に使用するコマンドではないが、いざという時に役立つコマンドなので、その使い方を学んでおくとよい。
データクレンジングにも使える「書式」コマンド

今回は「書式」コマンドの使い方を紹介していこう。データクレンジングをはじめ、さまざまな用途に活用できるコマンドとなるので、その処理内容をひととおり把握しておくとよい。

「データクレンジング」とは、データに混在したゴミの除去、表記ゆれの解消、重複データの削除などを行うことにより、一貫性のある扱いやすいデータに加工する作業のことを指す。「データスクラビング」や「データクリーニング」と呼ばれる場合もある。

「書式」コマンドには、大きく分けて以下の4つの機能が用意されている。

・余計なスペース文字を削除する
・セル内の改行を解消する
・アルファベットの大文字/小文字を統一する
・データの前後に文字を追加する

それぞれの処理内容について簡単に説明していこう。
「トリミング」で余計なスペースを削除する

最初に紹介するのは、データに含まれる“余計なスペース文字”を削除してくれる「トリミング」だ。以下の図は、名簿データを「Power Query エディター」に取得した例だ。この図をよく見ると、「氏名」の列に“余計なスペース文字”が混在していることに気付くと思う。

「文字が小さくて分かりづらい……」という方は、「表示」タブにある「等幅」をONにしてみるとよい。データが“等幅フォント”で表示されるようになり、「半角スペース」の有無を確認しやすくなるはずだ。

こういった“余計なスペース文字”を残しておくと、以降のデータ処理に悪影響を及ぼす恐れがある。よって、事前にデータを洗浄しておくのが基本だ。「氏名」の列を選択し、「変換」タブにある「書式」→「トリミング」を選択する。

すると、「氏名」の列から“余計なスペース文字”を削除できる。

このように、指定した列から“余計なスペース文字”を削除してくれる機能が「トリミング」となる。念のため、その処理内容について補足しておこう。

◆トリミングの処理内容
・データの「先頭」または「末尾」にあるスペース文字を削除する
・データの「途中」にあるスペース文字は削除されない

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください