1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

Excelをノーコードで自動化しよう! パワークエリの教科書 第18回 既存の列からデータを「抽出」する処理

マイナビニュース / 2024年9月9日 11時0分

先頭にある「県」を削除する手順は第15回の連載で詳しく解説しているので、よく分からない方はあわせて参照しておくとよいだろう。これで、以下の図のような結果を得ることができる。

このように、「抽出」コマンドを使って「住所」から「都道府県」や「それ以降の住所」だけを抜き出す方法もある。関数を使用する方法よりも「手軽で理解しやすい」と感じる方が多いのではないだろうか? 文字列データを処理するときの参考にして頂ければ幸いだ。
「変換」タブにある「抽出」コマンド

これまでは「列の追加」タブにある「抽出」コマンドの使い方を解説してきたが、「変換」タブにも「抽出」コマンドが用意されている。続いては、「列の追加」タブと「変換」タブの違いについて補足しておこう。

「変換」タブにある「抽出」コマンドも基本的に同じ操作手順で使用できる。ここでは、抽出方法に「最初の文字」を選択し、「先頭から3文字」のデータを抜き出した例を紹介しておこう。

「変換」タブの場合は、「新しい列」が追加されるのではなく、抽出元の列が「抽出後のデータ」に置き換わる仕組みになっている。上図の場合、「住所」のデータが「最初の3文字」のデータに置き換えられることになる。

データ表を加工する目的が「都道府県で分類すること」であった場合、「都道府県」のデータを抽出できたら「住所」の列は不要になるはずだ。これを「列の追加」タブにある「抽出」コマンドで処理すると、

(1)「住所」の列から「都道府県」のデータを抽出する(新しい列が作成される)
(2)作成された列の列名を「都道府県」などに変更する
(3)神奈川、和歌山、鹿児島のデータに「県」の文字を追加する
(4)列の並び順を変更する
(5)「住所」の列を削除する

といった手順を踏まなければならない。一方、「変換」タブにある「抽出」タブを使った場合は、(4)と(5)の手順を省略することが可能となり、より少ない工数で処理を完了できるようになる。

このように、「変換」タブを使用した方が少ない工数で処理を完了できるケースも少なくない。目的や状況に応じて「変換」タブと「列の追加」タブを使い分けられるように、両者の違いをよく理解しておく必要があるだろう。
「抽出」コマンドで文字数をカウントする

最後に、抽出方法に「長さ」を選択したときの動作を紹介しておこう。この場合は“データの抽出”ではなく、“文字数のカウント”が行われる仕組みになっている。

上図のように操作した場合、「氏名」の列にあるデータの“文字数”をカウントした結果が抽出される。結果を比較しやすいように、「抽出元の列」を「抽出後の列」の並べて配置した例を紹介しておこう。

今回の例では、姓と名の間に「半角スペース」が挿入されている。この場合、「半角スペース」も1文字としてカウントされる。よって、「清水 浩樹」は5文字、「荒川 俊」は4文字、……という結果になる。「長さ」の列には、これらの数値が「整数型」のデータとして抽出される。

このように、「長さ」はデータを抽出する機能ではなく、スペースを含む“文字数”をカウントする機能となる。なぜ「抽出」コマンドに含まれているのかは不明であるが、文字数をカウントしたい場合に便利に活用できるので、この機会にあわせて覚えておくとよいだろう。
(相澤裕介)



この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください