1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

Excelをノーコードで自動化しよう! パワークエリの教科書 第18回 既存の列からデータを「抽出」する処理

マイナビニュース / 2024年9月9日 11時0分

前述した例とは逆に、“特定の文字”より後にある文字だけを抽出することも可能だ。この場合は、抽出方法に「区切り記号の後のテキスト」を選択して操作を進めていけばよい。

抽出方法に「区切り記号の間のテキスト」を選択した場合は、以下の図のように2つの「区切り記号」を指定する設定画面が表示される。

たとえば、「4月」と「の売上」を区切り記号に指定すると、「4月」と「の売上」の間にある文字だけを抽出することが可能となる。結果として、「X日」の部分だけを「新しい列」に抽出できることになる。

「文字数」を指定してデータを抽出する

“特定の文字”ではなく、“文字数”を基準にデータを抽出する方法も用意されている。この場合は、以下の図に示した3項目の中から抽出方法を選択すればよい。

ここでは、「住所」の列から「都道府県」だけを抜き出す場合を例に操作手順を解説していこう。“先頭からN文字”のデータを抽出するときは「最初の文字」を選択し、抽出方法の設定画面で「文字数」を指定すればよい。今回の例では「3」を指定して、「OK」ボタンをクリックする。

すると、「先頭から3文字」を抽出したデータで「新しい列」を追加することができる。

以降の操作手順は、第15回の連載で紹介した内容と同じだ。「値の置換」コマンドを使って、県名が4文字になる都道府県に「県」の文字を追加してあげればよい。具体的には、「神奈川」→「神奈川県」、「和歌山」→「和歌山県」、「鹿児島」→「鹿児島県」といった3つの置換を行えばよい。

同様に、データの“末尾からN文字”を抽出することも可能だ。この場合は、抽出方法に「最後の文字」を選択し、抽出する「文字数」を指定する。

抽出方法に「範囲」を指定した場合は、「先頭のN文字を除いてM文字分」のデータを抽出できるようになる。たとえば、「先頭の3文字を除いて50文字分」のデータを抽出するときは、以下の図のように数値を入力すればよい。

すると、「4文字目から50文字分」を抽出したデータで「新しい列」を追加することができる。抽出するデータが50文字に満たない場合は、「4文字目から最後まで」のデータが抽出されることになる。

この抽出結果は、その大半が「都道府県以降の住所」になる。ただし、県名が4文字になる住所は、最初に「県」の文字が残ってしまう。この「県」の文字を削除すると、全データを「都道府県以降の住所」として扱えるようになる。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください