1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

Excelをノーコードで自動化しよう! パワークエリの教科書 第19回 少しだけ高度な「抽出」の使い方

マイナビニュース / 2024年9月17日 13時0分

このように、すでに指定されている処理(ステップ)の設定を後から変更することも可能だ。これは「抽出」コマンドに限った話ではなく、「歯車」のアイコンが表示されているステップであれば実行可能な操作といえる。処理手順を指定しなおす手間を簡略化できるので、この機会に覚えておくとよいだろう。
区切り記号の補足

続いては、前回の連載で紹介した「抽出」コマンドの少し応用的な使い方を紹介していこう。

たとえば、以下の図に示した「所属」の列から「東京本社」や「△△支社」の文字だけを抽出したいとしよう。この場合、区切り記号に「社」の文字を指定して、それより前にあるデータを抽出すればよい、と考えられる。この処理を「変換」タブにある「抽出」コマンドで実行してみよう。

結果は以下の図の通り。区切り記号に指定した「社」の文字は抽出対象にならないため、「東京本」や「名古屋支」といったデータが抽出されてしまう。

「抽出」コマンドに「区切り記号を含めて抽出する」というオプション設定があればよいのだが、残念ながら、そういった指定はできないようだ。では、どうすればよいか? このような場合は、後から自分で「区切り記号」の文字を追加してあげればよい。

データの末尾に“好きな文字”を追加したいときは、「変換」タブにある「書式」コマンドから「サフィックスの追加」を選択する。

続いて、データの末尾に追加する文字を指定し、「OK」ボタンをクリックする。

すると、各データの末尾に「社」の文字が追加され、「区切り記号」に指定した文字を含めた形でデータを抽出できるようになる。

このテクニックは第14回の連載で紹介したものと同じになるが、データを「抽出」する際にも活用できるので、この機会に復習しておくとよいだろう。
詳細設定オプションを指定したデータの抽出

次は、データ内に「区切り記号」となる文字が何回も登場する場合の対処方法を紹介していこう。

以下の図は、会員情報のデータを「Power Query エディター」に取得した例だ。ただし、かなり扱いづらい形で各データが記録されている。各会員の情報は、都道府県、生年、性別、メールアドレスが「/」(スラッシュ)で区切られて“1つのデータ”として登録されている。

このデータから「性別」のデータだけを抽出する場合を考えていこう。この場合、“2番目のスラッシュ”と“3番目のスラッシュ”の間にあるデータを抽出すればよいことになる。よって、抽出方法に「区切り記号の間のテキスト」を選択する。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください