1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

Excelをノーコードで自動化しよう! パワークエリの教科書 第19回 少しだけ高度な「抽出」の使い方

マイナビニュース / 2024年9月17日 13時0分

2つの区切り記号には、それぞれ「/」の文字を指定すればよい。続いて、詳細設定オプションを開くと、それぞれの区切り記号について“N番目”を指定できるようになる。開始の区切り記号は、「入力の先頭から」数えて「1」つスキップすると“2番目のスラッシュ”を指定できる。終了の区切り記号は、「開始区切り記号」の次に出現するスラッシュとなる。よって、スキップする数に「0」にすると“3番目のスラッシュ”を指定できる。

このように、詳細設定オプションを指定すると、“N番目に出現する区切り記号”を自由に指定することが可能となる。抽出結果は、以下の図の通り。「性別」だけを正しく抽出できていることを確認できるだろう。

なお、いちいち“N番目”を指定するのが面倒な場合は、「/」を区切り記号にして「列の分割」を実行してもよい。この際のポイントは「区切り記号の出現ごと」に列を分割するように指定すること。

すると、それぞれのデータを異なる列として扱えるようになる。

あとは不要な列を削除して、「列名」を適当に変更するだけ。この方法でも「性別」のデータだけを抽出することが可能だ。むしろ、こちらの手法の方が「抽出」コマンドを使用するより簡単で確実といえるかもしれない。
数値や日付からデータを抽出

「抽出」コマンドは、データ型が「テキスト」の列を対象に使用するのが一般的であるが、他のデータ型でも使えない訳ではない。いくつか例を紹介しておこう。

まずは、データ型が「日付」の列を対象にした例だ。この場合は、区切り記号に「/」の文字を指定するのが一般的だ。たとえば、抽出方法に「区切り記号より前のテキスト」を選択し、スキップ数に「0」を指定すると、最初に出現する「/」より前にあるデータだけを抽出できる。

結果として、日付データから「年」の部分だけを抜き出すことが可能となる。

ただし、抽出したデータは、データ型に「テキスト」が指定されていることに注意しなければならない。これを数値として扱いたい場合は、データ型を「整数」などに変更しておく必要がある。

次の例は、データ型が「10進数」の列を対象にした例だ。この場合は、「.」(ピリオド、小数点)を区切り記号にしてデータを抽出する、などの操作が行える。たとえば、抽出方法に「区切り記号より前のテキスト」を選択すると、「.」より前にあるデータだけを抽出できる。

結果として、小数点以下を切り捨てた「整数」の部分だけを抜き出すことが可能となる。

こちらも、データ型に「テキスト」が指定されていることに注意しなければならない。計算可能な数値データとして扱うには、データ型を「整数」などに変更しておく必要がある。

このように、「テキスト」以外の列を対象に「抽出」コマンドを使用することも可能であるが、実際には、このような使い方をする機会は滅多にない。というのも、日付データを加工する「日付」コマンド、数値データを整数にする「丸め」コマンドなどが別途、用意されているからだ。よって、最後に紹介した使い方は参考程度に捉えておけば十分である。
(相澤裕介)



この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください