データサイエンティストの仕事は奪われない 「Kaggle Grandmaster」が語るデータ分析の本質

ITmedia NEWS / 2019年10月21日 19時42分

写真

日本経済新聞でデータサイエンティストを務める「Kaggle Master」の石原祥太郎さん

 「AutoML(などの自動化ツール)はデータサイエンスのプロセスの一部を効率化できますが、データサイエンティストの業務全体を置き換えることはあり得ないと思います」

 「よくAutoMLでデータサイエンティストの仕事がなくなるといわれますが、本当にそれで仕事がなくなら、もうなくなってるんじゃないでしょうか」

 10月17日に開催されたデータサイエンティスト協会のシンポジウムで、こんなやりとりがあった。登壇したのは、パナソニックの阪田隆司(ビジネスイノベーション本部 AIソリューションセンター)さんと、ディー・エヌ・エー(DeNA)の小野寺和樹さん。

 2人は、データ分析や機械学習のコンペに参加できるプラットフォーム「Kaggle」(カグル)で、最高位である「Grandmaster」の称号を持つ(注1)。Kaggleは全世界で300万人以上のAI研究者や技術者が参加するサービスで、Grandmasterは日本では10人ほどしかいないという。

注1:Grandmasterになるには、Kaggleのコンペで5つのゴールドメダルを獲得する必要がある。Kaggleはチームでも取り組めるが、5つのうち1つはソロゴールド(1人参加)でなければならない

 数少ないGrandmasterの2人は、Kaggleと業務におけるデータ分析をどう結び付けているのか。Kaggleの魅力や、Grandmasterになって見えた景色などについて語った。モデレーターは、日本経済新聞でデータサイエンティストを務める「Kaggle Master」の石原祥太郎さん(デジタル事業情報サービスユニット)。

●「機械学習の初心者」からGrandmasterに

 小野寺さんは大学で経済学を専攻し、阪田さんは大学院で航空宇宙工学を専攻していた。両者とも機械学習とKaggleは社会人になってから触れたという。チームでコンペに臨むことが多いという小野寺さんは、「数学的なバックグラウンドがないので、数学が詳しいメンバーに助けてもらっています。私は特徴量エンジニアリング(注2)が得意のようです」と役割分担について語った。

注2:機械学習モデルの精度向上に向けて、追加の変数(特徴量)を作ってデータセットに追加すること

 大学と大学院で機械学習を学んでいた石原さんは、「大学ではSVM(サポートベクターマシン)など有名な手法を学びますが、それがKaggleの文脈では必ずしも使われないことがあり、理論と実践の両方で良い勉強になっています」と話す。阪田さんも「理論を知っているだけじゃKaggleでは良い順位を取れません。実際に手を動かして、体系化しにくいノウハウを実体験に基づいて学べるのがKaggleの良い所です」と続ける。

この記事に関連するニュース

トピックスRSS

ランキング