Infoseek 楽天

「リクナビ」内定辞退予測サービス、個人データ不正利用の深刻さ - 冷泉彰彦 プリンストン発 日本/アメリカ 新時代

ニューズウィーク日本版 2019年8月20日 16時30分

<本人にとって不利な個人データの不正利用が組織的かつ大規模に行われていた相当に悪質な事例>

就職情報サイト「リクナビ」を運営するリクルート系列の「リクルートキャリア」が、契約した企業に対して就活学生が「内定辞退する確率データ」の販売していた事実が明るみに出ています。当初の報道では38社が料金を払ってサービスを受けているそうで、その後、徐々に利用した企業が名乗り出てきています。その中にはトヨタ、ホンダ、大和総研、レオパレスなどの企業が含まれており、リクルート自身も採用活動の中で利用していたことを公表しました。

内定辞退確率データの販売については、徐々に批判が高まっている中で、報道によれば7983人分のデータが、本人が同意していないのに提供されていたことが判明しています。就活生の中には不快感が広まっているという報道もありますが、当然だと思います。

筆者は1980年代という遠い昔のことではありますが、日本の中堅企業で新卒採用のリーダーをしていた時期があり、その経験をもとに考えると、やはり相当に悪質な事件と言わざるを得ないと思っています。

問題は2段階に分けて考えるべきと思います。まず、リクルートキャリアの説明では、昨年の就活におけるサイト閲覧のデータから、人工知能(AI)がアルゴリズムで抽出したものが使用されているとされています。つまり、ビッグデータを使っているというのですが、これはおそらく次のような作業だと考えられます。

昨年の就活において、「リクナビ」のサイトには何十万人という就活生が訪問して、様々な活動をサイト上で行ったわけです。そのデータを使って、次のような分析をしたことが推測されます。

ある人が就活の時期に、リクナビのサイトで各社のサイトを閲覧したとして、「内定が出て実際にその会社に就職した場合、その会社の閲覧パターン」「内定したが辞退した場合、その会社の閲覧パターン」などをAIを使って、つまり相当に大きなデータを統計処理する形で集めていったのでしょう。その上で、全体的なパターンを分析していったのだと思います。

報道では、非常に単純化して「内定を出した会社の側から見て、前年に辞退した学生が内定後にも他社サイトを閲覧していたデータ」などを分析してパターンを発見していったような説明がされています。

おそらくそれだけではないはずです。辞退された会社の側から見て、自社が内定を出す前に、とっくに内定が出ていて「そっちが本命だった」場合には、自社が内定を出した「後にまだ閲覧を続けていた」というケースには当てはまりません。むしろ、自社より先に内定していた会社が結局本命だったというケースの方が、もしかしたら大きいかもしれず、そうしたケースも漏らさずパターンとして認識していた可能性はあると思います。



仮にそうであれば、いくら昨年のケースであってデータが過去形であり、またビッグデータとして匿名化されているにしても、非常にプライベートな情報になります。また、閲覧履歴だけでなく、リクナビを通じたエントリーシートの記入に関するデータ、つまり所要時間とかコピペの有無、記入と同時に参照したページなどの記録になれば、よりプライベートなものとなります。

ビッグデータだとか、アルゴリズム、人工知能などというと「何か最先端の技術が使われている」とか「匿名性で安全な世界」というようなイメージを抱きがちですが、どう考えても、この「内定辞退率」の算出を目的として考えると、使用された個々のデータは相当に高度なプライバシー情報と考えられるのです。

今回の辞退率予測については、こうして得られた「アルゴリズム」を、実際に2019年の就活生の個別データに当てはめて、算出されているという説明です。

昨年データのビッグデータ化、アルゴリズム化だけでもプライバシー侵害の可能性があるわけですが、そのアルゴリズムを今年のデータ、つまり個別データに適用する場合、プライバシーの侵害度は数段高くなります。

例えば、2019年にA社が内定を出した就活生Cさんに対して、Cさんが別の会社であるB社のサイトを閲覧したパターンを、前年の多くのパターンから導き出したアルゴリズムで分析するだけでなく、B社以外のCさんに内定を出しそうな多くの他社サイトの閲覧データも分析して、最終的にB社に就職する確率を算出、それを100からマイナスすれば辞退率が出るわけです。

その際には、B社をはじめとしてA社とは全く関係のない他社サイトをCさんが閲覧したデータが、加工された形で、A社に流れるわけです。これは前年のものとは違う個別データであり、しかも匿名ではありません。予測の計算は、すべて個別の名前の入った情報が処理されて、個人ごとに辞退率が算出されるのです。

そして、Cさんとしては、自分のあずかり知らないところで、「辞退率58%の学生」などという情報がリクルートキャリアからA社に示され、結果的に「辞退するかもしれないので、拘束や監視を強める対象」にされたり、「計算外とみなされて、場合によっては面接や試験のパフォーマンスを不利に判定されたり」することになります。

リクルートキャリアや、このサービスを利用したと公表している企業は、このうちの後者、つまり辞退予測に基づいて不合格にしたケースはないとしています。ですが、内定者数全体の管理としては、辞退率を前提に「水増し内定」を行ったり、「現在内定を出しているグループから辞退が出ることを前提に、次善のグループには合否連絡を遅らせたり」するということはあったと思います。

ということは、やはりデータを見られて辞退率を計算された就活生本人以外を含めて、このような不正なデータ提供により、振り回された就活生は数多く存在したということが推測できます。

勿論、この問題について、新卒一括採用がいけないとか、どの会社も「第一志望」と言わざるを得ない就活カルチャーの問題が背景にあるという指摘は間違っていないと思います。また、このような問題を生んだことが、新卒一括採用の行き詰まりを示しているという意見にも同意します。

ですが、その議論を行う前に、これほどまでに組織的な個人情報の不正利用、しかも本人に不利な形での不正利用というのは、もっと厳しく実態が解明されて、責任を問われてもいいと思います。

【お知らせ】ニューズウィーク日本版メルマガのご登録を!気になる北朝鮮問題の動向から英国ロイヤルファミリーの話題まで、世界の動きをウイークデーの朝にお届けします。ご登録(無料)はこちらから=>>


この記事の関連ニュース