<コンピュータによる全文解析でベストセラーが予測できる、とする書籍が近々米国で出版され、既に賛否両論を巻き起こしていている>
ベストセラーの秘訣が「解読」出来たという、出版関係者にとって気になる本が近々米国で出版される。全文解析という、非マーケティング系の技術を使ったアプローチが最大のポイントで、すでに賛否両論を巻き起こしているようだ。もし有効性が認められ、普及すれば、編集者の仕事にも影響を及ぼしそうだ。
全文解析が導くベストセラーのアルゴリズム
「ベストセラー」の秘密を掴むことは、出版界の永遠のテーマで、本のテーマにもなってきた。9月20日にマクミラン系のセント・マーティンズ社から刊行される『ベストセラー・コード』(The Bestseller Code: Anatomy of the Blockbuster Novel Hardcover, by Jodie Archer, Matthew L. Jockers, St. Martin's Press, 2016)はその最新のものだが、デジタル人文学の専門家でネブラスカ大学のマシュー・ジョッカー教授と、ペンギンUKの編集者やアップルの研究職を経て独立したライター、ジョディ・アーチャー氏の共著者コンビが、「ある原稿がNYタイムズ紙ベストセラー・フィクションのトップを占める確率を97%の確度で予想するアルゴリズム」について語る、という売り文句は十分に訴求力がある。
著者たちのアプローチは、現在のベストセラー・リストから、トーンやムード、話題、スタイルを読み取り、読者の嗜好や願望をアルゴリズム化し、原稿と対照してスコア化するというものだ。技術的な詳細は不明だが、方法的には合理的なものだ。少なくとも、大手書店チェーンの発注予約状況からベストセラーを予測するのと同程度の有効性はあっても不思議ではない。
発売はまだ先なので、筆者もまだ読んでいないが、すでに書店・書評用のコピーは出回っており、議論が生まれている。コンサルタントのマイク・シャツキン氏は「コンピュータによる全文解析がベストセラーを予測できる可能性は限りなく低い」(06/27)と書き、ITサービス企業 Intellogo のニール・ボルテーザーCEOは「機械学習はベストセラー予測を助けることができる」(07/20)と書いた。新刊のプロモーションには十分だろう。
編集者の仕事が変わる
本書は全文解析という技術がベストセラー予測に(高い確率で)使える、と主張する。原稿を読み込んでイケそうかどうかを判断し、あるいはイケるように、著者とともに推敲していくのが編集者の仕事だが、ほとんどの編集者は、そんな仕事がコンピュータに勤まるとは思っていないし、そもそもそれがベストセラーにつながるとも思っていないだろう。
「ベストセラー」は著者、ファン、テーマ、それに社会のムードといった得体の知れないものの関係で決まると考えられているが、不確実性を前に決断するのはギャンブラーのセンスが必要で、編集者に求められる忍耐強さや厳密さと一致しない。
しかし、もしかすると「原稿」の中にベストセラーの可能性を(高い確率で)読み取るアルゴリズムがある、としたらどうだろう。アマゾンを中心としたマーケティング・アルゴリズムのほかに、クリエイティブ系のアルゴリズムが成立し、両者を総合した第3のモデルが生まれる可能性もある。
コンピュータに本を読ませる全文解析の技術は、デジタル人文学の中でも地味な分野で、これまでビジネスには最も遠いと考えられてきた。そんなものが出来たら編集者の仕事も奪われかねないので、車の運転以上に「コンピュータに出来てほしくない」仕事にランクされるだろう。しかし、問題は事実と根拠で、アルゴリズムが人間(著者、編集者、出版社)に役立つものなら普及には時間がかからないと思われる。
○参考記事
Yes, Machine Learning Can Help Predict a Bestseller, By Neil Balthaser, Digital Book World, 07/20/2016
Full text examination by computer is very unlikely to predict bestsellers, By Mike Shatzkin, The Shatzkin Files, 06/27/2016
※当記事は「EBook2.0 Magazine」からの転載記事です。
鎌田博樹(EBook2.0 Magazine)
ベストセラーの秘訣が「解読」出来たという、出版関係者にとって気になる本が近々米国で出版される。全文解析という、非マーケティング系の技術を使ったアプローチが最大のポイントで、すでに賛否両論を巻き起こしているようだ。もし有効性が認められ、普及すれば、編集者の仕事にも影響を及ぼしそうだ。
全文解析が導くベストセラーのアルゴリズム
「ベストセラー」の秘密を掴むことは、出版界の永遠のテーマで、本のテーマにもなってきた。9月20日にマクミラン系のセント・マーティンズ社から刊行される『ベストセラー・コード』(The Bestseller Code: Anatomy of the Blockbuster Novel Hardcover, by Jodie Archer, Matthew L. Jockers, St. Martin's Press, 2016)はその最新のものだが、デジタル人文学の専門家でネブラスカ大学のマシュー・ジョッカー教授と、ペンギンUKの編集者やアップルの研究職を経て独立したライター、ジョディ・アーチャー氏の共著者コンビが、「ある原稿がNYタイムズ紙ベストセラー・フィクションのトップを占める確率を97%の確度で予想するアルゴリズム」について語る、という売り文句は十分に訴求力がある。
著者たちのアプローチは、現在のベストセラー・リストから、トーンやムード、話題、スタイルを読み取り、読者の嗜好や願望をアルゴリズム化し、原稿と対照してスコア化するというものだ。技術的な詳細は不明だが、方法的には合理的なものだ。少なくとも、大手書店チェーンの発注予約状況からベストセラーを予測するのと同程度の有効性はあっても不思議ではない。
発売はまだ先なので、筆者もまだ読んでいないが、すでに書店・書評用のコピーは出回っており、議論が生まれている。コンサルタントのマイク・シャツキン氏は「コンピュータによる全文解析がベストセラーを予測できる可能性は限りなく低い」(06/27)と書き、ITサービス企業 Intellogo のニール・ボルテーザーCEOは「機械学習はベストセラー予測を助けることができる」(07/20)と書いた。新刊のプロモーションには十分だろう。
編集者の仕事が変わる
本書は全文解析という技術がベストセラー予測に(高い確率で)使える、と主張する。原稿を読み込んでイケそうかどうかを判断し、あるいはイケるように、著者とともに推敲していくのが編集者の仕事だが、ほとんどの編集者は、そんな仕事がコンピュータに勤まるとは思っていないし、そもそもそれがベストセラーにつながるとも思っていないだろう。
「ベストセラー」は著者、ファン、テーマ、それに社会のムードといった得体の知れないものの関係で決まると考えられているが、不確実性を前に決断するのはギャンブラーのセンスが必要で、編集者に求められる忍耐強さや厳密さと一致しない。
しかし、もしかすると「原稿」の中にベストセラーの可能性を(高い確率で)読み取るアルゴリズムがある、としたらどうだろう。アマゾンを中心としたマーケティング・アルゴリズムのほかに、クリエイティブ系のアルゴリズムが成立し、両者を総合した第3のモデルが生まれる可能性もある。
コンピュータに本を読ませる全文解析の技術は、デジタル人文学の中でも地味な分野で、これまでビジネスには最も遠いと考えられてきた。そんなものが出来たら編集者の仕事も奪われかねないので、車の運転以上に「コンピュータに出来てほしくない」仕事にランクされるだろう。しかし、問題は事実と根拠で、アルゴリズムが人間(著者、編集者、出版社)に役立つものなら普及には時間がかからないと思われる。
○参考記事
Yes, Machine Learning Can Help Predict a Bestseller, By Neil Balthaser, Digital Book World, 07/20/2016
Full text examination by computer is very unlikely to predict bestsellers, By Mike Shatzkin, The Shatzkin Files, 06/27/2016
※当記事は「EBook2.0 Magazine」からの転載記事です。
鎌田博樹(EBook2.0 Magazine)