国立情報学研究所(NII)は11月25日、「ニコニコ大百科」の記事データを更新した。従来、2008年5月から2014年2月までのデータを利用できたが、新たに2024年1月までのデータを追加した。
「ニコニコ大百科」は、ドワンゴが提供するユーザー投稿型辞典。データセットには、記事IDやタイトル、作成日時、記事本文データなどが含まれており、研究目的なら誰でも利用できる。
同データセットは2014年3月に初公開。ドワンゴは当時「Wikipediaなどのユーザ生成型辞書サイトとの比較研究や、特定の単語の意味理解、ネットスラングのコーパス、記事の成長による編集過程の研究などが進むことが期待される」とコメントしていた。
NIIは、ニコニコ動画のコメントデータも公開している。