日本経済新聞記事オープンコーパスを公開、国立国語研究所と開発
PR TIMES / 2023年3月13日 19時45分
日本経済新聞社(本社:東京都千代田区、代表取締役社長:長谷部剛、以下日経)は、大学共同利用機関法人人間文化研究機構国立国語研究所(所在地:東京都立川市、所長:田窪行則、以下国語研)と共同で日本経済新聞の朝夕刊(2013年1~2月)から選択した約100本の記事を元に日本語の書き言葉コーパス「日本経済新聞記事オープンコーパス」を開発、公開を始めました。
コーパスとは、文章をセンテンスごと(一文)に分けたものを構造化し、言語情報(品詞など)を付与したもので、人工知能(AI)が日本語を理解するための学習データに使われるなど、自然言語処理技術の発展に欠かせない言語資源です。
日本経済新聞記事オープンコーパスは、コーパスデータとその元となる記事データをセットで公開します。記事データは日本経済新聞社が提供、コーパスは国語研が開発しました。研究用途に限り無償での利用が可能で、以下のURLからダウンロード可能です。コーパスの開発経緯と内容については、言語処理学会第29回年次大会で報告予定です。
日経は良質なコンテンツを公開することで、国内外のデータサイエンスの発展に貢献していきます。
ダウンロードサイト:https://nkbb.nikkei.co.jp/alternative/corpus/
■国立国語研究所について
国立国語研究所は、国語に関する総合的研究機関として、1948年に誕生しました。
2009年10月には大学共同利用機関法人人間文化研究機構国立国語研究所となり、共同研究・共同利用を中心とした活動を展開しています。
ウェブサイト:https://www.ninjal.ac.jp/
[画像: https://prtimes.jp/i/11115/502/resize/d11115-502-cec4206379a0ffa7ae07-0.png ]
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
「日経人財グロース&コンサルティング」サイト開設、人的資本経営支援の情報発信
PR TIMES / 2024年7月17日 14時40分
-
HPE、産総研の生成AI基盤の開発力強化に向け、NVIDIAで強化された次世代ABCIスーパーコンピューターを構築
PR TIMES / 2024年7月11日 13時45分
-
モルフォAIソリューションズ、国立情報学研究所から学術論文用のAI-OCR開発を受託
PR TIMES / 2024年7月10日 12時15分
-
【元日経新聞記者へインタビュー】平均年収の高いビジネスパーソンたちが好んで読む「面白いネタ」の共通点
THE GOLD ONLINE(ゴールドオンライン) / 2024年7月3日 8時15分
-
ウガンダ政府にスキーポン製品登録申請へ
PR TIMES / 2024年6月22日 22時40分
ランキング
-
1セルフレジで客が減る? 欧米で「セルフレジ撤去」の動き、日本はどう捉えるべきか
ITmedia ビジネスオンライン / 2024年7月18日 8時10分
-
2「レイバン」メーカー、人気ブランド「シュプリーム」を15億ドルで買収
ロイター / 2024年7月18日 8時34分
-
3東証、一時1000円近く下落 円高進行で輸出関連に売り
共同通信 / 2024年7月18日 11時58分
-
4申請を忘れると年金200万円の損…荻原博子「もらえるものはとことんもらう」ための賢者の知恵
プレジデントオンライン / 2024年7月17日 8時15分
-
5電話番号案内104終了へ NTT東西、利用者激減で
共同通信 / 2024年7月18日 21時35分
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/mission_close_icon.png)
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/point-loading.png)
エラーが発生しました
ページを再読み込みして
ください
![](/pc/img/mission/mission_close_icon.png)