AIセーフティに関する評価観点ガイドを公開
Digital PR Platform / 2024年9月18日 14時36分
2024年9月18日
AIセーフティ・インスティテュート
独立行政法人情報処理推進機構
AIセーフティに関する評価観点ガイドを公開
~AIセーフティ評価の観点や評価項目例、評価に関する手法の概要などを提示~
AIセーフティ・インスティテュート(AISI、所長:村上明子)は、AIシステムの開発者や提供者がAIセーフティ評価を実施する際に参照できる基本的な考え方を提示するため、「AIセーフティに関する評価観点ガイド」を公開しました。AIシステムの開発・提供管理者が本書を参照することで、AIセーフティ評価の要点を確認することができ、AIセーフティに配慮したAIシステムの開発・提供を行うことができます。
URL: https://aisi.go.jp/2024/09/18/evaluation_perspectives/
AIに関連する技術の発展と社会全体への普及が急速に進み、生成AI、特に基盤モデルの登場によりイノベーションが加速する一方で、AIシステムの悪用や誤用、不正確な出力の懸念など、いわゆるAIセーフティ(注釈1)についての関心が国内外で高まっています。AIセーフティを確保し続けることは、AIが社会の持続的な発展に寄与するための前提であることから、AISIはAIシステムの開発者や提供者がAIセーフティ評価を実施する際に参照できる基本的な考え方を提示するため、「AIセーフティに関する評価観点ガイド」(以下、本書)を公開しました。
本書では、本年4月に公表された「AI事業者ガイドライン」に加え、海外文献や関連ツール等に関する調査を踏まえ、AIセーフティ評価の観点や想定され得るリスクの例、評価項目例、評価の実施者や評価実施時期に関する考え方、評価に関する手法の概要などを提示しています。本書の主な想定読者は、AI開発者・AI提供者、特に、「開発・提供管理者」や「事業執行責任者」であり、想定するシステムは大規模言語モデル(LLM)を構成要素とするAIシステム(LLMシステム)です。本書の構成は次のとおりです。
■本書の構成(目次):
1. はじめに
2. AIセーフティ
3. 評価観点の詳細
4. 評価実施者及び評価実施時期
5. 評価手法の概要
6. 評価に際しての留意事項
本書では、AIセーフティの観点として、AI事業者ガイドライン「C. 共通の指針」において各主体が取り組む事項とされているもののうち、「人間中心」、「安全性」、「公平性」、「プライバシー保護」、「セキュリティ確保」「透明性」を重要要素としています。本書ではこれら6つの重要要素に関連するAIセーフティ評価の観点を、昨今の技術的潮流を踏まえて導出しました(「有害情報の出力制御」、「偽誤情報の出力・誘導の防止」、「公平性と包摂性」、「ハイリスク利用・目的外利用への対処」、「プライバシー保護」、「セキュリティ確保」、「説明可能性」、「ロバスト性」、「データ品質」、「検証可能性」の10項目)。
-
- 1
- 2
この記事に関連するニュース
-
AIの安全性評価ガイドライン公開 IPAと国などが設立したAISIから
ITmedia NEWS / 2024年9月18日 16時2分
-
日米のAI関連ガイドラインの相互運用性向上をめざし「クロスウォーク2」を公開
Digital PR Platform / 2024年9月18日 14時34分
-
カケハシ、薬歴作成における生成AI活用へ
PR TIMES / 2024年9月17日 14時15分
-
Allganize、日本語RAG性能を評価した「Allganize RAG Leaderboard」を本日公開
PR TIMES / 2024年9月14日 14時40分
-
富士通×MoBagel、AIによる予測を高速化するソリューションを提供開始
マイナビニュース / 2024年9月5日 16時3分
ランキング
-
18月の訪日外国人客数、半年ぶりに300万人下回る…それでも8月では過去最高
読売新聞 / 2024年9月18日 16時22分
-
2レバノンで爆発の機器、台湾企業「権利持つブタペスト会社が製造」
ロイター / 2024年9月18日 17時19分
-
3今「仕事を掛け持ちしない」のはリスクでしかない 安定した収入があれば新しいことを始められる
東洋経済オンライン / 2024年9月18日 17時0分
-
4【ガスト】平日17時から21時にタイムセールやってるよ!クーポン使うよりお得なのは見逃せない...。
東京バーゲンマニア / 2024年9月18日 17時36分
-
5「若者のディズニー離れは“料金が高い”から」説は、本当か
ITmedia ビジネスオンライン / 2024年9月18日 7時40分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください