AIセーフティに関するレッドチーミング手法ガイドを公開
Digital PR Platform / 2024年9月26日 10時0分
■本書の構成(目次):
1. はじめに
2. レッドチーミングについて
3. LLMシステムへの代表的な攻撃手法
4. 実施体制と役割
5. 実施時期及び実施工程
6. 実施計画の策定と実施準備
7. 攻撃計画・実施
8. 結果のとりまとめと改善計画の策定
本書では、2章でレッドチーミングの種類を、前提知識の有無・程度や実施環境、攻撃の実施方法によって分類して示し、3章ではLLMシステムへの代表的な攻撃手法例として、攻撃者が悪意あるプロンプトをAIシステムに直接注入する攻撃である「直接プロンプトインジェクション」など8つの攻撃手法を例示しています。(図1)
4章と5章では実施体制と役割、実施時期について、多様な関係者(攻撃シナリオの実施によって影響を受けるシステムに関わる組織)が参画するのが望ましく、またAIシステムのリリース/運用開始前に加え、運用開始後も、必要に応じて随時実施することが望ましいとしています。
6章から8章で、レッドチーミングの工程をそれぞれ第1工程「実施計画の策定と実施準備」、第2工程「攻撃計画・実施」、第3工程「結果のとりまとめと改善計画の策定」に分けて説明しています。各工程で5つずつ実施事項を示し、「実施の決定とレッドチーム発足」から「改善後のフォローアップ」まで計15ステップについて詳述しています。
AISIは、AI開発者や提供者が攻撃者の目線で対象AIシステムにおける弱点や対策の不備を発見し、それらを修正・堅牢化するために、本書が活用されることを期待しています。
「AIセーフティに関するレッドチーミング手法ガイド」と概要説明資料は、以下のウェブサイトからダウンロード可能です。
「AIセーフティに関するレッドチーミング手法ガイド」URL:https://www.ipa.go.jp/digital/ai/begoj90000004szb-att/ai_safety_rt_v1.00_ja.pdf
「概要説明資料」URL:https://www.ipa.go.jp/digital/ai/begoj90000004sxz-att/ai_safety_rt_summary_v1.00_ja.pdf
[画像1]https://digitalpr.jp/simg/2314/95575/700_405_2024092509374866f35b5c45e63.png
図1. レッドチーミングの概要(概要説明資料から)
この記事に関連するニュース
-
AI安全利用で11月に国際会議、米政権が主導
ロイター / 2024年9月19日 12時37分
-
AIの安全性評価ガイドライン公開 IPAと国などが設立したAISIから
ITmedia NEWS / 2024年9月18日 16時2分
-
AIセーフティに関する評価観点ガイドを公開
Digital PR Platform / 2024年9月18日 14時36分
-
日米のAI関連ガイドラインの相互運用性向上をめざし「クロスウォーク2」を公開
Digital PR Platform / 2024年9月18日 14時34分
-
米商務省、AI開発者にサイバーセキュリティー報告義務を課す規則案を発表(米国)
ジェトロ・ビジネス短信 / 2024年9月10日 11時15分
ランキング
-
14~9月の国内新車販売、トップはホンダ「N―BOX」…トヨタ「ヤリス」は一時生産停止が響き4位
読売新聞 / 2024年10月4日 21時6分
-
2円相場、対ドル一時149円台に下落…1か月半ぶりの円安・ドル高水準
読売新聞 / 2024年10月5日 6時41分
-
3なぜ軽自動車は選ばれるのか 「軽トラック」がじわじわ広がっている理由
ITmedia ビジネスオンライン / 2024年10月4日 6時10分
-
4「高齢者が1日20キロも歩いていた」アマゾンの倉庫で何が起こっていたのか…ジャーナリスト・横田増生が「潜入取材」をして明らかになった労働問題
文春オンライン / 2024年10月4日 6時0分
-
5パンを食べながら投資相談する人も…銀行で新たな取り組み “現金離れ”などで窓口利用なしが増加【Nスタ解説】
TBS NEWS DIG Powered by JNN / 2024年10月4日 21時0分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください