Microsoftが生成AI悪用を可能にするAIジェイルブレイクを指摘、回避策も提示
マイナビニュース / 2024年6月5日 19時2分
Microsoftは6月4日(米国時間)、「AI jailbreaks: What they are and how they can be mitigated|Microsoft Security Blog」において、生成AIの悪用を可能にするAIジェイルブレイクについて解説した。
○「AIジェイルブレイク」とは
2022年にOpenAIがChatGPTを公開してから、生成AIは急激な発展と普及を続けている。現在ではテキスト生成以外にも音声、画像、動画などを簡単に生成できるようになり、広告やコンテンツ制作などにも活用されている。生成AIは無の状態から情報を生み出しているわけではなく、膨大な学習データとディープラーニング(深層学習)によりさまざまな形の機械学習モデル(AIモデル)を作成し、その能力の範囲内で出力を得る。
この膨大な学習データには悪用可能な情報が含まれており、多くの大規模言語モデル(LLM: Large Language Model)の学習データにも含まれている。ChatGPTやGeminiのような有名な生成AIも悪用可能な回答を生成する能力があり、積極的に悪用しようとするユーザーが存在する。
多くのAI(Artificial Intelligence)開発企業は悪用を防ぐためにさまざまな防衛策を講じており、近年は悪用可能な情報を簡単に出力できないようになっている。しかしながら、この防衛策を突破するプロンプトインジェクションなどの試みがあり、この防衛策を突破する行為がAIジェイルブレイクと呼ばれている。
○生成AIを攻撃可能な理由
Microsoftは生成AIの機械学習モデルを次のように例えている。
本質的に、機械学習モデルは熱心で知識豊富だが、ビジネス環境における経験と成熟に伴う判断力、状況理解、境界線の遵守が欠けた従業員に例えることができる。
つまり、人間のような出力は可能だが、人格者のような行動ができるわけではなく、適切な保護が施されていない場合は有害なコンテンツを生成し、場合によっては問題のある行動を実行して機密情報を漏洩する可能性がある。
そこでMicrosoftはこのような問題を軽減するために、AIの実装に対してゼロトラストアプローチの採用を推奨している。すべての機械学習モデルはAIジェイルブレイクの影響を受けると想定し、攻撃を受けた場合の潜在的な損害を抑制できるように実装する。
○保護のガイダンス
-
-
- 1
- 2
-
この記事に関連するニュース
-
マイクロソフトが示す“マルチモーダルAI”の可能性、「GPT-4o」が実現する未来の体験とは?
マイナビニュース / 2024年6月28日 10時0分
-
情報戦略テクノロジーとの協業強化に関するお知らせ
PR TIMES / 2024年6月20日 17時45分
-
ソフトバンク、「生成AIパッケージ」に新機能追加とChatUI刷新
マイナビニュース / 2024年6月19日 9時18分
-
GaiXerが外務省の「生成AI活用のための環境構築及び運用」案件で採用
PR TIMES / 2024年6月5日 18時40分
-
電通総研、企業向けChatGPTソリューション「Know Narrator(ノウナレーター)」で最新LLMモデル「GPT-4o」の適用を開始
PR TIMES / 2024年6月5日 14時15分
ランキング
-
1老後の趣味で気軽に“塗り絵”を始めて1年後…… めきめき上達した70代女性の美麗な水彩画に「本当にすごい…」「感動です」
ねとらぼ / 2024年6月29日 22時0分
-
2藤本美貴&庄司智春、真っ昼間に変装ゼロで“腕絡め”デート 大勢の注目浴びるも“モザイク9割”の結果で「笑った」
ねとらぼ / 2024年7月2日 15時1分
-
3中小企業の社内Wi-Fi接続、約半数が「つながりにくさ」を実感‐対処法は?
マイナビニュース / 2024年7月3日 11時50分
-
4新紙幣「一万円札と千円札の1の字が違う」SNSに違和感覚えるという声も…… 「1」のデザインが違う理由は?
ねとらぼ / 2024年7月3日 18時15分
-
5シャオミ、ペンを発売 「書き心地は良いが、タブレットとペアリングはできません」と公式
ITmedia NEWS / 2024年7月3日 8時30分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください
![](/pc/img/mission/mission_close_icon.png)