米OpenAIは12月16日(現地時間)、クリスマスに向けたイベント「12 Days of OpenAI」の9日目は「DevDay Holiday Edition」として、開発者向けの複数の新機能を発表した。
推論モデル「o1」がAPIで利用可能に
これまで一部の開発者に限定公開されていた「o1-preview」の後継となるo1は、複雑なタスクを高い精度で処理できる能力を備えている。
o1 APIを利用するにはTier 5に加入する必要があり、より高度な機能が使える分、利用料金は高くなる可能性がある。
o1は、関数呼び出し、構造化出力、開発者メッセージ、画像処理能力などの機能を備える。外部データやAPIとの連携、信頼性の高いレスポンス生成、モデルへの指示やコンテキスト指定、画像理解などで、AIアプリ開発の可能性が広がるとOpenAIは説明した。
Realtime APIの進化
WebRTC(Web Real-Time Communication)の統合により、リアルタイム音声機能の追加が容易になり、音声品質が向上した「gpt-4o-realtime-preview-2024-12-17」のリリースとともに、音声トークンの価格が60%値下げされた。
また、コスト効率に優れた小型モデル「GPT-4o mini」もRealtime APIに追加され、より幅広いニーズに対応できるようになったとしている。
モデルカスタマイズ手法「Preference Fine-Tuning」
「Preference Fine-Tuning」は、モデルをカスタマイズする新しい手法。ペアのモデルレスポンスを比較して、モデルに好ましい出力と好ましくない出力を区別するように学習させる「Direct Preference Optimization」(DPO)を使っている。
固定ターゲットではなく、ペアワイズ比較から学習することで、トーン、スタイル、創造性が重要な主観的なタスクに特に効果的という。
詳細は公式ブログとそこで紹介されている関連リンクを参照されたい。