Gemini 3.1 Flash-Lite:大規模インテリジェンスのために構築
概要
Googleは、Gemini 3シリーズの中で最速かつ最も費用対効果の高いモデルであるGemini 3.1 Flash-Liteを発表しました。これは、大規模な開発者ワークロード向けに構築されており、現在Google AI StudioのGemini APIを通じて開発者向けに、またVertex AIを通じてエンタープライズ向けにプレビュー版として展開されています。このモデルは、入力トークンあたりわずか0.25ドル、出力トークンあたり1.50ドルという競争力のある価格設定で、2.5 Flashよりも大幅に優れたパフォーマンスを発揮し、最初の回答トークンまでの時間が2.5倍速く、出力速度が45%向上していますが、品質は同等かそれ以上を維持しています。Arena.aiリーダーボードでのEloスコアは1432を達成しています。3.1 Flash-Liteは、設定可能な思考レベルによる適応型インテリジェンスを備えており、高頻度の翻訳やコンテンツモデレーションから、ユーザーインターフェースの生成やシミュレーション作成といったより複雑な推論タスクまで対応できます。早期アクセスユーザーは、その効率性と推論能力を高く評価しています。
(出典:Gemini)