12月4日凌晨、GitHubとDesignArenaで同時にOpenAIの内部コード「ペンギン(Penguin)」の新しいモデルマトリクスがリークされ、4段階の推論予算が初めて公開された。エミペラーやロッカーハッパー、マカロニ、ミュームという4つのモデルが登場し、クラウドからエッジまでをカバーするすべてのシナリオに対応している。

画像出典:AI生成、画像ライセンス提供元Midjourney
512の推論予算!エミペラーはGPT-5.2のコアとなる可能性
内部ファイルによると、エミペラーには512単位の「ジュース(juice)」推論予算があり、現在のモデルの8〜10倍であり、エンドツーエンドの遅延は80ms以内に抑えられ、「待ち時間なし」の会話体験を実現している。コードパスにはリアルタイムの枝刈りと動的な計算割当てが組み込まれており、来年のGPT-5.2の下位構造を提供するものと推測されている。
4段階の予算=4種類のレイテンシー:マカロニは高速を重視し、ミュームは完全に推論ステップを省く
- ロッカーハッパー(64)(中級)は「推論+速度」のバランスを重視し、GPT-4.5の代替を目指す。
- マカロニ(16)はモバイル向けで、初めて8Gen3チップで70Bモデルを動作させた。
- ミューム(0)は推論ステップを完全に省き、応答時間が50ms未満で、頻繁な自動完了や音声中断のシナリオに使用される。
記憶検索も同時リーク:ワンクリックで会話の文脈を呼び出す
同様にリークされたコードでは、ChatGPTに「メモリーサーチ」ボタンが追加され、ユーザーが自然言語で入力するだけで過去の記憶を即座に検索できるようになる。この機能はすでに内側でのテストが行われており、ペンギンシリーズのモデルとともにリリースされる見込みである。
ShallotpeatとGarlicが続いて来る:OpenAIが赤色警報を発令
The Informationによると、OpenAIは次の週に内部コード「Shallotpeat」の新しい推論モデルを発表する可能性がある。その性能はGemini3を既に上回っている。もう一つのGarlicはすでに事前トレーニングを終え、2026年初頭にGPT-5.2またはGPT-5.5としてリリースされる予定で、「小パラメータ+高密度知識」の路線を主張し、グーグルの「事前トレーニング飛躍」に直接対抗する。
業界の混乱:オープンソースとクローズドソースの両方でスピードアップ
- 開発者にとって、4段階の予算は同じコード名で「遅延ーコストー精度」の異なる組み合わせを呼び出せるようになり、API価格は30%下落する可能性がある。
- 競合企業にとっては、OpenAIが初めて「推論予算」を明確に価格表示にしたため、GoogleやAnthropicが類似のグレードに追随する必要がある。
- 規制当局にとっては、ゼロ推論のミュームの高速応答が誤り率を拡大させる可能性があり、安全評価がリリース前の最後の関門となる可能性がある。
OpenAIはまだペンギンシリーズの具体的なリリース日を発表していないが、DesignArenaで盲測が開始されており、勝利モデルは直接ChatGPT PlusとEnterpriseの経路に組み込まれる。AIbaseは今後も引き続き追跡し、最初にベンチマーク結果とAPI価格の詳細をお知らせする。
