筆者が ChatGPT Plus で Codex を常用し始めたのは 2026 年 4 月のことだ。コード生成タスクを 2 本並列で走らせた翌朝、画面に「Usage limit reached」と表示されて作業が完全に止まった。原因は単純だった。Codex の利用枠が「5 時間ローリングウィンドウ」で管理されていることを把握していなかったのである。

2026 年 5 月 10 日前後から、OpenAI の開発者コミュニティに「上限到達が早すぎる」という報告が殺到した。軽い操作 1 回で 5 時間枠の 14% を消費したという声もある。OpenAI は 5 月 23 日にステータスインシデントとして認知したが、回復後も再発報告は続いている。Codex をまともに使うなら、このウィンドウの仕組みを正確に理解しておく必要がある。

5 時間ローリングウィンドウの計算ロジック

結論から言う。Codex の利用上限は、最初のメッセージ送信時刻から 5 時間で区切られるウィンドウ内の累積使用量で判定される。API のレートリミットと同じ発想だ。

見落としやすいのが、ローカルメッセージ(自分のマシンで実行するコード補完・チャット)とクラウドタスク(OpenAI のサーバーで実行するエージェント型タスク)がウィンドウを共有している点である。ローカルで軽いコード補完を数十回叩いた後にクラウドタスクを投入すると、すでに枠の大半が食い潰されている。筆者はこの仕様に気づかず、午前中にローカルで散発的に使った後、午後にクラウドタスクを走らせようとして上限に衝突した。

消費量を左右するのはメッセージの中身だけではない。使用モデル、タスクの複雑さ、実行方式(ローカル / クラウド)で変動する。OpenAI は具体的なトークン計算式を公開していないが、Codex 公式料金ページによると GPT-5.3-Codex のクラウドタスクは消費が重い。GPT-5.4-mini のローカルメッセージが最も軽量で、同じ 5 時間枠でも使える回数に数倍の差が出る。

SIer 時代に官公庁系システムの API レートリミット設計に携わった経験から補足すると、ローリングウィンドウ方式は「短時間の集中利用を防ぐ」設計であり、1 日の総量を制限するものではない。つまり、タスクを 5 時間単位で分散するだけで実質的な作業量は増やせるのだ。

プラン別の利用上限(2026 年 5 月時点)

以下は 2026 年 5 月 31 日まで適用されるプロモーション枠を含む数値だ。OpenAI Help Center の公式ガイドと料金ページを突き合わせて整理した。

プラン月額GPT-5.4 ローカルGPT-5.4-mini ローカルGPT-5.3-Codex クラウド
Plus$2020〜100 / 5h60〜350 / 5h10〜60 / 5h
Pro $100(プロモ 10x)$100200〜1,000 / 5h600〜3,500 / 5h100〜600 / 5h
Pro $200(プロモ 25x)$200500〜2,500 / 5h1,500〜8,750 / 5h250〜1,500 / 5h

数値に幅がある理由は、タスクの複雑度でモデルが消費するトークン量が変わるためだ。「ローカル 20〜100」は「単純な質問なら約 100 回、重い生成なら 20 回前後で枠を使い切る」と読み解いてほしい。

注意すべき点がある。5 月 31 日をもってプロモーション枠は終了する。Pro $100 は 10x から通常の 5x に、Pro $200 は 25x から 20x に戻る。VentureBeat の報道でも指摘されているとおり、6 月以降は体感で利用可能回数が大幅に減る。プロモ期間中の感覚で予算を組んでいると痛い目を見るはずだ。

5 月 10 日以降の異常消費とその顛末

5 月 10 日を境に、OpenAI 開発者フォーラムへ「上限到達が異常に早い」という報告が集中した。

具体的な症状を列挙する。

  • GPT-5.3 Codex で簡単なメッセージ 1 往復に、5 時間枠の約 14% を消費
  • 1〜2 時間の軽い利用でウィンドウが枯渇
  • 利用状況トラッカーの UI にバグがあり、残量が正しく表示されない

開発者フォーラムのスレッドには「1 回のシンプルなやり取りで 5 時間枠の 14% が消えた。これでは持続不可能だ」という報告がある。Pro $200 プランのユーザーですら、支払い直後に残量 3% と表示された事例も報告されている。

OpenAI は 5 月 23 日に公式ステータスページで「Increase in users hitting Codex rate limits」をインシデントとして起票し、同日中に「recovered」へ変更した。しかしフォーラムではその後も再発を訴える投稿が続いており、完全な解決には至っていないと判断する。

原因として有力視されているのが、Codex アプリ内のサジェスチョン機能だ。バックグラウンドでコード補完候補を先読み生成しており、これがトークンを消費していた可能性がある。あるユーザーが「サジェスチョンを無効化したら異常消費が止まった」と報告しており、再現性のある回避策として注目されている。

独立直後に Claude API のレートリミットを甘く見積もって夜間バッチを全件落とした経験があるが、バックグラウンド処理が枠を食い潰す構造は AI ツール共通の罠だ。仕様書を読んだだけでは気づけない消費源がある。

消費を抑える具体的な設定

検証は ChatGPT Plus(2026 年 5 月時点)で行った。Pro 環境では未確認のため、挙動が異なる可能性はある。

サジェスチョンの無効化。Codex アプリの Settings 画面から Suggestions をオフにする。前述の異常消費バグの要因とも指摘されている。コード補完の先読みが不要であれば、切っておくのが最も効果的だ。

モデルの使い分け。GPT-5.4-mini はローカルメッセージの消費効率が圧倒的に良い。単純な補完や軽い修正には mini を使い、複雑なコード生成や設計レビューのみ GPT-5.4 に回す。これだけで同じ 5 時間枠内の実行可能回数が 3〜5 倍に伸びる。

クラウドタスクの温存。クラウドタスクは 1 回あたりの消費が重い。ローカルで完結する作業はローカル実行に限定する。筆者は平日 5 時起きで技術検証をしているが、早朝の 2 時間はローカルの mini で軽い作業を回し、ウィンドウに余裕がある状態でクラウドタスクを投入する運用にしている。

タスクの時間分散。5 時間ウィンドウのリセットを待ってから次のバッチを走らせる。集中利用したい場合は、5 時間おきに作業セッションを区切るのが現実的な運用である。

上限に達した場合、Plus / Pro ユーザーは追加クレジットを購入して即座に作業を継続できる。ただしクレジットの具体的な単価は非公開で、頻繁に購入が必要になるなら上位プランへの移行を検討すべきだろう。

FAQ

Codex の無料プランにも利用上限はある?

ある。無料プランと Go プランにも 5 時間ローリングウィンドウが適用され、Plus よりも低い上限が設定されている。具体的な数値は Codex の公式レートカードで確認できる。

「Usage limit reached」が出たら何時間待てばリセットされる?

最大 5 時間だ。ウィンドウは最初のメッセージ送信時刻から 5 時間で区切られるため、直前に集中利用した場合は数時間待つ必要がある。待てない場合は追加クレジットの購入で即時解除が可能である。

Claude Code に乗り換えたほうが得か?

用途による。Claude Code は 2026 年 5 月時点で Max プラン($100/月)の週次利用制限が 50% 増量中で、7 月 13 日まで継続する。コード生成の品質と枠の効率はタスクによって異なるため、一概にどちらが優れるとは言えない。筆者は Codex と Claude Code を用途別に併用している。

5 月 31 日のプロモーション終了後はどうなる?

Pro $100 は利用枠が 10x から 5x に半減する。Pro $200 は 25x から 20x への微減にとどまる。Plus プランの上限値自体は変わらない見込みだが、OpenAI が予告なくレート調整を行う可能性は常にある。

参考文献