結論。ChatGPT の応答が途中で途切れる原因は、UIの不具合ではなく モデルの出力トークン上限への到達 だ。再開させるには 続けて または Continue と入力するか、表示される「Continue generating」ボタンをクリックすればよい。本質的に切れにくくしたい場合は、(a) プロンプト分割、(b) 出力形式の事前指定、(c) max_tokens 制御可能な API 経由への切り替え、の3点を運用に組み込む。
本稿では2026年4月時点の ChatGPT(gpt-5.1, gpt-4o)における出力トークン上限の仕様、再開手順、再発予防策を整理する。検証は Web 版 ChatGPT Plus と OpenAI API(gpt-5.1)で実施した。
なぜ ChatGPT の応答が途中で切れるのか
応答が途中で切れる主因は 1応答あたりの出力トークン数の上限 だ。OpenAI のシステム上、モデルごとに「1リクエストの応答で出力可能な最大トークン数」が定められている。代表値は以下。
| モデル | 出力上限 | 備考 |
|---|---|---|
| gpt-5.1 | 16,384 tokens | 2026-04 時点の主流 |
| gpt-4o | 16,384 tokens | 長文応答向け |
| gpt-4o-mini | 16,384 tokens | 軽量版 |
| o3 (reasoning) | 100,000 tokens | 推論連鎖込み |
日本語の場合、1文字あたり 1〜3 トークン 消費するため、英語より早く上限に到達する。100文字の和文出力でおおよそ150〜200トークン、16K 上限の場合 約8,000〜10,000字で物理的に切れる 計算になる。長文出力を要求する日本語ユーザーが切断に遭いやすい構造的理由はここにある。
副次的要因として、ネットワーク不安定・サーバー負荷も切断を発生させる。アクセスピーク帯(JST 21:00〜24:00)はサーバー応答品質が下がりやすく、トークン上限到達前に通信レイヤで切れるケースもある。
途中で切れた応答を再開する手順
切断時の対処は再現性のある単純手順だ。
ステップ1:応答途中で停止しているかを確認
文章が文末記号で終わっていない、コードブロックが ``` で閉じていない、列挙の途中で切れている、いずれかが該当すれば応答途中の停止と判断する。
ステップ2:同じチャットで「続けて」と送信
同一会話のコンテキストに切れた応答が残っているため、新規メッセージとして以下のいずれかを入力する。
続けてContinue先ほどの応答の続きを書けContinue from where you stopped
ステップ3:応答が切断ポイントから再開される
仕様上、ChatGPT は前応答のコンテキストを参照して、切れた箇所からの継続生成を試みる。
留意点: 「続けて」による再開は 切断ポイントの内部状態を完全には保持しない。再開出力で内容が一部重複する、または微妙に文脈がずれるケースがあるため、生成された継続部分は必ずレビューして整合性を確認する。コード生成では、関数定義の中途で切れた場合の再開精度が特に低下する。
切断を防ぐためのプロンプト設計
毎回「続けて」を打つコストを削減するには、プロンプト側で出力長を制御する。
1. プロンプトを分割する
1プロンプトに全要件を詰め込まず、2〜3回のラリーで段階的に出力させる。「まず概要を出力 → 次に詳細を出力 → 最後に補足」の構造にすると、1ラリーあたりのトークン消費が分散され、切断確率が下がる。
2. 出力形式を構造的に指定する
「箇条書き5点で」「500字以内で」のように、出力のボリュームを上限値で制約する。長文を求めるほど切断リスクが上がる仕様のため、必要十分な分量を明示するプロンプトが効率的だ。
3. 切断回避を事前指示する
プロンプト先頭に「もし出力が長くなりトークン上限に近づく場合は、キリの良い位置で一旦区切り『続きがあります』と明示せよ」と記述する。100%回避できるわけではないが、モデルが自発的に区切りポイントを設ける確率は上がる。
4. ChatGPT Plus / Pro プランを使う
ChatGPT Plus(月 $20)または Pro(月 $200)に加入すると、gpt-5.1 や o3 など出力上限の大きいモデルが利用可能になる。reasoning モデル(o3)は出力上限 10万トークンで、実質的に「切れない」運用が可能だ。
5. API 経由で max_tokens を明示制御する
技術者向けの選択肢として、OpenAI API を使う方法がある。max_tokens パラメータで応答上限を明示指定できるため、Web UI より精密にコントロール可能だ。長文生成が頻繁な業務では、API 経由のほうがコスト効率も上がるケースが多い。
「Continue generating」ボタンの仕様
ChatGPT Web 版では、出力がトークン上限で切れた場合に 「Continue generating(続きを生成)」 ボタンが応答末尾に自動表示されることがある。クリックで継続生成が走る。
ただしこのボタンは 常に表示されるわけではない。ネットワーク起因の切断や、システム側がトークン上限到達を検出していないケースでは非表示になる。表示されない場合は、前述の手動「続けて」プロンプトに切り替える。
スマホアプリ版(iOS / Android)も同等の挙動。アプリ版はネットワーク接続が比較的安定していて、ブラウザ版より切断頻度が低いとの報告がある。
FAQ
「続けて」と入力しても継続生成が走らない場合
モデルが文脈を見失っているケースだ。「先ほどの〇〇についての説明の続きを、関数定義の途中から再開せよ」のように、再開ポイントを具体的に指定する。それでも復旧しない場合は、新規チャットで切れた箇所までを再投入し、最初から要件を絞り直すのが効率的。
切れた応答をコピーしていなかった場合、後から参照できるか
参照できる。ChatGPT のチャット履歴は自動保存されているため、左サイドバーから該当チャットを開けば、切れた応答もそのまま残っている。ただし、設定で「Chat History & Training」を OFF にしている場合は履歴が保存されない仕様のため、事前確認が必要。
gpt-5.1 と gpt-4o-mini で切断頻度に差はあるか
差はある。gpt-5.1 は推論深度と応答精度の両方が高く、結果として「切れる前に意味のある応答を返し終える」確率が高い。gpt-4o-mini は出力トークン上限自体は同等だが、出力密度がやや低い分、同じ要件で切断到達点に達しやすい傾向がある。
コード生成の途中で切れた場合の再開戦略
「続けて」だけだと、コードブロックの整合性が崩れる。「先ほどのコードの続きを、関数 foo の定義から書け。コードブロック開始の ```python から始めること」 のように、再開位置と出力形式を明示する。これでコードブロックの欠損率が大幅に下がる。
参考文献
- ChatGPT General FAQ — OpenAI Help Center
- Rate limits — OpenAI Platform
- Models — OpenAI Platform(モデル別出力上限)
- ChatGPT Pricing — OpenAI






