ChatGPT回答が途中で切れる？続けてで再開するコツ

Q: コード生成の途中で切れた場合の再開戦略

「続けて」だけだと、コードブロックの整合性が崩れる。 「先ほどのコードの続きを、関数 foo の定義から書け。コードブロック開始の ```python から始めること」 のように、再開位置と出力形式を明示する。これでコードブロックの欠損率が大幅に下がる。

結論。ChatGPT の応答が途中で途切れる原因は、UIの不具合ではなく モデルの出力トークン上限への到達 だ。再開させるには 続けて または Continue と入力するか、表示される「Continue generating」ボタンをクリックすればよい。本質的に切れにくくしたい場合は、(a) プロンプト分割、(b) 出力形式の事前指定、(c) max_tokens 制御可能な API 経由への切り替え、の3点を運用に組み込む。

本稿では2026年4月時点の ChatGPT（gpt-5.1, gpt-4o）における出力トークン上限の仕様、再開手順、再発予防策を整理する。検証は Web 版 ChatGPT Plus と OpenAI API（gpt-5.1）で実施した。

なぜ ChatGPT の応答が途中で切れるのか

応答が途中で切れる主因は 1応答あたりの出力トークン数の上限 だ。OpenAI のシステム上、モデルごとに「1リクエストの応答で出力可能な最大トークン数」が定められている。代表値は以下。

モデル	出力上限	備考
gpt-5.1	16,384 tokens	2026-04 時点の主流
gpt-4o	16,384 tokens	長文応答向け
gpt-4o-mini	16,384 tokens	軽量版
o3 (reasoning)	100,000 tokens	推論連鎖込み

日本語の場合、1文字あたり 1〜3 トークン 消費するため、英語より早く上限に到達する。100文字の和文出力でおおよそ150〜200トークン、16K 上限の場合 約8,000〜10,000字で物理的に切れる 計算になる。長文出力を要求する日本語ユーザーが切断に遭いやすい構造的理由はここにある。

副次的要因として、ネットワーク不安定・サーバー負荷も切断を発生させる。アクセスピーク帯（JST 21:00〜24:00）はサーバー応答品質が下がりやすく、トークン上限到達前に通信レイヤで切れるケースもある。

途中で切れた応答を再開する手順

切断時の対処は再現性のある単純手順だ。

ステップ1：応答途中で停止しているかを確認

文章が文末記号で終わっていない、コードブロックが ``` で閉じていない、列挙の途中で切れている、いずれかが該当すれば応答途中の停止と判断する。

ステップ2：同じチャットで「続けて」と送信

同一会話のコンテキストに切れた応答が残っているため、新規メッセージとして以下のいずれかを入力する。

続けて
Continue
先ほどの応答の続きを書け
Continue from where you stopped

ステップ3：応答が切断ポイントから再開される

仕様上、ChatGPT は前応答のコンテキストを参照して、切れた箇所からの継続生成を試みる。

留意点: 「続けて」による再開は 切断ポイントの内部状態を完全には保持しない。再開出力で内容が一部重複する、または微妙に文脈がずれるケースがあるため、生成された継続部分は必ずレビューして整合性を確認する。コード生成では、関数定義の中途で切れた場合の再開精度が特に低下する。

切断を防ぐためのプロンプト設計

毎回「続けて」を打つコストを削減するには、プロンプト側で出力長を制御する。

1. プロンプトを分割する

1プロンプトに全要件を詰め込まず、2〜3回のラリーで段階的に出力させる。「まず概要を出力 → 次に詳細を出力 → 最後に補足」の構造にすると、1ラリーあたりのトークン消費が分散され、切断確率が下がる。

2. 出力形式を構造的に指定する

「箇条書き5点で」「500字以内で」のように、出力のボリュームを上限値で制約する。長文を求めるほど切断リスクが上がる仕様のため、必要十分な分量を明示するプロンプトが効率的だ。

3. 切断回避を事前指示する

プロンプト先頭に「もし出力が長くなりトークン上限に近づく場合は、キリの良い位置で一旦区切り『続きがあります』と明示せよ」と記述する。100%回避できるわけではないが、モデルが自発的に区切りポイントを設ける確率は上がる。

4. ChatGPT Plus / Pro プランを使う

ChatGPT Plus（月 $20）または Pro（月 $200）に加入すると、gpt-5.1 や o3 など出力上限の大きいモデルが利用可能になる。reasoning モデル（o3）は出力上限 10万トークンで、実質的に「切れない」運用が可能だ。

5. API 経由で `max_tokens` を明示制御する

技術者向けの選択肢として、OpenAI API を使う方法がある。max_tokens パラメータで応答上限を明示指定できるため、Web UI より精密にコントロール可能だ。長文生成が頻繁な業務では、API 経由のほうがコスト効率も上がるケースが多い。

「Continue generating」ボタンの仕様

ChatGPT Web 版では、出力がトークン上限で切れた場合に 「Continue generating（続きを生成）」 ボタンが応答末尾に自動表示されることがある。クリックで継続生成が走る。

ただしこのボタンは 常に表示されるわけではない。ネットワーク起因の切断や、システム側がトークン上限到達を検出していないケースでは非表示になる。表示されない場合は、前述の手動「続けて」プロンプトに切り替える。

スマホアプリ版（iOS / Android）も同等の挙動。アプリ版はネットワーク接続が比較的安定していて、ブラウザ版より切断頻度が低いとの報告がある。

FAQ

「続けて」と入力しても継続生成が走らない場合

モデルが文脈を見失っているケースだ。「先ほどの〇〇についての説明の続きを、関数定義の途中から再開せよ」のように、再開ポイントを具体的に指定する。それでも復旧しない場合は、新規チャットで切れた箇所までを再投入し、最初から要件を絞り直すのが効率的。

切れた応答をコピーしていなかった場合、後から参照できるか

参照できる。ChatGPT のチャット履歴は自動保存されているため、左サイドバーから該当チャットを開けば、切れた応答もそのまま残っている。ただし、設定で「Chat History & Training」を OFF にしている場合は履歴が保存されない仕様のため、事前確認が必要。

gpt-5.1 と gpt-4o-mini で切断頻度に差はあるか

差はある。gpt-5.1 は推論深度と応答精度の両方が高く、結果として「切れる前に意味のある応答を返し終える」確率が高い。gpt-4o-mini は出力トークン上限自体は同等だが、出力密度がやや低い分、同じ要件で切断到達点に達しやすい傾向がある。

コード生成の途中で切れた場合の再開戦略

「続けて」だけだと、コードブロックの整合性が崩れる。「先ほどのコードの続きを、関数 foo の定義から書け。コードブロック開始の ```python から始めること」 のように、再開位置と出力形式を明示する。これでコードブロックの欠損率が大幅に下がる。

参考文献

ChatGPT General FAQ — OpenAI Help Center
Rate limits — OpenAI Platform
Models — OpenAI Platform（モデル別出力上限）
ChatGPT Pricing — OpenAI

ChatGPTの回答が途中で切れる？「続けて」で再開する方法と切れにくくするコツ

なぜ ChatGPT の応答が途中で切れるのか

途中で切れた応答を再開する手順