結論から言う。AIにPDFを丸ごと投げて「要約して」と頼むと、一見もっともらしいが中身の違う要約が返ってくることがある。
筆者は元SIer時代の同僚から、20年もののCOBOL基幹仕様書PDF(200ページ超)をClaude Codeに要約させたいと相談を受けた。丸ごと投げてプロンプトを最適化しなかった結果、章節構造の認識が崩れ、要約には誤った主語で書かれた段落が複数混入していた。結局、章ごとに分割し用語集を先に渡してから再要約する羽目になり、1週間を無駄にした。
AIのファイル読み込みは「完璧に読んでくれる」わけではない。ファイル形式・ページ数・質問の仕方で精度は大きく変わる。
AIが文書を「読み間違える」原因
AIがアップロードされた文書を要約する際のハルシネーション(事実と異なる内容の生成)は、3つの原因に集約される。
グラウンデッドとアングラウンデッドの精度差
Suprmind社の2026年版ベンチマークによれば、AIが手元の文書を参照しながら要約する「グラウンデッド」タスクのハルシネーション率は0.7〜1.5%。一方、学習データだけに頼る「アングラウンデッド」タスクでは、SimpleQAベンチマークでo3が33〜51%を記録している。桁違いの差だ。
PDFを渡して要約させること自体は比較的安全だ。問題は、モデルが「文書に書いてないこと」を親切に補完しようとしたとき。訓練データ由来の誤情報が混入するリスクはここで跳ね上がる。
コンテキストウィンドウの限界
スタンフォード大学の研究で知られる「Lost in the Middle」問題は、ファイル読み込みでも発生する。Claude(Opus 4.6, 2026年5月時点)の公称コンテキストは200Kトークンだが、Claude公式ヘルプによればPDFの視覚分析は100ページまで。実効容量は公称値の60〜70%程度であり、100ページ超のPDFでは中間部分の情報が抜け落ちることがある。
ChatGPT(GPT-5.5, 2026年5月時点)は1ファイル最大4512MB・2Mトークンを受け付ける。だが内部的にはトークン数に応じて処理が分割されるため、ファイルサイズの上限をクリアしていても「全文を等しく読んでいる」保証はない。
スキャンPDFとOCR精度の壁
テキスト埋め込み型PDFなら直接テキストを読み取れる。だがスキャンPDFは内部でOCR処理が走り、フォントの潰れ・手書き注釈・表組みのセル結合で精度が落ちる。暗号化PDFや複雑な埋め込みフォントはパーシング自体が失敗する原因になる。
サービス別のファイルアップロード制限
要約精度に直結するのが、各サービスのアップロード制限だ。2026年5月時点の公式仕様を以下に示す。
| サービス | 1ファイル上限 | PDF固有の制限 | コンテキスト |
|---|---|---|---|
| ChatGPT (Plus) | 512MB / 2Mトークン | なし(トークン内) | 128Kトークン |
| Claude (Pro) | 30MB | 100ページ(視覚分析) | 200Kトークン |
| Gemini (Advanced) | 50MB | 1,000ページ | 256Kトークン |
ChatGPTは1メッセージにつき最备10ファイル、無料プランでは1日約3ファイルまで。Claudeはコンテキストウィンドウがボトルネックになる。密度の高いテキストPDFは5MBでもトークンを大量に消費する点に注意が必要だ。
Geminiは容量面で最も余裕がある。ただしAtlas Workspace社の2026年3〜4月の1,200文書ベンチマークでは、複雑な文書の深い分析精度でClaudeが一歩抜けていると報告されている。容量の大きさと分析精度は別問題だ。
要約の「嘘」を見抜く確認フロー
実際にClaudeで業務メモを要約させたら、実在しないプロジェクト名が要約に紛れ込んでいた経験がある。AI要約を魜呑みにすると、存在しない事実が社内資料に混入する。以下の3ステップで検証する。
ステップ1:固有名詞と数値を原典と突き合わせる
人名・社名・プロジェクト名・金額・日付はハルシネーションが混入しやすい項目だ。要約に出てきた固有名詞を元PDFでCtrl+F(Macは⌘+F)して存在を確認する。1件でも原典に存在しない固有名詞があれば、その要約全体を疑うべきだ。
ステップ2:構造の対応関係を確認する
AIが章の順序を入れ替えたり、異なる章の内容を混ぜて1段落にまとめることがある。原典の目次と要約の見出しを並べ、対応関係が崩れていないかを確認する。COBOL仕様書の件では、この構造チェックを怠ったために誤った主語の要約を見過ごした。
ステップ3:AIに根拠箇所を引用させる
要約を出させた後に「各ポイントについて、元文書のどの部分に基づいているか引用して」と追加で指示する。AIが引用を出せない、または引用と要約が食い違う場合はハルシネーションと判断してよい。
長い文書を正しく読ませる実践テクニック
章ごとに分割して投げる
100ページ超のPDFは丸投げ厳禁だ。章単位で分割し、1章ずつ要約させてから最後に統合する。COBOL仕様書の件も、この手順に切り替えてから精度は明確に改善した。
用語集を先に渡す
業界略語や社内用語を含む文書は、要約の前に定義一覧を渡す。「以下の用語集を前提に要約して」と指示するだけで、AIが用語を誤解して文脈を取り違えるリスクを下げられる。SIer時代の同じ轍を踏んだことがあって、用語の前提共有を省略すると必ず嚇み合わなくなる。
出力フォーマットを具体的に指定する
「箇条書き・各項目に該当ページ番号を付記・原文から1文引用」のようにフォーマットを限定すると、AIが自由に補完する余地が減りハルシネーションが抑制される。「要約して」の一言で投げるのが最も危険だ。
スキャンPDFは事前にOCR処理する
Adobe AcrobatやOCRツールで事前にテキスト化したPDFをアップロードする方が、AI内蔵OCRに頼るより精度が安定する。特に日本語の縦書きPDFや旧字体を含む文書では、事前OCRの有無で精度が大きく変わる。
※ 検証はClaude Pro (Opus 4.6) / ChatGPT Plus (GPT-5.5) / Gemini Advanced (3.5 Flash) 環境で実施。モデルのアップデートで挙動が変わる可能性がある。
FAQ
無料プランでもPDFの要約はできる?
ChatGPT無料版は1日約3ファイル、Claudeも無料版でファイルアップロード可能だが回数制限がある。Geminiは無料版でもGoogle AI StudioからPDFを読み込める。長文PDFの継続的な要約には有料プランの方が現実的だ。
ExcelやWord文書でもハルシネーションは起きる?
起きる。Excelは複数シートにまたがるデータの参照関係をAIが正しく把握できないケースがある。Wordも表組みや脚注を含む文書で要約精度が落ちることがある。構造が単純なテキストほど精度は高い。
NotebookLMのような専用ツールとどう使い分ける?
Google NotebookLMのようなグラウンデッド特化ツールは、アップロードした文書の範囲内でしか回答しない設計のため、ハルシネーションのリスクが構造的に低い。正確さ最優先ならグラウンデッド特化ツール、文書を超えた考察や分析が欲しいならChatGPT・Claudeという判断基準で使い分ける。
「このファイルは読めません」と返されたときの対処法は?
パスワード保護・DRM付き・画像のみで構成された古いスキャンPDFが主な原因だ。パスワードを解除するか、OCRでテキスト化してから再アップロードする。Claude公式ヘルプによれば、複雑な埋め込みフォントもパーシング失敗の原因になる。
参考文献
- AI Hallucination Rates & Benchmarks in 2026 — Suprmind, 2026年
- File Uploads FAQ — OpenAI Help Center
- Upload files to Claude — Anthropic Claude Help Center
- Chat with PDF (2026): 7 AI Tools Accuracy-Tested on Real Papers — Atlas Workspace, 2026年
- AI Hallucination Statistics 2026: 50+ Sourced Data Points — Suprmind, 2026年






