結論から言う。AIにPDFを丸ごと投げて「要約して」と頼むと、一見もっともらしいが中身の違う要約が返ってくることがある。

筆者は元SIer時代の同僚から、20年もののCOBOL基幹仕様書PDF(200ページ超)をClaude Codeに要約させたいと相談を受けた。丸ごと投げてプロンプトを最適化しなかった結果、章節構造の認識が崩れ、要約には誤った主語で書かれた段落が複数混入していた。結局、章ごとに分割し用語集を先に渡してから再要約する羽目になり、1週間を無駄にした。

AIのファイル読み込みは「完璧に読んでくれる」わけではない。ファイル形式・ページ数・質問の仕方で精度は大きく変わる。

AIが文書を「読み間違える」原因

AIがアップロードされた文書を要約する際のハルシネーション(事実と異なる内容の生成)は、3つの原因に集約される。

グラウンデッドとアングラウンデッドの精度差

Suprmind社の2026年版ベンチマークによれば、AIが手元の文書を参照しながら要約する「グラウンデッド」タスクのハルシネーション率は0.7〜1.5%。一方、学習データだけに頼る「アングラウンデッド」タスクでは、SimpleQAベンチマークでo3が33〜51%を記録している。桁違いの差だ。

PDFを渡して要約させること自体は比較的安全だ。問題は、モデルが「文書に書いてないこと」を親切に補完しようとしたとき。訓練データ由来の誤情報が混入するリスクはここで跳ね上がる。

コンテキストウィンドウの限界

スタンフォード大学の研究で知られる「Lost in the Middle」問題は、ファイル読み込みでも発生する。Claude(Opus 4.6, 2026年5月時点)の公称コンテキストは200Kトークンだが、Claude公式ヘルプによればPDFの視覚分析は100ページまで。実効容量は公称値の60〜70%程度であり、100ページ超のPDFでは中間部分の情報が抜け落ちることがある。

ChatGPT(GPT-5.5, 2026年5月時点)は1ファイル最大4512MB・2Mトークンを受け付ける。だが内部的にはトークン数に応じて処理が分割されるため、ファイルサイズの上限をクリアしていても「全文を等しく読んでいる」保証はない。

スキャンPDFとOCR精度の壁

テキスト埋め込み型PDFなら直接テキストを読み取れる。だがスキャンPDFは内部でOCR処理が走り、フォントの潰れ・手書き注釈・表組みのセル結合で精度が落ちる。暗号化PDFや複雑な埋め込みフォントはパーシング自体が失敗する原因になる。

サービス別のファイルアップロード制限

要約精度に直結するのが、各サービスのアップロード制限だ。2026年5月時点の公式仕様を以下に示す。

サービス1ファイル上限PDF固有の制限コンテキスト
ChatGPT (Plus)512MB / 2Mトークンなし(トークン内)128Kトークン
Claude (Pro)30MB100ページ(視覚分析)200Kトークン
Gemini (Advanced)50MB1,000ページ256Kトークン

ChatGPTは1メッセージにつき最备10ファイル、無料プランでは1日約3ファイルまで。Claudeはコンテキストウィンドウがボトルネックになる。密度の高いテキストPDFは5MBでもトークンを大量に消費する点に注意が必要だ。

Geminiは容量面で最も余裕がある。ただしAtlas Workspace社の2026年3〜4月の1,200文書ベンチマークでは、複雑な文書の深い分析精度でClaudeが一歩抜けていると報告されている。容量の大きさと分析精度は別問題だ。

要約の「嘘」を見抜く確認フロー

実際にClaudeで業務メモを要約させたら、実在しないプロジェクト名が要約に紛れ込んでいた経験がある。AI要約を魜呑みにすると、存在しない事実が社内資料に混入する。以下の3ステップで検証する。

ステップ1:固有名詞と数値を原典と突き合わせる

人名・社名・プロジェクト名・金額・日付はハルシネーションが混入しやすい項目だ。要約に出てきた固有名詞を元PDFでCtrl+F(Macは⌘+F)して存在を確認する。1件でも原典に存在しない固有名詞があれば、その要約全体を疑うべきだ。

ステップ2:構造の対応関係を確認する

AIが章の順序を入れ替えたり、異なる章の内容を混ぜて1段落にまとめることがある。原典の目次と要約の見出しを並べ、対応関係が崩れていないかを確認する。COBOL仕様書の件では、この構造チェックを怠ったために誤った主語の要約を見過ごした。

ステップ3:AIに根拠箇所を引用させる

要約を出させた後に「各ポイントについて、元文書のどの部分に基づいているか引用して」と追加で指示する。AIが引用を出せない、または引用と要約が食い違う場合はハルシネーションと判断してよい。

長い文書を正しく読ませる実践テクニック

章ごとに分割して投げる

100ページ超のPDFは丸投げ厳禁だ。章単位で分割し、1章ずつ要約させてから最後に統合する。COBOL仕様書の件も、この手順に切り替えてから精度は明確に改善した。

用語集を先に渡す

業界略語や社内用語を含む文書は、要約の前に定義一覧を渡す。「以下の用語集を前提に要約して」と指示するだけで、AIが用語を誤解して文脈を取り違えるリスクを下げられる。SIer時代の同じ轍を踏んだことがあって、用語の前提共有を省略すると必ず嚇み合わなくなる。

出力フォーマットを具体的に指定する

「箇条書き・各項目に該当ページ番号を付記・原文から1文引用」のようにフォーマットを限定すると、AIが自由に補完する余地が減りハルシネーションが抑制される。「要約して」の一言で投げるのが最も危険だ。

スキャンPDFは事前にOCR処理する

Adobe AcrobatやOCRツールで事前にテキスト化したPDFをアップロードする方が、AI内蔵OCRに頼るより精度が安定する。特に日本語の縦書きPDFや旧字体を含む文書では、事前OCRの有無で精度が大きく変わる。

※ 検証はClaude Pro (Opus 4.6) / ChatGPT Plus (GPT-5.5) / Gemini Advanced (3.5 Flash) 環境で実施。モデルのアップデートで挙動が変わる可能性がある。

FAQ

無料プランでもPDFの要約はできる?

ChatGPT無料版は1日約3ファイル、Claudeも無料版でファイルアップロード可能だが回数制限がある。Geminiは無料版でもGoogle AI StudioからPDFを読み込める。長文PDFの継続的な要約には有料プランの方が現実的だ。

ExcelやWord文書でもハルシネーションは起きる?

起きる。Excelは複数シートにまたがるデータの参照関係をAIが正しく把握できないケースがある。Wordも表組みや脚注を含む文書で要約精度が落ちることがある。構造が単純なテキストほど精度は高い。

NotebookLMのような専用ツールとどう使い分ける?

Google NotebookLMのようなグラウンデッド特化ツールは、アップロードした文書の範囲内でしか回答しない設計のため、ハルシネーションのリスクが構造的に低い。正確さ最優先ならグラウンデッド特化ツール、文書を超えた考察や分析が欲しいならChatGPT・Claudeという判断基準で使い分ける。

「このファイルは読めません」と返されたときの対処法は?

パスワード保護・DRM付き・画像のみで構成された古いスキャンPDFが主な原因だ。パスワードを解除するか、OCRでテキスト化してから再アップロードする。Claude公式ヘルプによれば、複雑な埋め込みフォントもパーシング失敗の原因になる。

参考文献