結論から言う。Gemini 3.5 Flash は2026年5月の Google I/O で発表されたフロンティアモデルであり、ベンチマーク上は Claude Opus 4.7 や GPT-5.5 と互角以上の性能を持つ。「なんか微妙」と感じている人がいるなら、原因は大きく2つ——無料版の自動モデル降格と、得意分野のミスマッチだ。

筆者がテックライターとして独立した2023年、ChatGPT API の課金だけで月3〜4万円が飛んでいた。あの頃から「新モデルが出たら、どのプランで何のモデルが動くかを公式ドキュメントで確認する」習慣がある。Gemini 3.5 Flash でも同じ手順で検証した。

ベンチマークでは Claude Opus 4.7・GPT-5.5 と互角以上

まず数字を見る。Google公式のモデルページによれば、Gemini 3.5 Flash は主要ベンチマーク11項目中6項目でトップスコアを記録している。

特にマルチモーダル領域が圧倒的だ。CharXiv Reasoning で84.2%、MMMU-Pro で83.6%、長文脈の MRCR v2 128k では77.3%を叩き出した。Claude Opus 4.7 が46.9%、GPT-5.5 が41.4%だから、差は歴然である。出力速度も毎秒289トークンと、Opus 4.7(67トークン/秒)や GPT-5.5(71トークン/秒)の約4倍。コスト面でも入力トークン100万あたり1.50ドルと、Claude Opus 4.7 の約10分の1だ。

ベンチマークだけ見れば「最も速くて安いフロンティアモデル」と言い切っていい。にもかかわらず「微妙」の声が出る。ここに構造的な原因がある。

無料版の落とし穴 — 32Kトークンで旧モデルに自動降格する

X上の投稿を追うと、不満の大半は無料版ユーザーに集中している。

2026年5月時点で、Google AI の無料プランでは Gemini 3.5 Flash のコンテキストが約32,000トークンに制限される。有料プランなら最大1,048,576トークン(約100万トークン)を扱えるから、無料版はそのわずか3%だ。長い会話や大きなドキュメントを投げれば、すぐ天井に当たる。

厄介なのが自動降格の仕様である。無料版で利用上限に達すると、モデルが旧世代の Gemini 3 Flash に切り替わる。ユーザーへの通知が目立たないため、「さっきまで賢かったのに、いきなり回答の質が落ちた」という体感になる。Gemini 3 Flash は2026年3月リリースの世代であり、3.5 Flash とはベンチマークスコアに明確な差がある。ここに気づかず「Gemini はダメだ」と結論づけている人が少なくないと判断する。

得意タスクと苦手タスク — 万能ではない

自動降格の問題を差し引いても、モデルの得意・不得意は存在する。

Gemini 3.5 Flash が強いのはマルチモーダル処理とエージェント的なツール連携だ。MCP Atlas 83.6%、Toolathlon のスコアが示すとおり、外部ツールを呼び出して複合タスクを組み上げる能力では他モデルを上回る。画像・動画・音声を横断的に処理させるタスクでも圧倒的である。フォーマット変換や大量テキストの分類など「正確さよりスピード」が求められる場面も得意分野に入る。

一方、深い数学的推論ではGPT-5.5に分がある。FrontierMath Tier 4 で GPT-5.5 が35.4%を記録しており、段階的に論理を積み上げるタスクでは差がつく。ソフトウェアエンジニアリングの最難関ベンチマーク SWE-Bench Pro では Claude Opus 4.7 が64.3%で単独トップだ。大規模なコードベースの文脈を保持しながらリファクタリングを指示するような場面では、Claudeのほうが正確に意図を汲んでくれた——これは筆者の検証環境(macOS 15.5 / Google AI Studio Web UI / 2026年5月28日時点)での体感と一致する。

有料プラン加入と Gemini 3.5 Pro 待ちの判断

本気で評価するなら、有料プランで100万トークンのコンテキストを解放した状態で使うべきだ。Google AI Plus / Pro プランに加入すれば、コンテキスト制限と自動降格の問題は解消される。料金体系は頻繁に変わるため、最新情報はGoogle AI 公式料金ページを確認してほしい。

さらに、2026年6月には Gemini 3.5 Pro のリリースがGoogle公式ブログで予告されている。Google社内ではすでに利用が始まっており、Flash を上回る推論精度が期待される。チャット用途で深い推論を求めるなら、Proの登場を待つのも合理的な判断だ。

結局のところ、2026年5月時点での最適解はタスクで使い分けることである。マルチモーダルとエージェント連携は Gemini 3.5 Flash、コード生成・大規模リファクタリングは Claude Opus 4.7、数学・論理推論は GPT-5.5。1つのモデルに全部任せる時代は終わった。

FAQ

Gemini 3.5 Flashは無料で使えるのか?

使える。ただし無料版はコンテキストが約32,000トークンに制限され、上限に達すると旧世代の Gemini 3 Flash に自動降格する。有料プランなら最大約100万トークンまで利用可能だ。

ChatGPTやClaudeから乗り換えるべきか?

全面乗り換えは推奨しない。マルチモーダル処理やツール連携では Gemini 3.5 Flash が現時点で最強だ。一方、ソフトウェア開発では Claude Opus 4.7、数学的推論では GPT-5.5 のほうが精度が高い。タスクごとに選ぶのが合理的である。

「Gemini 3 Flash」と「Gemini 3.5 Flash」は何が違うのか?

Gemini 3 Flash は2026年3月リリースの旧世代。3.5 Flash は5月の Google I/O で発表された新世代であり、ベンチマークスコアが大幅に向上している。無料版の自動降格で3 Flashに戻されると性能差を体感しやすい。

Gemini 3.5 Proはいつ出るのか?

Google公式ブログによれば2026年6月にロールアウト予定だ。Flash より推論精度が高い上位モデルという位置づけであり、チャット用途で深い推論を求めるなら待つ価値がある。

参考文献