1. AIブラウザエージェント
AIブラウザエージェントが話題になっています。
Claude in Chrome、ChatGPT Atlas、Perplexity Comet。
いずれも「ブラウザ上の作業をAIに任せる」ツールで、フォーム入力、ページ比較、データ抽出、Webアプリのテストまで対象になるとされています1。
宣伝文句はたいてい似ています。
「調査を自動化できる」「作業時間を削減できる」「エージェントが代わりにやってくれる」。
ただ、便利さの話と、安全に使える範囲の話は、切り分けて考える必要があります。
1.1. チャットAIと何が違うのか
チャットAIは、テキストを受け取ってテキストを返します。
Web検索を組み合わせれば公開情報の調査や要約、比較表の作成、文章の下書きも十分にできます。
これらの作業は、実際のブラウザ操作を必要としません。
ブラウザAIエージェントは、実際のブラウザ画面を見ながらクリック、入力、ページ移動ができます。
ログイン後のページを読め、フォームに文字を入れられ、複数タブを横断しながらWebアプリの操作をそのまま実行できます2。
この差が価値になる場面は、ある程度はっきりしています。
ログイン後の画面確認、フォームへの転記、表示中ページからのデータ抽出、Webアプリのテスト、バグの再現手順実行、UI上の確認作業——実ブラウザ操作が必要で、かつ手作業だと面倒な作業です。
公開情報の調査や要約、比較表の作成、文章の下書きといった作業は、ブラウザAIエージェントを使う必然性がほとんどありません。
チャットAIで足ります。
1.2. 比較優位性とリスクの2軸
AIブラウザエージェントの用途を評価する軸は2つあります。
1つ目は、チャットAIと比べた比較優位性です。
「実ブラウザ操作なしには代替しにくいか」を問います。
2つ目は、セキュリティおよび法的なリスクです。
「操作が外部に影響し、取り返しがつかなくなる可能性があるか」を問います3。
この2軸で整理すると、4つの領域に分かれます。

| 比較優位性:低 (チャットAIで代替できる) | 比較優位性:高 (実ブラウザ操作が必要) | |
|---|---|---|
| リスク:高 (外部に影響し、取り消しにくい) | 避ける領域。 メール自動処理、SNS自動投稿、個人情報を含む資料整理。チャットAIで代替できるのにリスクだけが残る。 | 要管理領域。 CRM転記、営業メール送信、EC購入、予約確定、ファイル共有、権限変更。宣伝されやすいが、「できる」と「任せてよい」は別。 |
| リスク:低 (外部への影響が限定的) | チャットAIで十分な領域。 公開ページの要約、料金比較、競合調査、文章の下書き。ブラウザAIエージェントを使う必然性が薄い。 | 有望領域。 フォーム入力補助(送信しない)、データ抽出、複数タブ比較、Webアプリのテスト、バグ再現、UI確認。実ブラウザ操作の価値があり、外部に影響しにくい。 |
表で見ると、使いどきは右下の有望領域に集中します。
宣伝されやすい右上の要管理領域は、使えても最終実行は人間が担う必要があります。
左上は、リスクだけ高くてメリットが薄い、最も避けたい組み合わせです。
2. 「取り返しのつかなさ」の構造
AIブラウザエージェントのリスクは、「AIが間違えるかもしれない」という話だけではありません。
インターネット上で動作するということは、外部環境に対して現実のアカウント権限で作用するということです。
そこには2種類の「取り返しのつかなさ」があります。
- 1つは、相手がいることです。
メール、フォーム、SNS投稿、レビュー、コメントには、受け取る相手がいます。
誤送信すれば相手の手元に届き、転送され、スクリーンショットが撮られます。
信用が毀損し、規約違反になることもあります。 - もう1つは、公開範囲が広がることです。
一度送った情報は、転送・保存・拡散・検索・転載が起きる可能性があります。
SNS投稿は完全に削除できないことがあり、ファイル共有は共有先を消しても相手の手元には残ります4。
AIブラウザエージェントのリスクは、AIの判断ミスそのものより、判断ミスが外部に実行されたあと回収できないことにあります。
2.1. 失敗パターンの類型
フォーラム、セキュリティ企業の検証、公式の注意喚起から、失敗パターンはいくつかの類型に整理できます。
外部送信の失敗は、頻度が高い類型です。
営業メール、問い合わせフォーム、SNS投稿への誤送信が当てはまります。
文章作成から入力、送信が一続きの作業になると、人間が止まるタイミングが消えます。
購入・予約・契約の失敗は、取り返しがつきにくい典型です。
AIブラウザエージェントをECフローで試した検証では、10サイト中7サイトで基本的なナビゲーションに失敗したという報告があります5。
サイズ選択のドロップダウン一つで詰まることがある一方、別の場面では購入確定まで進んでしまうことがあります。
プロンプトインジェクションによる乗っ取りは、より根本的なリスクです。
プロンプトインジェクションとは、Webページ、メール、コメント欄、フォームに埋め込まれた悪意ある文字列が、AIへの命令として機能してしまう問題です6。
Claude in Chromeでは、任意のWebサイトがClaude拡張にプロンプトを注入できた可能性のある脆弱性が報告されており、ShadowPromptと呼ばれています7。
他のChrome拡張機能がClaude拡張に指示を注入できた可能性を示す問題も報告されており、ClaudeBleedと呼ばれています8。
大量処理による失敗の増幅も見落としがちです。
1件なら人間が気づけるミスでも、AIに100件処理させると、誤送信、重複送信、規約違反、迷惑行為が一気にスケールします。
効率化と同時に、失敗もスケールするわけです。
3. AIの「デコボコな知能」
生成AIの能力は、人間の能力のように滑らかにつながっているわけではありません。
難しい文章を読め、コードが書け、複雑な概念を整理できます。
しかし、画面上の微妙な違和感を感じ取れなかったり、詐欺サイトっぽさに気づけなかったり、送信ボタンの「重み」を感じなかったりします。
知能検査に例えれば、ある下位検査では非常に高得点なのに、別の下位検査では平均以下というプロファイルに近いです9。
知能が高いか低いかという一次元の話ではなく、能力の凹凸が極端に大きい。
AIブラウザエージェントでは、この凹凸が特に問題になります。
「難しい調査や文章作成ができる」から、「画面操作や判断も同じくらいできるはず」と思われやすいためです。
しかし、送信ボタンの重み、公開範囲の危険性、相手への迷惑、偽サイトの違和感は、人間の常識判断に依存する部分が大きいです。
3.1. 「疑う」のは人間の仕事
人間の「疑う」という能力は、純粋な論理能力だけでなく、身体性と損失感覚に支えられています。
身体性は、「なんかこのURL変だな」「このフォーム情報取りすぎてないか」「このメール急かしすぎている」という、言語以前の違和感の感知です。
損失感覚は、「これを間違えたら恥ずかしい」「相手に迷惑がかかる」「炎上する」「返金できない」という想像から来るブレーキです。
LLMには、この2つがありません。
「危険です」と書くことはできますし、「責任があります」と出力することもできます。
ただ、本当に怖がっているわけではないし、取り返しがつかない経験を積み上げてきたわけでもありません。
難しい規約文を読めるのに、「このボタンは押さないほうがよさそう」という生活感のある判断が弱いのは、そういった構造からきています。
自己修正の研究でも似たことが指摘されています。
外部フィードバックなしに「もう一度考えて」「間違いを直して」と促しても、推論性能が安定して改善するとは限りません10。
「反省っぽい文を生成すること」と「本当に誤りを見抜いて修正すること」は別だからです。
3.2. プロンプトはブレーキではない
プロンプトは、プログラムの命令文のように必ず実行されるものではありません。
AIの出力や行動をそちらへ誘導するものに近いです。
「絶対に送信しないで」と書いても、通常は強い制約として働きますが、機械的に保証されるわけではありません。
文脈が長い、外部ページに紛らわしい指示がある、モデルがタスク達成を優先して解釈する、といった条件で崩れることがあります。
安全設計では、「送信しないで」とプロンプトに書くだけでは不十分です。
送信ボタンを人間が押す設計にする、送信権限のないアカウントを使う、機密サイトにログインしない、危険操作の前でシステム的に止める。そうした構造的な制約が必要になります11。
プロンプトはブレーキではなく、ハンドル操作のお願いに近いものです。
本当のブレーキは、権限設計、人間確認、環境分離、送信・公開・購入を止める仕組みです。
4. 実務上の安全ライン
AIに任せてよい作業は、読む、整理する、抽出する、入力する、下書きする、送信直前まで進める、の範囲です。
人間が必ず確認すべき作業は、送信する、公開する、購入する、予約を確定する、削除する、共有する、権限を変える、の範囲です。
対象情報でいえば、公開情報やテストデータは比較的安全な領域で、個人情報、顧客情報、契約、金融は慎重な領域です。
アカウントについては、テスト用・最小権限のアカウントが望ましく、メインアカウントや管理者権限での運用は避けたほうがよいです12。
「チャットAIではできない実ブラウザ操作が必要で、かつ最終的な外部影響を人間が止められる作業に限定する」——これが実務上の安全ラインになります。
AIは頭がよくても、危険の匂いには鈍いです。
アクセルを任せてよい場面はあっても、最後のブレーキは人間が持つべきです。
- Claude in Chromeは、AnthropicがChrome拡張として提供するブラウザAIエージェントで、Webサイトの閲覧、フォーム入力、データ抽出、複数ステップの作業が公式ユースケースとして挙げられている。ChatGPT AtlasはOpenAIがAtlas(ChromeおよびMacOS向けの独立したブラウザアプリ)に統合したエージェント機能、Perplexity CometはPerplexityが提供するAIブラウザで、それぞれ同様のブラウザ操作自動化を目指している。 – Use Claude Code with Chrome (beta) – Claude Code Docs
- Claude in Chromeの公式ドキュメントでは、Claude Code(CLIツール)との連携によるWebアプリのテスト、コンソールログの確認、フォーム入力やページからのデータ抽出が具体的な用途として挙げられている。 – Use Claude Code with Chrome (beta) – Claude Code Docs
- AIエージェントのセキュリティリスクを「操作の外部影響」と「情報漏えいの可能性」に分けて考える観点は、Anthropicのプロンプトインジェクション対策に関する公式解説でも示されており、ブラウザエージェントがユーザーの権限でWebを操作するという構造上のリスクが指摘されている。 – Mitigating the risk of prompt injections in browser use – Anthropic
- Googleは、Auto browse機能(開いているタブをまたいでAIがユーザーの代わりに行動する機能)の説明で、AIが操作するサイトと情報を共有する可能性があることを明記している。こうした「情報が外部に渡ること」はブラウザAIエージェント全般に共通するリスクとして認識されている。 – Using Ask ChatGPT sidebar and ChatGPT Agent on Atlas – OpenAI Help Center
- この検証はLinkedIn上の個人投稿で報告されたもので、Claude in Chrome、ChatGPT Atlas、Perplexity Cometを標準的なECサイトのTシャツ購入フローで試したとされている。投稿者はブラウザAIエージェントの実用性に懐疑的なまとめをしており、個人の評価であるため一般化には注意が必要だが、現時点でのECサイト操作の難易度を示す一例として参照した。 – I watched an AI browser agent fail to buy a t-shirt yesterday – LinkedIn
- Anthropicのプロンプトインジェクション解説では、エージェントがブラウジングする際に遭遇するコンテンツには「完全には信頼できないものが含まれる」と説明されており、検索結果、ドキュメント、アプリの中に攻撃者の悪意ある命令が埋め込まれている可能性があるとしている。この問題をAIブラウザエージェントにおける最大のセキュリティ課題の一つと位置づけている。 – Mitigating the risk of prompt injections in browser use – Anthropic
- Koi Securityが報告したShadowPromptは、Claude Chrome拡張のワイルドカードオリジン許可リストと、CAPTCHAサブドメインのDOM-based XSSを組み合わせた攻撃手法で、攻撃者が不可視のiframeを通じてAIセッションに悪意ある命令を注入し、認証情報の窃取やメール閲覧、成りすまし操作が可能になる可能性があったとされる。2026年2月19日に修正済み。 – ShadowPrompt: How Any Website Could Have Hijacked Claude’s Chrome Extension – Koi Security
- LayerX Securityが報告したClaudeBleedは、特別な権限を持たない任意のChrome拡張機能が、Claude拡張に悪意ある命令を注入できる脆弱性で、攻撃者が望む情報の抽出やエージェントによる能動的な操作が可能になる構造だったとされている。 – ClaudeBleed: A Flaw In Claude’s Browser Extension Allows Any Extension to Hijack It – LayerX
- WISC(Wechsler Intelligence Scale for Children)はアメリカの心理学者デイヴィッド・ウェクスラーが開発した児童向けの知能検査。言語理解、視覚空間認識、流動性推理、ワーキングメモリ、処理速度という複数の指標から構成されており、総合IQが高くても特定の領域で著しく低い「能力の凸凹」が見られることがある。この凸凹プロファイルはAIの能力特性を説明する比喩として用いた。 – 児童向けウェクスラー式知能検査 – Wikipedia
- ICLR 2024で発表された研究「Large Language Models Cannot Self-Correct Reasoning Yet」は、外部フィードバックなしにLLMに自己修正を求めても推論性能が安定して改善されず、むしろ悪化する場合があることを示した。内発的な自己修正の限界として、LLMが「反省っぽい文を生成すること」と「誤りを正しく見抜いて修正すること」は別だという点が指摘されている。 – Large Language Models Cannot Self-Correct Reasoning Yet – OpenReview
- 命令の優先順位をモデルに学習させる「instruction hierarchy」の研究(Wallace et al., 2024)では、システムプロンプト、開発者指示、ユーザー指示、外部Webページのテキストに優先順位をつけ、下位の外部テキストが上位の指示を上書きできないよう訓練することで、プロンプトインジェクションへの耐性を高められると報告されている。ただし、この手法も完全な防御にはならず、プロンプトという誘導に加えて権限設計や環境分離という構造的な制約が重要になる。 – The Instruction Hierarchy: Training LLMs to Prioritize Privileged Instructions – arXiv
- 英国の国家サイバーセキュリティセンター(NCSC)は、プロンプトインジェクション攻撃について「適切に緩和されない可能性がある」と警告しており、従来のSQLインジェクションのようにデータと命令を明確に分離できないLLMの構造的な問題を指摘している。この観点から、プロンプトによる誘導だけではなく、権限の最小化や環境分離のような構造的な安全設計が求められる。 – Prompt injection attacks might ‘never be properly mitigated’ UK NCSC warns – TechRadar