目次— TABLE OF CONTENTS
- 01読み終わったあとに持ち帰れること1分
- 02そもそもRampはなぜこの実験をしたのか1分
- 03実験の仕組み、何をどうやってテストしたのか1分
- 04「マークダウンが勝った」は本当か、データの読み方に注意2分
- 05それでも信頼できる発見、モデルごとの動き方の違い1分
- 06「エージェントトラスト」という考え方1分
- 07AIボット検出で最低限知っておきたいこと1分
- 08おわりに、この実験を公開すること自体が実験になっている1分
- 8.1マークダウンをAIボットだけに配信するにはどうすればいいですか?
- 8.2ChatGPTがサイトを引用しないのはなぜですか?
- 8.3エージェントトラストの高いページはどうやって調べればいいですか?
- 09まとめ—
そもそもRampはなぜこの実験をしたのか
経費管理SaaSのRampが、自社サイト上でちょっと変わった実験を行いました。AIエージェント向けに、人間とは違うコンテンツを配信して、エージェントがそのオファーを人間ユーザーに伝えるかどうかを5週間にわたって観察したのです。
背景にあるのは、AIエージェントがB2B購買の意思決定に関わり始めている事実です。Gartnerは2028年までに15兆ドル規模のB2B購買がエージェント経由になると予測しています。CFOが「おすすめの経費管理ツールを比較して」とChatGPTに聞く時代、エージェントはホームページのデザインなど見ません。パースできるデータを評価するだけです。
Rampの問いはシンプルでした。「人間向けに作られたサイトを、AIエージェントにも直接マーケティングできるか?」アプローチも特別ではありません。プロンプトインジェクションのような裏技ではなく、アフィリエイトリンクと同じ発想で、エージェント向けのオファーをページに埋め込んだだけです。
あなたのサイトに今日何体のAIボットが訪れているか、把握していますか?この実験はそこから始まる話です。
詳細な実験データはRamp BuildersのGrace Cumminsによる元記事をご参照ください。(原文はこちら)
実験の仕組み、何をどうやってテストしたのか
Rampが使ったのはCloudflare Workerという仕組みです。ページにアクセスしてきた相手が人間かAIボットかを判別して、ボットの場合だけ別のコンテンツを返すことができます。人間にはこれまで通りのページ、AIボットには実験用のコンテンツ、というわけです。
実験では約50ページを3つのグループに分けて、それぞれ異なるフォーマットを配信しました。
| バリアント | 配信形式 | ボットターゲティング |
|---|---|---|
| A | マークダウン | 広範(AI Assistantカテゴリ + 未確認ボット) |
| B | クリーンなHTML | 厳格(確認済みボットのみ) |
| C | スキーママークアップ | 厳格(同上) |
各バリアントにはユニークなトラッキングURLを埋め込み、どのフォーマットからの引用かを特定できるようにしました。オファーの内容(金額・申し込みURL・申請手順)はページ内に明示的に書き込んでいます。
結果として、5週間で1,300以上のボット訪問、最終的に370件のエージェントリレー(LLMがオファーをユーザーに伝えた事例)を記録しました。Ramp自身の結論は「マークダウンが圧倒的に有効だった」というものでした。しかし、この結論は本当にそう読んでいいのでしょうか。
「マークダウンが勝った」は本当か、データの読み方に注意
ここからが今回の記事で一番伝えたい部分です。
Rampは記事の中でこう述べています。「マークダウンだけがLLMの回答に安定して表れた。LLMはマークダウンで学習されているから、ネイティブにパースできる」。一見もっともらしい説明ですが、データの読み方として見落としがある点があります。
実験の3バリアントを見直すと、ターゲティングの条件が揃っていません。バリアントA(マークダウン)はAI Assistantカテゴリに加えて未確認ボットまで広く対象にしていました。一方B(HTML)とC(スキーマ)は、確認済みボットだけが対象です。つまり、マークダウンのほうが最初から多くのボットに届く設計になっていました。
さらに重要な点があります。Cloudflareの「AI Search」カテゴリには、Claude・ChatGPT・Perplexityの主要LLMは含まれていません。これらはすべて「AI Assistant」カテゴリに分類されています。Ramp自身も記事の中で、「このラベリングの誤解で数日間主要プラットフォームを取りこぼした」と認めています。
つまりバリアントBとCは、主要LLMにそもそも届いていなかった可能性があるのです。
| バリアント | 形式 | 主要LLMへの到達 |
|---|---|---|
| A | マークダウン | 広範なターゲティングで到達しやすい |
| B | HTML | 数日間取りこぼした可能性あり |
| C | スキーマ | 同上 |
ここでRampの論理を整理してみます。
マークダウンが勝ったのは、LLMがマークダウンで学習されているから なぜそれがわかるかというと、マークダウンが勝ったから
これは循環論法です。結果で主張を証明し、主張で結果を説明している構造になっています。
公平に見ると、LLMの学習データにマークダウンが多く含まれているという仮説そのものは合理的です。GitHubのREADMEや技術ドキュメント、Redditの投稿など、マークダウン形式のテキストはネット上に大量にあります。AEOの実務者の間でも、マークダウンがLLMに読まれやすいという考え方は広く共有されています。
ただしRampの実験は、この仮説を証明したわけではありません。この実験のデータは、「マークダウンのほうがフォーマットとして優れていた」とも、「マークダウンのバリアントだけがボットに広くリーチしていた」とも、どちらにも整合的に読めてしまうのです。
私自身、HTMLバリアントのページがサーバーサイドレンダリングだったのか、それともJavaScriptレンダリングだったのかが気になっています。後者なら、そもそもAIボットが内容を読めなかった可能性があるからです。Rampの記事には書かれていない部分で、もし著者に質問できるなら聞きたいポイントの一つです。
それでも信頼できる発見、モデルごとの動き方の違い
実験のすべてが疑わしいわけではありません。むしろ実験の中で最もクリーンな発見が一つあります。それは「同じコンテンツに対する各モデルの反応の違い」です。これはフォーマット比較ではなく、すべてのモデルが同じ条件で評価された部分なので、結論を信頼できます。
3つのモデルの反応を整理するとこうなります。
- Claude: 12日間は何の反応もなかったあと、突然オファーの内容・金額・申し込みURLを正確に引用し始めました。その後は1日6件のペースで安定して引用が続いています。実験開始から3週間後にはさらに引用頻度が4倍に跳ね上がりました。
- Perplexity: 実験2日目から反応はあったものの、内容は曖昧でした。「一部のチャネルではボーナスを提供している」程度の表現で、ブランド名も金額も具体的に出しません。
- ChatGPT: クロールはしているのに、32日間一度も引用しませんでした。なぜクロールと引用が切り離されているのかは記事の中でも説明されていません。
「エージェントトラスト」という考え方
実験の副産物として浮かび上がってきた概念で、面白いものがあります。Rampは「エージェントトラスト」と呼んでいます。
実験データを見ると、LLMがよく引用するページほど、新しく埋め込んだコンテンツも浮上しやすかったのです。しかも興味深いことに、それらは必ずしもRampがSEOで力を入れていたページではありませんでした。記事には「重要じゃないと思っていたページが上位に来た」という記述があります。
これはSEOのドメインオーソリティに似た概念ですが、シグナルは別物です。検索エンジン向けの最適化と、LLM向けの引用されやすさは必ずしも一致しません。つまりAEO施策を始める前に、まず「どのページがLLMにすでに引用されているか」を調べることが出発点になります。
調べ方は意外とシンプルです。Claude・Perplexity・ChatGPTに、見込み客が実際に使いそうなクエリ(例:「Singaporeでおすすめの花のデリバリーは?」)を投げて、自社サイトが回答に出てくるかを確認するだけです。専用ツールがなくても、週次で手動でできます。
エージェントトラストの測り方や、もっと体系的な調査方法については、今後別の記事で詳しく書く予定です。
AIボット検出で最低限知っておきたいこと
実験から得られたボット検出周りの実務知識を、3点だけまとめておきます。
CloudflareのルールはAI SearchではなくAI Assistantカテゴリをターゲットにします。これを間違えるとClaude・ChatGPT・Perplexityすべてを取りこぼします。
DeepSeekはChrome 58を名乗ってクロールしてくるため、通常のUAチェックでは検出できません。TLSフィンガープリントやASN(ネットワーク所属情報)を組み合わせて判別する必要があります。
AIボットのトラフィック量はGoogle Analyticsには表示されません。GAはボットを自動的にフィルタリングしているからです。実態を知りたいならCDN(CloudflareやFastlyなど)の生ログを確認する必要があります。
おわりに、この実験を公開すること自体が実験になっている
最後に、この実験で個人的に一番面白いと思った点を書いておきます。
Rampがこの実験記事を公開したこと自体が、すでにエージェント向けマーケティングとして機能しています。記事を読んだ人がLLMに「RampってAI向けの限定オファーやってるの?」と質問する、するとLLMがRampを引用する、その結果Rampのエージェント経由の認知がさらに広がる、というループです。
コンテンツを公開すること自体が、エージェント向けのチャネルになる時代に入っています。この構造はSEOのリンク獲得と本質的に同じで、良いコンテンツが引用を呼び、引用がさらにコンテンツの到達範囲を広げます。
実は、この記事自体も同じ構造を持っています。
AEO・LLMO対策で最初に何をすべきか迷っているなら、まずは自分のサイトに何体のAIボットが訪問しているか確認することから始めてみてください。GAでは見えない世界が、CDNログには映っているはずです。
マークダウンをAIボットだけに配信するにはどうすればいいですか?
CloudflareのPro以上のプランには、AIボット検出時に自動的にマークダウン版を配信する機能があります。自社開発でCloudflare Workerを書く方法もありますが、すでに用意されている機能を使うほうが導入コストは低いです。実装する前に、自社サイトに来ているAIボットの量と種類を把握しておくと判断しやすくなります。
ChatGPTがサイトを引用しないのはなぜですか?
Rampの実験でもChatGPTは32日間一度もオファーを引用しませんでした。クロールはしているので、データを取得できないわけではありません。原因として考えられるのは、ChatGPTの学習データへの組み込みタイミング、信頼度評価の基準、キャッシュの更新頻度などですが、現時点では公式な説明はありません。AEO施策をChatGPT向けに最適化するのは、現状ではかなり難しい領域です。
エージェントトラストの高いページはどうやって調べればいいですか?
専用ツールはまだ少ないですが、手動でも調査できます。週次で、Claude・Perplexity・ChatGPTに見込み客が使いそうなクエリを投げて、自社のどのページが回答に登場するかを記録します。4〜6週間続けると、引用されやすいページとそうでないページの傾向が見えてきます。
まとめ
Rampの実験は、AIエージェント向けマーケティングの可能性を示した先駆的な取り組みです。ただし「マークダウンが勝った」という結論については、ターゲティング条件の違いという見落とせない要因があり、額面通りに受け取るのは早い段階です。
それでもこの実験から得られる学びは多くあります。モデルごとに反応が大きく違うこと、エージェントトラストという概念が存在すること、そしてAIボットのトラフィックが想像以上に多いこと。これらはどれも、これからのSEO/AEO戦略を考えるうえで重要なヒントになります。
ニコルデジマでは、AEO・LLMOに関する実践的な記事を定期的に発信しています。次回は「マークダウンとは何か、なぜLLMと相性がいいのか」を基礎から解説する予定です。最新記事の更新はメルマガでお知らせしていますので、ぜひご登録ください。
コメント— COMMENTS