SearchConsoleを使って新しいサイトをGoogleに知らせるものはあるけど、もしその存在を知らない場合、どのようにして「このサイトは新しいねぇ」と判定しているのか。
SEOをやっている人でも意外と知らない事実があるかも?
新しいサイトを Google が発見する主な入口(7つ)
① 他サイトからのリンク
最も古典的かつ強力な経路。Googlebotは既存ページを巡回中にリンクを見つけて遷移する。
- SNSリンク
- ブログの引用リンク
- 掲示板
- サテライトサイト
- 他者が貼った紹介リンク
1本でも被リンクがあれば、かなり高確率でクロールされます。現在のWebページは「相互リンク」の概念がほぼないけど、昔はサーチエンジン経由よりも「サイトからサイトへ」の移動はリンク集が主だったので、名残りみたいなもの。
現在は”被リンク”で知られており、SNS共有などURLを含めたポストとか、プロフィール欄にあるURLでも被リンクとしてカウントはされている。
② DNS・ドメイン登録情報(レジストラ)
Googleは公開されたDNSゾーンやレジストラ情報を監視しており、新しいドメインが登録された・AレコードやAAAAレコードが追加された・公開サーバーにHTTP応答がある。
こうしたタイミングで「候補」に乗ります。
※『DNS監視→即クロール』ではないが、発見経路には確実に入っています。
③ サーバーログ / プロバイダレベルでの露出
CDN(Cloudflareなど)やホスティングサービスの一部はGoogleと技術提携しており、最新の公開ホスト情報をクローラが自然に掴む仕組みがあります。
例:
- Cloudflare 上の新サイト
- Blogger
- Wix
- Shopify
- Squarespace
これらは公開と同時にクロール候補へ乗ります。
直近でCloudflareが障害で様々なサービスが阿鼻叫喚になったように、CDNの大本からのリンクは強いってわけですね。
④ サイトマップ(sitemap.xml)
サイトマップは最も意図的に"新サイト"を教える方法です。
GSC(Google Search Console)で「/sitemap.xml」を自動or手動で登録。robots.txtにも「site.com/sitemap.xml」なりで記載しておくと、クロールの際に"新規サイト" と判定しやすくなります。
⑤ Google Search Consoleへの手動登録
これは人間側のアクションですが、新しいサイトを GSC にプロパティ追加することで、サイトの存在が確定します。
Google内部的には"確実に存在が証明済みの新規サイト"として処理されます。
⑥ HTTPアクセスの普遍的スキャン
Googlebot以外にも世界中のクローラ(研究機関・セキュリティ会社・他検索エンジン)が全ドメインのポート80/443を走査しています。
Googleはこうした外部信号も参考にしており、「存在するホストとしての候補」になります。
⑦ URLの公開情報・SNS
X(Twitter)、Instagram、Facebook、YouTubeなど「URLが投稿される場所」はGoogleが継続的にクロールしています。
特にX/TwitterはGooglebotが頻繁にクロールします。サイト立ち上げ時はSNSで宣伝するのが有効だとわかります。
つまり、Google は"どこからでも"新規サイトを発見できる
| 経路 | 特徴 |
|---|---|
| 被リンク | もっとも自然で強力 |
| DNS登録情報 | 自動的に候補に載る |
| ホスティング・CMS提携 | 公開直後に検出しやすい |
| sitemap.xml | 意図的に通知 |
| GSC | 確実な通知 |
| 全ドメインスキャン | 技術上の背景探索 |
| SNSや公共投稿 | 即クロール対象 |
上記の要素が複合的に働き、“まったく誰も紹介していないサイト"でも、早期に発見されます。なので新規サイトを立ち上げて、一刻も速くGoogleに認知されるためには、複数の方法から出来ることを1つでもやればいいことになります。
まとめと補足:実務で最も速いクロール誘導は?
確実性の順位はこうです。
- GSCでプロパティ登録 → sitemap送信
- 既存サイトから1本リンクを貼る
- SNS (X) にリンク投稿
この3つをやると新規ドメインでも、数分〜数時間でクロール → 24–72時間でインデックスが現実的です。
(2)については個人で最初に立ち上げた場合だと困るけど、ブログ登録サービスを使ってもOK(ブログ村とか)。無料ブログならトップドメインからのリンクとみなされるので、そのままでも大丈夫。
個人でサイトを立ち上げるなら、最低でもサイトマップは用意しておいて、(1)と(3)をサクッとやるのが確実な方法といえます。
旧サイト(ドメイン)のクロールは遅い
これは特殊な形になるけど、特定のドメインを譲り受けて"全く別物"として作成した場合、元の情報を保存したままになりやすい。
つまり、新しく作成したサイトのクロールが反映されずらい現象が起きます。
ある程度運用されたドメインは、過去のアクセス実績を引き継いでおり、それまでと違うジャンル・タイプで運用をすると、「ページ改ざんされてね?」みたいな意識高めのセキュリティが発動する。
そのため、新ドメインよりもインデックス登録が遅くなり、やきもきすることも。なので中古ドメインの購入だったり譲渡をした場合は、もともとそこで運用されていたジャンル・タイトルを使ったほうがすぐ反映されやすいです。
逆に、中古ドメインで元のアクセスを期待しつつ新しいサイトを立ち上げる場合は、Googleからペナルティを受けて順位が下がるなどのリスクがあるため、それなりの覚悟をもってするようにするべき。