日付URLを総当たりするボットは何をしているのか？目的と背景をやさしく解説

こんにちは、阿久梨絵です！
Webサイトを運営していると、アクセス解析に
/2019/03/01/
/2019/07/29/
のような日付形式のURL へのアクセスが突然増えることがあります。

しかも、その多くが存在しないページ。
「誰がこんなURLを見ているの？」と不思議に感じるかもしれません。

実はこれ、ほとんどがボット（自動プログラム）によるアクセスです。
この記事では、ボットがなぜ日付URLを総当たりするのか、その目的と背景をわかりやすく解説します。

1. なぜ “日付URL” を狙うのか

ブログやCMS（WordPressなど）では、昔から

/2020/01/01/
/2019/03/07/

のように日付を含むURL構造がよく使われてきました。

そのため、ボットはこう考えます。

・「このサイトは日付URLで記事を管理しているかもしれない」
・「存在する記事を探すために、日付を総当たりしてみよう」

つまり、記事の一覧を勝手に推測して探しているのです。

2. ボットの目的は “情報収集”

日付URLを叩くボットの目的は、大きく分けて3つあります。

① サイト構造の調査（クローリング）

Googleのような検索エンジン以外にも、
世界中には無数のクローラーが存在します。

彼らはサイトの構造を調べるために、
存在しそうなURLを自動生成してアクセスします。

日付URLは規則性があるため、
「総当たりしやすい」＝「狙われやすい」のです。

② 脆弱性の探索（セキュリティスキャン）

悪意のあるボットは、次のような目的でアクセスします。

・古いCMSの記事ページが残っていないか
・過去のプラグインやテーマの脆弱性がないか
・管理画面やバックアップファイルが置かれていないか

特に /2019/ や /2020/ のような古いURLは、
「昔の脆弱なファイルが残っているかも」と狙われやすい。

③ スパム・リファラー汚染

一部のボットは、アクセス解析に
「自分のURLを残す」ことを目的にしています。

日付URLを叩く動きとセットで行われることもあります。

3. 人間のアクセスではない理由

日付URLへのアクセスは、次の特徴があります。

・アクセス元が海外に偏る
・1秒間に複数URLを連続で叩く
・存在しないURLばかり
・ページ滞在時間が0秒
・リファラーが「(direct) / (none)」

これらは典型的なボットの挙動です。

4. サイト運営者への影響

放置すると、次のような問題が起きます。

・404（ページが見つかりません）が急増
・アクセス解析が汚れる
・サーバー負荷が上がる
・セキュリティリスクが増える

特に企業サイトでは、
統計が歪むことが大きな問題になります。

5. 対策は “ブロック” と “統計の除外”

日付URLを総当たりするボットは、
止めることが可能です。

代表的な対策は次のとおり。

・日付URLを丸ごとブロック
・ボットのIP帯を遮断
・Cloudflareで国別・パターン別ブロック
・404ページを解析から除外

特に Cloudflare や .htaccess を使ったブロックは効果的です。

まとめ

日付URLを総当たりするアクセスは、
ほぼ100% ボットによる自動スキャンです。

目的は

・サイト構造の調査
・脆弱性の探索
・情報収集

であり、あなたのサイトが狙われているというより、
世界中のサイトが日常的に受けているノイズの一種です。

ただし、放置すると統計が汚れたり、
セキュリティリスクが増えるため、
必要に応じてブロックするのが安全です。
阿久梨絵でした！