こんにちは、阿久梨絵です!
Webサイトを運営していると、アクセス解析に
/2019/03/01/
/2019/07/29/
のような 日付形式のURL へのアクセスが突然増えることがあります。
しかも、その多くが 存在しないページ。
「誰がこんなURLを見ているの?」と不思議に感じるかもしれません。
実はこれ、ほとんどが ボット (自動プログラム)によるアクセス です。
この記事では、ボットがなぜ日付URLを総当たりするのか、その目的と背景をわかりやすく解説します。
1. なぜ “日付URL” を狙うのか
ブログやCMS(WordPressなど)では、昔から
/2020/01/01/
/2019/03/07/
のように 日付を含むURL構造 がよく使われてきました。
そのため、ボットはこう考えます。
・「このサイトは日付URLで記事を管理しているかもしれない」
・「存在する記事を探すために、日付を総当たりしてみよう」
つまり、記事の一覧を勝手に推測して探している のです。
2. ボットの目的は “情報収集”
日付URLを叩くボットの目的は、大きく分けて3つあります。
① サイト構造の調査(クローリング)
Googleのような検索エンジン以外にも、
世界中には無数のクローラーが存在します。
彼らはサイトの構造を調べるために、
存在しそうなURLを自動生成してアクセス します。
日付URLは規則性があるため、
「総当たりしやすい」=「狙われやすい」 のです。
② 脆弱性の探索(セキュリティスキャン)
悪意のあるボットは、次のような目的でアクセスします。
・古いCMSの記事ページが残っていないか
・過去のプラグインやテーマの脆弱性がないか
・管理画面やバックアップファイルが置かれていないか
特に /2019/ や /2020/ のような古いURLは、
「昔の脆弱なファイルが残っているかも」 と狙われやすい。
③ スパム・リファラー汚染
一部のボットは、アクセス解析に
「自分のURLを残す」ことを目的にしています。
日付URLを叩く動きとセットで行われることもあります。
3. 人間のアクセスではない理由
日付URLへのアクセスは、次の特徴があります。
・アクセス元が海外に偏る
・1秒間に複数URLを連続で叩く
・存在しないURLばかり
・ページ滞在時間が0秒
・リファラーが「(direct) / (none)」
これらは 典型的なボットの挙動 です。
4. サイト運営者への影響
放置すると、次のような問題が起きます。
・404(ページが見つかりません)が急増
・アクセス解析が汚れる
・サーバー負荷が上がる
・セキュリティリスクが増える
特に企業サイトでは、
統計が歪むことが大きな問題 になります。
5. 対策は “ブロック” と “統計の除外”
日付URLを総当たりするボットは、
止めることが可能 です。
代表的な対策は次のとおり。
・日付URLを丸ごとブロック
・ボットのIP帯を遮断
・Cloudflareで国別・パターン別ブロック
・404ページを解析から除外
特に Cloudflare や .htaccess を使ったブロックは効果的です。
まとめ
日付URLを総当たりするアクセスは、
ほぼ100% ボット による自動スキャン です。
目的は
・サイト構造の調査
・脆弱性の探索
・情報収集
であり、あなたのサイトが狙われているというより、
世界中のサイトが日常的に受けているノイズ の一種です。
ただし、放置すると統計が汚れたり、
セキュリティリスクが増えるため、
必要に応じてブロックするのが安全です。
阿久梨絵でした!
