日付URLを総当たりする ボット は何をしているのか?目的と背景をやさしく解説

こんにちは、阿久梨絵です!
Webサイトを運営していると、アクセス解析に
/2019/03/01/
/2019/07/29/
のような 日付形式のURL へのアクセスが突然増えることがあります。

しかも、その多くが 存在しないページ。
誰がこんなURLを見ているの?」と不思議に感じるかもしれません。

実はこれ、ほとんどが ボット (自動プログラム)によるアクセス です。
この記事では、ボットがなぜ日付URLを総当たりするのか、その目的と背景をわかりやすく解説します。

1. なぜ “日付URL” を狙うのか

ブログやCMS(WordPressなど)では、昔から

/2020/01/01/
/2019/03/07/

のように 日付を含むURL構造 がよく使われてきました。

そのため、ボットはこう考えます。

・「このサイトは日付URLで記事を管理しているかもしれない
・「存在する記事を探すために、日付を総当たりしてみよう

つまり、記事の一覧を勝手に推測して探している のです。

2. ボットの目的は “情報収集”

日付URLを叩くボットの目的は、大きく分けて3つあります。

① サイト構造の調査(クローリング)

Googleのような検索エンジン以外にも、
世界中には無数のクローラーが存在します。

彼らはサイトの構造を調べるために、
存在しそうなURLを自動生成してアクセス します。

日付URLは規則性があるため、
総当たりしやすい」=「狙われやすい」 のです。

② 脆弱性の探索(セキュリティスキャン)

悪意のあるボットは、次のような目的でアクセスします。

古いCMSの記事ページが残っていないか
過去のプラグインやテーマの脆弱性がないか
管理画面やバックアップファイルが置かれていないか

特に /2019/ や /2020/ のような古いURLは、
昔の脆弱なファイルが残っているかも」 と狙われやすい。

③ スパム・リファラー汚染

一部のボットは、アクセス解析に
「自分のURLを残す」ことを目的にしています。

日付URLを叩く動きとセットで行われることもあります。

3. 人間のアクセスではない理由

日付URLへのアクセスは、次の特徴があります。

アクセス元が海外に偏る
1秒間に複数URLを連続で叩く
存在しないURLばかり
ページ滞在時間が0秒
リファラーが「(direct) / (none)」

これらは 典型的なボットの挙動 です。

4. サイト運営者への影響

放置すると、次のような問題が起きます。

404(ページが見つかりません)が急増
アクセス解析が汚れる
サーバー負荷が上がる
セキュリティリスクが増える

特に企業サイトでは、
統計が歪むことが大きな問題 になります。

5. 対策は “ブロック” と “統計の除外”

日付URLを総当たりするボットは、
止めることが可能 です。

代表的な対策は次のとおり。

日付URLを丸ごとブロック
ボットのIP帯を遮断
Cloudflareで国別・パターン別ブロック
404ページを解析から除外

特に Cloudflare や .htaccess を使ったブロックは効果的です。

まとめ

日付URLを総当たりするアクセスは、
ほぼ100% ボット による自動スキャン です。

目的は

サイト構造の調査
脆弱性の探索
情報収集

であり、あなたのサイトが狙われているというより、
世界中のサイトが日常的に受けているノイズ の一種です。

ただし、放置すると統計が汚れたり、
セキュリティリスクが増えるため、
必要に応じてブロックするのが安全です。
阿久梨絵でした!

上部へスクロール
Verified by MonsterInsights