ここが変だよ!はてなブログのサイトマップ
はてなブログのサイトマップはGoogleサーチコンソールを見ると、検索エンジンのインデックスに登録されていても、登録されているURLがインフォメーションレベル扱いとなっています。
URLは有効なので、普通なら無視できますが...
Googleクローラーの巡回エラーなど一連のサイトマップ問題等を含めると、気になってきましたw
そこで、サイトマップの内容をチェックしました。
1.はてなブログのサイトマップのインデックス
サイトマップは、おおよそ 500url ぐらいまで扱うことができます。
これを超える場合、サイトマップインデクスを作って、分割されたサイトマップを扱うことになります。
はてなブログの場合、 URLから判断すると (PHPやPerlなど)サーバーサイドのプログラムを使って、サイトマップを管理しているようです。
2.分割されている各サイトマップをみてみる
各ページはプログラムで生成されたもののようです。
3.疑問①
もし、サーバーサイドでsitemapファイル(データ)を作っているなら、何故そんなことをしているのか?
Webサーバーは固定ファイル(データ)なら、プログラムを通さず、ファイル化したほうがレスポンスが良くCPU負荷が少ないのですが。
なぜ固定ファイルではないのか?!
4.疑問②
更新されていない page=2 が、何故 pahe=1 と同じ日付なの?
インデクスのpage=2の更新日が "2019-03-07" になっているが、page=2 の内容をみても、そんな日付で更新されていない。
Googleから見ると、無駄な読み込みをすることになり、Googleもはてなサーバーも負荷が増えることなります。
これってバグじゃないの?!
5.疑問③
調べた結果、はてなブログのサイトマップの構造が上図のようになっています。
これは、サイトっマップの分割数が増える都度、過去のサイトマップ(page=n)が、page=1がpage=2,page=2がpage=3に移り変わってしまうことを示唆しています。
Goggleから見ると、一度読んだはずのサイトマップの内容が変わってしまい、再度全てのサイトマップを読み直す必要があります。
6.まとめ
とまぁ、正直SEO対策以前の問題があります。
1つのブログなら、微々たる負荷でも、数千以上のブログとなると話は別問題!
いずれも sitemaps.org の規格に明記されていなくても考慮すべきことで、暗黙の常識です。
意外にWebサイト開発者で、sitemap.org の存在を知らない人が多いんですよw
はてなスターの処理でサーバー負荷がかかっていることは有名ですが...これだって...といくらでもやりようがあると思うですが。
まぁ、なんと言いますが、はてな自身が自分で高負荷にしているなぁ〜と感じますw
こういったテクニックは、大規模なClient-Serverシステム開発経験者なら当然のように設計時に考慮するのですが(^^ゞ
まさにソフトウエアエンジニアの空洞化現象ですw
たぶん引退した私には関係ないですが、ユーザーに迷惑がかかるようなことだけはしないで欲しいです。(^^)/
※この記事へのコメントは無視します。
面倒くさそうになりそうなので (^^ゞ
Webプログラミングが面白いほどわかる本 環境構築からWebサービスの作成まで、はじめからていねいに (N高校のプログラミング教育)
- 作者: 吉村総一郎
- 出版社/メーカー: KADOKAWA
- 発売日: 2018/06/22
- メディア: 単行本
- この商品を含むブログを見る
インフラ/ネットワークエンジニアのためのネットワーク技術&設計入門
- 作者: みやたひろし
- 出版社/メーカー: SBクリエイティブ
- 発売日: 2013/12/26
- メディア: 単行本
- この商品を含むブログ (8件) を見る
- 作者: 岡田賢治,川井義治,宮原徹,遠山洋平,田口貴久
- 出版社/メーカー: 特定非営利活動法人エルピーアイジャパン(LPI-Japan)
- 発売日: 2013/03/17
- メディア: Kindle版
- この商品を含むブログ (2件) を見る
WEBアプリケーション・サーバー 設計・構築ノウハウ 第2版
- 作者: NTTデータ先端技術株式会社 NTTデータ株式会社著,日経SYSTEMS
- 出版社/メーカー: 日経BP社
- 発売日: 2010/04/15
- メディア: 単行本
- 購入: 6人 クリック: 336回
- この商品を含むブログ (6件) を見る
改訂3版 サーバ/インフラエンジニア養成読本 (Software Design plus)
- 作者: 養成読本編集部,200
- 出版社/メーカー: 技術評論社
- 発売日: 2016/03/18
- メディア: 大型本
- この商品を含むブログを見る