googlebotから深読みする
3月 17th, 2006
NP_Analyze導入しててそのログ眺めてたらgooglebot様がなんかしてる。
<%popup(20060317-googlebot.gif|671|180|googlebot)%>
み、未来検索!?
Botがキャッシュしていく上で、「?archive=2006-03」の部分を変更したらページが存在するのではないかと解釈したと思われる。
ここで、総当たりを行うわけではなく、キャッシュデータから存在しそうな値を導き出してチェック。
他のログもみてみたが、下二桁は01〜12で決め打ちされてる。
す、すでにMonthだということを認識しているのかこのバケモノは!
その過程はすでに終わってる可能性もありますが。
で、上四桁。
下二桁が月だとわかってるならYearだってわかるだろと思ったけど、DD-MM-YYYYな書式も普通にありえる。
それを踏まえて上四桁をみるとブレが30以内で収まっている。
固定値±30でDayを表してる可能性をチェックしてるのか?
最終的には上四桁がYearを認識し、掘り下げていって、このサイトには〜からの情報しかないという判断をする。
検索ワードによってはこのサイトの年齢を考慮してランクをつける!
GoogleSugeeeeee!!