読者です 読者をやめる 読者になる 読者になる

dpsさん移転

お知らせで(一方的に)お世話になっているDPSさんがhttp://dpsmac.com/に移転された。フィードの仕様もちょっと変わっているので、現行のxptクローラーでは追いかけきれていない。

xptクローラーは、タイトルだけから正規表現で情報を取り出している。アプリケーション名、バージョンを正規表現で分割する訳だ。何故タイトルから取得するかというと、本文側だと解析するデータ量が必然的に増える=不確実性が増すという理由による。

今回のdpsさんの今回の出力仕様では、タイトルにはアプリケーション名だけとなる。従って、バージョンデータは本文側から得なければならない訳だ。フォーマットは定型なので、本文側を解析してもそう大して不確実性が大きくなるということもなさそうだが、設計上タイトルのみに正規表現を当てはめるようにしているので、対応しきれない事になった。

対応策としては…クローラーの拡張が必要になる。この程度の拡張であれば、現行のシステムに少し手を加えるだけで大丈夫だとは思うのだが、ずっと全面的に書き換えたかったものなので、この機会に一気にやろうかなぁとか少し思う。ただ、それをやると時間がかかるのがネックだ。既にいくつか作っている途中のものあって、それを何とかしたい。うーむ。(でも、やるべきことが行き詰まっているときに片手間で作ったものは、何故か成功するんだよな…。)