mixi にアクセスしていろいろごにょれる「Perlモジュール/LWP::Mixi - Mixiに簡単にアクセスするためのLWP::UserAgentライクなモジュール」なんてのが作られていて、素晴らし過ぎてる!
さっそくごにょって動かしてみたら、Forbidden by robots.txt
なんていわれてしまったよ…。んで、mixi の robots.txt を見てみたら、ひとんとこをのぞけるぱげは全部弾かれんのな。まぁ、そりゃそうか。
また、LWP::RobotUAのサブクラスなので、robot exclusionへの配慮が既に行われています。例えば、将来mixiがrobot.txt等を書いてロボットを排除した時には、このモジュールは働かなくなります(そうなるべきでしょう)。また、サーバーに高負荷をかけないよう、delayが1秒に設定されており、1秒間に1回以上のリクエストは処理しないようになっています。
[LWP::Mixi - Mixiアクセス用のLWP::UserAgentモジュール - DESCRIPTION]
というわで例えばこのモジュールを用いて任意のひとの日記を RSS 化するなんてことはできなさそうなんですが、まぁ他にもいろいろ使い手がありそうなので、あれこれやってみたいなぁってな所存。
- なにか [動作未確認]