Kentaro Kuribayashi's blog

Software Engineering, Management, Books, and Daily Journal.

LWP::Mixi を使ってみる

mixi にアクセスしていろいろごにょれる「Perlモジュール/LWP::Mixi - Mixiに簡単にアクセスするためのLWP::UserAgentライクなモジュール」なんてのが作られていて、素晴らし過ぎてる!

さっそくごにょって動かしてみたら、Forbidden by robots.txt なんていわれてしまったよ…。んで、mixi の robots.txt を見てみたら、ひとんとこをのぞけるぱげは全部弾かれんのな。まぁ、そりゃそうか。

また、LWP::RobotUAのサブクラスなので、robot exclusionへの配慮が既に行われています。例えば、将来mixiがrobot.txt等を書いてロボットを排除した時には、このモジュールは働かなくなります(そうなるべきでしょう)。また、サーバーに高負荷をかけないよう、delayが1秒に設定されており、1秒間に1回以上のリクエストは処理しないようになっています。

[LWP::Mixi - Mixiアクセス用のLWP::UserAgentモジュール - DESCRIPTION]

というわで例えばこのモジュールを用いて任意のひとの日記を RSS 化するなんてことはできなさそうなんですが、まぁ他にもいろいろ使い手がありそうなので、あれこれやってみたいなぁってな所存。