February 2008アーカイブ

Perl microformat parsing というスレッドで「microformats の vCard などを Perl でスクレイピングする」という話題がありましたので、私が Web::Scraper を紹介しましたところ、Web::Scraper の作者の miyagawa さんよりベターな使い方のレスポンスをいただきました。ありがとうございました。

my $scraper = scraper {
    process ".vcard", "vcards[]" => scraper {
        process ".email", email => '@href';
        process ".fn", fullname => "TEXT";
        process ".tel", tel => "TEXT";
        process ".title", title => "TEXT";
    };
};
my $result = $scraper->scrape($uri);

scrape をネストさせるとは恐れ入りました。。。

この件について builder tech day - open API & beyond で Lightning talk してもいいかなと思いました。microformats と Web::Scraper はかなり親和性が高いのでもっと広まるといいと思います。まだ募集してるかな?

LTに出る出ないに関わらず、builder tech day - open API & beyond は行きます。よろしくお願いします。