0 && $edn < $lmax ) ? $edn: $lmax; $fmt = '%0'.strlen($edn).'d: '; for (; $stn<=$edn; $stn++ ) { $tstr = htmlspecialchars(mb_convert_encoding($lines[$stn-1],SOURCE_ENCODING,"auto")); $res .= ( $args[2] ? sprintf($fmt,$stn):'').refpre_replace_tab($tstr); } return '
'.$res.'
'; } ?> Python:URLLIBでプロキシ経由でページを取得 のバックアップ(No.1) - HiiHahWIKI - making some notes for... -
トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS

Python:URLLIBでプロキシ経由でページを取得 のバックアップ(No.1)


Python:URLLIBでプロキシ経由でページを取得

urllibをつかってプロキシ経由でページを取得します。

具体的には、ファイルリストよりキーワードを取得して、国立国会図書館サーチより検索結果のRSSを取得します。

サンプル実装

サンプルのソースは以下の通り。

filegetRss.py

#refpre(getRss.py,,1)

データファイルは、タブ区切りで1カラム目がキーワード、2カラム目がRSSを出力する際のファイル名です。

こんな感じです。

蟹工船    kanikousen
デザインパターン  designpattern
走れメロス  hashire