urllibモジュールの超簡単なサンプル(その3)

RSSフィードを取得して記事のタイトルを表示する。

import sys
import re
import urllib

url = sys.argv[1]

src = urllib.urlopen(url).read()

for title in re.findall(r"", src):
    print title.decode("utf-8")

実行例:

^o^ > python get_feed.py https://blog.panicblanket.com/feed
blog.PanicBlanket.com
urllibモジュールの超簡単なサンプル(その2)
urllibモジュールの超簡単なサンプル
変数に関数と同じ名前をつけてはいけない
== 演算子と is 演算子
randomモジュール
fileinputモジュール
Rubyで点数を集計するとき、あなたはどうしてますか? をPythonで
Pythonで偽と見なされる値
エラトステネスの篩
ファイルの文字数、ワード数、行数を数える

タイトルの抜き出しを正規表現でやってるので、ブログのタイトルまで表示されてるけど、とりあえずはこんなものだろう。ちゃんとやるならXML解析をやるべきだろうな。

urllibモジュールの超簡単なサンプル(その2)

URL を指定してヘッダーを得る。

import urllib
import sys

url = sys.argv[1]

r = urllib.urlopen(url)
info = r.info()

for key in info.keys():
    print key, ":", info[key]

実行結果:

^o^ > python httphead.py https://blog.panicblanket.com/
date : Sun, 03 Feb 2013 00:12:51 GMT
connection : close
content-type : text/html; charset=UTF-8
x-pingback : https://blog.panicblanket.com/xmlrpc.php
server : Apache/2.2.23