pip

以前、easy_install をインストールしたけど、最近ではパッケージ管理に pip を使うのが一般的のようだ。
pip 自体は easy_install を使ってインストールする。

^o^ > python -m easy_install pip
Searching for pip
Reading http://pypi.python.org/simple/pip/
Best match: pip 1.3.1
Downloading https://pypi.python.org/packages/source/p/pip/pip-1.3.1.tar.gz#md5=c
bb27a191cebc58997c4da8513863153
Processing pip-1.3.1.tar.gz
Writing c:\users\hiro\appdata\local\temp\easy_install-aqy3vi\pip-1.3.1\setup.cfg

Running pip-1.3.1\setup.py -q bdist_egg --dist-dir c:\users\hiro\appdata\local\t
emp\easy_install-aqy3vi\pip-1.3.1\egg-dist-tmp-ja6n4k
warning: no files found matching '*.html' under directory 'docs'
warning: no previously-included files matching '*.txt' found under directory 'do
cs\_build'
no previously-included directories found matching 'docs\_build\_sources'
Adding pip 1.3.1 to easy-install.pth file
Installing pip-script.py script to C:\Python27\Scripts
Installing pip.exe script to C:\Python27\Scripts
Installing pip-2.7-script.py script to C:\Python27\Scripts
Installing pip-2.7.exe script to C:\Python27\Scripts

Installed c:\python27\lib\site-packages\pip-1.3.1-py2.7.egg
Processing dependencies for pip
Finished processing dependencies for pip

なにやらメッセージがいろいろ出て、無事インストールできたようだ。

^o^ > pip --version
pip 1.3.1 from c:\python27\lib\site-packages\pip-1.3.1-py2.7.egg (python 2.7)

ためしに、テンプレートエンジンの Jinja2 をインストールしてみる。

^o^ > pip install jinja2
Downloading/unpacking jinja2
  Downloading Jinja2-2.7.tar.gz (377kB): 377kB downloaded
  Running setup.py egg_info for package jinja2

    warning: no files found matching '*' under directory 'custom_fixers'
    warning: no previously-included files matching '*' found under directory 'do
cs\_build'
    warning: no previously-included files matching '*.pyc' found under directory
 'jinja2'
    warning: no previously-included files matching '*.pyc' found under directory
 'docs'
    warning: no previously-included files matching '*.pyo' found under directory
 'jinja2'
    warning: no previously-included files matching '*.pyo' found under directory
 'docs'
Downloading/unpacking markupsafe (from jinja2)
  Downloading MarkupSafe-0.18.tar.gz
  Running setup.py egg_info for package markupsafe

Installing collected packages: jinja2, markupsafe
  Running setup.py install for jinja2

    warning: no files found matching '*' under directory 'custom_fixers'
    warning: no previously-included files matching '*' found under directory 'do
cs\_build'
    warning: no previously-included files matching '*.pyc' found under directory
 'jinja2'
    warning: no previously-included files matching '*.pyc' found under directory
 'docs'
    warning: no previously-included files matching '*.pyo' found under directory
 'jinja2'
    warning: no previously-included files matching '*.pyo' found under directory
 'docs'
  Running setup.py install for markupsafe

    building 'markupsafe._speedups' extension
    ==========================================================================
    WARNING: The C extension could not be compiled, speedups are not enabled.
    Failure information, if any, is above.
    Retrying the build without the C extension now.


    ==========================================================================
    WARNING: The C extension could not be compiled, speedups are not enabled.
    Plain-Python installation succeeded.
    ==========================================================================
Successfully installed jinja2 markupsafe
Cleaning up...

C extension がコンパイルできない、と言う警告が出てるけど、Plain-Python のインストールが成功した、と書いてある。一応成功みたいだ。

pip list コマンドで見てみると、Jinja2 のほかに MarkupSafe と言うパッケージがインストールされている。どうやら依存しているパッケージみたい。

^o^ > pip list
distribute (0.6.36)
Jinja2 (2.7)
MarkupSafe (0.18)

itertools モジュール(4)

さらに続く。今日で終わりだ。

 cf. http://docs.python.jp/2.7/library/itertools.html

組合せジェネレータ

itertools.product は入れ子のループと同じ。

>>> for x in itertools.product('ABC', 'abc'):
...     print x
...
('A', 'a')
('A', 'b')
('A', 'c')
('B', 'a')
('B', 'b')
('B', 'c')
('C', 'a')
('C', 'b')
('C', 'c')

名前つき引数 repeat を与えると、その回数の引数が与えられたのと同じになる。

>>> for x in itertools.product('ABC', 'abc', repeat = 2):
...     print x
...
('A', 'a', 'A', 'a')
('A', 'a', 'A', 'b')
('A', 'a', 'A', 'c')
('A', 'a', 'B', 'a')
('A', 'a', 'B', 'b')
('A', 'a', 'B', 'c')
('A', 'a', 'C', 'a')
('A', 'a', 'C', 'b')
('A', 'a', 'C', 'c')
('A', 'b', 'A', 'a')
('A', 'b', 'A', 'b')
('A', 'b', 'A', 'c')
('A', 'b', 'B', 'a')
('A', 'b', 'B', 'b')
('A', 'b', 'B', 'c')
('A', 'b', 'C', 'a')
('A', 'b', 'C', 'b')
('A', 'b', 'C', 'c')
('A', 'c', 'A', 'a')
('A', 'c', 'A', 'b')
('A', 'c', 'A', 'c')
('A', 'c', 'B', 'a')
('A', 'c', 'B', 'b')
('A', 'c', 'B', 'c')
('A', 'c', 'C', 'a')
('A', 'c', 'C', 'b')
('A', 'c', 'C', 'c')
('B', 'a', 'A', 'a')
('B', 'a', 'A', 'b')
('B', 'a', 'A', 'c')
('B', 'a', 'B', 'a')
('B', 'a', 'B', 'b')
('B', 'a', 'B', 'c')
('B', 'a', 'C', 'a')
('B', 'a', 'C', 'b')
('B', 'a', 'C', 'c')
('B', 'b', 'A', 'a')
('B', 'b', 'A', 'b')
('B', 'b', 'A', 'c')
('B', 'b', 'B', 'a')
('B', 'b', 'B', 'b')
('B', 'b', 'B', 'c')
('B', 'b', 'C', 'a')
('B', 'b', 'C', 'b')
('B', 'b', 'C', 'c')
('B', 'c', 'A', 'a')
('B', 'c', 'A', 'b')
('B', 'c', 'A', 'c')
('B', 'c', 'B', 'a')
('B', 'c', 'B', 'b')
('B', 'c', 'B', 'c')
('B', 'c', 'C', 'a')
('B', 'c', 'C', 'b')
('B', 'c', 'C', 'c')
('C', 'a', 'A', 'a')
('C', 'a', 'A', 'b')
('C', 'a', 'A', 'c')
('C', 'a', 'B', 'a')
('C', 'a', 'B', 'b')
('C', 'a', 'B', 'c')
('C', 'a', 'C', 'a')
('C', 'a', 'C', 'b')
('C', 'a', 'C', 'c')
('C', 'b', 'A', 'a')
('C', 'b', 'A', 'b')
('C', 'b', 'A', 'c')
('C', 'b', 'B', 'a')
('C', 'b', 'B', 'b')
('C', 'b', 'B', 'c')
('C', 'b', 'C', 'a')
('C', 'b', 'C', 'b')
('C', 'b', 'C', 'c')
('C', 'c', 'A', 'a')
('C', 'c', 'A', 'b')
('C', 'c', 'A', 'c')
('C', 'c', 'B', 'a')
('C', 'c', 'B', 'b')
('C', 'c', 'B', 'c')
('C', 'c', 'C', 'a')
('C', 'c', 'C', 'b')
('C', 'c', 'C', 'c')

itertools.permutations は繰り返しを許さない順列、itertools.combinations は繰り返しを許さない組み合わせ。この2つはこの間書いたので省略。

itertools.combinations_with_replacement は繰り返しを許した組み合わせ。

>>> for x in itertools.combinations_with_replacement('ABCD', 2):
...     print x
...
('A', 'A')
('A', 'B')
('A', 'C')
('A', 'D')
('B', 'B')
('B', 'C')
('B', 'D')
('C', 'C')
('C', 'D')
('D', 'D')

itertools モジュール(3)

まだまだ続くよ。

 cf. http://docs.python.jp/2.7/library/itertools.html

一番短い入力シーケンスで止まるイテレータ(つづき)

これまた map とどう違うのかわからない itertools.imap。ひょっとしてリストを返すか、イテレータを返すかの違いだけなんだろか。

>>> for x in itertools.imap(lambda y: y*2, [1,2,3,4,5]):
...     print x
...
2
4
6
8
10

itertools.starmap は、イテラブルなオブジェクトを引数として受け取り、*つきで展開して関数を適用してくれる。

>>> for x in itertools.starmap(pow, [(2, 3), (3, 3), (10, 3)]):
...     print x
...
8
27
1000

itertools.tee は、1つのイテラブルからn個の独立したイテレータを生成する……ってなんだかよくわからん。

>>> x, y = itertools.tee(range(5), 2)
>>> for i in x:
...     print i
...
0
1
2
3
4
>>> for j in y:
...     print j
...
0
1
2
3
4

第2引数nは省略するとn=2。

itertools.takewhile は Haskell の takeWhile と同じく、条件が真の間だけ値を返す。

>>> for x in itertools.takewhile(lambda y: y < 5, range(10)):
...     print x
...
0
1
2
3
4

itertools.izip。これまた zip と何が違うのか。

>>> for x in itertools.izip(range(5), range(10,14)):
...     print x
...
(0, 10)
(1, 11)
(2, 12)
(3, 13)

短いほうのリストにあわせるのも zip と同じ。

長いほうのリストにあわせるのが itertools.izip_longest

>>> for x in itertools.izip_longest(range(5), range(10,14)):
...     print x
...
(0, 10)
(1, 11)
(2, 12)
(3, 13)
(4, None)

引数fillvalueを指定すると、Noneの代わりにそれを使う。

>>> for x in itertools.izip_longest(range(5), range(10,14), fillvalue='x'):
...     print x
...
(0, 10)
(1, 11)
(2, 12)
(3, 13)
(4, 'x')

itertools モジュール(2)

昨日の続き。

一番短い入力シーケンスで止まるイテレータ

itertools.chain は引数をひとつのシーケンスのようにつなげてくれる。

>>> for x in itertools.chain('abc', 'def', 'ghi'):
...     print x
...
a
b
c
d
e
f
g
h
i

itertools.compress は2つのシーケンスを引数にとり、2つ目のシーケンスの要素が真の場合、対応する1つ目のシーケンスの要素を返す。

>>> for x in itertools.compress('abcdef', [0,1,0,1,1,0]):
...     print x
...
b
d
e

itertools.dropwhile は Haskell の dropWhile と同じように先頭の条件が真になる要素を取り除いた残りの要素を返す。

>>> for x in itertools.dropwhile(lambda x: x < 5, [1,3,4,5,7,8,5,3]):
...     print x
...
5
7
8
5
3

itertools.groupby は少しわかりにくい。このイテレータが返すのは、第2引数で指定した関数の返り値と、その返り値で分けられたグループ(itertools._grouperオブジェクト)だ。

>>> for k, g in itertools.groupby([2,4,6,8,10,1,3,5,7,9], lambda x: x % 2):
...     print k
...     print g
...
0
<itertools._grouper object at 0x02127FD0>
1
<itertools._grouper object at 0x02127EB0>

このグループ自体がイテレータになっていて、繰り返し処理をすることができる。

>>> for k, g in itertools.groupby([2,4,6,8,10,1,3,5,7,9], lambda x: x % 2):
...     print 'key: ', k
...     for x in g:
...         print x
...
key:  0
2
4
6
8
10
key:  1
1
3
5
7
9

ちなみに、あらかじめ関数の値でソートされているのが前提のようで、ばらばらなものをまとめてくれたりはしない。

>>> for k, g in itertools.groupby(range(10), lambda x: x % 2):
...     print 'key: ', k
...     for x in g:
...         print x
...
key:  0
0
key:  1
1
key:  0
2
key:  1
3
key:  0
4
key:  1
5
key:  0
6
key:  1
7
key:  0
8
key:  1
9

itertools.ifilter は filter関数と同じ。何が違うんだろ。

>>> for i in itertools.ifilter(lambda x: x%2, range(10)):
...     print i
...
1
3
5
7
9

itertools.ifilter と逆の動作をするのが itertools.ifilterfalse。条件が偽になる要素を返す。

>>> for i in itertools.ifilterfalse(lambda x: x%2, range(10)):
...     print i
...
0
2
4
6
8

itertools.islice はリストのスライスと同じようだ。これもちょっとどう違うのかわからない。
引数は、seq、start、stop、step の順。startとstepは省略できる。

>>> for c in itertools.islice('abcdefghi', 2, 6, 2):
...     print c
...
c
e

今日はここまで。時間があれば続きを書くかも。

itertools モジュール(1)

先週ちょっと紹介したitertoolsモジュールを少しずつ見ていくことにしよう。

 cf. http://docs.python.jp/2.7/library/itertools.html

無限イテレータ

まずは、itertools.count。初期値から1ずつカウントアップしていく。

>>> for i in itertools.count(0):
...     if i > 10:
...         break
...     print i
...
0
1
2
3
4
5
6
7
8
9
10

第2引数にステップを指定することも可能。

>>> for i in itertools.count(0, 3):
...     if i > 10:
...         break
...     print i
...
0
3
6
9

itertolls.cycle はシーケンスを無限に繰り返す。

>>> i = 0
>>> for x in itertools.cycle(['foo', 'bar', 'baz']):
...     i += 1
...     if i > 10:
...         break
...     print x
...
foo
bar
baz
foo
bar
baz
foo
bar
baz
foo

itertools.repeat は、オブジェクトを無限に繰り返す。

>>> i = 0
>>> for x in itertools.repeat("Hello"):
...     i += 1
...     if i > 10:
...         break
...     print x
...
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello

第2引数に回数を指定することも可能。

>>> for x in itertools.repeat("hello", 5):
...     print x
...
hello
hello
hello
hello
hello

itertools の関数は数が多いので今日はここまで。

Python で順列と組み合わせ

itertools モジュールが使える。
順列は、itertools.permutations。

>>> import itertools
>>> for x in itertools.permutations("ABCDE", 3):
...     print x
...
('A', 'B', 'C')
('A', 'B', 'D')
('A', 'B', 'E')
('A', 'C', 'B')
('A', 'C', 'D')
('A', 'C', 'E')
('A', 'D', 'B')
('A', 'D', 'C')
('A', 'D', 'E')
('A', 'E', 'B')
('A', 'E', 'C')
('A', 'E', 'D')
('B', 'A', 'C')
('B', 'A', 'D')
('B', 'A', 'E')
('B', 'C', 'A')
('B', 'C', 'D')
('B', 'C', 'E')
('B', 'D', 'A')
('B', 'D', 'C')
('B', 'D', 'E')
('B', 'E', 'A')
('B', 'E', 'C')
('B', 'E', 'D')
('C', 'A', 'B')
('C', 'A', 'D')
('C', 'A', 'E')
('C', 'B', 'A')
('C', 'B', 'D')
('C', 'B', 'E')
('C', 'D', 'A')
('C', 'D', 'B')
('C', 'D', 'E')
('C', 'E', 'A')
('C', 'E', 'B')
('C', 'E', 'D')
('D', 'A', 'B')
('D', 'A', 'C')
('D', 'A', 'E')
('D', 'B', 'A')
('D', 'B', 'C')
('D', 'B', 'E')
('D', 'C', 'A')
('D', 'C', 'B')
('D', 'C', 'E')
('D', 'E', 'A')
('D', 'E', 'B')
('D', 'E', 'C')
('E', 'A', 'B')
('E', 'A', 'C')
('E', 'A', 'D')
('E', 'B', 'A')
('E', 'B', 'C')
('E', 'B', 'D')
('E', 'C', 'A')
('E', 'C', 'B')
('E', 'C', 'D')
('E', 'D', 'A')
('E', 'D', 'B')
('E', 'D', 'C')

組み合わせは、itertools.combinations。

>>> for x in itertools.combinations("ABCDE", 3):
...     print x
...
('A', 'B', 'C')
('A', 'B', 'D')
('A', 'B', 'E')
('A', 'C', 'D')
('A', 'C', 'E')
('A', 'D', 'E')
('B', 'C', 'D')
('B', 'C', 'E')
('B', 'D', 'E')
('C', 'D', 'E')

itertools モジュールにはほかにも便利そうな関数があるので、そのうち使ってみたい。

cf. http://docs.python.jp/2.7/library/itertools.html