ファイルの入出力

ファイルのopenとclose

ファイルをオープンするにはopen関数、クローズするにはcloseメソッドを使う。

f = open("sample.txt", "r")
(何らかの処理)
f.close()

openの戻り値はファイルオブジェクトで、ファイルへの入出力にはこのファイルオブジェクトを使う。
2番目の引数はモードで次のモードが指定できる。

r 読み込みモード
w 書き込みモード。既存のファイルには上書きする
a 追加書き込みモード

ほかにもあるけど省略。

ファイルの読み込み

ファイルの内容すべてをいっぺんに読み込むには、readメソッド。

import sys

filename = sys.argv[1]

file = open(filename, "r")
contents = file.read()
print contents
file.close()

実行結果:

^o^ > type sample.txt
Mon
Tue
Wed
Thu
Fri
Sat
Sun

^o^ > python file_read.py sample.txt
Mon
Tue
Wed
Thu
Fri
Sat
Sun


ファイルを1行ずつ読み込むには、readlineを使う。

import sys

filename = sys.argv[1]

file = open(filename, "r")
while True:
    line = file.readline()
    if not line:
        break
    print line.rstrip("\n")

file.close()

whileループの中で1行ずつ読み込んで出力している。ファイルの最後に到達すると空文字列が返ってくるんだろうか、そこでbreakしてループを抜け出している。
あと、print文は最後に改行を出力するので、lineの最後についている改行文字をrstripで取り去っている。このprintの改行を出力する動作はおせっかいに思えてならない。

readlinesはファイルすべてを行ごとに分割して、文字列のリストを返す。

import sys

filename = sys.argv[1]

file = open(filename, "r")
for line in file.readlines():
    print line.rstrip("\n")

file.close()

大きなファイルでなければこの方がすっきり書ける。

さらに、readlinesを使わなくてもファイルオブジェクト自体をforに渡すことで、1行ずつ処理することができる。このやり方だと大きなファイルでも大丈夫みたい。

import sys

filename = sys.argv[1]

file = open(filename, "r")
for line in file:
    print line.rstrip("\n")

file.close()

ファイルへの書き込み

ファイルへの書き込みは、writeメソッド。

import sys

filename = sys.argv[1]

file = open(filename, "w")
file.write("Hello, world.\n")
file.close()

実行結果:

^o^ > python file_write.py sample.out
^o^ > type sample.out
Hello, world.

writeメソッドは余計な改行文字を出力しないから素直でいいね。

writelinesは文字列のリストを受け取って、ファイルに出力する。

import sys

filename = sys.argv[1]

seq = ["foo\n", "bar\n", "baz\n"]

file = open(filename, "w")
file.writelines(seq)
file.close()

実行結果:

^o^ > python file_writelines.py sample.out
^o^ > type sample.out
foo
bar
baz

mapとreduce

map

まずは標準的な使い方。

>>> map((lambda x: x ** 2), [1,2,3,4,5])
[1, 4, 9, 16, 25]

面白いのは、引数にリストを複数とれること。この場合、Haskell の zipWith 相当の動作をする。

>>> map((lambda x,y: x + y), [1,2,3,4,5], [10,20,30,40,50])
[11, 22, 33, 44, 55]

リスト3つでもいける。

>>> map((lambda x,y,z: x * y + z), [1,2,3,4,5], [6,7,8,9,10], [10,20,30,40,50])
[16, 34, 54, 76, 100]

いくつまでいけるのかは確認してない。

reduce

mapときたらreduce。injectでもfoldlでもなくreduce。何でこう、畳み込み関数って言語によって名前が違うんだろう。

>>> reduce((lambda x,y: x * y), [1,2,3,4,5], 1)
120

第3引数は省略可能で、そのときはリストの最初の値が初期値になるみたい。

>>> reduce((lambda x,y: x * y), [1,2,3,4,5])
120

この例の場合だと結果は同じだ。

追記:こういう例のほうが初期値の有無による動作の違いがわかりやすい:

>>> reduce((lambda x,y: (x,y)), [1,2,3,4,5], 0)
(((((0, 1), 2), 3), 4), 5)
>>> reduce((lambda x,y: (x,y)), [1,2,3,4,5])
((((1, 2), 3), 4), 5)

関数に関数を渡す

リストのsortメソッドには、比較用の関数を渡すことができる。
まずは何も渡さない場合:

a = ["abc", "def", "BCD", "EFG"]

a.sort()
print a
^o^ > python sort.py
['BCD', 'EFG', 'abc', 'def']

比較用の関数を渡さないと、ASCII順にソートされている。次は小文字に変換してから比較する関数を渡してみる。

a = ["abc", "def", "BCD", "EFG"]

def cmp_lower(a, b):
    return cmp(a.lower(), b.lower())

a.sort(cmp_lower)
print a

実行結果:

^o^ > python sort2.py
['abc', 'BCD', 'def', 'EFG']

大文字小文字を無視した順になった。

こんな風に関数に関数を渡すことができる。Pythonでは関数は第一級のオブジェクトだったことだな。

じゃあ、関数を返すことはできるのか。

def foo():
    print "foo"
    def bar():
       print "bar"
    return bar

bar = foo()
bar()

foo関数のなかでbar関数を定義して、それをreturnしている。実行すると:

^o^ > python return_function.py
foo
bar

予想通りの結果になった。最初の出力 foo はfoo関数の実行中に出力されたもの。次の bar はfoo関数から返ってきた関数を呼び出したときに出力されたものだ。

Pythonでは関数に関数を渡すことも、関数を返すこともできる。

forループ

forループは、「for 変数 in シーケンス」という形をしている。シーケンスとはリスト、タプル、文字列の総称みたいなもの。

リストでの例:

>>> for i in [1,2,3,4,5]:
...     print str(i) + ":" + "Hello" * i
...
1:Hello
2:HelloHello
3:HelloHelloHello
4:HelloHelloHelloHello
5:HelloHelloHelloHelloHello

タプルの例:

>>> for t in ('Foo', 'Bar', 'Baz'):
...     print t
...
Foo
Bar
Baz

文字列でもいける:

>>> for c in "abcde":
...     print c
...
a
b
c
d
e

setだとどうか:

>>> for c in set(['a', 'b', 'c']):
...     print c
...
a
c
b

いけた。

if ~ elif ~ else

Python での条件分岐。これも関数と同じくブロックをインデントであらわしている。
例は引数の大小で出力が変化する。

import sys

num = int(sys.argv[1])

if num < 10:
    print "smaller than 10."
elif 10 < num:
    print "bigger than 10."
else:
    print "just 10."

引数は文字列なのでint関数を使って整数に変換している。

実行結果:

^o^ > python if.py 3
smaller than 10.

^o^ > python if.py 16
bigger than 10.

^o^ > python if.py 10
just 10.

コマンドライン引数

スクリプトのコマンドライン引数は、sys モジュールの argv に格納されている。

import sys

print sys.argv

実行結果:

^o^ > python argv.py foo bar baz
['argv.py', 'foo', 'bar', 'baz']

見てのとおり、sys.argv の最初の要素はスクリプト名で、コマンドライン引数は2番目以降。Rubyと違うのでちょっと注意だな。

関数

関数の定義にはdefを使う。

def hamspamfactory(spams, hams):
    print "Spam! " * spams
    print "Ham! " * hams


hamspamfactory(3, 5)
print "--"
hamspamfactory(hams = 4, spams = 5)

特徴的なのは、関数定義のブロックを表すのにインデントを使うところ。インデントされた部分が関数の中身になる。あと、キーワード引数が使える。

実行結果:

^o^ > python function.py
Spam! Spam! Spam!
Ham! Ham! Ham! Ham! Ham!
--
Spam! Spam! Spam! Spam! Spam!
Ham! Ham! Ham! Ham!

引数のデフォルト値を指定することもできる。デフォルト値がある引数は省略が可能。

def foodfactory(times, foodname="Spam! "):
    print foodname * times


foodfactory(3)
foodfactory(5, "Egg! ")

実行結果:

^o^ > python function2.py
Spam! Spam! Spam!
Egg! Egg! Egg! Egg! Egg!

辞書

辞書(ディクショナリ)はRubyで言うところのハッシュだと思えばいい。
リテラル表記は{と}で囲み、キーと値は:で区切る。

>>> d = {'a' : 'Andy', 'b' : 'Bill', 'c' : 'Charlie'}
>>> d
{'a': 'Andy', 'c': 'Charlie', 'b': 'Bill'}

また、dict関数を使って辞書(この場合はコピーになる)、リストのリスト、タプルのリストから作ることもできる。

print "from dictionary (copy):"
d1 = dict({"a":"Andy", "b":"Bill", "c":"Charlie"})
print d1

print "--"

print "from list of list:"
d2 = dict([['a', 'Andy'], ['b', 'Bill'], ['c', 'Charlie']])
print d2

print "--"

print "from list of tuple:"
d3 = dict([('a', 'Andy'), ('b', 'Bill'), ('c', 'Charlie')])
print d3

実行結果:

^o^ > python dict.py
from dictionary (copy):
{'a': 'Andy', 'c': 'Charlie', 'b': 'Bill'}
--
from list of list:
{'a': 'Andy', 'c': 'Charlie', 'b': 'Bill'}
--
from list of tuple:
{'a': 'Andy', 'c': 'Charlie', 'b': 'Bill'}

キーと値を追加するときはインデックスを使って代入すればいいが

>>> d = {'a':'Andy', 'b':'Bill'}
>>> d
{'a': 'Andy', 'b': 'Bill'}
>>> d['c'] = 'Charlie'
>>> d
{'a': 'Andy', 'c': 'Charlie', 'b': 'Bill'}

削除するときはdel関数を使う。

>>> del d['b']
>>> d
{'a': 'Andy', 'c': 'Charlie'}