本当はうまくいってから書くつもりだったけど、どうにもうまくいかないので書くだけ書いておく。
簡単な説明
サーバからの指示でファイルをダウンロードしたり削除したりするプログラムを Node.js で書いている。けど、指示通りの順番で処理してくれないので困ってしまった。async.forEachSeries を試してみたけどダメだった(←今ここ)。
より細かい説明
サーバは http://localhost:8888/ で動いていて、/recent.json にアクセスすると指示を受け取ることができる。指示は JSON 形式で、次のようなもの。
[ { "action": "new", "path": "Penguins.jpg" }, { "action": "new", "path": "data/Desert.jpg"}, { "action": "delete", "path": "Penguins.jpg"} ]
action がするべき処理を示していて、new は新しくファイルをダウンロード、delete はすでにダウンロードしたファイルを削除する。上の例では、
- Penguins.jpg をダウンロードして保存
- data/Desert.jpg をダウンロードして保存
- Penguins.jpg を削除
となって、結果として data/Desert.jpg だけが保存されるはず。
書いてみたプログラム replicate.js を載せるよ。
var http = require('http'); var fs = require('fs'); var path = require('path'); var mkdirp = require('mkdirp'); var host = "http://localhost:8888/"; var action = { new: getNewItem, delete: deleteItem } function replicate(host) { var req = http.get(host + "recent.json", function(res) { var body = ""; res.setEncoding('utf8'); res.on('data', function(chunk) { body += chunk; }); res.on('end', function(res) { var items = JSON.parse(body); items.forEach(function(item) { action[item.action](item); }); }); }).on('error', function(err) { colsole.log("Error: " + err.message); }); } function getNewItem(item) { console.log("New item: " + item.path); var filepath = "./storage/" + item.path; var dir = path.dirname(filepath); mkdirp(dir, function(e) { if (e) { console.log(e.message); } else { var itemUrl = host + item.path; var ws = fs.createWriteStream(filepath); var req = http.get(itemUrl, function(res) { res.pipe(ws); res.on('end', function() { ws.close(); }); }); console.log("New: " + item.path + "...done."); } }); } function deleteItem(item) { console.log("Delete item: " + item.path); var filepath = "./storage/" + item.path; fs.unlink(filepath, function(e) {}); console.log("Delete: " + item.path + "...done."); } replicate(host);
たいして難しいことはしてない。変数 action にアクションを登録(9~12行目)しておいた上で、サーバから JSON で指示を受け取り(15行目)、パースして配列に直し(22行目)、配列の順番どおりに処理している(23~25行目)。ついでに各処理のはじめと終わりにコンソールに出力している。
さて、これを実行してみると、期待通りには動いてくれない。
^o^ > node replicate.js New item: Penguins.jpg New item: data/Desert.jpg Delete item: Penguins.jpg Delete: Penguins.jpg...done. New: Penguins.jpg...done. New: data/Desert.jpg...done.
処理の開始は配列の順番どおり(最初の3行)だけど、Delete が先に終わってしまって、New があとになっている。結果として、削除するはずの Penguins.jpg が残っている。
^o^ > tree /F storage フォルダー パスの一覧: ボリューム OS ボリューム シリアル番号は FE2A-F7C6 です C:\USERS\TAKATOH\DOCUMENTS\W\REPLICATE\STORAGE │ Penguins.jpg │ └─data Desert.jpg
原因はアクションの処理が非同期なせいだ。Array.forEach 自体は非同期じゃないらしいけど(だから指示の順番どおりにアクションが始まっている)、アクション自体が非同期なので、ひとつのアクションが終わらないうちに次のアクションが始まり、終わりの順番が入れ替わってしまっているんだ。
これは困った。ちゃんと指示通りに順番に処理してくれないと、上のように Penguins.jpg のダウンロードと削除が指示通りにならない。さて、どうしよう。
async.forEachSeriesを試す
いろいろググってみた結果、async というライブラリでフロー制御ができるらしい、というのがわかった。というわけで、async.forEachSeries を試してみた。
書き換えたのがこのコード。
var http = require('http'); var fs = require('fs'); var path = require('path'); var mkdirp = require('mkdirp'); var async = require('async'); var host = "http://localhost:8888/"; var action = { new: getNewItem, delete: deleteItem } function replicate(host) { var req = http.get(host + "recent.json", function(res) { var body = ""; res.setEncoding('utf8'); res.on('data', function(chunk) { body += chunk; }); res.on('end', function(res) { var items = JSON.parse(body); async.forEachSeries(items, function(item) { action[item.action](item); }); }); }).on('error', function(err) { colsole.log("Error: " + err.message); }); } function getNewItem(item) { console.log("New item: " + item.path); var filepath = "./storage/" + item.path; var dir = path.dirname(filepath); mkdirp(dir, function(e) { if (e) { console.log(e.message); } else { var itemUrl = host + item.path; var ws = fs.createWriteStream(filepath); var req = http.get(itemUrl, function(res) { res.pipe(ws); res.on('end', function() { ws.close(); }); }); console.log("New: " + item.path + "...done."); } }); } function deleteItem(item) { console.log("Delete item: " + item.path); var filepath = "./storage/" + item.path; fs.unlink(filepath, function(e) {}); console.log("Delete: " + item.path + "...done."); } replicate(host);
書き換えたのは2行だけ。5行目で async を読み込み、24行目では items.forEach(function… の代わりに、async.forEachSeries(items, function… としている。これで、うまく動いてくれるだろうか。
^o^ > node replicate.js New item: Penguins.jpg New: Penguins.jpg...done.
ダメだーーー!
なんだかわからないけど、最初のアクションしか実行してくれない。ぜんぜん each じゃないじゃないか。どういうことだろう?
「Node.js:async.forEachSeriesって配列の順番どおりに処理してくれるんじゃないの?」への1件のフィードバック