ウィキペディアをEPWING形式に変換してオフラインで楽しむ方法については、今までいろいろ書いてきましたが、今日もまたまたちょっと違ったことをしてみます。
似たような記事ばかりですが、お許しを。あと1回で終わります。
実は、ウィキペディア以外のプロジェクトのダンプファイルもダウンロードできます。今回はウィキソースを変換したいので、以下のリストからウィキペディアと同じように「jawikisource-latest-pages-articles.xml.bz2」をダウンロードします。
http://download.wikimedia.org/jawikisource/
ウィキペディアと違って、5.5MBほどなので、ほとんど時間がかかりません。
その後、解凍してファイル名を「wikipedia.xml」に変更します。
これもウィキペディアと同じように、
http://ikazuhiro.s206.xrea.com/staticpages/index.php/wikipedia-fpw
から
wikipedia-fpw-20090428-src.tar.gz
をダウンロードして解凍します。ここからはCygwinでやったほうがいいかもしれませんね。
-------------------「Cygwin」-------------------
tar zxvf wikipedia-fpw-20090428-src.tar.gz
------------------------------------------------
解凍したファイルの中に「catalogs.txt」があるので、まずはエディタでこれを編集します。
-------------------「catalogs.txt」-------------------
[Catalog]
FileName = catalogs
Type = EPWING1
Books = 1
[Book]
Title = "ウィキソース日本語版"
BookType = 5001
Directory = "WIKISC"
------------------------------------------------------
加えて「wikipedia-fpw.conf」も編集します。
-------------------「wikipedia-fpw.conf」-------------------
数式はとりあえず収録しないことにするので、
<38行目>
'enable_math' => 0,
不要なエントリーは除外したいので、
<97行目>
my @skip_headings = (
'^(Wikisource|ウィキソース|MediaWiki|Template|WP|Portal|Category|Help|Image|画像|ファイル):',
'/履歴$',
);
------------------------------------------------------------
今回のウィキソースは今月16日にアップロードされた、現時点で最新版のダンプファイルを使用しました。特にエラーもなく、すんなり通りました。
できたら両方とも上書き保存して、ファイル「wikipedia.xml」をフォルダ「wikipedia-fpw-20090428」に移動します。
そしたら、あとはCygwinから・・・
-------------------「Cygwin」-------------------
fpwmake
fpwmake catalogs
fpwmake package
------------------------------------------------
これでOK!
ほとんど時間はかかりません。
あとは、変換した辞書を圧縮するなりなんなり、好きにしてください。
なお、フォルダ名は「WIKIP」になっているので、これを「Directory = "WIKISC"」で指定した名前(ここではWIKISC)にしておいてください。でないとうまく読み込まれません。
ウィキソースには、古い書物や詩、憲法や法律などが多く記載されていて、とくに文学、政治などについて検索した時には、その参考として非常に役立つと思います。
ここでは簡単に説明しましたが、手順はほとんどウィキペディアの場合と同様です。
わからなければ、こちらを参考にしてください。ウィキペディアの変換手法ではありますが。
○あさりのみそしる「ウィキペディアを持ち歩け!」
http://asarinomisosoup.web.fc2.com/zaurus/wikipedia.html
Firefoxでも表示できるようになりました。あと、JavaScriptはONにしてください。
書式が同じなので、ウィキペディアではない姉妹プロジェクトでも変換に成功しました。次回はいよいよ最終回、ウィキクォートについて取り上げてみます。