2012年6月2日土曜日

なまず

全文検索システム namazu を導入した。

前々から検討して試してみた物の今一よくなかったので放置していた物をちゃんと導入してみた。
なぜ一念発起したかというと、友人からscansnapを格安で譲られたからである。
(私がもらったのは1300だが、もっといい奴を買うらしい。

以前からローカルに溜め込んだ文献を検索したいと思い色々試してはいたのだが、今回新たに雑誌や小説の類いまで仲間入りすることになったので頑張ってみた。

一番ベストなのはやはりspotlight。macを使ってる分にはこれが最強だと思う。
が、保存している場所がローカルとはいえファイルサーバ上。しかも、ipadから直接覗けるようになっているので検索したい時はだいたいipadなのである。
また、いまいち触れなかったのだがbeagleはspotlightのlinux版らしくweb uiもあるのでイイかと思ったがファイルサーバにはXが無くXが乗って常時電源が入ってるマシンも無い。

そこで、前々から挑戦しつつも文字化けがひどいとか、一部のファイルしか検索できなかったnamazuをちゃんと導入して使ってみることにした。(前は簡単にやってすぐあきらめている。

やることは簡単
sudo emerge namazu
sudo emerge kakasi
でものはインストール完了。

そっからの設定もこのサイトでだいたいオッケー。
流れとしては、
1. cgiと設定をwebで見れる所に置いておく
2. インデックスを作る
3. 確認する
4. インデックスを定期的に作るように設定する
これだけ。

ところが個々でやはり問題が。
とりあえず、文字化けはしてるとことして無い所があって面倒そうなのでスルー
少ないファイル(pdf)でテストしていたのだがなぜかインデックスの内容が0のまま。

調べてみると(というかメッセージで出てた)、ファイルサイズとテキストのサイズがオーバーしていたので、/etc/namazu/mknmzrcのその部分の数字を大きくしてやった。
すると次はコピープロテクトされてるとか言われる。(プロテクトされてないのに
それに関してはこちらに書いてあります。互換ソフトとバージョンの問題らしいです。
とりあえず動けばいい私は、/usr/share/namazu/pdf.plのバージョンチェック部分を数文字かえるだけです。

文字化けはまだこれからですが、システムはUTF-8、namazuはEUCなあたりに問題がありそうな気がします。


0 件のコメント:

コメントを投稿