全文検索システムのNamazuはもう使えない?

Linux Mintに、20年ぶりくらいに全文検索システムのNamazuをインストールしてみた。

全文検索システムというのは、保存してあるWordやExcelPowerPointやPDFやテキストファイルの文字を検索して、ファイルを抽出してくれるシステムのことだ。

中身が分かるようなファイル名を付ければ、ファイル名で検索ができるが、日記などは何時何をやったかを思い出せないことが多い。

そんな時に使うと便利なのが全文検索システムだ。

Windowsには探三郎という優秀なフリーの全文検索システムがある。

これがLinux Mintでも使えるようにしようと思ってWineを使ってインストールしたのだが、最近、文字化けして使えなくなってしまった。

それで、試しにNamazuが使えるかなと思い、インストールする気になった。

 

20年前に使ったNamazuの設定ファイルのmknmzrcやnamazurcを使った。

検索文字を入力するシェルスクリプトも20年前のものを使った。

もちろん、設定ファイルもシェルスクリプトも修正した。

mknmzでインデックスを作ろうとしたが、NKF.pmというperlモジュールがないというエラーが出て実行できなかった。

パッケージマネージャーを使ってNKF.pmをインストールしたら、このエラーは出なくなったが、今度は、Kakasiがないというエラーが出てしまった。

こちらは、ソフトウエアマネージャーでインストールできた。

これで、ぶじにmknmzでインデックスを作ることはできたが、シェルスクリプトに検索文字を入力しても文字化けしてしまってわけが分からない状態になってしまった。

Namazuはmknmzでインデックスを作る時に、Kakasiを使って文字列を「分かち書き」という手法を使って分割する。

この時に使う日本語の文字コードEUC-JPなのだ。

Kakasiは変換前の文字列をEUC-JPとして入力して、「分かち書き」にした後の文字コードEUC-JPにする。

Linux Mint文字コードUNICODEなので、ターミナルから入力した文字列を検索できないことになってしまう。

Linux MintNamazuを使うことは諦めることにする。

Namazuソースコードを修正するスキルは残念ながら私にはない。