Lucene導入メモ
Last-modified: 2010-12-03 (金) 23:50:52
Top / Lucene導入メモ
- 導入するもの
- Apache Ant
- SenのJARファイル(sen.jar)
- senプロジェクトが配布する日本語アナライザのJARファイル(lucene-ja.jar)
- LuceneのJARファイル(lucene-1.4.3.jar)も同梱されている
- 今回はLucene + JapaneseAnalyzerで全文検索をしてみる
Sen のインストール †
- Senで形態素解析/インストール/Linux にしたがって、Sen をインストールする。
lucene †
- Lucene(TECHSCORE) を参考に
- ここ から lucene-ja-1.4.3sen1.2-2.zip をダウンロード、解凍して shower におく。
- クラスパスを通す
$ export LUCENE_HOME=(lucene-jaディレクトリのパス) $ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/lucene-1.4.3.jar $ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/lucene-ja.jar $ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/commons-logging.jar $ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/lucene-demos-1.4.3.jar
クラスパスの環境変数を変えている場合、コンパイルは通っても実行できないので、「今いるディレクトリ」もクラスパスに指定して実行する(参考)
- Lucene-ja を参考に
- 実行確認
$ cd $LUCENE_HOME $ java org.apache.lucene.demo.IndexFiles docs-ja $ java org.apache.lucene.demo.SearchFiles
- 実行確認
- インデックスを作る
- lucene-jaのサンプルプログラム mktextindex.sh を実行(M君のレポートを参考にした)
$ sh $LUCENE_HOME/bin/mktextindex.sh -create -index (インデックス出力先) (検索対象ファイルの入ったディレクトリ)
- 参考(インデックスの作成)
- 出力先フォルダ内に検索対象ファイルが出力される。
- lucene-jaのサンプルプログラム mktextindex.sh を実行(M君のレポートを参考にした)
- 検索する
$ sh $LUCENE_HOME/bin/search.sh (インデックス出力先) Query: 除草効果 (省略) Searching for: "除草 効果" 1 total matching documents 0. ../result2/A01F0143.txt charset=Shift_JIS
- うまく検索できた。
- Webアプリとしての実装方法はLuceneによる動画検索システムを参照