トップ   編集 凍結解除 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索   ヘルプ   最終更新のRSS

Lucene導入メモ

Last-modified: 2010-12-03 (金) 23:50:52
Top / Lucene導入メモ

Luceneによる動画検索システム

  • 導入するもの
    • Apache Ant
    • SenのJARファイル(sen.jar)
    • senプロジェクトが配布する日本語アナライザのJARファイル(lucene-ja.jar)
      • LuceneのJARファイル(lucene-1.4.3.jar)も同梱されている

Sen のインストール

lucene

  • Lucene(TECHSCORE) を参考に
    • ここ から lucene-ja-1.4.3sen1.2-2.zip をダウンロード、解凍して shower におく。
    • クラスパスを通す
      $ export LUCENE_HOME=(lucene-jaディレクトリのパス)
      $ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/lucene-1.4.3.jar
      $ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/lucene-ja.jar
      $ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/commons-logging.jar
      $ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/lucene-demos-1.4.3.jar
      • クラスパスの環境変数を変えている場合、コンパイルは通っても実行できないので、「今いるディレクトリ」もクラスパスに指定して実行する(参考
  • Lucene-ja を参考に
    • 実行確認
      $ cd $LUCENE_HOME
      $ java org.apache.lucene.demo.IndexFiles docs-ja
      $ java org.apache.lucene.demo.SearchFiles
  • インデックスを作る
    • lucene-jaのサンプルプログラム mktextindex.sh を実行(M君のレポートを参考にした)
      $ sh $LUCENE_HOME/bin/mktextindex.sh -create -index (インデックス出力先) (検索対象ファイルの入ったディレクトリ)
    • 参考(インデックスの作成)
    • 出力先フォルダ内に検索対象ファイルが出力される。
  • 検索する
    $ sh $LUCENE_HOME/bin/search.sh (インデックス出力先)
    Query: 除草効果
    (省略)
    Searching for: "除草 効果"
    1 total matching documents
    0. ../result2/A01F0143.txt      charset=Shift_JIS
    • うまく検索できた。