トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索   ヘルプ   最終更新のRSS

Lucene導入メモ の変更点

Top / Lucene導入メモ
  • 追加された行はこの色です。
  • 削除された行はこの色です。
  • Lucene導入メモ へ行く。

#freeze
#access
#analog

[[Luceneによる動画検索システム]]

-導入するもの
--Apache Ant
--SenのJARファイル(sen.jar)
--senプロジェクトが配布する日本語アナライザのJARファイル(lucene-ja.jar)
---LuceneのJARファイル(lucene-1.4.3.jar)も同梱されている

-今回はLucene + JapaneseAnalyzerで全文検索をしてみる
--[[アナライザの違い:http://www.techscore.com/tech/ApacheJakarta/Lucene/1.html]]

***Sen のインストール [#n2214d44]
-[[Senで形態素解析/インストール/Linux:http://shower.human.waseda.ac.jp/~m-kouki/pukiwiki_public/index.php?Sen%E3%81%A7%E5%BD%A2%E6%85%8B%E7%B4%A0%E8%A7%A3%E6%9E%90#q58f92c7]] にしたがって、Sen をインストールする。

***lucene [#cadb958c]
-[[Lucene(TECHSCORE):http://www.techscore.com/tech/ApacheJakarta/Lucene/1-2.html]] を参考に
--[[ここ:https://sen.dev.java.net/servlets/ProjectDocumentList?folderID=755&expandFolder=755&folderID=0]] から lucene-ja-1.4.3sen1.2-2.zip をダウンロード、解凍して shower におく。
--クラスパスを通す
 $ export LUCENE_HOME=(lucene-jaディレクトリのパス)
 $ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/lucene-1.4.3.jar
 $ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/lucene-ja.jar
 $ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/commons-logging.jar
 $ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/lucene-demos-1.4.3.jar
---%%クラスパスの環境変数を変えている場合、コンパイルは通っても実行できないので、「今いるディレクトリ」もクラスパスに指定して実行する([[参考:http://www.javaroad.jp/bbs/answer.jsp?q_id=2005111613514712]])%%

-[[Lucene-ja:http://www.f.waseda.jp/kikuchi/tips/Lucene-ja.html]] を参考に
--実行確認
 $ cd $LUCENE_HOME
 $ java org.apache.lucene.demo.IndexFiles docs-ja
 $ java org.apache.lucene.demo.SearchFiles

--インデックスを作る
---lucene-jaのサンプルプログラム mktextindex.sh を実行(M君のレポートを参考にした)
 $ sh $LUCENE_HOME/bin/mktextindex.sh -create -index (インデックス出力先) (検索対象ファイルの入ったディレクトリ)
---[[参考(インデックスの作成):http://www.masatom.in/pukiwiki/Java/Lucene/]]
---出力先フォルダ内に検索対象ファイルが出力される。

--検索する
 $ sh $LUCENE_HOME/bin/search.sh (インデックス出力先)
 Query: 除草効果
 (省略)
 Searching for: "除草 効果"
 1 total matching documents
 0. ../result2/A01F0143.txt      charset=Shift_JIS
---うまく検索できた。

-Webアプリとしての実装方法は[[Luceneによる動画検索システム]]を参照