Lucene導入メモ の変更点
Top / Lucene導入メモ
- 追加された行はこの色です。
- 削除された行はこの色です。
- Lucene導入メモ へ行く。
#freeze
#access
#analog
[[Luceneによる動画検索システム]]
-導入するもの
--Apache Ant
--SenのJARファイル(sen.jar)
--senプロジェクトが配布する日本語アナライザのJARファイル(lucene-ja.jar)
---LuceneのJARファイル(lucene-1.4.3.jar)も同梱されている
-今回はLucene + JapaneseAnalyzerで全文検索をしてみる
--[[アナライザの違い:http://www.techscore.com/tech/ApacheJakarta/Lucene/1.html]]
***Sen のインストール [#n2214d44]
-[[Senで形態素解析/インストール/Linux:http://shower.human.waseda.ac.jp/~m-kouki/pukiwiki_public/index.php?Sen%E3%81%A7%E5%BD%A2%E6%85%8B%E7%B4%A0%E8%A7%A3%E6%9E%90#q58f92c7]] にしたがって、Sen をインストールする。
***lucene [#cadb958c]
-[[Lucene(TECHSCORE):http://www.techscore.com/tech/ApacheJakarta/Lucene/1-2.html]] を参考に
--[[ここ:https://sen.dev.java.net/servlets/ProjectDocumentList?folderID=755&expandFolder=755&folderID=0]] から lucene-ja-1.4.3sen1.2-2.zip をダウンロード、解凍して shower におく。
--クラスパスを通す
$ export LUCENE_HOME=(lucene-jaディレクトリのパス)
$ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/lucene-1.4.3.jar
$ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/lucene-ja.jar
$ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/commons-logging.jar
$ export CLASSPATH=$CLASSPATH:$LUCENE_HOME/lib/lucene-demos-1.4.3.jar
---%%クラスパスの環境変数を変えている場合、コンパイルは通っても実行できないので、「今いるディレクトリ」もクラスパスに指定して実行する([[参考:http://www.javaroad.jp/bbs/answer.jsp?q_id=2005111613514712]])%%
-[[Lucene-ja:http://www.f.waseda.jp/kikuchi/tips/Lucene-ja.html]] を参考に
--実行確認
$ cd $LUCENE_HOME
$ java org.apache.lucene.demo.IndexFiles docs-ja
$ java org.apache.lucene.demo.SearchFiles
--インデックスを作る
---lucene-jaのサンプルプログラム mktextindex.sh を実行(M君のレポートを参考にした)
$ sh $LUCENE_HOME/bin/mktextindex.sh -create -index (インデックス出力先) (検索対象ファイルの入ったディレクトリ)
---[[参考(インデックスの作成):http://www.masatom.in/pukiwiki/Java/Lucene/]]
---出力先フォルダ内に検索対象ファイルが出力される。
--検索する
$ sh $LUCENE_HOME/bin/search.sh (インデックス出力先)
Query: 除草効果
(省略)
Searching for: "除草 効果"
1 total matching documents
0. ../result2/A01F0143.txt charset=Shift_JIS
---うまく検索できた。
-Webアプリとしての実装方法は[[Luceneによる動画検索システム]]を参照