2007년 12월 5일 수요일

Apache Lucene - 자바로 개발된 오픈소스 검색 엔진

http://lucene.apache.org

http://lucene.apache.org/java/docs/index.html
Apache Lucene은 고성능의 풀 기능을 갖춘 자바로 작성된 텍스트 검색엔진 라이브러리입니다. 모든 플렛폼, 모든 어플리케이션에 full-text 검색기능을 제공할 수 있습니다.

http://lucene.apache.org/java/docs/demo.html
다운로드를 받아서 압축을 풀고 간단히 데모를 실행해 볼 수 있습니다.
우선 lucene-core-2.2.0.jar , lucene-demos-2.2.0.jar 를 CLASSPATH에 추가 한 후,  

아래와 같은 명령어로 인덱스를 생성합니다.

D:\workspace\lucene-2.2.0>java org.apache.lucene.demo.IndexFiles d:\workspace\lucene-2.2.0\src


위 명령을 실행하면 index 디렉토리가 생성되고, readable하지 않은 3개의 파일이 생깁니다.
indexing의 결과겠죠.

아래와 같이 데모 프로그램인 검색 프로그램을 실행하면,
커멘드 명령어로 검색을 수행할 수 있습니다.

D:\workspace\lucene-2.2.0>java org.apache.lucene.demo.SearchFiles
Enter query:
vector
Searching for: vector
1 total matching documents
1. d:\workspace\lucene-2.2.0\src\demo\org\apache\lucene\demo\SearchFiles.java
Enter query:


다음에는 Lucene 기반으로 작성된 웹 검색 엔진인 Nutch 에 대해서 알아보겠습니다.

댓글 없음:

댓글 쓰기