程序员社区

Lucene的核心API介绍

Hello,欢迎来到程序员社区。 今天聊一聊 Lucene的核心API介绍,希望对大家有所帮助。

Java面试手册PDF下载:http://117.78.51.75/219-2

IndexWriter

1) 利用这个类可以对索引库进行增、删、改操作。
2) 利用构造方法

IndexWriter indexWriter =
 new IndexWriter(directory,LuceneConfig.analyzer,MaxFieldLength.LIMITED)

可以构造一个IndexWriter的对象。
3) addDocument 向索引库中添加一个Document
4) updateDocument 更新一个Document
5) deleteDocuments 删除一个Document

Directory

指向索引库的位置,有两种Directory

FSDirectory

1) 通过FSDirectory.open(new File("./indexDir"))建立一个indexDir的文件夹,而这个文件夹就是索引库存放的位置。
2) 通过这种方法建立索引库时如果indexDire文件夹不存在,程序将自动创建一个,如果存在就用原来的这个。
3) 通过这个类可以知道所建立的索引库在磁盘上,能永久性的保存数据。这是优点
4) 缺点为因为程序要访问磁盘上的数据,这个操作可能引发大量的IO操作,会降低性能。

RAMDirectory

1) 通过构造函数的形式Directory ramdirectory = new RAMDirectory(fsdirectory)可以建立RAMDirectory。
2) 这种方法建立的索引库会在内存中开辟一定的空间,通过构造函数的形式把fsdirectory移动到内编程电子书汇总存中。
3) 这种方法索引库中的数据是暂时的,只要内存的数据消失,这个索引库就跟着消失了。
4) 因为程序是在内存中跟索引库交互,所以利用这种方法创建的索引的好处就在效率比较高,访问速度比较快。

Document

1) 通过无参的构造函数可以创建一个Document对象。Document doc = new Document();
2) 一个Directory是由很多Document组成的。用户从客户端输入的要搜索的关键内容被服务器端包装成JavaBean,然后再转化为Java面试手册Document。这个转化过程的代码如下:
Lucene的核心API介绍插图

Field

1) Field相当于JavaBean的属性。 编程电子书汇总
2) Field的用法为:
new Field(“title”,article.getTitle(),Store.YES,Index.ANALYZED)
Java面试手册a) 第一个参数为属性
b) 第二个参数为属性值
c) 第三个参数为是否往索引库里存储
d) 第四个参数为是否更新引索
1) NO 不进行引索
2) ANALYZED 进行分词引索
3) NOT_ANALYZED 进行引索,把整个输入作为一个词对待。

MaxFieldLength

a) 能存储的最大长度
b) 在IndexWriter的构造方法里使用编程电子书汇总
c) 值为:
1) LIMITED 限制的最大长度 值为10000
2) UNLIMITED 没有限制的最大长度(一般不使用)

时间不一定能证明很多东西,但是一定能看透很多东西。坚信自己的选择,不动摇,使劲跑,明天会更好。

赞(0) 打赏
未经允许不得转载:IDEA激活码 » Lucene的核心API介绍

一个分享Java & Python知识的社区