Lucene研究Lucene 读书笔记

csdnonizuka 36 0 DOCX 2019-07-16 23:07:15

一、全文检索的基本概念(1)、数据总体分为两种:结构化数据和非结构化数据。结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等。(2)、索引(Index):将非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目的。

用户评论
请输入评论内容
评分:
暂无评论