mass-data-lucene
  • Introduction
  • 底层lucene(路森)
    • 搜索引擎理论讲解
    • 分词器
    • lucene介绍以及原理
    • lucene索引文件格式
    • lucene索引过程分析
    • lucene搜索过程解析
    • lucene应用
    • 性能分析及调优
    • lucene相关问题
  • Solr篇
    • Solr架构及概念分析
    • 入门
    • 部署和运营
    • 使用Solr管理用户界面
    • 文档,字段和架构设计
    • 了解分析器,标记器和过滤器
    • 索引和基本数据操作
    • 多语言搜索
    • 企业级Solr云实战
    • Solr独立模式
    • SolrCloud集群模式
  • elasticsearch篇([ɪˈlæstɪk] [sɜːtʃ] )
    • 教程
      • 前言
      • linux系统安装es、head、kibana插件
      • linux安装ik分词
      • windows系统安装es
      • es、head、kibana、ik插件安装时遇到问题汇总
      • kibana consle 与sense区别
      • elasticsearch架构及概念分析
      • elasticsearch集群搭建及管理
      • _bulk 批量导入数据
      • elasticsearch基本CURD方法及示例
      • 分词一些基本用法
      • text和keyword类型的区别
      • elasticsearch单台服务器部署多个节点
      • elasticSearch复制索引并修改字段
      • 中文分词与停用词的作用
    • elasticsearch实战
Powered by GitBook
On this page

Was this helpful?

  1. elasticsearch篇([ɪˈlæstɪk] [sɜːtʃ] )
  2. 教程

前言

Previous教程Nextlinux系统安装es、head、kibana插件

Last updated 5 years ago

Was this helpful?

Elasticsearch是一个基于的开源搜索引擎。无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。

但是,Lucene只是一个库。想要使用它,你必须使用Java来作为开发语言并将其直接集成到你的应用中,更糟糕的是,Lucene非常复杂,你需要深入了解检索的相关知识来理解它是如何工作的。

Elasticsearch也使用Java开发并使用Lucene作为其核心来实现所有索引和搜索的功能,但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性,从而让全文搜索变得简单。

不过,Elasticsearch不仅仅是Lucene和全文搜索,我们还能这样去描述它:

  • 分布式的实时文件存储,每个字段都被索引并可被搜索

  • 分布式的实时分析搜索引擎

  • 可以扩展到上百台服务器,处理PB级结构化或非结构化数据

而且,所有的这些功能被集成到一个服务里面,你的应用可以通过简单的RESTful API、各种语言的客户端甚至命令行与之交互。

上手Elasticsearch非常容易。它提供了许多合理的缺省值,并对初学者隐藏了复杂的搜索引擎理论。它开箱即用(安装即可使用),只需很少的学习既可在生产环境中使用。

Elasticsearch在下许可使用,可以免费下载、使用和修改。

随着你对Elasticsearch的理解加深,你可以根据不同的问题领域定制Elasticsearch的高级特性,这一切都是可配置的,并且配置非常灵活。

模糊的历史

多年前,一个叫做Shay Banon的刚结婚不久的失业开发者,由于妻子要去伦敦学习厨师,他便跟着也去了。在他找工作的过程中,为了给妻子构建一个食谱的搜索引擎,他开始构建一个早期版本的Lucene。

直接基于Lucene工作会比较困难,所以Shay开始抽象Lucene代码以便Java程序员可以在应用中添加搜索功能。他发布了他的第一个开源项目,叫做“Compass”。

后来Shay找到一份工作,这份工作处在高性能和内存数据网格的分布式环境中,因此高性能的、实时的、分布式的搜索引擎也是理所当然需要的。然后他决定重写Compass库使其成为一个独立的服务叫做Elasticsearch。

第一个公开版本出现在2010年2月,在那之后Elasticsearch已经成为Github上最受欢迎的项目之一,代码贡献者超过300人。一家主营Elasticsearch的公司就此成立,他们一边提供商业支持一边开发新功能,不过Elasticsearch将永远开源且对所有人可用。

Shay的妻子依旧等待着她的食谱搜索……

Apache Lucene(TM)
Apache 2 license