Elasticsearch从入门到放弃(一) -- 基本概念

Elasticsearch

何为 Elasticsearch

Elasticsearch，是一款基于Lucene的开源的高扩展的分布式全文检索引擎。Elastic 是 Lucene 的封装，提供了 RESTFull API 的操作接口，开箱即用。它可以近乎实时的存储、检索数据；本身扩展性很好，可以扩展到上百台服务器，处理PB级别的数据。

Elasticsearch 核心概念

Near Realtime (NRT)

近实时概念包含两层含义，一是数据从写入到可搜索到，时间达到秒级别；二是Elasticsearch 查询、聚合、分析，时间到达秒级别。

Cluster

Elasticsearch是一个分布式的全文检索引擎，多个程序节点构成一个大的集群，集群中节点即是数据备份节点，也是数据查询分析负载均衡节点。

Node

节点，即是一个Elasicsearch的实例，一台机器可以运行一个或多个节点。

Shard(primary shard)

分片是为了解决海量数据存储问题，Elasticsearch 使用分片机制，将海量数据切分为多个分片存储在不同的节点上。Elasticseach分片就是它的主分片，Elasticsearch默认主分片数量是5。

replica(replica shard)

分片副本，意思显而易见，就是分片的备份，作用是提高集群数据安全，提升系统高可用性，同时副本节点在海量数据检索时也分担检索压力，具备提升 Elasticsearch 请求吞吐量和性能作用。

Index

这里的 Index 不是查询索引的概念，可以理解为同类型数据的库，相当于 MySQL 中的库，但又有不同，不同之处在于此处的Index中存储的都是字段类型基本一致的同类型数据。

Type

这里的 Type ，可以理解为 MySQL 中的表，一个 Index 中可以有多个 Type，且一个 Type存储同种数据。如，一个名为 animal 的 Index 中有 bird 和 fish 两个 Type, 他们有很多共同的属性。

Document

Document，即是 Type 中具体的文档。每个文档都有自己唯一的 id.

Field

Field，是文档的属性或者叫做字段，不同字段，类型不同，分词方式也不同。

Martin Li

技术主管，大数据及后端高级研发工程师

Elasticsearch从入门到放弃(一) -- 基本概念

相关概念

通用搜索与垂直搜索

全文检索与倒排索引

Lucene

Elasticsearch

何为 Elasticsearch

Elasticsearch 核心概念

Near Realtime (NRT)

Cluster

Node

Shard(primary shard)

replica(replica shard)

Index

Type

Document

Field

Elasticsearch从入门到放弃(一) -- 基本概念

相关概念

通用搜索 与 垂直搜索

全文检索 与 倒排索引

Lucene

Elasticsearch

何为 Elasticsearch

Elasticsearch 核心概念

Near Realtime (NRT)

Cluster

Node

Shard(primary shard)

replica(replica shard)

Index

Type

Document

Field

通用搜索与垂直搜索

全文检索与倒排索引