ES的基本概念包括索引、文档、节点和分片。其中索引、文档偏向开发人员的视角，是一个逻辑概念。而节点和分片偏向的是运维的视角，是一个物理的概念。

文档（Document）

ElasticSearch是面向文档的，文档是所有可搜索数据的最小单位。如

文档会被序列化为JSON格式，保存在ElasticSearch中。

每个文档都有自己的Unique ID，可以自己指定也可以通过ElasticSearch自动生成。

除了文档的信息之外，还有用于描述文档信息的元数据。

索引（Index）

索引是文档的容器，是一类文档的结合。索引的Mapping定义文档字段的类型，Setting定义不同数据的分布。

节点是一个ES实例。本质上是一个Java进程，一个进程上可以运行多个ES实例，但是生产环境中一个机器只运行一个实例。

每一个节点都有名字，通过配置文件配置。并且每个节点启动后，会分配一个UID，保存在data目录下。

这是用于分布式集群搭建的。

每个节点启动后，默认就是一个Master eligible节点，这一参加选主流程，成为Master node。

第一个节点启动的时候，会将自己选举为Master 节点。

每个节点都保存着集群的状态，只有Master节点可以修改集群状态，这也是分布式集群的工作方式。

集群状态：

生产环境中，应该设置单一的角色的节点。

主分片：用以解决数据水平扩展的问题。通过主分片，可以将数据分布到集群内的所有节点之上。
- 一个分片是一个运行的Lucene实例。
- 主分片在索引创建时指定，后续不允许修改，除非Reindex。
副本：用来解决数据高可用的问题。分片时主分片的拷贝。
- 副本分片数，可以动态调整。
- 增加副本数，可以在一定程度上提高程序的可用性。

生产环境中分片的设定，需要提前做好容量规划。