Elasticsearch 自定义分片分配

ElasticSearch 索引分片

在 es 的概念中,最重要的一个概念便是索引。索引是真实数据的载体,对索引的管理如果不慎重,则会带来很多的性能问题。

用过es的小伙伴都应该了解,我们应该在创建索引的时候为索引创建分片数,并且一个索引的分片数一经指定后就不能再修改(相比,副本数可以通过命令随时更改)。

在通常情况下,我们都会通过预判数据量级和 过度分配 这一策略来避免因数据量过大或QPS增长带来的必须需要迁移索引的场景。

关于具体分片和过度分配以及相关分配策略的介绍,请移步 选择恰当的分片数量和分片副本数量

自定义分片坐落节点

在我们的生产中,遇到了一个实际问题:在一个集群中,有两个索引比其余索引在数据量和 QPS 上的要求都高很多,这样在很多时候这两个索引会影响其余索引的性能。在阅读了 elasticsearch 的相关文档后,我们可以通过给集群打tag的方式,来将集群划分为几个子域,从而实现对特殊索引进行指定节点存储,使得其不影响其他索引的性能,同时虽然我们将 es 的节点划分为不同子域,但是实际上还是属于同一集群,对外提供服务,该改动对外界无感知,也做到了最小修改的情况下解决问题。

实践过程

调研 es 官方支持

在 elasticsearch 官方文档的 IndexModules -> Index Shard Allocation 节的介绍中,我们可以通过 elasticsearch 原生提供的一些设置来对分片的分配进行 手动干预

在 elasticsearch 中,提供了一种叫做 Shard Allocation Filtering 的策略。官方对于该策略的描述翻译过来是:

Shard Allocation Filtering 允许你来指定索引分片允许被坐落在哪个节点

在该部分文档的介绍中,可以了解到,我们可以通过给集群节点打tag的形式来给一个 elasticsearch 集群进行子域划分,从而指定某索引坐落在特定子域。

该过程的具体实现如下。

给集群打 tag

我们可以通过启动时指定参数和在 elasticsearch.yml 文件配置两种方式来实现为集群打标签,具体如下。

示例中,我们给集群添加 domain 属性。

1
2
3
4
# 启动参数指定
./elasticsearch -Enode.attr.domain=domain1
# yml 配置文件指定
node.attr.domain: domain1

通过以上任一方法,便可实现对节点的配置添加。

注: 该属性不在 elasticsearch 提供的可以热更新的配置中,故任一方法配置后均需要对 elasticsearch 进行重新启动

给索引添加配置

在给节点添加完配置后,我们在创建索引时,即可通过在 settings 中指定的方式,来实现将该索引的分片分配在指定机器(子域)的效果,该配置如下。

1
2
3
{
"index.routing.allocation.include.domain": "domain1"
}

通过添加以上设置,便可将该索引的分片指定坐落在我们之前定义好的 domain1 中的节点上,从而实现一个集群中的子域划分。

现有索引迁移

在进行集群子域划分的过程中,免不了涉及到集群中现有索引的迁移,我这里的迁移方案如下:

  1. 先给集群节点加上子域属性进行重启
  2. 给现有索引添加 setting,设置该属性
  3. 新添加指定不同子域的节点
  4. 在新子域创建新索引

以上四个步骤按步骤完成,即可完成集群的改造。相比于将索引直接迁移到新集群,该方式能够降低成本,同时对外无感知,在单个索引影响性能极大的情况下,可以考虑通过这一方案进行解决。