Elasticsearch 是一个基于 Lucene 的分布式搜索和分析引擎,其核心架构设计可扩展、高可用。以下是关键组成模块:

  1. 分布式存储
    数据以分片(Shard)形式存储,支持水平扩展。每个分片包含:

    • 主分片(Primary Shard)
    • 复制分片(Replica Shard)
    elasticsearch_shard
  2. 集群架构
    由多个节点(Node)组成,节点类型包括:

    • 数据节点(Data Node):存储数据并参与计算
    • 协调节点(Coordinating Node):处理客户端请求
    • 管理节点(Master Node):负责集群状态管理
    elasticsearch_cluster
  3. 数据分片机制

    • 分片路由算法(Shard Routing)确保数据分布均匀
    • 副本机制(Replication)提供高可用性
    elasticsearch_shard_routing
  4. 搜索与聚合

    • 倒排索引(Inverted Index)实现快速检索
    • 支持复杂聚合查询(Aggregation)
    elasticsearch_inverted_index

如需深入了解 Elasticsearch 基础概念,可访问 /elasticsearch_introduction 页面。