ES的简介

JAY.LIN 收录于大数据测试

2025-01-02 约 1338 字预计阅读 3 分钟

https://bing.ee123.net/img/rand?artid=119776609

ES的简介

一、先普及下概念：

ES全称：Elasticsearch， 是一个基于库的。它提供了一个分布式、支持多租户的引擎，具有 Web接口和无模式文档。Elasticsearch是用开发的，并在下作为开源软件发布。

二、基本概念

2.1 Node 与 Cluster

Elastic 本质上是一个分布式数据库，允许多台服务器协同工作，每台服务器可以运行多个 Elastic 实例。

单个 Elastic 实例称为一个节点（node）。一组节点构成一个集群（cluster）。

2.2 Index

Elastic 会索引所有字段，经过处理后写入一个反向索引（Inverted Index）。查找数据的时候，直接查找该索引。

所以，Elastic 数据管理的顶层单位就叫做 Index（索引）。它是单个数据库的同义词。每个 Index （即数据库）的名字必须是小写。

2.3 Document

Index 里面单条的记录称为 Document（文档）。许多条 Document 构成了一个 Index。

Document 使用 JSON 格式表示，下面是一个例子。


{
  "user": "张三",
  "title": "工程师",
  "desc": "数据库管理"
}

同一个 Index 里面的 Document，不要求有相同的结构（scheme），但是最好保持相同，这样有利于提高搜索效率。

2.4 Type

Document 可以分组，比如 weather 这个 Index 里面，可以按城市分组（北京和上海），也可以按气候分组（晴天和雨天）。这种分组就叫做 Type，它是虚拟的逻辑分组，用来过滤 Document。

不同的 Type 应该有相似的结构（schema），举例来说， id 字段不能在这个组是字符串，在另一个组是数值。这是与关系型数据库的表的。性质完全不同的数据（比如 products 和 logs ）应该存成两个 Index，而不是一个 Index 里面的两个 Type（虽然可以做到）。

下面的命令可以列出每个 Index 所包含的 Type。

2.5 mapping

映射，相当于数据库的表结构。

二、 Elasticsearch的数据存储

存储原理

（1）面向文档

Elasticsearch是面向文档(document oriented)的，这意味着它可以存储整个对象或文档(document)。然而它不仅仅是存储，还会索引(index)每个文档的内容使之可以被搜索。在Elasticsearch中，你可以对文档（而非成行成列的数据）进行索引、搜索、排序、过滤。这种理解数据的方式与以往完全不同，这也是Elasticsearch能够执行复杂的全文搜索的原因之一。

（2）JSON

ELasticsearch使用Javascript对象符号(JavaScript Object Notation)，也就是JSON，作为文档序列化格式。JSON现在已经被大多语言所支持，而且已经成为NoSQL领域的标准格式。它简洁、简单且容易阅读。

{

“email”: “ ”,

“first_name”: “John”,

“last_name”: “Smith”,

“info”: {

“bio”: “Eco-warrior and defender of the weak”,

“age”: 25,

“interests”: [ “dolphins”, “whales” ]

“join_date”: “2014/05/01”

}

尽管原始的user对象很复杂，但它的结构和对象的含义已经被完整的体现在JSON中了，在Elasticsearch中将对象转化为JSON并做索引要比在表结构中做相同的事情简单的多。

传统数据库有表名.字段.,属性然后对应下面行为数据,但是在es中不区分,统一将一行数据转换为json格式进行存储,所以es中存储非格式化的方式

下图是ElasticSearch的索引结构，下边黑色部分是物理结构，上边橙色部分是逻辑结构，逻辑结构也是为了更好的去描述ElasticSearch的工作原理及去使用物理结构中的索引文件

目录

ES的简介

ES的简介

一、先普及下概念：

二、基本概念

2.1 Node 与 Cluster

2.2 Index

2.3 Document

2.4 Type

2.5 mapping

二、 Elasticsearch的数据存储