Elasticsearch相关
ES简介
Elasticsearch 是由Apache开源的一个兼有搜索引擎和NoSQL数据库功能的系统
ES特点
基于Java/Lucene构建,支持全文搜索、结构化搜索
低延迟,支持实时搜索
分布式部署,可横向集群扩展
支持百万级数据
支持多条件复杂查询,如聚合查询
高可用性,数据可以进行切片备份
支持Restful风格的api调用
ES应用场景
监控,针对日志类数据进行存储、分析、可视化。针对日志数据,ES给出了ELK的解决方案。其中logstash采集日志,ES进行复杂的数据分析,kibana进行可视化展示。
电商网站,用于商品信息检索。
Json文档数据库,用于存放json格式的文档
维基百科,提供全文搜索并高亮关键字
ES核心概念
集群(Cluster): 包含一个或多个具有相同 cluster.name 的节点.
节点(node): 是一个逻辑上独立的服务,可以存储数据,并参与集群的索引和搜索功能, 每个节点都有其唯一的名字,集群通过节点名称进行管理和通信。节点可以充当一个或多个角色。ES集群中的每个节点都会存储集群状态,知道索引内各分片所在的节点位置。
主节点(master node):主要负责集群方面的操作,比如节点的加入和退出、索引的创建和删除、分片被分配到哪个节点、节点状态监测。
数据节点(Data Node):存储文档数据的节点,执行文档数据的查询和写入等操作。
协调节点(Coordinate Node):客户端请求可以发送到集群的任何节点,集群中的每个节点都知道所有文档的位置。接收到客户端请求的节点自动变为协调节点,进行请求的转发,并整合数据返回给客户端。比如创建索引的请求,就转发到主节点。
映射(Mapping): mapping是对索引库中的索引字段及其数据类型进行定义,类似于关系型数据库中的表结构。ES默认动态创建索引和索引类型的mapping,这就像是关系型数据库中无需定义表结构,更不用指定字段的数据类型。也可以手动指定mapping类型。mapping机制可以自动检测数据的结构和类型,创建索引并使数据可搜索。
分片(shard):索引数据量很大,超过硬件存放单个文件的限制,就会影响查询请求的速度,Es引入了分片技术。一个分片本身就是一个完成的搜索引擎,文档存储在分片中,而分片会被分配到集群中的各个节点中,随着集群的扩大和缩小,ES会自动的将分片在节点之间进行迁移,以保证集群能保持平衡。一个索引中含有shard的数量,默认值为5,在索引创建后这个值是不能被更改的。
副本(replica):切片(shard)的冗余备份,每个切片默认的副本数为1。副本数可以随时进行调整。
索引(Index): 索引与关系型数据库实例(Database)相当。索引只是一个逻辑命名空间。ES可以把索引数据存放到服务器中,也可以sharding(分片)后存储到多台服务器上。每个索引有一个或多个分片,每个分片可以有多个副本。
文档类型(Type):相当于数据库中的table概念。每个文档在ElasticSearch中都必须设定它的类型。文档类型使得同一个索引中在存储结构不同文档时,只需要依据文档类型就可以找到对应的参数映射(Mapping)信息,方便文档的存取
文档(Document) :相当于数据库中的row, 是可以被索引的基本单位。其可以理解为关系型数据库中表的一行数据记录。每个文档由多个字段(field)组成,区别于关系型数据库的是,ES是一个非结构化的数据库,每个文档可以有不同的字段,并且有一个唯一标识。
ES和关系型数据库概念对比
ES 关系型数据库
索引(Index) 数据库(DataBase)
类型(Type) 表(Table)
映射(mapping) 表结构(Schema)
文档(Document) 行(Row)
字段(Field) 列(Column)
反向索引 正向索引
DSL查询 SQL查询
1.windows版安装包下载地址:https://www.elastic.co/cn/downloads/elasticsearch
2.目录结构
- bin目录:包含所有的可执行命令
- config目录:包含ES服务器使用的配置文件
- jdk目录:此目录中包含了一个完整的jdk工具包,版本17,当ES升级时,使用最新版本的jdk确保不会出现版本支持性不足的问题
- lib目录:包含ES运行的依赖jar文件
- logs目录:包含ES运行后产生的所有日志文件
- modules目录:包含ES软件中所有的功能模块,也是一个一个的jar包。和jar目录不同,jar目录是ES运行期间依赖的jar包,modules是ES软件自己的功能jar包
- plugins目录:包含ES软件安装的插件,默认为空
3.启动服务器
双击elasticsearch.bat文件即可启动ES服务器,默认服务端口9200。通过浏览器访问http://localhost:9200。
4.操作索引
可以把他看成是一个数据库,我们操作他需要库,所以在这里它叫做索引,先创建索引
①创建索引
用restful风格,put请求http://localhost:9200/books,即创建books索引
发送请求后,看到如下信息即索引创建成功
{
“acknowledged”: true,
“shards_acknowledged”: true,
“index”: “books”
}
②查询索引
GET请求 http://localhost:9200/books
③删除索引
DELETE请求 http://localhost:9200/books
④创建索引并指定分词器
注意:在这里需要用到分词器,我们常用的是IK分词器,默认的是standard分词器,他是一个插件,直接解压在es中的plugs目录即可
在这里使用分词器需要在请求网址添加请求体,使用json格式
PUT请求 http://localhost:9200/books
请求参数如下(注意是json格式的参数)
{
“mappings”:{ #定义mappings属性,替换创建索引时对应的mappings属性
“properties”:{ #定义索引中包含的属性设置
“id”:{ #设置索引中包含id属性
“type”:”keyword” #当前属性可以被直接搜索
},
“name”:{ #设置索引中包含name属性
“type”:”text”, #当前属性是文本信息,参与分词
“analyzer”:”ik_max_word”, #使用IK分词器进行分词
“copy_to”:”all” #分词结果拷贝到all属性中
},
“type”:{
“type”:”keyword”
},
“description”:{
“type”:”text”,
“analyzer”:”ik_max_word”,
“copy_to”:”all”
},
“all”:{ #定义属性,用来描述多个字段的分词结果集合,当前属性可以参与查询
“type”:”text”,
“analyzer”:”ik_max_word”
}
}
}
}
5.操作文档
这里面数据叫做文档
①添加文档,有三种方式
POST请求 http://localhost:9200/books/_doc #使用系统生成id
POST请求 http://localhost:9200/books/_create/1 #使用指定id
POST请求 http://localhost:9200/books/_doc/1 #使用指定id,不存在创建,存在更新(版本递增)
文档通过请求参数传递,数据格式json
{
"name":"springboot",
"type":"springboot",
"description":"springboot"
}
②查询文档
GET请求 http://localhost:9200/books/_doc/1 #查询单个文档
GET请求 http://localhost:9200/books/_search #查询全部文档
③条件查询
GET请求 http://localhost:9200/books/_search?q=name:springboot # q=查询属性名:查询属性值
④删除文档
DELETE请求 http://localhost:9200/books/_doc/1
⑤修改文档(全量更新)
PUT请求 http://localhost:9200/books/_doc/1
文档通过请求参数传递,数据格式json
{
"name":"springboot",
"type":"springboot",
"description":"springboot"
}
⑥修改文档(部分更新)
POST请求 http://localhost:9200/books/_update/1
文档通过请求参数传递,数据格式json
{
"doc":{ #部分更新并不是对原始文档进行更新,而是对原始文档对象中的doc属性中的指定属性更新
"name":"springboot" #仅更新提供的属性值,未提供的属性值不参与更新操作
}
}