mirror of
https://github.com/zhwei820/learn.lianglianglee.com.git
synced 2025-09-17 08:46:40 +08:00
998 lines
44 KiB
HTML
998 lines
44 KiB
HTML
<!DOCTYPE html>
|
||
<!-- saved from url=(0046)https://kaiiiz.github.io/hexo-theme-book-demo/ -->
|
||
<html xmlns="http://www.w3.org/1999/xhtml">
|
||
<head>
|
||
<head>
|
||
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
|
||
<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1.0, user-scalable=no">
|
||
<link rel="icon" href="/static/favicon.png">
|
||
<title>ElasticSearch 小白从入门到精通.md.html</title>
|
||
<!-- Spectre.css framework -->
|
||
<link rel="stylesheet" href="/static/index.css">
|
||
<!-- theme css & js -->
|
||
<meta name="generator" content="Hexo 4.2.0">
|
||
</head>
|
||
<body>
|
||
<div class="book-container">
|
||
<div class="book-sidebar">
|
||
<div class="book-brand">
|
||
<a href="/">
|
||
<img src="/static/favicon.png">
|
||
<span>技术文章摘抄</span>
|
||
</a>
|
||
</div>
|
||
<div class="book-menu uncollapsible">
|
||
<ul class="uncollapsible">
|
||
<li><a href="/" class="current-tab">首页</a></li>
|
||
</ul>
|
||
<ul class="uncollapsible">
|
||
<li><a href="../">上一级</a></li>
|
||
</ul>
|
||
<ul class="uncollapsible">
|
||
<li>
|
||
|
||
<a href="/文章/AQS 万字图文全面解析.md.html">AQS 万字图文全面解析.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Docker 镜像构建原理及源码分析.md.html">Docker 镜像构建原理及源码分析.md.html</a>
|
||
</li>
|
||
<li>
|
||
<a class="current-tab" href="/文章/ElasticSearch 小白从入门到精通.md.html">ElasticSearch 小白从入门到精通.md.html</a>
|
||
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/JVM CPU Profiler技术原理及源码深度解析.md.html">JVM CPU Profiler技术原理及源码深度解析.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/JVM 垃圾收集器.md.html">JVM 垃圾收集器.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/JVM 面试的 30 个知识点.md.html">JVM 面试的 30 个知识点.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Java IO 体系、线程模型大总结.md.html">Java IO 体系、线程模型大总结.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Java NIO浅析.md.html">Java NIO浅析.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Java 面试题集锦(网络篇).md.html">Java 面试题集锦(网络篇).md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Java-直接内存 DirectMemory 详解.md.html">Java-直接内存 DirectMemory 详解.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Java中9种常见的CMS GC问题分析与解决(上).md.html">Java中9种常见的CMS GC问题分析与解决(上).md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Java中9种常见的CMS GC问题分析与解决(下).md.html">Java中9种常见的CMS GC问题分析与解决(下).md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Java中的SPI.md.html">Java中的SPI.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Java中的ThreadLocal.md.html">Java中的ThreadLocal.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Java线程池实现原理及其在美团业务中的实践.md.html">Java线程池实现原理及其在美团业务中的实践.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Java魔法类:Unsafe应用解析.md.html">Java魔法类:Unsafe应用解析.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Kafka 源码阅读笔记.md.html">Kafka 源码阅读笔记.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Kafka、ActiveMQ、RabbitMQ、RocketMQ 区别以及高可用原理.md.html">Kafka、ActiveMQ、RabbitMQ、RocketMQ 区别以及高可用原理.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL · 引擎特性 · InnoDB Buffer Pool.md.html">MySQL · 引擎特性 · InnoDB Buffer Pool.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL · 引擎特性 · InnoDB IO子系统.md.html">MySQL · 引擎特性 · InnoDB IO子系统.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL · 引擎特性 · InnoDB 事务系统.md.html">MySQL · 引擎特性 · InnoDB 事务系统.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL · 引擎特性 · InnoDB 同步机制.md.html">MySQL · 引擎特性 · InnoDB 同步机制.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL · 引擎特性 · InnoDB 数据页解析.md.html">MySQL · 引擎特性 · InnoDB 数据页解析.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL · 引擎特性 · InnoDB崩溃恢复.md.html">MySQL · 引擎特性 · InnoDB崩溃恢复.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL · 引擎特性 · 临时表那些事儿.md.html">MySQL · 引擎特性 · 临时表那些事儿.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 主从复制 半同步复制.md.html">MySQL 主从复制 半同步复制.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 主从复制 基于GTID复制.md.html">MySQL 主从复制 基于GTID复制.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 主从复制.md.html">MySQL 主从复制.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 事务日志(redo log和undo log).md.html">MySQL 事务日志(redo log和undo log).md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 亿级别数据迁移实战代码分享.md.html">MySQL 亿级别数据迁移实战代码分享.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 从一条数据说起-InnoDB行存储数据结构.md.html">MySQL 从一条数据说起-InnoDB行存储数据结构.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 地基基础:事务和锁的面纱.md.html">MySQL 地基基础:事务和锁的面纱.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 地基基础:数据字典.md.html">MySQL 地基基础:数据字典.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 地基基础:数据库字符集.md.html">MySQL 地基基础:数据库字符集.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 性能优化:碎片整理.md.html">MySQL 性能优化:碎片整理.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 故障诊断:一个 ALTER TALBE 执行了很久,你慌不慌?.md.html">MySQL 故障诊断:一个 ALTER TALBE 执行了很久,你慌不慌?.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 故障诊断:如何在日志中轻松定位大事务.md.html">MySQL 故障诊断:如何在日志中轻松定位大事务.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 故障诊断:教你快速定位加锁的 SQL.md.html">MySQL 故障诊断:教你快速定位加锁的 SQL.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 日志详解.md.html">MySQL 日志详解.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL 的半同步是什么?.md.html">MySQL 的半同步是什么?.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL中的事务和MVCC.md.html">MySQL中的事务和MVCC.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL事务_事务隔离级别详解.md.html">MySQL事务_事务隔离级别详解.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL优化:优化 select count().md.html">MySQL优化:优化 select count().md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL共享锁、排他锁、悲观锁、乐观锁.md.html">MySQL共享锁、排他锁、悲观锁、乐观锁.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/MySQL的MVCC(多版本并发控制).md.html">MySQL的MVCC(多版本并发控制).md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/QingStor 对象存储架构设计及最佳实践.md.html">QingStor 对象存储架构设计及最佳实践.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/RocketMQ 面试题集锦.md.html">RocketMQ 面试题集锦.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/SnowFlake 雪花算法生成分布式 ID.md.html">SnowFlake 雪花算法生成分布式 ID.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Spring Boot 2.x 结合 k8s 实现分布式微服务架构.md.html">Spring Boot 2.x 结合 k8s 实现分布式微服务架构.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Spring Boot 教程:如何开发一个 starter.md.html">Spring Boot 教程:如何开发一个 starter.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Spring MVC 原理.md.html">Spring MVC 原理.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Spring MyBatis和Spring整合的奥秘.md.html">Spring MyBatis和Spring整合的奥秘.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Spring 帮助你更好的理解Spring循环依赖.md.html">Spring 帮助你更好的理解Spring循环依赖.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Spring 循环依赖及解决方式.md.html">Spring 循环依赖及解决方式.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Spring中眼花缭乱的BeanDefinition.md.html">Spring中眼花缭乱的BeanDefinition.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/Vert.x 基础入门.md.html">Vert.x 基础入门.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/eBay 的 Elasticsearch 性能调优实践.md.html">eBay 的 Elasticsearch 性能调优实践.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/不可不说的Java“锁”事.md.html">不可不说的Java“锁”事.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/互联网并发限流实战.md.html">互联网并发限流实战.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/从ReentrantLock的实现看AQS的原理及应用.md.html">从ReentrantLock的实现看AQS的原理及应用.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/从SpringCloud开始,聊微服务架构.md.html">从SpringCloud开始,聊微服务架构.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/全面了解 JDK 线程池实现原理.md.html">全面了解 JDK 线程池实现原理.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/分布式一致性理论与算法.md.html">分布式一致性理论与算法.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/分布式一致性算法 Raft.md.html">分布式一致性算法 Raft.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/分布式唯一 ID 解析.md.html">分布式唯一 ID 解析.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/分布式链路追踪:集群管理设计.md.html">分布式链路追踪:集群管理设计.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/动态代理种类及原理,你知道多少?.md.html">动态代理种类及原理,你知道多少?.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/响应式架构与 RxJava 在有赞零售的实践.md.html">响应式架构与 RxJava 在有赞零售的实践.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/大数据算法——布隆过滤器.md.html">大数据算法——布隆过滤器.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/如何优雅地记录操作日志?.md.html">如何优雅地记录操作日志?.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/如何设计一个亿级消息量的 IM 系统.md.html">如何设计一个亿级消息量的 IM 系统.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/异步网络模型.md.html">异步网络模型.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/当我们在讨论CQRS时,我们在讨论些神马?.md.html">当我们在讨论CQRS时,我们在讨论些神马?.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/彻底理解 MySQL 的索引机制.md.html">彻底理解 MySQL 的索引机制.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/最全的 116 道 Redis 面试题解答.md.html">最全的 116 道 Redis 面试题解答.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/有赞权限系统(SAM).md.html">有赞权限系统(SAM).md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/有赞零售中台建设方法的探索与实践.md.html">有赞零售中台建设方法的探索与实践.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/服务注册与发现原理剖析(Eureka、Zookeeper、Nacos).md.html">服务注册与发现原理剖析(Eureka、Zookeeper、Nacos).md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/深入浅出Cache.md.html">深入浅出Cache.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/深入理解 MySQL 底层实现.md.html">深入理解 MySQL 底层实现.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/漫画讲解 git rebase VS git merge.md.html">漫画讲解 git rebase VS git merge.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/生成浏览器唯一稳定 ID 的探索.md.html">生成浏览器唯一稳定 ID 的探索.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/缓存 如何保证缓存与数据库的双写一致性?.md.html">缓存 如何保证缓存与数据库的双写一致性?.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/网易严选怎么做全链路监控的?.md.html">网易严选怎么做全链路监控的?.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/美团万亿级 KV 存储架构与实践.md.html">美团万亿级 KV 存储架构与实践.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/美团点评Kubernetes集群管理实践.md.html">美团点评Kubernetes集群管理实践.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/美团百亿规模API网关服务Shepherd的设计与实现.md.html">美团百亿规模API网关服务Shepherd的设计与实现.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/解读《阿里巴巴 Java 开发手册》背后的思考.md.html">解读《阿里巴巴 Java 开发手册》背后的思考.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/认识 MySQL 和 Redis 的数据一致性问题.md.html">认识 MySQL 和 Redis 的数据一致性问题.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/进阶:Dockerfile 高阶使用指南及镜像优化.md.html">进阶:Dockerfile 高阶使用指南及镜像优化.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/铁总在用的高性能分布式缓存计算框架 Geode.md.html">铁总在用的高性能分布式缓存计算框架 Geode.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/阿里云PolarDB及其共享存储PolarFS技术实现分析(上).md.html">阿里云PolarDB及其共享存储PolarFS技术实现分析(上).md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/阿里云PolarDB及其共享存储PolarFS技术实现分析(下).md.html">阿里云PolarDB及其共享存储PolarFS技术实现分析(下).md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/面试最常被问的 Java 后端题.md.html">面试最常被问的 Java 后端题.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/领域驱动设计在互联网业务开发中的实践.md.html">领域驱动设计在互联网业务开发中的实践.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/领域驱动设计的菱形对称架构.md.html">领域驱动设计的菱形对称架构.md.html</a>
|
||
</li>
|
||
<li>
|
||
|
||
<a href="/文章/高效构建 Docker 镜像的最佳实践.md.html">高效构建 Docker 镜像的最佳实践.md.html</a>
|
||
</li>
|
||
</ul>
|
||
</div>
|
||
</div>
|
||
<div class="sidebar-toggle" onclick="sidebar_toggle()" onmouseover="add_inner()" onmouseleave="remove_inner()">
|
||
<div class="sidebar-toggle-inner"></div>
|
||
</div>
|
||
<script>
|
||
function add_inner() {
|
||
let inner = document.querySelector('.sidebar-toggle-inner')
|
||
inner.classList.add('show')
|
||
}
|
||
function remove_inner() {
|
||
let inner = document.querySelector('.sidebar-toggle-inner')
|
||
inner.classList.remove('show')
|
||
}
|
||
function sidebar_toggle() {
|
||
let sidebar_toggle = document.querySelector('.sidebar-toggle')
|
||
let sidebar = document.querySelector('.book-sidebar')
|
||
let content = document.querySelector('.off-canvas-content')
|
||
if (sidebar_toggle.classList.contains('extend')) { // show
|
||
sidebar_toggle.classList.remove('extend')
|
||
sidebar.classList.remove('hide')
|
||
content.classList.remove('extend')
|
||
} else { // hide
|
||
sidebar_toggle.classList.add('extend')
|
||
sidebar.classList.add('hide')
|
||
content.classList.add('extend')
|
||
}
|
||
}
|
||
|
||
function open_sidebar() {
|
||
let sidebar = document.querySelector('.book-sidebar')
|
||
let overlay = document.querySelector('.off-canvas-overlay')
|
||
sidebar.classList.add('show')
|
||
overlay.classList.add('show')
|
||
}
|
||
function hide_canvas() {
|
||
let sidebar = document.querySelector('.book-sidebar')
|
||
let overlay = document.querySelector('.off-canvas-overlay')
|
||
sidebar.classList.remove('show')
|
||
overlay.classList.remove('show')
|
||
}
|
||
</script>
|
||
<div class="off-canvas-content">
|
||
<div class="columns">
|
||
<div class="column col-12 col-lg-12">
|
||
<div class="book-navbar">
|
||
<!-- For Responsive Layout -->
|
||
<header class="navbar">
|
||
<section class="navbar-section">
|
||
<a onclick="open_sidebar()">
|
||
<i class="icon icon-menu"></i>
|
||
</a>
|
||
</section>
|
||
</header>
|
||
</div>
|
||
<div class="book-content" style="max-width: 960px; margin: 0 auto;
|
||
overflow-x: auto;
|
||
overflow-y: hidden;">
|
||
<div class="book-post">
|
||
<p id="tip" align="center"></p>
|
||
<div><h1>ElasticSearch 小白从入门到精通</h1>
|
||
<h3>什么是 ElasticSearch</h3>
|
||
<p>ElasticSearch 简称为 ES,网址为:</p>
|
||
<blockquote>
|
||
<p><a href="https://www.elastic.co/">https://www.elastic.co/</a></p>
|
||
</blockquote>
|
||
<p>ES 是一个分布式的开源搜索和分析引擎,适用于文本、数字、地理空间、结构化数据、非结构化数据等数据的搜索。ES 是在 Apache Lucene 的基础上完成开发。由 Elastic 于 2010 年发布。ES 通过其简单的 REST 风格的 API、分布式特性、速度和可扩容闻名世界。是 Elastic Stack 的核心组件。Elastic Stack 是一套用于数据采集、扩充、保存、分析、可视化的开源工具。Elastic Stack 称之为 ELK。目前 ELK 包含一系列丰富的轻量数据采集代理,这些代理被称之为 Beats。</p>
|
||
<h4>ES 的用途</h4>
|
||
<p>主要有以下的用途:</p>
|
||
<ul>
|
||
<li>应用程序搜索</li>
|
||
<li>网站搜索</li>
|
||
<li>企业搜索</li>
|
||
<li>日志处理</li>
|
||
<li>基础设施指标和容器监测</li>
|
||
<li>应用程序性能监测</li>
|
||
<li>地理空间数据分析和可视化</li>
|
||
<li>安全分析</li>
|
||
<li>业务分析</li>
|
||
</ul>
|
||
<h4>工作原理</h4>
|
||
<p>从多个来源输入到 ES 中,数据在 ES 中进行索引和解析,标准化并充实这些数据。这些数据在 ES 中索引完成之后,用户就可以针对他们的数据进行复杂的查询,并使用聚合来检索这些数据,在 Kibana 中,用户可以创建数据可视化面板,并对 ELK 进行管理。</p>
|
||
<h4>索引</h4>
|
||
<p>ES 索引是指相互关联的文档集合。ES 是会以 JSON 文档的形式保存数据,每个文档都会在一组键值对中建立联系。</p>
|
||
<p>ES 使用的是一种倒排序索引的数据结构。这个结构可以允许十分快速的进行全文本的搜索。</p>
|
||
<p>在索引的过程中,ES 会保存文档并构建倒排序索引,这样用户就可以实时的对文档数据进行搜索。索引是在添加过程中就启动的。</p>
|
||
<h4>Logstash</h4>
|
||
<p>Logstash 是 ELK 的核心菜品,可以对数据进行聚合和处理。并将数据发送到 ES 中。Logstash 是一个开源的服务器端数据处理管道。</p>
|
||
<h4>Kibana</h4>
|
||
<p>Kibana 是一款 ES 的数据可视化和管理工具,可以提供直方图,线形图,饼状图,地图。Kibana 还包含 Canvas 和 Elastic Maps 等应用程序。Canvas 可以基于用户创建动态信息。Elastic Maps 可以对空间数据进行可视化处理。</p>
|
||
<h4>为什么要使用 ES</h4>
|
||
<ul>
|
||
<li><strong>ES 很快</strong>:ES 是在 Lucene 基础上构建,所以全文本搜索相当的出色。ES 还是一个实时搜索平台。文档索引操作到文档变为可搜索之间速度很快。</li>
|
||
<li><strong>ES 具有分布式的特征</strong>:ES 中保存的文档分布在不同的容器中,这些容器为分片,可以对分片进行复制并形成冗余副本。ES 可以扩充到数百台,并处理 PB 级别的数据。</li>
|
||
<li><strong>ES 包含一系列广泛的功能</strong>:ES 拥有大量的内置功能,方便用户管理数据。</li>
|
||
<li><strong>ES 简化了数据采集,可视化报告的过程</strong>:通过与 Beats 和 Logstash 集成,用户可以在 ES 中索引数据并处理数据,</li>
|
||
</ul>
|
||
<h3>ES 搭建</h3>
|
||
<p>安装镜像:</p>
|
||
<pre><code>docker pull docker.elastic.co/elasticsearch/elasticsearch:7.3.2
|
||
</code></pre>
|
||
<p>启动容器:</p>
|
||
<pre><code>docker run -d --name es -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" docker.elastic.co/elasticsearch/elasticsearch:7.3.2
|
||
</code></pre>
|
||
<p>修改配置:</p>
|
||
<pre><code>#进入 docker 容器内部
|
||
docker exec -it es /bin/bash
|
||
#打开配置文件
|
||
vim config/elasticsearch.yml
|
||
### 加入跨域配置
|
||
http.cors.enabled: true
|
||
http.cors.allow-origin: "*"
|
||
</code></pre>
|
||
<p>进入容器,安装分词器:</p>
|
||
<pre><code>docker exec -it es /bin/bash
|
||
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.3.2/elasticsearch-analysis-ik-7.3.2.zip
|
||
</code></pre>
|
||
<p>重启 ES:</p>
|
||
<pre><code>docker restart es
|
||
</code></pre>
|
||
<p>测试:</p>
|
||
<p><img src="assets/199ad3c0-cee2-11eb-bfdf-b9d6bba95aa3" alt="在这里插入图片描述" /></p>
|
||
<p>查看分词器是否安装上:</p>
|
||
<p><img src="assets/25ebc030-cee2-11eb-ac3e-190fba44d759" alt="在这里插入图片描述" /></p>
|
||
<h3>ES 查询</h3>
|
||
<h4>空查询</h4>
|
||
<p>空查询将会返回一个索引库中所有文档:</p>
|
||
<pre><code>curl -X GET "localhost:9200/_search?pretty" -H 'Content-Type: application/json' -d'
|
||
{}
|
||
'
|
||
</code></pre>
|
||
<p>在一个或者多个索引库或者所有的 _type 中查询:</p>
|
||
<pre><code>GET /index_2014*/type1,type2/_search
|
||
{}
|
||
</code></pre>
|
||
<p>使用分页:</p>
|
||
<pre><code>GET /_search
|
||
{
|
||
"from": 30,
|
||
"size": 10
|
||
}
|
||
</code></pre>
|
||
<h4>查询表达式</h4>
|
||
<p>只需要在查询上,将语句传递给 queue 参数:</p>
|
||
<pre><code>GET /_search
|
||
{
|
||
"query": YOUR_QUERY_HERE
|
||
}
|
||
</code></pre>
|
||
<h5><strong>查询语句的结构</strong></h5>
|
||
<p>一个查询的典型结构:</p>
|
||
<pre><code>{
|
||
QUERY_NAME: {
|
||
ARGUMENT: VALUE,
|
||
ARGUMENT: VALUE,...
|
||
}
|
||
}
|
||
</code></pre>
|
||
<p>针对某个字段:</p>
|
||
<pre><code>{
|
||
QUERY_NAME: {
|
||
FIELD_NAME: {
|
||
ARGUMENT: VALUE,
|
||
ARGUMENT: VALUE,...
|
||
}
|
||
}
|
||
}
|
||
</code></pre>
|
||
<p>如果想要使用 match 查询 tewwt 字段中包含 elasticsesh 的内容。</p>
|
||
<pre><code>curl -X GET "localhost:9200/_search?pretty" -H 'Content-Type: application/json' -d'
|
||
{
|
||
"query": {
|
||
"match": {
|
||
"tweet": "elasticsearch"
|
||
}
|
||
}
|
||
}
|
||
'
|
||
</code></pre>
|
||
<h5><strong>合并查询</strong></h5>
|
||
<p>分为叶子语句,被用于将查询字符串和字段进行对比,复合语句用于合并其他查询语句。</p>
|
||
<p>例如下面语句:找出信件正文包含 business opportunity 的星标邮件,或者在邮件正文包含 business opportunity 的非垃圾邮件:</p>
|
||
<pre><code>{
|
||
"bool": {
|
||
"must": { "match": { "email": "business opportunity" }},
|
||
"should": [
|
||
{ "match": { "starred": true }},
|
||
{ "bool": {
|
||
"must": { "match": { "folder": "inbox" }},
|
||
"must_not": { "match": { "spam": true }}
|
||
}}
|
||
],
|
||
"minimum_should_match": 1
|
||
}
|
||
}
|
||
</code></pre>
|
||
<h4>常用查询</h4>
|
||
<h5><strong>match_all 查询</strong></h5>
|
||
<p>该查询匹配所有文档:</p>
|
||
<pre><code>{ "match_all": {}}
|
||
</code></pre>
|
||
<h5><strong>match 查询</strong></h5>
|
||
<p>用于使用分词器进行查询:</p>
|
||
<pre><code>{ "match": { "tweet": "About Search" }}
|
||
</code></pre>
|
||
<h5><strong>multi_match 查询</strong></h5>
|
||
<p>用于在多个字段上执行相同更多 match 查询:</p>
|
||
<pre><code>{
|
||
"multi_match": {
|
||
"query": "full text search",
|
||
"fields": [ "title", "body" ]
|
||
}
|
||
}
|
||
</code></pre>
|
||
<h5><strong>range 查询</strong></h5>
|
||
<p>用于找出在指定区间内的数字或者时间:</p>
|
||
<pre><code>{
|
||
"range": {
|
||
"age": {
|
||
"gte": 20,
|
||
"lt": 30
|
||
}
|
||
}
|
||
}
|
||
</code></pre>
|
||
<h5><strong>term 查询</strong></h5>
|
||
<p>用于进行精确匹配:</p>
|
||
<pre><code>{ "term": { "age": 26 }}
|
||
{ "term": { "date": "2014-09-01" }}
|
||
{ "term": { "public": true }}
|
||
{ "term": { "tag": "full_text" }}
|
||
</code></pre>
|
||
<h5><strong>terms 查询</strong></h5>
|
||
<p>用于进行多值匹配:</p>
|
||
<pre><code>{ "terms": { "tag": [ "search", "full_text", "nosql" ] }}
|
||
</code></pre>
|
||
<h5><strong>exists 查询和 missing 查询</strong></h5>
|
||
<p>用于查询在指定字段中有值或者无值的文档:</p>
|
||
<pre><code>{
|
||
"exists": {
|
||
"field": "title"
|
||
}
|
||
}
|
||
</code></pre>
|
||
<h3>ES 索引</h3>
|
||
<h4>创建一个索引</h4>
|
||
<pre><code>PUT /my_index
|
||
{
|
||
"settings": { ... any settings ... },
|
||
"mappings": {
|
||
"type_one": { ... any mappings ... },
|
||
"type_two": { ... any mappings ... },
|
||
...
|
||
}
|
||
}
|
||
</code></pre>
|
||
<p>此刻,ES 会自动创建一个索引。</p>
|
||
<h4>删除一个索引</h4>
|
||
<pre><code>DELETE /my_index
|
||
</code></pre>
|
||
<h4>索引设置</h4>
|
||
<ul>
|
||
<li>number_of_shards:每个索引的主分片数</li>
|
||
<li>number_of_replicas:每个主分片的副本数</li>
|
||
</ul>
|
||
<p>创建只有 一个主分片,没有副本的小索引:</p>
|
||
<pre><code>PUT /my_temp_index
|
||
{
|
||
"settings": {
|
||
"number_of_shards" : 1,
|
||
"number_of_replicas" : 0
|
||
}
|
||
}
|
||
</code></pre>
|
||
<h4>配置分析器</h4>
|
||
<p>standard 分析器是用于全文字段的默认分析器,包含以下部分:</p>
|
||
<ul>
|
||
<li>standard 分词器,通过单词边界分割输入的文本。</li>
|
||
<li>standard 语汇单元过滤器,目的是整理分词器触发的语汇单元(但是目前什么都没做)。</li>
|
||
<li>lowercase 语汇单元过滤器,转换所有的语汇单元为小写。</li>
|
||
<li>stop 语汇单元过滤器,删除停用词—对搜索相关性影响不大的常用词,如 a、the、and、is。</li>
|
||
</ul>
|
||
<p>在下面的例子中,创建了一个新的分析器 es_std,并使用预定义的西班牙语停用词列表。</p>
|
||
<pre><code>PUT /spanish_docs
|
||
{
|
||
"settings": {
|
||
"analysis": {
|
||
"analyzer": {
|
||
"es_std": {
|
||
"type": "standard",
|
||
"stopwords": "_spanish_"
|
||
}
|
||
}
|
||
}
|
||
}
|
||
}
|
||
</code></pre>
|
||
<p>进行测试:</p>
|
||
<pre><code>curl -X GET "localhost:9200/spanish_docs/_analyze?analyzer=es_std&pretty" -H 'Content-Type: application/json' -d'
|
||
El veloz zorro marrón
|
||
'
|
||
</code></pre>
|
||
<p>通过结果进行查看:</p>
|
||
<pre><code>{
|
||
"tokens" : [
|
||
{ "token" : "veloz", "position" : 2 },
|
||
{ "token" : "zorro", "position" : 3 },
|
||
{ "token" : "marrón", "position" : 4 }
|
||
]
|
||
}
|
||
</code></pre>
|
||
<h4>自定义分析器</h4>
|
||
<p>在 analysis 下的相应位置设置字符过滤器,分词过滤器,词单元过滤器。</p>
|
||
<pre><code>PUT /my_index
|
||
{
|
||
"settings": {
|
||
"analysis": {
|
||
"char_filter": { ... custom character filters ... },
|
||
"tokenizer": { ... custom tokenizers ... },
|
||
"filter": { ... custom token filters ... },
|
||
"analyzer": { ... custom analyzers ... }
|
||
}
|
||
}
|
||
}
|
||
</code></pre>
|
||
<p>接着创建一个自定义分析器,用于清楚 html 部分,将 & 映射为 and:</p>
|
||
<pre><code>"char_filter": {
|
||
"&_to_and": {
|
||
"type": "mapping",
|
||
"mappings": [ "&=> and "]
|
||
}
|
||
}
|
||
</code></pre>
|
||
<p>使用标准分词器讽刺,小写词条使用小写过滤,使用自定义停止词过滤器移除自定义的停止词列表中包含的词。</p>
|
||
<pre><code>"filter": {
|
||
"my_stopwords": {
|
||
"type": "stop",
|
||
"stopwords": [ "the", "a" ]
|
||
}
|
||
}
|
||
</code></pre>
|
||
<p>最后使用分析器,自定义组合过滤器和分词器。</p>
|
||
<pre><code>"analyzer": {
|
||
"my_analyzer": {
|
||
"type": "custom",
|
||
"char_filter": [ "html_strip", "&_to_and" ],
|
||
"tokenizer": "standard",
|
||
"filter": [ "lowercase", "my_stopwords" ]
|
||
}
|
||
}
|
||
</code></pre>
|
||
<p>总和如下所示:</p>
|
||
<pre><code>curl -X PUT "localhost:9200/my_index?pretty" -H 'Content-Type: application/json' -d'
|
||
{
|
||
"settings": {
|
||
"analysis": {
|
||
"char_filter": {
|
||
"&_to_and": {
|
||
"type": "mapping",
|
||
"mappings": [ "&=> and "]
|
||
}},
|
||
"filter": {
|
||
"my_stopwords": {
|
||
"type": "stop",
|
||
"stopwords": [ "the", "a" ]
|
||
}},
|
||
"analyzer": {
|
||
"my_analyzer": {
|
||
"type": "custom",
|
||
"char_filter": [ "html_strip", "&_to_and" ],
|
||
"tokenizer": "standard",
|
||
"filter": [ "lowercase", "my_stopwords" ]
|
||
}}
|
||
}}}
|
||
'
|
||
</code></pre>
|
||
<p>测试一下:</p>
|
||
<pre><code>curl -X GET "localhost:9200/my_index/_analyze?analyzer=my_analyzer&pretty" -H 'Content-Type: application/json' -d'
|
||
The quick & brown fox
|
||
'
|
||
</code></pre>
|
||
<p>可以看到结果如下所示:</p>
|
||
<pre><code>{
|
||
"tokens" : [
|
||
{ "token" : "quick", "position" : 2 },
|
||
{ "token" : "and", "position" : 3 },
|
||
{ "token" : "brown", "position" : 4 },
|
||
{ "token" : "fox", "position" : 5 }
|
||
]
|
||
}
|
||
</code></pre>
|
||
<p>最后,把这个分词器用在 string 字段上:</p>
|
||
<pre><code>curl -X PUT "localhost:9200/my_index/_mapping/my_type?pretty" -H 'Content-Type: application/json' -d'
|
||
{
|
||
"properties": {
|
||
"title": {
|
||
"type": "string",
|
||
"analyzer": "my_analyzer"
|
||
}
|
||
}
|
||
}
|
||
'
|
||
</code></pre>
|
||
<h4>类型和映射</h4>
|
||
<h5><strong>Lucene 如何处理文档</strong></h5>
|
||
<p>在 Lucene 中一个文档由键值对组成。在索引文档的时候,每个字段的值都会添加到相关字段的倒排序中。</p>
|
||
<h5><strong>类型如何实现</strong></h5>
|
||
<p>每个文档的类型名称将会保存在 _type 字段上,当要检索字段的时候,ES 会自动在 _type 字段上检索。</p>
|
||
<p>例如在 User 类型中,name 字段会映射声明为 string 类型,并索引到 name 的倒排序中,需要使用 whitespace 分词器分析。</p>
|
||
<pre><code>"name": {
|
||
"type": "string",
|
||
"analyzer": "whitespace"
|
||
}
|
||
</code></pre>
|
||
<h5><strong>Lucene 索引的每个字段都包含一个单一的扁平的模式</strong></h5>
|
||
<p>在 Lucene 中,一个特定的字段可以映射到 string 类型或者是 number 类型,但是不能两者兼具。因为 ES 添加的优于 lucene 的额外机制(以元数据 _type 字段的形式。)在 ES 中所有类型都最终共享相同的映射。</p>
|
||
<pre><code>{
|
||
"data": {
|
||
"mappings": {
|
||
"people": {
|
||
"properties": {
|
||
"name": {
|
||
"type": "string",
|
||
},
|
||
"address": {
|
||
"type": "string"
|
||
}
|
||
}
|
||
},
|
||
"transactions": {
|
||
"properties": {
|
||
"timestamp": {
|
||
"type": "date",
|
||
"format": "strict_date_optional_time"
|
||
},
|
||
"message": {
|
||
"type": "string"
|
||
}
|
||
}
|
||
}
|
||
}
|
||
}
|
||
}
|
||
</code></pre>
|
||
<p>在上方中,<code>"name"/"address"</code> 和 <code>"timestamp"/"message"</code> 虽然是独立的,但是在 Lucene 中是一个映射。</p>
|
||
<pre><code>{
|
||
"data": {
|
||
"mappings": {
|
||
"_type": {
|
||
"type": "string",
|
||
"index": "not_analyzed"
|
||
},
|
||
"name": {
|
||
"type": "string"
|
||
}
|
||
"address": {
|
||
"type": "string"
|
||
}
|
||
"timestamp": {
|
||
"type": "long"
|
||
}
|
||
"message": {
|
||
"type": "string"
|
||
}
|
||
}
|
||
}
|
||
}
|
||
</code></pre>
|
||
<p>对于整个索引,映射在本质上被 扁平化 成一个单一的、全局的模式。</p>
|
||
<h3>Java 连接 ES</h3>
|
||
<p>添加依赖:</p>
|
||
<pre><code> <!-- TransportClient 依赖包-->
|
||
<dependency>
|
||
<groupId>org.elasticsearch.client</groupId>
|
||
<artifactId>transport</artifactId>
|
||
<version>6.2.2</version>
|
||
</dependency>
|
||
<!-- 测试包,与 JAVA 连接 ES 无关 -->
|
||
<dependency>
|
||
<groupId>junit</groupId>
|
||
<artifactId>junit</artifactId>
|
||
<version>4.12</version>
|
||
<scope>test</scope>
|
||
</dependency>
|
||
</code></pre>
|
||
<p>创建 ES 集群:</p>
|
||
<p><img src="assets/f8f185b0-cee6-11eb-81e7-cb4b73a5fa4f" alt="在这里插入图片描述" /></p>
|
||
<p>连接 ES:</p>
|
||
<pre><code>package cn.zsm.es;
|
||
import org.elasticsearch.client.transport.TransportClient;
|
||
import org.elasticsearch.common.settings.Settings;
|
||
import org.elasticsearch.common.transport.TransportAddress;
|
||
import org.elasticsearch.transport.client.PreBuiltTransportClient;
|
||
import org.junit.Before;
|
||
import org.junit.Test;
|
||
import java.net.InetAddress;
|
||
import java.net.UnknownHostException;
|
||
public class JavaEsTest {
|
||
private String IP;
|
||
private int PORT;
|
||
@Before
|
||
public void init(){
|
||
this.IP = "192.168.?.?";
|
||
this.PORT = 9300;
|
||
}
|
||
@Test
|
||
public void esClient(){
|
||
try {
|
||
Settings settings = Settings.builder().put("cluster.name", "my-application").build();
|
||
TransportClient client = new PreBuiltTransportClient(settings)
|
||
.addTransportAddresses(new TransportAddress(InetAddress.getByName(IP), PORT));
|
||
System.out.println(client.toString());
|
||
} catch (UnknownHostException e) {
|
||
e.printStackTrace();
|
||
}
|
||
}
|
||
}
|
||
</code></pre>
|
||
<p>测试结果:</p>
|
||
<p><img src="assets/1053b2a0-cee7-11eb-a372-c3e5da0127b2" alt="在这里插入图片描述" /></p>
|
||
<h3>总结</h3>
|
||
<p>在本场 Chat 中介绍了什么是 ES,以及 ES 的查询、ES 的索引,最后通过 Java 语言连接了 ES。</p>
|
||
</div>
|
||
</div>
|
||
<div>
|
||
<div style="float: left">
|
||
<a href="/文章/Docker 镜像构建原理及源码分析.md.html">上一页</a>
|
||
</div>
|
||
<div style="float: right">
|
||
<a href="/文章/JVM CPU Profiler技术原理及源码深度解析.md.html">下一页</a>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
<a class="off-canvas-overlay" onclick="hide_canvas()"></a>
|
||
</div>
|
||
<script defer src="https://static.cloudflareinsights.com/beacon.min.js/v652eace1692a40cfa3763df669d7439c1639079717194" integrity="sha512-Gi7xpJR8tSkrpF7aordPZQlW2DLtzUlZcumS8dMQjwDHEnw9I7ZLyiOj/6tZStRBGtGgN6ceN6cMH8z7etPGlw==" data-cf-beacon='{"rayId":"70997fa74a018b66","version":"2021.12.0","r":1,"token":"1f5d475227ce4f0089a7cff1ab17c0f5","si":100}' crossorigin="anonymous"></script>
|
||
</body>
|
||
<!-- Global site tag (gtag.js) - Google Analytics -->
|
||
<script async src="https://www.googletagmanager.com/gtag/js?id=G-NPSEEVD756"></script>
|
||
<script>
|
||
window.dataLayer = window.dataLayer || [];
|
||
function gtag() {
|
||
dataLayer.push(arguments);
|
||
}
|
||
gtag('js', new Date());
|
||
gtag('config', 'G-NPSEEVD756');
|
||
var path = window.location.pathname
|
||
var cookie = getCookie("lastPath");
|
||
console.log(path)
|
||
if (path.replace("/", "") === "") {
|
||
if (cookie.replace("/", "") !== "") {
|
||
console.log(cookie)
|
||
document.getElementById("tip").innerHTML = "<a href='" + cookie + "'>跳转到上次进度</a>"
|
||
}
|
||
} else {
|
||
setCookie("lastPath", path)
|
||
}
|
||
function setCookie(cname, cvalue) {
|
||
var d = new Date();
|
||
d.setTime(d.getTime() + (180 * 24 * 60 * 60 * 1000));
|
||
var expires = "expires=" + d.toGMTString();
|
||
document.cookie = cname + "=" + cvalue + "; " + expires + ";path = /";
|
||
}
|
||
function getCookie(cname) {
|
||
var name = cname + "=";
|
||
var ca = document.cookie.split(';');
|
||
for (var i = 0; i < ca.length; i++) {
|
||
var c = ca[i].trim();
|
||
if (c.indexOf(name) === 0) return c.substring(name.length, c.length);
|
||
}
|
||
return "";
|
||
}
|
||
</script>
|
||
</html>
|