
/br>
img src="https://www.west.cn/info/upload//eocd1xvvsha.jpg" alt="">
1、elasticsearch 了解多少,说说你们公司 es 的集群架构,索
引数据大小,分片有多少,以及一些调优手段 。
面试官:
想了解应聘者之前公司接触的 ES 使用场景、规模,有没有做过比较大
解答:
(文末可领取更多面试资料)
比如:
ES 集群架构 13 个节点,索引根据通道不同共 20+索引,根据日期,每日
仅索引层面调优手段:
1.1、设计阶段调优
1.2、写入调优
1.3、查询调优
1.4、其他调优
2、elasticsearch 的倒排索引是什么
面试官:
想了解你对基础概念的认知。
解答
:通俗解释一下就可以。
img src="https://www.west.cn/info/upload//xmmywl3hyjd.jpg" alt="">
学术的解答方式:
加分项:倒排索引的底层实现是基于:
lucene 从 4+版本后开始大量使用的数据结构是 FST。FST 有两个优点:
3、elasticsearch 索引数据多了怎么办,如何调优,部署
面试官:
想了解大数据量的运维能力。
解答
:索引数据的规划,应在前期做好规划,正所谓“设计先行,编码在后”,
如何调优,正如问题 1 所说,这里细化一下:
3.1 动态索引层面
3.2 存储层面
3.3 部署层面
4、elasticsearch 是如何实现 master 选举的
解答:
前置前提:
选举流程大致描述如下:
第一步:
确认候选主节点数达标,elasticsearch.yml 设置的值
第二步:
比较:先判定是否具备 master 资格,具备候选主节点资格的优先返回;
5、详细描述一下 Elasticsearch 索引文档的过程
面试官:
想了解 ES 的底层原理,不再只关注业务层面了。
解答:
img src="https://www.west.cn/info/upload//lhm4immq101.jpg" alt="">
第一步:
客户写集群某节点写入数据,发送请求。(如果没有指定路由/协调节点,
第二步:
节点 1 接受到请求后,使用文档_id 来确定文档属于分片 0。请求会被转
第三步:
节点 3 在主分片上执行写操作,如果成功,则将请求并行转发到节点 1
如果面试官再问:第二步中的文档获取分片的过程?
6、详细描述一下 Elasticsearch 搜索的过程?
面试官:
想了解 ES 搜索的底层原理,不再只关注业务层面了。
解答:
query 阶段的目的
:定位到位置,但不取。
步骤拆解如下:
fetch 阶段的目的
:取数据。
7、Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法
面试官:
想了解对 ES 集群的运维能力。
解答:
8、lucence 内部结构是什么?
解答:
img src="https://www.west.cn/info/upload//q3f3nycgmcz.jpg" alt="">
9、Elasticsearch 是如何实现 Master 选举的?
node.master: true
)根据 nodeId 字典排
10、Elasticsearch 中的节点(比如共 20 个),其中的 10 个
选了一个 master,另外 10 个选了另一个 master,怎么办?
discovery.zen.minimum_master_nodes
)超过所有候选节点一半以上来解
11、客户端在和集群连接时,如何选择特定的节点执行请求的?
轮
询
的方式与这些地址进行通信。
12、详细描述一下 Elasticsearch 索引文档的过程。
img src="https://www.west.cn/info/upload//movkqf2zsjp.jpg" alt="">
补充:关于 Lucene 的 Segement:
13、详细描述一下 Elasticsearch 更新和删除文档的过程。
14、详细描述一下 Elasticsearch 搜索的过程。
查询阶段
时,查询会广播到索引中每一个分片拷贝(主分片或者副本分
所有文档的 ID 和排序值
给协调节点,它合并
取回阶段
,协调节点辨别出哪些文档需要被取回并向相关的分片
丰富
文档,如果有需要的话,接着返回
img src="https://www.west.cn/info/upload//fzqnqtiqwds.jpg" alt="">
15、在 Elasticsearch 中,是怎么根据一个词找到对应的倒排索
引的?
16、Elasticsearch 在部署时,对 Linux 的设置有哪些优化方
法?
大量 的
文件。同时,Elasticsearch 在节点和 HTTP 客户端
补充:索引阶段性能提升方法
17、对于 GC 方面,在使用 Elasticsearch 时要注意什么?
18、Elasticsearch 对于大数据量(上亿量级)的聚合如何实现?
distinct
或者
unique
值的数目。它是基于 HLL 算法的。HLL 会先对
19、在并发情况下,Elasticsearch 如果保证读写一致?
20、如何监控 Elasticsearch 集群状态?
21、介绍下你们电商搜索的整体技术架构
img src="https://www.west.cn/info/upload//iv5q1vkszhz.jpg" alt="">
22、介绍一下你们的个性化搜索方案?
23、是否了解字典树?
img src="https://www.west.cn/info/upload//nolr0tsqaal.jpg" alt="">
达到提高效率的目的。它有 3 个基本性质:
img src="https://www.west.cn/info/upload//acogw0yryab.jpg" alt="">
24、拼写纠错是如何实现的?
img src="https://www.west.cn/info/upload//wnihihxffsf.jpg" alt="">
系满足以下三条基本条件:
d(x,y) = 0 -- 假如 x 与 y 的距离为 0,则 x=yd(x,y) = d(y,x) -- x 到 y 的距离等同于 y 到 x 的距离
d(x,y) + d(y,z) >= d(x,z) -- 三角不等式
3、查询相似词如下:
计算单词与根节点的编辑距离 d,然后递归查找每个子节点
cake
,然后再找和 cake 节点编辑距离是 0 到 2 的,分别找到 cape 和
cape
这个满足条件的结果。
img src="https://www.west.cn/info/upload//i4uxypuepxi.jpg" alt="">
img src="https://www.west.cn/info/upload//1p1ixacvlhs.png" alt="">
到此这篇服务器部署方案怎么写(服务器部署方案怎么写的)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!
版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/hd-yjs/44719.html